C#网页自动登录和提交POST信息的多种方法(转)

时间:2022-09-26 08:05:07

网页自动登录和提交POST信息的核心就是分析网页的源代码(HTML),在C#中,可以用来提取网页HTML的组件比较多,常用的用WebBrowser、WebClient、HttpWebRequest这三个。

以下就分别用这三种方法来实现:

1、WebBrowser是个"迷你"浏览器,其特点是Post时不用关心Cookie、内置JS等问题

WebBrowser是VS2005新提供的组件(其实就是封装了IE接口),实现POST功能一般在webBrowser的DocumentCompleted中分析HtmlDocument 来实现,代码如下:

HtmlElement ClickBtn =null;

if (e.Url.ToString().ToLower().IndexOf("http://sandou.cnblogs.com/") > 0)   //登陆页面

{

HtmlDocument doc = webBrowser1.Document;

for (int i = 0; i < doc.All.Count ; i++)

{

if (doc.All[i].TagName.ToUpper().Equals("INPUT"))

{

switch (doc.All[i].Name)

{

case "userCtl":

doc.All[i].InnerText = "user01";

break;

case "passCt1":

doc.All[i].InnerText = "mypass";

break;

case "B1":

ClickBtn = doc.All[i]; //提交按钮

break;

}

}

}

ClickBtn.InvokeMember("Click");   //执行按扭操作

}

2、WebClient封装了HTTP的一些类,操作简单,相较于webBrowser,特点是可以自设代理,缺点是对COOKIE的控制

WebClient的运行全在后台,并且提供了异步操作的能力,这样很方便并发多个任务,然后等待结果的返回,再逐个处理。多任务异步调用的代码如下:

private void StartLoop(int ProxyNum)

{

WebClient []  wcArray = new WebClient[ProxyNum];  //初始化

for (int idArray = 0; idArray< ProxyNum;idArray++)

{

wcArray[idArray] = new WebClient();

wcArray[idArray].OpenReadCompleted += new OpenReadCompletedEventHandler(Pic_OpenReadCompleted2);

wcArray[idArray].UploadDataCompleted += new UploadDataCompletedEventHandler(Pic_UploadDataCompleted2);

try

{

wcArray[idArray].Proxy = new WebProxy(proxy[1], port);

wcArray[idArray].OpenReadAsync(new Uri("http://sandou.cnblogs.com/")); //打开WEB;

proxy = null;

}

catch

{

}

}

}

private void Pic_OpenReadCompleted2(object sender, OpenReadCompletedEventArgs e)

{

if (e.Error == null)

{

string textData = new StreamReader(e.Result, Encoding.Default).ReadToEnd();  //取返回信息

..

String cookie = ((WebClient)sender).ResponseHeaders["Set-Cookie"];

((WebClient)sender).Headers.Add("Content-Type", "application/x-www-form-urlencoded");

((WebClient)sender).Headers.Add("Accept-Language", "zh-cn");

((WebClient)sender).Headers.Add("Cookie", cookie);

string postData = ""

byte[] byteArray = Encoding.UTF8.GetBytes(postData); // 转化成二进制数组

((WebClient)sender).UploadDataAsync(new Uri("http://sandou.cnblogs.com/"), "POST", byteArray);

}

}

private void Pic_UploadDataCompleted2(object sender, UploadDataCompletedEventArgs e)

{

if (e.Error == null)

{

string returnMessage = Encoding.Default.GetString(e.Result);

}

}

3、HttpWebRequest较为低层,能实现的功能较多,Cookie操作也很简单:

private bool  PostWebRequest()

{

CookieContainer cc = new CookieContainer();

string pos tData = "user=" + strUser + "&pass=" + strPsd;

byte[] byteArray = Encoding.UTF8.GetBytes(postData); // 转化

HttpWebRequest webRequest2 = (HttpWebRequest)WebRequest.Create(new Uri(http://sandou.cnblogs.com/));

webRequest2.CookieContainer = cc;

webRequest2.Method = "POST";

webRequest2.ContentType = "application/x-www-form-urlencoded";

webRequest2.ContentLength = byteArray.Length;

Stream newStream = webRequest2.GetRequestStream();

// Send the data.

newStream.Write(byteArray, 0, byteArray.Length);    //写入参数

newStream.Close();

HttpWebResponse response2 = (HttpWebResponse)webRequest2.GetResponse();

StreamReader sr2=new StreamReader(response2.GetResponseStream(), Encoding.Default);

string text2 =  sr2.ReadToEnd();

}

HttpWebRequest 实现, 这个是从网上COPY 的!我以前用相关的代码登录到WWW.ASP.NET上,并且成功post,可惜代码不知道放什么地方了。

HttpWebRequest自动登录网站并获取网站内容(不包含验证码的网站)

可以使用 Visual Sniffer(百度搜索) 来捕捉提交的数据信息:

1. 访问你需要站外提交的页面,比如 CSDN 登陆页http://www.csdn.net/member/UserLogin.aspx

2. 填写好需要的资料,比如用户名和密码,

3. 打开 Visual Sniffer, 点“开始拦截”

4. 在访问的页面中提交。

5. 等提交成功之后,在 Visual Sniffer 中“停止拦截”

6. 在 Visual Sniffer 的左侧栏的加号中依次点开,右边是它拦截到的内容:

POSThttp://www.csdn.net/member/UserLogin.aspx HTTP/1.0

Accept: image/gif, image/x-xbitmap, image/jpeg, image/pjpeg, application/vnd.ms-excel, application/vnd.ms-powerpoint, application/msword, application/x-shockwave-flash, **

Referer:http://www.csdn.net/member/UserLogin.aspx

Accept-Language: zh-cn

UA-CPU: x86

Pragma: no-cache

User-Agent: Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.2; SV1; .NET CLR 1.1.4322; InfoPath.1)

Host: www.csdn.net

Proxy-Connection: Keep-Alive

Cookie: ASPSESSIONIDAAAATBQC=FMEGGCKDBKHAMMCGKPFDMBFG; ASP.NET_SessionId=lusprmnom05lr445tmteaf55; userid=699879

以上为拦截内容,其中提交数据的参数部分(程序中的:strArgs)如:

__EVENTTARGET=&__EVENTARGUMENT=&__VIEWSTATE=dDwtMTcwMzgxNjQ2Mjs7bDxDU

0ROVXNlckxvZ2luOmNiX1NhdmVTdGF0ZTtDU0ROVXNlckxvZ2luOkltYWdlX0xvZ2luOz4%2Btu

1q2wmRZoAJTi9L73w1zBleylY%3D&CSDNUserLogin%3Atb_UserName=testusername&CSDN

UserLogin%3Atb_Password=testpassword&CSDNUserLogin%3Atb_ExPwd=9232

protected static string cookieHeader;

private void Page_Load(object sender, System.EventArgs e)

{

string strReContent = string.Empty;

//登录

strReContent = PostLogin("http://www.mystand.com.cn/login/submit.jsp提交的页面","提交的参数:userid=hgj0000&password=06045369","引用地址:http://www.mystand.com.cn/");

//asp.net登录传递的参数需注意

//strReContent = PostLogin("47bDxcZTs%2BPjs%2BOzs%2BOz4%2BOz6aX2dtqkJTK%2BKbNPsjd7Op%2Fl26Iw%3D%3D&txtUserName=hxf&txtPassword=hxf0000&btnEnter=%E7%99%BB%E5%BD%95","http://www.mystand.com.cn/login.aspx">http://www.mystand.com.cn/login.aspx","__VIEWSTATE=dDwtNjkzMjUyNDczO3Q8O2w8aTwzPjs%2BO2w8dDxwPHA8bDxUZXh0Oz47bDxcZTs%2BPjs%2BOzs%2BOz4%2BOz6aX2dtqkJTK%2BKbNPsjd7Op%2Fl26Iw%3D%3D&txtUserName=hxf&txtPassword=hxf0000&btnEnter=%E7%99%BB%E5%BD%95","http://www.mystand.com.cn/login.aspx");

//获取页面

strReContent = GetPage("http://www.mystand.com.cn/company/getdata.jsp?code=","引用地址:http://www.mystand.com.cn/");

//strReContent = GetPage("http://www.mystand.com.cn/Modules/index.aspx","http://www.mystand.com.cn/login.aspx");

//可以对获得的内容进行处理:strReContent

}

/// <summary>

/// 功能描述:模拟登录页面,提交登录数据进行登录,并记录Header中的cookie

/// </summary>

/// <param name="strURL">登录数据提交的页面地址</param>

/// <param name="strArgs">用户登录数据</param>

/// <param name="strReferer">引用地址</param>

/// <returns>可以返回页面内容或不返回</returns>

public static string PostLogin(string strURL,string strArgs,string strReferer)

{

string strResult = "";

HttpWebRequest myHttpWebRequest = (HttpWebRequest)WebRequest.Create(strURL);

myHttpWebRequest.AllowAutoRedirect = true;

myHttpWebRequest.KeepAlive = true;

myHttpWebRequest.Accept = "image/gif, image/x-xbitmap, image/jpeg, image/pjpeg, application/vnd.ms-excel, application/msword, application/x-shockwave-flash, */// <summary>

/// 功能描述:在PostLogin成功登录后记录下Headers中的cookie,然后获取此网站上其他页面的内容

/// </summary>

/// <param name="strURL">获取网站的某页面的地址</param>

/// <param name="strReferer">引用的地址</param>

/// <returns>返回页面内容</returns>

public static string GetPage(string strURL,string strReferer)

{

string strResult = "";

HttpWebRequest myHttpWebRequest = (HttpWebRequest)WebRequest.Create(strURL);

myHttpWebRequest.ContentType = "text/html";

myHttpWebRequest.Method = "GET";

myHttpWebRequest.Referer = strReferer;

myHttpWebRequest.Headers.Add("cookie:"+ cookieHeader);

HttpWebResponse response = null;

System.IO.StreamReader sr = null;

response = (HttpWebResponse)myHttpWebRequest.GetResponse();

sr = new System.IO.StreamReader(response.GetResponseStream(), Encoding.GetEncoding("gb2312"));    //    //utf-8

strResult = sr.ReadToEnd();

return strResult;

}

技术应用——网页自动登录(提交Post内容)的用途很多,如验证身份、程序升级、网络投票等,以下是用C#实现的方法.

未解决问题——目前最大问题无法绕过验证码——我曾经和同事讨论图片的算法,基本上很难识别,网上也有很多识别验证码的例子,但是对于简单的噪声还是可以的,可是对于复杂的就一点用都没有了!到目前为止,我没有测试成功过!如果你有测试成功过,请帖代码,我们一起研究研究。

C#网页自动登录和提交POST信息的多种方法(转)的更多相关文章

  1. C&num;三种模拟自动登录和提交POST信息的实现方法

    网页自动登录(提交Post内容)的用途很多,如验证身份.程序升级.网络投票等,以下是用C#实现的方法.       网页自动登录和提交POST信息的核心就是分析网页的源代码(HTML),在C#中,可以 ...

  2. C&num;三种模拟自动登录和提交POST信息的实现方法【转】

    网页自动登录(提交Post内容)的用途很多,如验证身份.程序升级.网络投票等,以下是用C#实现的方法.       网页自动登录和提交POST信息的核心就是分析网页的源代码(HTML),在C#中,可以 ...

  3. C&num; 网络编程之网页自动登录 &lpar;一&rpar;&period;使用WebBrower控件模仿登录

    最近学习C#网络编程中,想实现网页自动登录并提交GET/POST信息,再实现循环登录不断发送报文给服务器,服务器发送消息给客户端记录能登录的账户和密码,做到后面实现绕过验证码.动态抓取登录位置等,但由 ...

  4. java生成二维码扫码网页自动登录功能

    找了很多资料,七七八八都试了一遍,最终写出来了这个功能. 菜鸟一枚,此文只为做笔记. 简单的一个生成二维码,通过网页确认登录,实现二维码页面跳转到主页面. 有三个servlet: CodeServle ...

  5. Selenium网页自动登录项目&lpar;基于Python从0到1&rpar;

    Selenium是一个自动化测试工具,利用它我们可以驱动浏览器执行特定的动作,如点击.下拉等操作. 本文讲述的是通过自动化的方式登陆某一网站,其中包含Selenium+python自动化项目环境如何部 ...

  6. python 实现网页 自动登录

    完整代码: 1 from apscheduler.schedulers.blocking import BlockingScheduler 2 from selenium import webdriv ...

  7. ip反查域名的详细信息(多种方法)

    不多说,直接上干货! 至于这里怎FQ,很简单,请见我下面的博客! kali 2.0安装 *(成功FQ) *(简称SSFQ软件)步骤详解 FQ软件*-inst ...

  8. QQ模拟自动登录实现

    QQ模拟自动登录实现 本篇文章主要介绍"QQ模拟自动登录实现(带验证码)",主要涉及到java 实现QQ自动登录(带验证码)方面的内容,对于java 实现QQ自动登录(带验证码)感 ...

  9. yii自动登录

    在yii,登录页面选择记住密码,下次就会自动登陆 前些天,自己增加了一个web应用,但是发现虽然选择记住密码,没选退出,关闭浏览器,重新进入还会跳转到登陆页面 自动登录是利用cookie实现的 配置U ...

随机推荐

  1. 使用OAuth打造webapi认证服务供自己的客户端使用

    一.什么是OAuth OAuth是一个关于授权(Authorization)的开放网络标准,目前的版本是2.0版.注意是Authorization(授权),而不是Authentication(认证). ...

  2. ORACLE临时表总结(转载)

    转载地址:http://www.cnblogs.com/kerrycode/p/3285936.html 临时表概念 临时表就是用来暂时保存临时数据(亦或叫中间数据)的一个数据库对象,它和普通表有些类 ...

  3. linux Bash

    本文包含的命令:type.echo.evn.set.locale.read.declare / typeset.ulimit.alias.unalias.history.!.source.stty.c ...

  4. Unity的物理材质

    Physic Materials资源包 在Unity中的项目导入Unity自带的资源包 Physic Materials,自带的资源包有不同种类的物理材质: Bouncy:有弹性的 Ice:结冰 Me ...

  5. 《C和指针》 读书笔记 -- 第13章 高级指针话题

    1.函数指针 int (*f)(); int *(*f[])(); 用途: [1]回调函数 e.g. /*在一个单链表中查找指定值*/ Node *search_list(Node *node,voi ...

  6. 开源的Android开发框架-------PowerFramework使用心得(五)网络请求HTTPRequest

    GET请求示例 //所有参数都使用Bundle,用putString Bundle bundle = new Bundle(); bundle.putString("username&quo ...

  7. 【剑指offer】面试题32:从1到n整数中1出现的次数

    题目: 求出1~13的整数中1出现的次数,并算出100~1300的整数中1出现的次数?为此他特别数了一下1~13中包含1的数字有1.10.11.12.13因此共出现6次,但是对于后面问题他就没辙了.A ...

  8. &lbrack;J2EE框架&rsqb;&lbrack;Debug&rsqb;

    注意xml头部问题 比如在xx-servlet中注意: <mvc:annotation-driven/> <context:component-scan base-package=& ...

  9. Android首席设计师宣称移动概念已死,开发人员应该面向屏幕编写应用而非移动

    腾讯科技对Android首席设计师Duarte"移动已死"訪谈内容的翻译错得离谱,被到处转载,误人视听. 而要真正理解Duarte所想表达的含义,须要深入了解互联网前沿设计理念以及 ...

  10. OTN&amp&semi;互换amp&semi; P-OTN有效降低100G 网络成本 (两)

    OTN互换& P-OTN有效降低100G 网络成本 (两) 在全球范围内.网流量的增长速度是空前的,导致此现象的缘由包含云服务的增长.移动宽带和基于互联网的视频点播服务的增长. Cisco估计 ...