目的
想通过JAVA代码实现淘宝网的自动登录,通过获取设置的登录信息自动填写并提交。目前这个代码是小编测试过的,可以通过,后期不知道淘宝会不会有相应的封堵策略。
代码分享:
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
|
package util;
import org.openqa.selenium.By;
import org.openqa.selenium.WebElement;
import org.openqa.selenium.firefox.FirefoxDriver;
import org.openqa.selenium.firefox.FirefoxOptions;
import org.openqa.selenium.firefox.FirefoxProfile;
import java.io.File;
import java.util.Random;
public class TestCase2 {
public static void main(String[] args)
{
System.setProperty( "webdriver.firefox.bin" , "C:\\Program Files\\Mozilla Firefox\\firefox.exe" );
System.setProperty( "webdriver.gecko.driver" , "C:\\Users\\18431\\IdeaProjects\\SeleniumDemo\\bin\\geckodriver.exe" );
FirefoxOptions options = new FirefoxOptions();
FirefoxProfile profile = new FirefoxProfile( new File( "C:\\Users\\18431\\AppData\\Roaming\\Mozilla\\Firefox\\Profiles\\efzu2oem.default" ));
options.setProfile(profile);
FirefoxDriver driver = new FirefoxDriver();
driver.get( "https://login.m.taobao.com/login.htm" );
//下面开始完全模拟正常人的操作,所以你会看到很多 sleep 操作
WebElement usernameElement = driver.findElement(By.id( "username" ));
//模拟用户点击用户名输入框
usernameElement.click();
String username = "18588260144" ; //你的手机号
String password = "xxxxxxxxxxx" ; //你的密码
Random rand = new Random();
try {
for ( int i = 0 ; i <username.length() ; i++) {
Thread.sleep(rand.nextInt( 1000 )); //随机睡眠0-1秒
//逐个输入单个字符
usernameElement.sendKeys( "" +username.charAt(i));
}
WebElement passwordElement = driver.findElement(By.id( "password" ));
passwordElement.click();
//输入完成用户名后,随机睡眠0-3秒
Thread.sleep(rand.nextInt( 3000 ));
for ( int i = 0 ; i <password.length() ; i++) {
Thread.sleep(rand.nextInt( 1000 ));
passwordElement.sendKeys( "" +password.charAt(i));
}
driver.findElement(By.id( "btn-submit" )).click();
} catch (Exception e){
e.printStackTrace();
}
try {
Thread.sleep( 300000 );
} catch (InterruptedException ie){
ie.printStackTrace();
}
driver.quit();
}
}
|
总结
可以看出来,万变不离其宗,再难的模拟登录都是可以完全模拟人类的操作习惯去实现反爬虫的,好吧,全都告诉你了,PHP 爬虫技术不打算继续写下去了,感觉还是用 PHP 适合它做的事情比较好,PHP 写的爬虫段位太低,还是python 和 java 更好些。