cURL
cURL可以使用URL的语法模拟浏览器来传输数据,因为它是模拟浏览器,因此它同样支持多种协议,FTP, FTPS, HTTP, HTTPS, GOPHER, TELNET, DICT, FILE 以及 LDAP等协议都可以很好的支持,包括一些:HTTPS认证,HTTP POST方法,HTTP PUT方法,FTP上传,keyberos认证,HTTP上传,代理服务器,cookies,用户名/密码认证,下载文件断点续传,上传文件断点续传,http代理服务器管道,甚至它还支持IPv6,scoket5代理服务器,通过http代理服务器上传文件到FTP服务器等等。
本文主要介绍的是php远程请求CURL(爬虫、保存登录状态)的相关内容,下面话不多说了,来一起看看详细的介绍吧
GET案例
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
|
/**
* curl_get
* @param $url
* @param null $param
* @param null $options
* @return array
*/
function curl_get( $url , $param = null, $options = null){
if ( empty ( $options )){
$options = array (
'timeout' => 30, // 请求超时
'header' => array (),
'cookie' => '' , // cookie字符串,浏览器直接复制即可
'cookie_file' => '' , // 文件路径,并要有读写权限的
'ssl' => 0, // 是否检查https协议
'referer' => null
);
} else {
empty ( $options [ 'timeout' ]) && $options [ 'timeout' ] = 30;
empty ( $options [ 'ssl' ]) && $options [ 'ssl' ] = 0;
}
$result = array (
'code' => 0,
'msg' => 'success' ,
'body' => ''
);
if ( is_array ( $param )){
$param = http_build_query( $param );
}
$url = strstr ( $url , '?' )?trim( $url , '&' ). '&' . $param : $url . '?' . $param ;
$ch = curl_init();
curl_setopt( $ch ,CURLOPT_URL, $url ); // 设置url
! empty ( $options [ 'header' ]) && curl_setopt( $ch , CURLOPT_HTTPHEADER, $options [ 'header' ]); // 设置请求头
if (! empty ( $options [ 'cookie_file' ]) && file_exists ( $options [ 'cookie_file' ])){
curl_setopt( $ch , CURLOPT_COOKIEFILE, $options [ 'cookie_file' ]);
curl_setopt( $ch , CURLOPT_COOKIEJAR, $options [ 'cookie_file' ]);
} else if (! empty ( $options [ 'cookie' ])){
curl_setopt( $ch , CURLOPT_COOKIE, $options [ 'cookie' ]);
}
curl_setopt( $ch , CURLOPT_ENCODING, 'gzip' ); //curl解压gzip页面内容
curl_setopt( $ch , CURLOPT_HEADER, 0); // 不获取请求头
curl_setopt( $ch , CURLOPT_RETURNTRANSFER, 1); // 输出转移,不输出页面
! $options [ 'ssl' ] && curl_setopt( $ch , CURLOPT_SSL_VERIFYPEER, $options [ 'ssl' ]); // 禁止服务器端的验证ssl
! empty ( $options [ 'referer' ]) && curl_setopt( $ch , CURLOPT_REFERER, $options [ 'referer' ]); //伪装请求来源,绕过防盗
curl_setopt( $ch , CURLOPT_TIMEOUT, $options [ 'timeout' ]);
//执行并获取内容
$output = curl_exec( $ch );
//对获取到的内容进行操作
if ( $output === FALSE ){
$result [ 'code' ] = 1; // 错误
$result [ 'msg' ] = "CURL Error:" .curl_error( $ch );
}
$result [ 'body' ] = $output ;
//释放curl句柄
curl_close( $ch );
return $result ;
}
|
POST案例
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
|
/**
* curl_post
* @param $url 请求地址
* @param null $param get参数
* @param array $options 配置参数
* @return array
*/
function curl_post( $url , $param = null, $options = array ()){
if ( empty ( $options )){
$options = array (
'timeout' => 30,
'header' => array (),
'cookie' => '' ,
'cookie_file' => '' ,
'ssl' => 0,
'referer' => null
);
} else {
empty ( $options [ 'timeout' ]) && $options [ 'timeout' ] = 30;
empty ( $options [ 'ssl' ]) && $options [ 'ssl' ] = 0;
}
$result = array (
'code' => 0,
'msg' => 'success' ,
'body' => ''
);
if ( is_array ( $param )){
$param = http_build_query( $param );
}
$ch = curl_init();
curl_setopt( $ch , CURLOPT_URL, $url ); // 设置url
! empty ( $options [ 'header' ]) && curl_setopt( $ch , CURLOPT_HTTPHEADER, $options [ 'header' ]); // 设置请求头
if (! empty ( $options [ 'cookie_file' ]) && file_exists ( $options [ 'cookie_file' ])){
curl_setopt( $ch , CURLOPT_COOKIEFILE, $options [ 'cookie_file' ]);
curl_setopt( $ch , CURLOPT_COOKIEJAR, $options [ 'cookie_file' ]);
} else if (! empty ( $options [ 'cookie' ])){
curl_setopt( $ch , CURLOPT_COOKIE, $options [ 'cookie' ]);
}
curl_setopt( $ch , CURLOPT_ENCODING, 'gzip' ); //curl解压gzip页面内容
curl_setopt( $ch , CURLOPT_POST, 1);
curl_setopt( $ch , CURLOPT_POSTFIELDS, $param );
curl_setopt( $ch , CURLOPT_HEADER, 0); // 不获取请求头
curl_setopt( $ch , CURLOPT_RETURNTRANSFER, 1); // 输出转移,不输出页面
! $options [ 'ssl' ] && curl_setopt( $ch , CURLOPT_SSL_VERIFYPEER, $options [ 'ssl' ]); // 禁止服务器端的验证ssl
! empty ( $options [ 'referer' ]) && curl_setopt( $ch , CURLOPT_REFERER, $options [ 'referer' ]); //伪装请求来源,绕过防盗
curl_setopt( $ch , CURLOPT_TIMEOUT, $options [ 'timeout' ]);
//执行并获取内容
$output = curl_exec( $ch );
//对获取到的内容进行操作
if ( $output === FALSE ){
$result [ 'code' ] = 1; // 错误
$result [ 'msg' ] = "CURL Error:" .curl_error( $ch );
}
$result [ 'body' ] = $output ;
//释放curl句柄
curl_close( $ch );
return $result ;
}
|
其他请求类型请自己参考封装处理
到此这篇关于php远程请求CURL(爬虫、保存登录状态)的文章就介绍到这了,更多相关php远程请求CURL(爬虫、保存登录状态)内容请搜索服务器之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持服务器之家!
原文链接:https://blog.csdn.net/qq_35606400/article/details/108023234