【文件属性】:
文件名称:网页抓取图片的PHP类.zip
文件大小:2KB
文件格式:ZIP
更新时间:2022-07-31 04:11:24
类库下载-网页抓取图片的PHP类
<?php
header('Content-Type:text/html;charset=utf-8');
/**
* 一个用于抓去图片的类
*/
class download_image {
public $_save_path = NULL; //图片保存路劲
public $_limit_size = NULL; //图片限制大小
public static $_img_url_old = array(); //存储已抓取过的图片链接地址
public static $_a_page_url = array(); //存储抓取过的页面
public function __construct( $_save_path, $_limit_size) {
$this->_save_path = $_save_path;
$this->_limit_size = $_limit_size;
}
public function get_all_page_image( $site_url ) {
if ( $site_url == '' ) {
return false;
}
if ( ! in_array( $site_url, self::$_a_page_url ) ) { //判断当前页面是否抓取过
self::$_a_page_url[] = $site_url; //将超链接存入静态数组中
} else {
return; //若抓取过则跳出
}1.找到一个页面2.正则过滤所有的img3.正则过滤出所有的src的属性4.获取链接信息,写入文件 file_get_contents(), file_put_contents()5.在cli模式下运行代码(浏览器运行可能内存爆掉,或运行超时)
【文件预览】:
网页抓取图片的PHP类
----php中文网下载站.url(114B)
----php中文网免费下载站.txt(219B)
----tp.php(5KB)