paip.抓取网页内容--java php python

时间:2022-01-09 15:01:27

paip.抓取网页内容--java php python.txt



作者Attilax  艾龙, EMAIL:1466519819@qq.com

来源:attilax的专栏

地址:http://blog.csdn.net/attilax



//////////java

String urlContent = WebpageContent("http://www.123cha.com/ip/?q="+ip,"utf-8");







///////////php

file_get_contents($url);

 curl_init()>>>curl_exec

 fopen->fread->fclose

 

 

 /////python

 urllib.urlopen(url).read()

 response = urllib2.urlopen('http://www.baidu.com/')  

html = response.read()  

 

 ///ahk

 UrlDownloadToFile, URL, Filename



 

 

 public String downloadPage(String Url, String encode) {

        try {

            URL pageUrl = new URL(Url);

            // Open connection to URL for reading.

            BufferedReader reader = new BufferedReader(new InputStreamReader(

                    pageUrl.openStream(), encode));

            // BufferedReader br = new BufferedReader(new InputStreamReader(in,

            // "gbk"));

            // Read page into buffer.

            String line;

            StringBuffer pageBuffer = new StringBuffer();

            while ((line = reader.readLine()) != null) {

                pageBuffer.append(line);

            }

            String s = pageBuffer.toString();

            return s;

            // System.out.println(s);

            // return pageBuffer.toString();

        } catch (Exception e) {

            // return null;

            throw new RuntimeException(e);

        }



    }



 

 

 参考:

 php获取网页内容方法总结_php技巧_脚本之家.htm

 Python 3 抓取网页资源的 N 种方法.htm