使用Python保存网页上的图片或者保存页面为截图

时间:2021-10-24 03:25:52

Python保存网页图片
这个是个比较简单的例子,网页中的图片地址都是使用'http://。。。。.jpg'这种方式直接定义的。

使用前,可以先建立好一个文件夹用于保存图片,本例子中使用的文件夹是 d:\\pythonPath这个文件夹

代码如下:

?
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
# -*- coding: UTF-8 -*-
import os,re,urllib,uuid
 
#首先定义云端的网页,以及本地保存的文件夹地址
urlPath='http://gamebar.com/'
localPath='d:\\pythonPath'
 
 
#从一个网页url中获取图片的地址,保存在
#一个list中返回
def getUrlList(urlParam):
  urlStream=urllib.urlopen(urlParam)
  htmlString=urlStream.read()
  if( len(htmlString)!=0 ):
    patternString=r'http://.{0,50}\.jpg'
    searchPattern=re.compile(patternString)
    imgUrlList=searchPattern.findall(htmlString)
    return imgUrlList
 
     
#生成一个文件名字符串 
def generateFileName():
  return str(uuid.uuid1())
 
   
#根据文件名创建文件 
def createFileWithFileName(localPathParam,fileName):
  totalPath=localPathParam+'\\'+fileName
  if not os.path.exists(totalPath):
    file=open(totalPath,'a+')
    file.close()
    return totalPath
   
 
#根据图片的地址,下载图片并保存在本地 
def getAndSaveImg(imgUrl):
  if( len(imgUrl)!= 0 ):
    fileName=generateFileName()+'.jpg'
    urllib.urlretrieve(imgUrl,createFileWithFileName(localPath,fileName))
 
 
#下载函数
def downloadImg(url):
  urlList=getUrlList(url)
  for urlString in urlList:
    getAndSaveImg(urlString)
     
downloadImg(urlPath)

保存的文件如下:

使用Python保存网页上的图片或者保存页面为截图

网页的一部分保存为图片
主要思路是selenium+phantomjs(中文网页需要设置字体)+PIL切图

?
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
def webscreen():
  url = 'http://www.xxx.com'
  driver = webdriver.PhantomJS()
  driver.set_page_load_timeout(300)
  driver.set_window_size(1280,800)
  driver.get(url)
  imgelement = driver.find_element_by_id('XXXX')
  location = imgelement.location
  size = imgelement.size
  savepath = r'XXXX.png'
  driver.save_screenshot(savepath)
  im = Image.open(savepath)
  left = location['x']
  top = location['y']
  right = left + size['width']
  bottom = location['y'] + size['height']
  im = im.crop((left,top,right,bottom))
  im.save(savepath)