Python爬虫:获取新浪网新闻

时间:2022-12-21 03:27:59

代码

#coding:utf-8

import requests
from bs4 import BeautifulSoup

res = requests.get("http://news.sina.com.cn/china/")
res.encoding = "utf-8"

soup = BeautifulSoup(res.text,'html.parser')
for news in soup.select('.blk122'):
# print news
new_as = news.select("a")
i = 1
for news_a in new_as:
print '第%d条新闻标题:'%i,news_a.text
i = i+1

结果

第1条新闻标题: 少将为何带500多名海军未来精英赴欧
第2条新闻标题: 9月18日 这4艘中国军舰齐聚日本海
第3条新闻标题: 中国最大市同时调整2名高层 其中1人为跨界入政
第4条新闻标题: “百名红通人员”王林娟回国投案 已到案45人
第5条新闻标题: 海军戚继光舰首次远航实习出访 舰上能唱K健身
第6条新闻标题: 35颗卫星3重天网 中国这个全球定位系统厉害了
第7条新闻标题: 港中大“标语战”升级 有人贴出:这里就是中国
第8条新闻标题: 韩媒:萨德问题致韩企对中国直接投资缩水近一半
第9条新闻标题: 刚与台“断交”三个月 *总统对中国送祝愿
第10条新闻标题: 天舟一号与天宫二号分离 最终将陨落太平洋
第11条新闻标题: 新华社:从金砖国家*会晤看五大民生实惠