【文件属性】:
文件名称:新浪微博数据挖掘方案
文件大小:848KB
文件格式:PDF
更新时间:2015-05-28 07:15:03
新浪微博 数据挖掘 方案
随着新浪微博用户群体的增长, 新浪微博的数据获
取是微博研究首先需要解决的问题。该文提出了基于新浪
微博API 与基于页面解析的新浪微博数据获取方案。程序
逻辑控制API 调用方法与频率, 获取JSON 对象并解析实现
高效数据获取。同时将传统的网络爬虫结合网页解析技术
结合API 同时使用, 解决了因API 接口开放不完善, 且因在
返回结果数量上限与调用频率方面的限制, 导致不能有效实
现新浪微博数据的全面获取的问题。经过实验测试, 通过2
套方案的结合可以实现新浪微博数据高效全面的获取。
网友评论
- 有一定的参考价值,内容不够具体
- 师兄hugo的论文啊。但是能谈的更具体就更好了。
- 思路是对的 但是随着微博的下降 可用性就降低了
- 网络爬虫如何应用在html中并结合API采集数据?没有具体些详细
- 对新版的新浪微博完全没用了
- 讲的不是很详细,没很大收获
- 希望能够在细化一点,可读性稍弱。
- 还是比较抽象啊!
- 做这个方面的,感觉挺不错的.
- 太粗略仅有点理论参考价值
- 技术细节还需详细一点
- 感觉一般,还是有借鉴意义的
- 整体性还可以,但是没有提供技术细节啊。。。
- 结果很一般
- 看起来比较吃力,感觉不详细