【文件属性】:
文件名称:hacker-news-digest:带有摘要和缩略图的Hacker News响应界面
文件大小:1.16MB
文件格式:ZIP
更新时间:2021-02-03 19:32:07
python html rss content crawler
该服务从文章中提取摘要和插图,供那些想充分利用的人使用,同时减少了在决定阅读哪个和跳过哪个方面时所花的时间。
另请参阅有关指南。
产品特点
灵敏的现代界面非常适合手机
摘要和图像使文章可扫描
普通视频站点,PDF和github要点直接嵌入
还显示了子域及其可爱的图标
按分数/评论/时间对文章进行排序
RSS feed可以按分数和关键字进行自定义
谈话很便宜,说明对我有什么用!
去做
删除网站的更好方法(也许是PhantomJS和Selenium)
一个更漂亮的主页(也许在HTML9中)
提取摘要的更好算法
按分数/评论/时间对文章进行排序
的RSS
睡个好觉!重要
执照
中文版的
【文件预览】:
hacker-news-digest-master
----runtime.txt(14B)
----Dockerfile(734B)
----.gitignore(584B)
----README.md(2KB)
----config.py(1KB)
----models.py(6KB)
----test()
--------test_hackernews_parser.py(955B)
--------test_pdf_parser.py(808B)
--------README.md(297B)
--------test_html_parser.py(15KB)
--------fixtures()
--------test_embeddable_parser.py(5KB)
--------test_utils.py(637B)
--------__init__.py(141B)
--------test_database.py(1KB)
--------test_image.py(1KB)
----Procfile(24B)
----static()
--------css()
--------sitemap.xml(515B)
--------fonts()
--------qr_zhifubao.png(94KB)
--------apple-touch-icon.png(2KB)
--------spinner.gif(112KB)
--------js()
--------ads.txt(58B)
--------favicon.ico(15KB)
----[tutorial] How-to-extract-main-content-from-web-pages-using-Machine-Learning.ipynb(43KB)
----.buildpacks(102B)
----index.py(5KB)
----hackernews.py(6KB)
----page_content_extractor()
--------README.md(835B)
--------exceptions.py(38B)
--------utils.py(3KB)
--------__init__.py(2KB)
--------embeddable.py(5KB)
--------html.py(14KB)
--------pdf.py(3KB)
--------webimage.py(4KB)
--------imgsz.py(13KB)
----config()
--------nginx.conf.erb(2KB)
--------blueware.ini(8KB)
--------newrelic.ini(9KB)
----requirements.txt(305B)
----LICENSE-lgpl-3.0.txt(7KB)
----startupnews.py(563B)
----.travis.yml(154B)
----templates()
--------startupnews.html(1KB)
--------hackernews.html(1KB)
--------base.html(11KB)
----Makefile(1KB)