python搜索引擎

时间:2012-12-20 17:33:42
【文件属性】:
文件名称:python搜索引擎
文件大小:29KB
文件格式:RAR
更新时间:2012-12-20 17:33:42
python 搜索引擎 爬虫 lucene pagerank 纯python编写的搜索引擎原型,适合入门学习,源代码一共1000多行。包括一个通过XML配置的多线程的网络爬虫,最简单的analyzer,indexer,query,ranker,实现了词频排序和pagerank排序。还有一个简单的服务器模型。<原创>
【文件预览】:
asimo
----myserver.py(946B)
----cgi-bin()
--------search_cgi.py(3KB)
--------cache.py(1KB)
----__init__.py(0B)
----template()
--------asimo.gif(9KB)
--------result.htm(346B)
--------result_item.htm(228B)
----config.xml(616B)
----readme.txt(4KB)
----index.htm(265B)
----core()
--------bloom.py(3KB)
--------rank.py(6KB)
--------config.py(2KB)
--------secore.py(3KB)
--------analyzer.py(938B)
--------progress.py(2KB)
--------webspider.py(7KB)
--------index.py(4KB)
--------htmlparser.py(3KB)
--------utils.py(2KB)
--------__init__.py(0B)
--------query.py(2KB)

网友评论