Zeitgeist:计算和排序大文本文件中的单词频率

时间:2021-07-11 11:43:45
【文件属性】:
文件名称:Zeitgeist:计算和排序大文本文件中的单词频率
文件大小:3.13MB
文件格式:ZIP
更新时间:2021-07-11 11:43:45
C++ 时代精神 背景资料 Google 趋势 ( ) 会跟踪特定日期最流行的搜索词。 在这个作业中,你将设计一个数据结构,谷歌可以使用它来实现他们的“趋势”。 阶段 开发用例(书面描述、作业) 实现数据结构的天真版本(为您完成) 实现代码以测试用例的运行时间(作业) 实现数据结构的真实版本(作业) 使用用例评估您的数据结构版本(在课堂上) 数据结构要求 您的数据结构将支持四种操作: void increaseCount(string s, unsigned int amount) – 谷歌搜索引擎每次收到搜索词时都会调用这个函数,将“amount”设置为1。如果你的“trends”数据结构之前没有见过这个字符串,请添加它到数据结构,并将其计数设置为数量。 如果以前见过,则按数量增加该字符串的计数。 unsigned int getCount(string s) – 被谷歌用来确定特
【文件预览】:
Zeitgeist-master
----Trends.h(3KB)
----data()
--------1342.txt(688KB)
--------28885_txt.out(67KB)
--------4300_txt.out(564KB)
--------6130.txt(1.12MB)
--------28885.txt(169KB)
--------1342_txt.out(158KB)
--------3090_txt.out(479KB)
--------4300.txt(1.47MB)
--------23684.txt(265KB)
--------46_txt.out(81KB)
--------46.txt(174KB)
--------3090.txt(2.61MB)
--------23684_txt.out(137KB)
--------6130_txt.out(298KB)
----utilities.cpp(476B)
----smarterTrends.cpp(701B)
----utilities.h(122B)
----main.cpp(3KB)
----.gitignore(137B)
----naiveTrends.cpp(1KB)
----naiveTrends.h(358B)
----README.md(4KB)
----smarterTrends.h(232B)

网友评论