Nutch的发展历程

时间:2023-03-10 01:08:30
Nutch的发展历程

Nutch的创始人是Doug Cutting,他同时也是Lucene、Hadoop和Avro开源项目的创始人

下面是Nutch的发展历程:

月由Doug Cutting发起,托管于Sourceforge,之后发布了0.4、0.5、0.6三个版本

2004年9月Oregon State University(俄勒冈州立大学)采用Nutch

2004年9月Creative Commons(知识共享)推出基于Nutch的搜索服务

月加入Apache的孵化器

2005年6月孵化结束成为Lucene的子项目

月发布版本0.7(Apache Lucene sub-project)

2005年10月发布版本0.7.1

2006年3月发布版本0.7.2

2006年7月发布版本0.8(全新的架构,基于Hadoop0.4 ,Hadoop诞生)

2006年9月发布版本0.8.1

2007年4月发布版本0.9

2009年3月发布版本1.0(Tika诞生,0.1-incubating)

2010年4月Nutch成为Apache*项目

2010年6月发布版本1.1

2010年9月发布版本1.2

2011年6月发布版本1.3(从搜索引擎到网络爬虫)

月发布版本1.4

2012年6月发布版本1.5

2012年7月发布版本2.0(2.X  Gora诞生,table-based architecture)

2012年7月发布版本1.5.1

2012年8月Nutch诞生十周年

月发布版本2.1( 2.X开始支持elastic search )

月发布版本1.6

2013年6月发布版本2.2(crawler-commons 诞生)

2013年6月发布版本1.7(crawler-commons 诞生)

月发布版本2.2.1

2014年3月发布版本1.8

2014年8月发布版本1.9

2015年1月发布版本2.3