前生今世——搜索引擎发展史

1990年以前,没有任何人能搜索互联网。

  所有搜索引擎的祖先,是1990年由MontrealMcGill University学生Alan EmtagePeter DeutschBill Wheelan发明的Archie(Archie FAQ)。当时World Wide Web还未出现。Archie是第一个自动索引互联网上匿名FTP网站文件的程序,但它还不是真正的搜索引擎。Archie是一个可搜索的FTP文件名列表,用户必须输入精确的文件名搜索,然后Archie会告诉用户哪一个FTP地址可以下载该文件。

 

  由于Archie深受欢迎,受其启发,Nevada System Computing Services大学于1993年开发了一个GopherGopher FAQ)搜索工具VeronicaVeronica FAQ)。Jughead是后来另一个Gopher搜索工具。

 

  由于专门用于检索信息的Robot程序象蜘蛛(spider)一样在网络间爬来爬去,因此,搜索引擎的Robot程序被称为spider(Spider FAQ)程序。世界上第一个Spider程序,是MIT Matthew GrayWorld wide Web Wanderer,用于追踪互联网发展规模。刚开始它只用来统计互联网上的服务器数量,后来则发展为也能够捕获网址(URL)。

 

  与Wanderer相对应,199310Martijn Koster创建了ALIWEBMartijn Koster Annouces the Availability of Aliweb),它相当于ArchieHTTP版本。ALIWEB不使用网络搜寻Robot,如果网站主管们希望自己的网页被ALIWEB收录,需要自己提交每一个网页的简介索引信息,类似于后来大家熟知的Yahoo

 

  1993年底,一些基于此原理的搜索引擎开始纷纷涌现,其中最负盛名的三个是:ScotlandJumpStationColorado 大学Oliver McBryanThe World Wide Web WormFirst Mention of McBryan’s World Wide Web Worm)、NASARepository-Based Software Engineering (RBSE) spider

 

  19932月,6Stanford(斯坦福)大学生的想法是分析字词关系,以对互联网上的大量信息作更有效的检索。这就是Excite。后来曾以概念搜索闻名,20025月,被Infospace收购的Excite停止自己的搜索引擎,改用元搜索引擎Dogpile

 

  19941月,第一个既可搜索又可浏览的分类目录EINet GalaxyTradewave Galaxy)上线。除了网站搜索,它还支持GopherTelnet搜索。 

 

  19944月,Stanford两名博士生,美籍华人Jerry Yang(杨致远)和David Filo共同创办了Yahoo。随着访问量和收录链接数的增长,Yahoo目录开始支持简单的数据库搜索。因为Yahoo!的数据是手工输入的,所以不能真正被归为搜索引擎,事实上只是一个可搜索的目录。搜索效率明显提高。(Yahoo以后陆续使用AltavistaInktomiGoogle提供搜索引擎服务)

 

  1994年初,Washington大学CS学生Brian Pinkerton开始了他的小项目WebCrawlerBrian Pinkerton Announces the Availability of Webcrawler)。1994420日,WebCrawler正式亮相时仅包含来自6000个服务器的内容。WebCrawler是互联网上第一个支持搜索文件全部文字的全文搜索引擎,在它之前,用户只能通过URL和摘要搜索,摘要一般来自人工评论或程序自动取正文的前100个字。(后来webcrawler陆续被AOLExcite收购,现在和excite一样改用元搜索引擎Dogpile

 

  LycosCarnegie Mellon University Center for Machine Translation Announces Lycos )是搜索引擎史上又一个重要的进步。Carnegie Mellon UniversityMichael MauldinJohn Leavittspider程序接入到其索引程序中,创建了Lycos1994720日,数据量为54,000Lycos正式发布。除了相关性排序外,Lycos还提供了前缀匹配和字符相近限制,Lycos第一个在搜索结果中使用了网页自动摘要,而最大的优势还是它远胜过其它搜索引擎的数据量:19948月--394,000 documents19951月--1.5 million documents199611月--over 60 million documents。(注:19994月,Lycos停止自己的Spider,改由Fast提供搜索引擎服务)

 

  InfoseekSteve Kirsch Announces Free Demos Of the Infoseek Search Engine)是另一个重要的搜索引擎,虽然公司声称19941月已创立,但直到年底它的搜索引擎才与公众见面。起初,Infoseek只是一个不起眼的搜索引擎,它沿袭Yahoo!Lycos的概念,并没有什么独特的革新。但是它的发展史和后来受到的众口称赞证明,起初第一个登台并不总是很重要。Infoseek友善的用户界面、大量附加服务(such as UPS tracking, News, a directory, and the like) 使它声望日隆。而199512月与Netscape的战略性协议,使它成为一个强势搜索引擎:当用户点击Netscape浏览器上的搜索按钮时,弹出Infoseek的搜索服务,而此前由Yahoo!提供该服务。(注:Infoseek后来曾以相关性闻名,20012月,Infoseek停止了自己的搜索引擎,开始改用Overture的搜索结果)

 

  1995年,一种新的搜索引擎形式出现了——元搜索引擎(A Meta Search Engine Roundup)。用户只需提交一次搜索请求,由元搜索引擎负责转换处理后提交给多个预先选定的独立搜索引擎,并将从各独立搜索引擎返回的所有查询结果,集中起来处理后再返回给用户。第一个元搜索引擎,是Washington大学硕士生 Eric Selberg Oren Etzioni Metacrawler。元搜索引擎概念上好听,但搜索效果始终不理想,所以没有哪个元搜索引擎有过强势地位。 

 

  DECAltaVista(2001年夏季起部分网友需通过p-roxy访问,无p-roxy可用qbseach单选altavista搜索,只能显示第一页搜索结果)是一个迟到者,199512月才登场亮相(AltaVista Public Beta Press Release )。但是,大量的创新功能使它迅速到达当时搜索引擎的顶峰。Altavista最突出的优势是它的速度(搜索引擎9238:比较搞笑,设计altavista的目的,据说只是为了展示DEC Alpha芯片的强大运算能力)。  而Altavista的另一些新功能,则永远改变了搜索引擎的定义。AltaVista是第一个支持自然语言搜索的搜索引擎,AltaVista是第一个实现高级搜索语法的搜索引擎(如AND, OR, NOT)。用户可以用AltaVista搜索Newsgroups(新闻组)的内容并从互联网上获得文章,还可以搜索图片名称中的文字、搜索Titles、搜索Java applets、搜索ActiveX objectsAltaVista也声称是第一个支持用户自己向网页索引库提交或删除URL的搜索引擎,并能在24小时内上线。AltaVista最有趣的新功能之一,是搜索有链接指向某个URL的所有网站。在面向用户的界面上,AltaVista也作了大量革新。它在搜索框区域下放了“tips”以帮助用户更好的表达搜索式,这些小tip经常更新,这样,在搜索过几次以后,用户会看到很多他们可能从来不知道的的有趣功能。这系列功能,逐渐被其它搜索引擎广泛采用。1997年,AltaVista发布了一个图形演示系统LiveTopics,帮助用户从成千上万的搜索结果中找到想要的。

 

  然后到来的是HotBot1995926日,加州伯克利分校CS助教Eric Brewer、博士生Paul Gauthier创立了InktomiUC Berkeley Announces Inktomi),1996520日,Inktomi公司成立,强大的HotBot出现在世人面前。声称每天能抓取索引1千万页以上,所以有远超过其它搜索引擎的新内容。HotBot也大量运用cookie储存用户的个人搜索喜好设置。(Hotbot曾是随后几年最受欢迎的搜索引擎之一,后被Lycos收购)

 

  Northernlight 公司于19959月成立于马萨诸塞州剑桥,19978月,Northernlight搜索引擎正式现身。它曾是拥有最大数据库的搜索引擎之一,它没有Stop Words,它有出色的Current News7,100多出版物组成的Special Collection、良好的高级搜索语法,第一个支持对搜索结果进行简单的自动分类。(2002116日,Northernlight公共搜索引擎关闭,随后被divine收购,但在Nlresearch,选中"World Wide Web only",仍可使用Northernlight搜索引擎)

 

  199810月之前,Google只是Stanford大学的一个小项目BackRub1995年博士生Larry Page开始学习搜索引擎设计,于1997915日注册了google.com的域名,1997年底,在Sergey BrinScott HassanAlan Steremberg的共同参与下,BachRub开始提供Demo19992月,Google完成了从Alpha版到Beta版的蜕变。Google公司则把1998927日认作自己的生日。

  GooglePagerank、动态摘要、网页快照、DailyRefresh、多文档格式支持、地图股票词典寻人等集成搜索、多语言支持、用户界面等功能上的革新,象Altavista一样,再一次永远改变了搜索引擎的定义。

  在2000年中以前,Google虽然以搜索准确性备受赞誉,但因为数据库不如其它搜索引擎大,缺乏高级搜索语法,所以使用价值不是很高,推广并不快。直到2000年中数据库升级后,又借被Yahoo选作搜索引擎的东风,才一飞冲天。

 

  FastAlltheweb)公司创立于1997年,是挪威科技大学(NTNU)学术研究的副产品。19995月,发布了自己的搜索引擎AllTheWebFast创立的目标是做世界上最大和最快的搜索引擎,几年来庶几近之。FastAlltheweb)的网页搜索可利用ODP自动分类,支持Flashpdf搜索,支持多语言搜索,还提供新闻搜索、图像搜索、视频、MP3、和FTP搜索,拥有极其强大的高级搜索功能。

 

  Teoma 起源于1998Rutgers大学的一个项目。Apostolos Gerasoulis教授带领华裔Tao Yang教授等人创立Teoma于新泽西Piscataway2001年春初次登场,20019月被提问式搜索引擎Ask Jeeves收购,20024月再次发布。Teoma的数据库目前仍偏小,但有两个出彩的功能:支持类似自动分类的Refine;同时提供专业链接目录的Resources

 

  Wisenut 由韩裔Yeogirl Yun创立。2001年春季发布Beta版,200195日发布正式版,20024月被分类目录提供商looksmart收购。wisenut也有两个出彩的功能:包含类似自动分类和相关检索词的WiseGuide;预览搜索结果的Sneak-a-Peek

 

  Gigablast 由前Infoseek工程师Matt Wells创立,20023月展示pre-beta版,2002721日发布Beta版。Gigablast的数据库目前仍偏小,但也提供网页快照,一个特色功能是即时索引网页,你的网页刚提交它就能搜索(注:这个spammers的肉包子功能暂已关闭)。

 

  Openfind 创立于19981月,其技术源自台湾中正大学吴升教授所领导的GAIS实验室。Openfind起先只做中文搜索引擎,曾经是最好的中文搜索引擎,鼎盛时期同时为三大著名门户新浪、奇摩、雅虎提供中文搜索引擎,但2000年后市场逐渐被BaiduGoogle瓜分。20026月,Openfind重新发布基于GAIS30 ProjectOpenfind搜索引擎Beta版,推出多元排序(PolyRankTM),宣布累计抓取网页35亿,开始进入英文搜索领域,此后技术升级明显加快。

 

  北大天网 是国家"九五"重点科技攻关项目"中文编码和分布式中英文信息发现"的研究成果,由北大计算机系网络与分布式系统研究室开发,于19971029日正式在CERNET上提供服务。2000年初成立天网搜索引擎新课题组,由国家973重点基础研究发展规划项目基金资助开发,收录网页约6000万,利用教育网优势,有强大的ftp搜索功能。

 

 

Baidu 20001月,超链分析专利发明人、前Infoseek资深工程师李彦宏与好友徐勇(加州伯克利分校博士)在北京中关村创立了百度(Baidu)公司。20018月发布Baidu.com搜索引擎Beta版(此前Baidu只为其它门户网站搜狐新浪Tom等提供搜索引擎),20011022日正式发布Baidu搜索引擎。Baidu虽然只提供中文搜索,但目前收录中文网页超过9000万,可能是最大的的中文数据库。Baidu搜索引擎的其它特色包括:网页快照、网页预览/预览全部网页、相关搜索词、错别字纠正提示、新闻搜索、Flash搜索、信息快递搜索。20023月闪电计划(Blitzen Project

麻麻搜宝app下载-麻麻搜宝app是一款专注于母婴产品在线购买的软件,通过麻麻搜宝app你可以方便的购买到自己需要的母婴产品,对于有需要的朋友来说非常的不错,您可以免费下载安卓手机麻麻搜宝。
2017-04-13
全民宜购app下载-全民宜购app是一款网络购物应用,是个精选海量优质商品的B2B商城购物平台。在全民宜购app中你可便捷的查询产品信息,了解近期实惠活动信息,享受贴心、快捷的线上购物服务等,您可以免费下载安卓手机全民宜购。
2020-07-24
勤赚金官方下载-勤赚金软件是一款非常实用的兼职赚钱平台,勤赚金app为用户推出了海量的兼职信息,勤赚金软件兼职类型十分丰富,可自由选择感兴趣的内容,您可以免费下载安卓手机勤赚金。
2020-06-30
手机提词器app是一款实用的视频录制提词工具。软件为用户提供了实用的提词功能,适用于多种场景,让用户不再为记不住台词而烦劳,工作生活更便捷。
2023-02-28
惠普无线打印机app下载-惠普无线打印App是一款惠普旗下的手机打印APP,在惠普无线打印App中你可以直接连接以后就可以打印照片和文档了,不管是在在打印方面还是很方便快捷的,感兴趣小伙伴千万不要错过了,现在就点击下载吧,您可以免费下载安卓手机惠普无线打印。
2020-04-24
不思议迷宫不思议同学会北京的试炼题目已经开启了,这些题目的答案你们都知道吗?可能还有些玩家还不知道有些题目的正确答案是哪一个。就来一起看不思议同学会北京的试炼所有题目的答案吧!,不思议迷宫不思议同学会北京的试炼题目答案
2018-11-09
呱呱K歌伴侣是一款专业的音乐K歌软件,这款软件拥有很多好的歌词,如果喜欢唱歌的朋友这款软件肯定不会错过,呱呱k歌伴侣怎么用呢?小编和大家分享下,如果对这款软件还操作不太会的朋友一定要看看哦,呱呱k歌伴侣怎么用
2014-12-25
随着“侠隐降临”新版本的开启,带来大量属性提升的“炼魂金装”成为了大唐无双手游里最热的关键词,作为金装主要产出地的历练副本,迎来了全新地图——夜香阁。那么大唐无双夜香阁怎么玩?下面,就和小编一起来看吧。,大唐无双夜香阁怎么玩 大唐无双夜香阁通关技巧介绍
2017-04-10
唐唐海外app下载-唐唐app是一款提供海外生活服务的客户端应用,唐唐提供诸如生活、学习、金融、医疗等服务,智能匹配,提供细心的服务,并且还可以在上面认识新朋友,让您到异国也不不会觉得陌生,满足您所有的需求,您可以免费下载安卓手机唐唐。
2016-09-30
近日,“淘气值”作为淘宝网的全新会员体系正式亮相,用户在手机淘宝“我的淘宝”——“会员中心”即可看到自己的淘气值,淘气值是什么意思 淘宝淘气值有什么用
2016-07-20