搜尋引擎的發展史
1990年初當時全球資訊網還未出現,為了查詢散佈在各個分散的主電腦中的檔案,曾有過Archie、Gopher等搜尋工具,隨著網際網路的迅速發展,基於HTTP訪問的web技術的迅速普及,他們就不再能適套用戶的需要。在1994年1月,第一個既可搜尋又可瀏覽的分類目錄EINet Galaxy(Tradewave Galaxy)上線,它還支援Gopher和Telnet搜尋。同年4月,Yahoo目錄誕生,隨著訪問量和收錄連結數的增長,開始支援簡單的資料庫查詢。這就是我們說的早期的目錄導航系統,他們的缺點網站收錄/更新都是要考人工維護,所以在訊息量劇增的條件下,就不是非常受用了。
1994年7月,Lycos推出了基於robot的資料發現技術,並支援搜尋結果關聯性排序,並且他第一個開始在搜尋結果中使用了網頁自動摘要。Infoseek也是同時期的一個重要代表,他們是搜尋引擎史上一個重要的進步。
1995年,一種新的搜尋引擎工具出現了——元搜尋引擎,第一個元搜尋引擎是華盛頓大學的學生開發的Metacrawler。使用者只需送出一次搜尋請求,由元搜尋引擎負責轉換處理後送出給多個預先選取的獨立搜尋引擎,並將從各獨立搜尋引擎返回的所有查詢結果,集中起來處理後再返回給使用者。
1995年12月才登場亮相的AltaVista推出了大量的創新功能使它迅速到達當時搜尋引擎的頂峰,它第一個支援自然語言搜尋的搜尋引擎,具備了基於網頁內容分析,智慧處理的能力,第一個實現進階搜尋語法的搜尋引擎(如AND、OR、NOT等),同時AltaVista還支援搜尋新聞群群組,搜尋圖片等具有劃時代意義的功能。同時期還有inktomi、HotBot等搜尋引擎。
1997年8月Northernlight 公司正式推出搜尋引擎,它第一個支援對搜尋結果進行簡單的自動分類,也是當時擁有最大資料庫的搜尋引擎之一。
1998年10月,Google誕生。它是目前最流行的搜尋引擎之一,具備很多獨特而且優秀的功能,並且在介面等實現了革命性創新。
1999年5月,Fast(Alltheweb)公司發佈了自己的搜尋引擎AllTheWeb,它的網頁搜尋可利用ODP自動分類,支援Flash和pdf搜尋,支援多語言搜尋,還提供新聞搜尋、圖像搜尋、視訊、MP3、和FTP搜尋,擁有極其強大的進階搜尋功能。它曾經是最流行的搜尋引擎之一,後在2003年2月被Overture收購。
在中文搜尋引擎領功能變數,1996年8月成立的搜狐公司是最早參與作網路訊息分類導航的網站,曾一度有「出門找地圖,上網找搜狐的」美譽。由於其人工分類送出的局限性,隨著網路訊息的暴增,逐漸被基於robot自動抓取智慧分類的新一代訊息技術取代。
臺灣中正大學吳升教授所領導的GAIS實驗室1998年1月創立了Openfind中文搜尋引擎,是最早開發的中文智慧搜尋引擎,採用GAIS實驗室推出多元排序(PolyRankTM)核心技術,截止2002年6月,宣佈累計抓取網頁35億,開始進入英文搜尋領功能變數。
北大天網是教育網最流行的搜尋引擎,它由北大電腦系網路與分散式系統研究室開發,於1997年10月29日正式在CERNET上提供服務, 2000年初成立天網搜尋引擎新課題群組,由國家973重點基礎研究發展規劃項目基金資助開發,收錄網頁約6000萬,利用教育網優勢,有強大的ftp搜尋功能。
百度中文搜尋由超鏈分析專利發明人、前Infoseek資深專案師李彥巨集和好友徐勇2000年1月建立,目前支援網頁訊息檢索,圖片,Flash,音樂等多媒體訊息的檢索。並且百度在中文領功能變數第一個開始使用ppc經營模式。
2002年開始很多公司受搜尋市場前景和Google神話的吸引,積極進入搜尋引擎市場,謀求一席之地。但是不幸的是他們當中很多公司尤其是不少中國公司採用流氓手段進行自己搜尋引擎的推廣工作,常用的手段是瀏覽器劫持、惡意捆綁adware/spyware等等,比較惡劣的典型公司是中搜、3721等等。
2003年11月,Yahoo全資收購3721公司。2005年8月,阿里巴巴和Yahoo達成戰略合作,全資收購雅虎中國,並更名為阿里巴巴雅虎,並將其業務重點全面轉向搜尋領功能變數。