搜尋引擎技術發展推動網路資訊檢索模式持續演進

你知道在Google之前的第一個搜尋引擎是誰嗎?

# 「Archie」SEO這一回事,似乎比Google還早出現。其實很多人都沒太注意,「Google」爆紅之前,大家在網路上找資料,好像主要是靠一些比較舊的搜尋工具或什麼目錄型網站。那時候大概將近三十年前了吧?「SEO」這個詞彙,其實很後來才慢慢流行起來的。

有些人會說:「不要再一直幫Google做免費宣傳了啦!」講得也不是沒有道理。畢竟他們好像不提供什麼推薦連結分潤計畫(至少目前沒聽說),你推廣再多,也不會直接因此拿到什麼獎勵。反而有些SEO相關服務,偶爾會有推薦獎金,雖然金額大多不算特別高,但有人就願意去研究怎樣轉介、怎樣可以賺點外快。

那最早期的搜尋引擎到底是哪個?普遍說法是「Archie」應該算第一批之一,差不多網路剛興起沒多久,它就出現了。當時功能其實蠻陽春,大約只能處理一些檔案清單,不像現在搜尋引擎這麼花俏。不過它確實幫助過不少早年用戶找到資源。有些人可能還記得那種全黑底白字、操作又卡又慢的感覺——那年代也真是有點懷舊味。

至於那些號稱全球成長型組織啊、NGO背景什麼的,有時候也會講到搜索工具發展史,但細節版本都好像不太一致。有的人記得時間線,有的人則只提名字。有時候你查閱不同地方資料,還會發現數據和年份略有差異。總之,可以肯定的是,「Google」紅起來前很久,其實已經有一小撮人默默開始琢磨怎樣讓網站容易被找到,只是當年的玩法跟現在差很多就是了。

如果想要靠推廣SEO賺錢,目前看起來好像還是要找其他方案,不要太依賴某幾家大品牌。畢竟市場生態變動滿快的,也許未來幾年又冒出新的模式也說不定。

Archie如何用FTP檔案搜尋改變了網路世界?

有時候,網路上東西一多,怎麼找都像在大海撈針。那時候,大概三十多年前,加拿大有個年輕人在麥基爾大學唸書,他叫 Alan Emtage。他好像注意到,大家用的不是現在這種網頁,而是靠某種叫 FTP 的東西互相分享檔案。其實,那會兒網站還沒什麼影子,幾乎大家全憑那套舊系統走跳。

FTP,全名應該是檔案傳輸協定吧?反正,就是讓人可以從遠方伺服器拉資料下來。不過說真的,要找到想要的東西並不容易,好像得一個個去翻,挺費工夫。有些人也許會覺得很煩。

Emtage 那時就想了點辦法——他弄出一套程式,好像名字跟「archive」有點關係,只是少了中間那個字母。據說這個程式會自動跑去各地的 FTP 站台,把那些公開目錄抓下來,再丟進某種資料庫裡面存著。後來,這些資訊就變成能搜尋的樣子,用起來方便不少。

事情是不是發生在九零年代初頭?好像也有人記得稍微再早一些,但總之,那段時間差不多就是這樣。有趣的是,「Archie」到底算不算第一個搜尋工具,有些老朋友偶爾還會討論。不過,在當時那環境,它確實為很多需要找東西的人帶來了一些幫助啦。至於後續怎麼演變,就又是另一回事了。

Comparison Table:
搜尋工具名稱特點商業化歷程使用者影響現狀
AltaVista速度快、進階查詢功能曾被廣泛使用,後被Google取代老用戶懷念其全站索引能力已不再是主流搜尋引擎
Excite多元服務(信箱、新鮮新聞)嘗試做入口網站,與其他搜尋引擎合作過界面複雜讓部分用戶困惑逐漸消失於市場
Infoseek廣告與搜尋結果結合的早期平台商業化推動發展,但使用者反應不一部分用戶感到困擾,另一些認為促進了成長現在幾乎無人提及
OpenText支援複雜查詢邏輯的系統早期商業市場參與者之一,但詳細資訊各有不同說法對某些專業領域用戶較方便仍在某些專業圈中存在
DMOZ (ODP)開放式目錄,由志工編輯維護許多SEO策略依賴此平台獲得曝光機會社群氛圍濃厚但更新緩慢於2017年正式關閉

Archie如何用FTP檔案搜尋改變了網路世界?

Veronica和Jughead這對Gopher時代的搜尋雙胞胎有什麼故事?

好像在很久以前,那時候網路還沒這麼普及,有個叫Archie的東西出現過。有人說它是用來搜尋FTP檔案的,只要打進去一個關鍵字,螢幕上就會跳出一串跟那個詞有點關聯的檔名,位置也都大致標示出來。內容本身倒是不會被查到,純粹就是看那個檔案名字和放在哪裡。現在回頭想想,也許會覺得這套系統真的挺陽春,但當初對不少人來說應該算是蠻新奇的發明。

其實Google那些超強大的搜尋引擎還沒冒出頭時,Archie已經先走了一步——雖然功能比起現在簡單了數十倍,它多少展現了自動整理網路資訊這件事有多方便。有些學者後來就把Archie歸在「搜尋引擎」的開山祖師爺那種角色,不過這種講法可能也只是部分人的意見而已。

至於Alan Emtage,他參與了Archie計畫,大概也因此變得比較有名吧?很多資料都提到他負責了這套工具。不知道為什麼,到現在相關討論偶爾還會提到他的名字,好像大家都認為他幫忙推動了數位資訊整理往前走了好幾步。至於是不是劃時代、或是影響力到底到哪裡,感覺不同圈子的人看法不太一樣,總之在電腦歷史裡,他做過的事情還算值得一提。

Aliweb為什麼被稱為第一個真正的網頁搜尋引擎?

好像在網路剛開始興起的那段日子,有些人還記得「Gopher」這個名字。差不多三十年前,Veronica 這東西冒出來,它主要是在協助大家搜尋那些純文字選單,算是跟 Archie 各有分工。不過,Veronica 跟現在我們熟悉的網頁有點距離,它大概只是讓當時的人能夠比較容易找到資訊而已。

之後沒多久,有個叫 Aliweb 的網站也出現了。有人說它可能是最早的那種「網頁」搜尋工具,但其實運作方式和我們現在看到的不太一樣。Aliweb 不會自己到處亂爬資料,反而是讓站長自己提交內容,所以資料來源有點依賴別人的主動性。這種做法,好像也帶來一些限制吧?

還有 Jughead,那時候專門針對單一伺服器去找 Gopher 資料。用過的人感覺應該沒有 Veronica 那麼多,可是在某些場景下,也許會方便一些。

至於 Wandex,大約同一時期出現的,它被認為是比較早期開始自動抓取網頁內容的機器人之一。有些紀錄顯示它和其他搜尋技術相比,確實引入了自動化,不過當時能索引到多少內容,其實也有限度。

總之,那段時間,各種不同的小工具和想法交錯出現。有些東西很快就消失了,有些則慢慢演變成今天看到的模樣。不過哪一個真的影響最大,好像也說不準。

Aliweb為什麼被稱為第一個真正的網頁搜尋引擎?

WebCrawler如何開啟全文檢索的新紀元?

說到九零年代中期,有一陣子好像不少人都在摸索怎麼整理網路上的資料。那時有個叫「Galaxy」的網站,大致上是一種早期的網頁目錄,內容主要是把網站按照主題和類別分門別類,這種做法當時應該還算新鮮,不過是不是最早也很難說。有些人可能記得另外幾個差不多時期出現的平台,比如「WebCrawler」,聽說它大約是在七十多年前後開始運作,據說當初允許大家用關鍵字去找任意網頁裡的單詞,對某些使用者來講挺方便,但好不好用見仁見智。再來,「Lycos」也是差不多那段時間冒出來的東西,據稱發源自卡內基美隆大學,好像很快就變成商業化服務了。不過具體哪個功能是誰先有、哪些改進是後來才慢慢加進去,其實現在回頭看有點模糊。整體而言,那時候搜尋引擎和分類型目錄並存,彼此之間到底哪家比較受歡迎,也不是每個人印象都一樣。

Lycos和AltaVista這些90年代搜尋巨頭是怎麼崛起的?

如果回想起網路剛開始流行的時候,好像有那麼幾個搜尋工具特別容易被提起。有一陣子,AltaVista 聽說速度比多數同時期的網站都快,還有些進階功能,蠻多人一度覺得這東西用起來還算方便。後來,大概過了沒幾年,Google 慢慢冒出頭來,就變成大部分人會選的新選項。不過 AltaVista 那種全站索引、查詢細緻的印象,好像在不少老用戶心中留下痕跡。

至於 Excite,那時好像也不只是做搜尋而已。他們還搞了什麼信箱啊、新鮮新聞、各式入口聚合,感覺介面上東西滿多,不單只靠找資料維生。當然,有些人可能會把它跟其他入口網站混淆,不過那年代大家就是這樣嘗試不同服務。

Infoseek 這名字現在聽到的人應該不太多。當初他們好像是較早嘗試把廣告和搜尋結果結合在一起的平台之一,但這種設計是不是討喜就見仁見智了。有朋友提過,某段時間裡 Infoseek 的廣告方式讓部分使用者有點小困擾,不過也有人認為商業化多少帶動了發展。

OpenText,大約也是九零年代中段出現的產品之一。據說,他們那套系統支援比較複雜的查詢邏輯,也和一些公司談合作。如果問細節,其實很多人記得的不太一樣,有人說那時候 OpenText 算是比較早進入商業市場的一批,但具體情況每個人口徑都有點差距。

總之,那陣子各家搜尋平台百花齊放,有些名字現在幾乎消失在大眾視野裡,只剩下少數人在偶爾聊天時才會提到。

Lycos和AltaVista這些90年代搜尋巨頭是怎麼崛起的?

Yahoo從手動目錄變成搜尋巨頭的轉型秘辛

說起來,在九〇年代中期,有個叫 Magellan 的東西,好像是某種由人手挑選、整理網站的目錄。那會兒資訊量沒現在這麼爆炸,很多網站還得靠人工分類才能讓人找到。有些人記得它還會對網站做點分級或評分,類似打幾顆星那樣,但細節大家印象不一。結構上有點像 Yahoo,那時候不少人都這麼覺得。

Yahoo!嘛,一開始差不多就是靠一群人慢慢把網站分類,說是目錄,其實更像一本很厚很雜的黃頁。大約在快要進入新世紀前後,他們好像開始跟其他搜尋引擎合作,有段時間用 AltaVista,之後又換過 Google。演變過程裡頭,好像有那麼一陣子讓人搞不清到底算目錄還是搜尋引擎,反正就是一直變動。有人會懷念當初全靠人工整理的時代,但現在想想,也許那只是當年條件下不得已的選擇吧——畢竟網路規模才剛起步,用戶數可能只有現在的零頭左右。

Ask Jeeves用自然語言搜尋征服用戶的絕招是什麼?

有些人可能還記得那種用自然語言輸入問題的方式,當時「Ask Jeeves」大約是在九十年代中後期出現的。它讓大家可以直接像跟朋友說話一樣問問題,雖然準確度好像有點參差。至於「HotBot」,這名字在網路搜尋剛起步的時候也算是小有名氣——印象中他們特別強調速度,還和Inktomi合作過,所以資料更新得挺快,不過現在回頭看,好像沒留下太多痕跡。

講到更偏學術方向,有個叫Northern Light的平台,那會兒吸引了不少學術圈裡的人。它混合了部分免費內容和一些需要付費才能查閱的學術資源,據說排名演算法也不是照搬別人的模式,只是具體怎麼運作就沒有那麼多人清楚。有些人覺得這樣找專業資料比較方便,但其實一般使用者可能接觸不多。

另外LookSmart這名字偶爾會被提起,一開始主要是做目錄分類服務,後來慢慢轉型成搜尋平台。不過到底有多少人在用、改變帶來什麼影響,好像也很難找到統一答案。總之,那個時代的搜尋工具百花齊放,大致上就是這種感覺。

Ask Jeeves用自然語言搜尋征服用戶的絕招是什麼?

SEO在Google出現前到底都在玩哪些把戲?

說到那個年代,像MSN搜尋、AltaVista這些早期的東西,好像有段時間都還得手動把網站資料送過去,不少站長會跑去類似Yahoo或後來叫做ODP(好像又有人稱它DMOZ)的地方掛站。ODP印象中算是一種開放式的目錄,聽說很多人靠這個做SEO,至於效果怎麼樣,每個人講法不太一樣,有的說當時只要肯花點時間填寫,曝光機會就能多一點。也有一派認為,早年網頁關鍵字塞滿meta tag、標題名稱、甚至圖片描述ALT標籤什麼的,都多少能混進搜尋結果裡頭,不過那時候演算法好像沒現在複雜,所以有些技巧用起來比現在明顯得多。

DMOZ倒是挺特別,大概是將近一半以上內容都靠志工協助編輯維護,社群氛圍濃厚,只是分類和審核速度偶爾讓人等得有點不耐煩。不過話題拉回來,其實Google並沒有推出那種專門給獨立推廣者、可以一直分潤收入的SEO聯盟項目,如果你看公開資訊,大致上找不到相關計畫,有些傳聞或討論,但目前主流還是不見這類官方合作方式。

為什麼Google不搞SEO聯盟計畫卻一堆公司在賺這塊錢?

在這個SEO聯盟計畫的世界裡,關於能帶來持續收入的方案,好像一直都有人在討論。說到比較有名的那幾個,其實大致輪廓還算清楚。舉例來說,有一個叫SEO PowerSuite的聯盟計畫,據說佣金比例大概三成出頭吧,而且續約也算進去,很多人覺得平均下來收益還不差。不過也不是只有這一家,聽過Muon Marketing底下本地SEO相關的合作方式嗎?他們好像給的是每月分潤,至於到底多少就很難講了。

另外,如果有注意一些排行榜或部落格文章,好像也會看到Streamline Results,他們給的新戶註冊分潤,大約就是七分之一左右終身回饋,不少人覺得評價還不錯。當然啦,那些專門整理高報酬聯盟網路的網站,例如StatsDrone、Partnerkin之類,都會陸續列出其他方案,也會提到哪些選項是比較有機會拿到長期收益的。

整體看下來,各種SEO相關聯盟計畫確實存在不少,不同平台給法細節各異,但要找Google自己推出同類型長期分潤計畫,目前看起來沒什麼確切資料支持。有些資訊可能隱約提到,但沒有明白寫出Google真的提供這種持續收入模式,所以想靠Google本身這方面獲利,大概還是只能再觀望看看吧。

Related to this topic:

Comments