當人們開始使用網路的時候,我們驚訝於網際網路的多樣化與包容性。任何人,只要您願意,便可以在網路上發表自己的意見、與人溝通,甚至將自己的知識集結成「站」,放到網路上供人參考使用。隨著時間的演進,「資訊過載」(Infor-mation overloaded)的問題逐漸顯現。我們必須要花費愈來愈多的時間來找尋所需的資訊。
就本質而言,網路是一個被動媒體,也就是說,人們必須要知道您的網站的網址,才有可能進入您的網站參觀。網路上的網站成千上萬,要讓網友們記住您的網站並重複造訪實在不是一件容易的事。所以愈來愈多的網站經營者花費愈來愈多的經費透過各種媒體管道進行廣告宣傳活動,加強大家的印象,企圖成為網友的目光焦點。這也就是網際網路上所謂的眼球(Eyeball)的戰爭。
根據統計,網友們主要還是利用搜尋引擎來找尋需要的網站,接下來才是由朋友告知或者由已知網頁鏈結找到新的網站。既然如此,我們就有必要更深入的了解搜尋引擎的使用方式,善用搜尋引擎獲得更好的搜尋結果,才能讓我們在網路上的「衝浪」(Surfing)更加的順暢。
一、搜尋引擎的分類
一般來說,我們在網路是所使用的搜尋引擎約可分為兩大類:網頁全文檢索搜尋引擎和分類目錄式網路搜尋引擎。
網頁全文檢索搜尋引擎
網頁全文檢索搜尋引擎主要是利用一個所謂網路機器人(Robot),又稱網路蜘蛛(Spider)的程式,它會自動到網路上找尋網頁資料並跟隨網頁上的超鏈結向外擴散來尋找其他的網頁資料,並將所有它找到的網頁經過程式的處理作成索引檔。日後如果有人利用搜尋引擎送出一個關鍵字(Keyword),搜尋引擎的查詢程式便會回到索引檔中找到與關鍵字相符的資料並送回給查詢者。
分類目錄式網路搜尋引擎
這個部分最著名的莫過於Yahoo!搜尋引擎(圖一)。分類目錄式網路搜尋引擎主要的運作方式則是通常會有一組分類編輯者,他們會針對搜尋到的網站編寫一段網站的描述並將它分到適當的樹狀分類的目錄中。例如:如果今天找到一個網站是一個HTML的教學網站,則這個網站通常會被分類在電腦 → 網際網路 → 網路教學 → HTML教學的分類之中。
從以上的分類來看,我們可以了解到,隨著搜尋情況的不同,選用不同的搜尋引擎可以幫助您得到更符合需要的搜尋結果喔!舉例來說,如果網友只對某一個議題的有興趣,,或者希望找尋品質較高,人工篩選過的資料,則建議使用來找尋相關資料。相對的,如果使用主要找尋的資料已相當的明確,或者是屬於較為冷門的主題,則建議採用來找尋更多的相關資料。當然,不同的搜尋引擎也會有不同的缺點。例如,分類目錄式網路搜尋引擎因為需要利用人工來進行網站的分類,所以必須要花費大量的人力,持續的維護、更新才能確保分類目錄的搜尋品質;相對的,網頁全文檢索的搜尋引擎因為幾乎都是利用電腦自動進行網路資料更新與維護,所以查詢品質便較不容易控制。請參見(表一)。
二、查詢技巧
相信各位在平常使用搜尋引擎時都會發現一個問題,那就是每當我們輸入一個關鍵字後,總是會得到成千上百的搜尋結果。更氣人的是,還會夾雜著一些跟我們想要的完全風馬牛不相及的資料在裡面。這個時候除了怪罪搜尋引擎不好外,其實我們還是有一些方式來改善這樣的情況的。在看完了搜尋引擎的分類與比較後,我們再來看看,如何利用一些簡單的搜尋技巧來提高搜尋的精確性。
1.布林運算(and, or)查詢法
布林運算是在電腦程式語言中運用非常廣泛的一個概念。簡單來說,“And”就是「一定要包含」的意思;“or”就是「可包含可不包含」的意思。舉例來說,如果我們要找的網頁資料一定要同時包含「蘭嶼」和「澎湖」這兩個名詞,我們便可以在搜尋引擎中輸入「蘭嶼 and 澎湖」三個字,則搜尋引擎便會把同時包含有「蘭嶼」和「澎湖」這兩個名詞的網頁找出來,如果網頁中只有「蘭嶼」或「澎湖」這兩個名詞中的某一個,搜尋引擎便不會把這樣的網頁找出來給我們。相對的,如果我們只要找與「蘭嶼」或「澎湖」相關的網頁資料,我們便可以在搜尋引擎中輸入「蘭嶼 or 澎湖」三個字,則搜尋引擎便會把所有包含「蘭嶼」或「澎湖」的網頁資料通通找出來給我們。(圖二)
2.同音
常常會發生一種情況,就是有許多的字,我們知道如何發音但是卻忘了怎麼寫。這個時候「同音」的功能便非常的重要。舉例來說,如果我們想要找「金城武」的資料,但是我們卻打成「金城五」,或者我們根本就不知道「金城武」這三個字應該怎麼寫。這個時候我們只需要打開同音的功能,不管您是輸入「金城五」還是「金乘五」,搜尋引擎都能將網頁中有「金城武」的資料找出來。(圖三)
3.容錯(模糊搜尋)
這一個功能主要也是考慮到我們時常在輸入不管是中文字還是英文字時,時常會不小心打錯字而設計的。舉例來說,如果我們要尋找有關“Nokia”的網頁資料,但卻因為不小心打成“Nojia”,部分搜尋引擎如果不提供「容錯」的功能,導致的結果將會是找不到任何資料。如果有提供容錯功能,便有可能找到關於「Nokia」的資料。不過在此要說明的是,當「容錯」功能被開啟後,搜尋引擎會去做許多可能性的比對,將相似的資料全部傳送給您,所以非常有可能您會找到許多許多不同的資料,反而增加您搜尋資料的困擾,所以還是建議您,在輸入搜尋關鍵字時,特別注意是否輸入正確,以確保查詢的品質。
4.“ ”完全比對查詢
有些搜尋引擎會提供完全比對的查詢。舉例來說,如果我們輸入‘Search engine’為關鍵字,通常搜尋引擎會將包含‘Search’或‘engine’的網頁資料找出來,這可能會造成與我們搜尋的原意不符的狀況發生。這個時候我們就可以利用“完全比對”查詢的功能來幫助我們解決這個問題。我們可以在搜尋引擎中輸入‘“Search engine”’(利用雙括號將Search Engine兩個字括起來),搜尋引擎便會以這兩個字來作完全比對,如果在這兩個字的中間有其他的字存在,這個網頁便不符合我們的查詢需求。
5.加減查詢法
加減查詢法在某些程度來說有一點類似布林運算查詢法。主要是我們可以來設定有哪些關鍵字一定要出現(+號);哪些關鍵字一定不能出現(-號)。舉例來說,如果我們要查詢SQL語法的資料,卻不需要ASP的資料。我們就可以在搜尋擎中輸入“+SQL ,-ASP”,這個時候搜尋引擎便會自動將包含SQL但不包含ASP的網頁資料傳送給我們。(圖四)
6.自然語言
目前搜尋引擎的設計主要仍以關鍵字的比對為準。而前面提到的一些技巧的確可以幫助我們在關鍵字的搜尋上獲得更精確的搜尋結果。但對於一般使用者來說,要很順暢的使用以上的技巧的確有一些困難。所以目前有愈來愈多的搜尋引擎服務提供者開始致力於自然語言的研發,也已確實獲得相當的成果。在國外,這一個領域最為人所知道首推Ask Jeeves。它允許您直接輸入口語化的英文句子,例如:「Where can I buy some books?」,接著它就會幫您找出許多的網路書店供您選擇。是不是簡單又方便呢!下一次我們將會針對Ask Jeeves作進一步的介紹與分析。(圖五)
最後必須要注意的是,並不是所有的搜尋引擎都提供以上所有的進階搜尋功能。但是相信每一個提供搜尋引擎服務的入口網站都會有使用說明可供網友們參考。以Openfind為例,在首頁的下方便有一「Q弟秘訣」詳細的說明了Openfind搜尋引擎的使用方式。建議大家在使用搜尋引擎之前可以先參考一下使用說明,相信可以幫助大家更快找到所需的資料。
三、如何選擇一個好的搜尋引擎
1.User Friendly(完善的使用者介面)
與其創造一個功能超強,卻不知如何使用的搜尋引擎,簡單易懂的使用者介面,將會是吸引網友前來使用的最大因素。
2.Quality(查詢品質)
對於搜尋引擎而言,搜尋到最多的資料並不代表搜尋到最有用的資料。如何依照搜尋到的資料的重要性進行排序(Ranking),將最重要的資料最先呈現給查詢者,將是使用者最關心的議題。
3.Performance(效能)
如何在最短的時間內,在數百萬甚至數千萬的網頁資料庫中找尋到符合搜尋者需要的資料將是搜尋引擎一個非常大的挑戰。畢竟網友們都不願意為了一個關鍵字的查詢在電腦螢幕前枯等數十秒。
4.Reliability(穩定性)
對於網路服務的提供者(入口網站)而言,網路的服務首重系統的穩定性。尤其是對於一個搜尋引擎而言,它往往要服務數十萬甚至數百萬的使用者,對於系統穩定性的要求也將會是有增無減。
5.Scalability(擴充性)
不管是網路上的資料或者網路的使用人口每年都以極快的速度在成長,對此所延伸出來的另一個問題就是,搜尋引擎必須擁有良好的系統擴充性,才能夠因應未來鉅量的成長。
在談完這麼多的搜尋引擎相關的東西後,下一次我們將針對現有國內外知名的搜尋引擎作一個綜合的分析與介紹,也和大家來談一談搜尋引擎的現在與未來。我們下次見!
備註
參考網址:
Yahoo!:http://www.yahoo.com
Ask Jeeves:http://www.ask.com
Openfind:http://www.openfind.com.tw
(作者任職於網擎資訊Openfind)