账号:
密码:
最新动态
产业快讯
CTIMES / 文章 /
网络信息一把抓
 

【作者: 王唯孝】2000年05月01日 星期一

浏览人次:【4479】

当人们开始使用网络的时候,我们惊讶于因特网的多样化与包容性。任何人,只要您愿意,便可以在网络上发表自己的意见、与人沟通,甚至将自己的知识集结成「站」,放到网络上供人参考使用。随着时间的演进,「信息过载」(Infor-mation overloaded)的问题逐渐显现。我们必须要花费愈来愈多的时间来找寻所需的信息。


就本质而言,网络是一个被动媒体,也就是说,人们必须要知道您的网站的网址,才有可能进入您的网站参观。网络上的网站成千上万,要让网友们记住您的网站并重复造访实在不是一件容易的事。所以愈来愈多的网站经营者花费愈来愈多的经费透过各种媒体管道进行广告宣传活动,加强大家的印象,企图成为网友的目光焦点。这也就是因特网上所谓的眼球(Eyeball)的战争。


根据统计,网友们主要还是利用搜索引擎来找寻需要的网站,接下来才是由朋友告知或者由已知网页链结找到新的网站。既然如此,我们就有必要更深入的了解搜索引擎的使用方式,善用搜索引擎获得更好的搜寻结果,才能让我们在网络上的「冲浪」(Surfing)更加的顺畅。


一、搜索引擎的分类

一般来说,我们在网络是所使用的搜索引擎约可分为两大类:网页全文搜索引擎和分类目录式网络搜索引擎。


网页全文搜索引擎

网页全文搜索引擎主要是利用一个所谓网络机器人(Robot),又称网络蜘蛛(Spider)的程序,它会自动到网络上找寻网页数据并跟随网页上的超链结向外扩散来寻找其他的网页数据,并将所有它找到的网页经过程序的处理作成索引档。日后如果有人利用搜索引擎送出一个关键词(Keyword),搜索引擎的查询程序便会回到索引档中找到与关键词相符的数据并送回给查询者。


分类目录式网络搜索引擎

这个部分最著名的莫过于Yahoo!搜索引擎(图一)。分类目录式网络搜索引擎主要的运作方式则是通常会有一组分类编辑者,他们会针对搜寻到的网站编写一段网站的描述并将它分到适当的树状分类的目录中。例如:如果今天找到一个网站是一个HTML的教学网站,则这个网站通常会被分类在计算机 → 因特网 → 网络教学 → HTML教学的分类之中。


《图一 分类目录式网络搜索引擎 Yahoo!》
《图一 分类目录式网络搜索引擎 Yahoo!》

从以上的分类来看,我们可以了解到,随着搜寻情况的不同,选用不同的搜索引擎可以帮助您得到更符合需要的搜寻结果喔!举例来说,如果网友只对某一个议题的有兴趣,,或者希望找寻质量较高,人工筛选过的数据,则建议使用来找寻相关数据。相对的,如果使用主要找寻的数据已相当的明确,或者是属于较为冷门的主题,则建议采用来找寻更多的相关数据。当然,不同的搜索引擎也会有不同的缺点。例如,分类目录式网络搜索引擎因为需要利用人工来进行网站的分类,所以必须要花费大量的人力,持续的维护、更新才能确保分类目录的搜寻质量;相对的,网页全文检索的搜索引擎因为几乎都是利用计算机自动进行网络数据更新与维护,所以查询质量便较不容易控制。请参见(表一)。



《表一 搜索引擎的比较》
《表一 搜索引擎的比较》

二、查询技巧

相信各位在平常使用搜索引擎时都会发现一个问题,那就是每当我们输入一个关键词后,总是会得到成千上百的搜寻结果。更气人的是,还会夹杂着一些跟我们想要的完全风马牛不相及的数据在里面。这个时候除了怪罪搜索引擎不好外,其实我们还是有一些方式来改善这样的情况的。在看完了搜索引擎的分类与比较后,我们再来看看,如何利用一些简单的搜寻技巧来提高搜寻的精确性。


1.布尔运算(and, or)查询法

布尔运算是在计算机程序语言中运用非常广泛的一个概念。简单来说,“And”就是「一定要包含」的意思;“or”就是「可包含可不包含」的意思。举例来说,如果我们要找的网页数据一定要同时包含「兰屿」和「澎湖」这两个名词,我们便可以在搜索引擎中输入「兰屿 and 澎湖」三个字,则搜索引擎便会把同时包含有「兰屿」和「澎湖」这两个名词的网页找出来,如果网页中只有「兰屿」或「澎湖」这两个名词中的某一个,搜索引擎便不会把这样的网页找出来给我们。相对的,如果我们只要找与「兰屿」或「澎湖」相关的网页数据,我们便可以在搜索引擎中输入「兰屿 or 澎湖」三个字,则搜索引擎便会把所有包含「兰屿」或「澎湖」的网页数据通通找出来给我们。(图二)



《图二 布尔运算查询》
《图二 布尔运算查询》

2.同音

常常会发生一种情况,就是有许多的字,我们知道如何发音但是却忘了怎么写。这个时候「同音」的功能便非常的重要。举例来说,如果我们想要找「金城武」的数据,但是我们却打成「金城五」,或者我们根本就不知道「金城武」这三个字应该怎么写。这个时候我们只需要打开同音的功能,不管您是输入「金城五」还是「金乘五」,搜索引擎都能将网页中有「金城武」的数据找出来。(图三)



《图三 同音查询》
《图三 同音查询》

3.容错(模糊搜寻)

这一个功能主要也是考虑到我们时常在输入不管是中文字还是英文字时,时常会不小心打错字而设计的。举例来说,如果我们要寻找有关“Nokia”的网页数据,但却因为不小心打成“Nojia”,部分搜索引擎如果不提供「容错」的功能,导致的结果将会是找不到任何数据。如果有提供容错功能,便有可能找到关于「Nokia」的数据。不过在此要说明的是,当「容错」功能被开启后,搜索引擎会去做许多可能性的比对,将相似的数据全部传送给您,所以非常有可能您会找到许多许多不同的数据,反而增加您搜寻数据的困扰,所以还是建议您,在输入搜寻关键词时,特别注意是否输入正确,以确保查询的质量。


4.“ ”完全比对查询

有些搜索引擎会提供完全比对的查询。举例来说,如果我们输入‘Search engine’为关键词,通常搜索引擎会将包含‘Search’或‘engine’的网页数据找出来,这可能会造成与我们搜寻的原意不符的状况发生。这个时候我们就可以利用“完全比对”查询的功能来帮助我们解决这个问题。我们可以在搜索引擎中输入‘“Search engine”’(利用双括号将Search Engine两个字括起来),搜索引擎便会以这两个字来作完全比对,如果在这两个字的中间有其他的字存在,这个网页便不符合我们的查询需求。


5.加减查询法

加减查询法在某些程度来说有一点类似布尔运算查询法。主要是我们可以来设定有哪些关键词一定要出现(+号);哪些关键词一定不能出现(-号)。举例来说,如果我们要查询SQL语法的数据,却不需要ASP的数据。我们就可以在搜寻擎中输入“+SQL ,-ASP”,这个时候搜索引擎便会自动将包含SQL但不包含ASP的网页数据传送给我们。(图四)


《图四 加减查询》
《图四 加减查询》

6.自然语言

目前搜索引擎的设计主要仍以关键词的比对为准。而前面提到的一些技巧的确可以帮助我们在关键词的搜寻上获得更精确的搜寻结果。但对于一般用户来说,要很顺畅的使用以上的技巧的确有一些困难。所以目前有愈来愈多的搜索引擎服务提供商开始致力于自然语言的研发,也已确实获得相当的成果。在国外,这一个领域最为人所知道首推Ask Jeeves。它允许您直接输入口语化的英文句子,例如:「Where can I buy some books?」,接着它就会帮您找出许多的网络书店供您选择。是不是简单又方便呢!下一次我们将会针对Ask Jeeves作进一步的介绍与分析。(图五)


《图五 自然语音查询网站Ask Jeeves》
《图五 自然语音查询网站Ask Jeeves》

最后必须要注意的是,并不是所有的搜索引擎都提供以上所有的进阶搜寻功能。但是相信每一个提供搜索引擎服务的入口网站都会有使用说明可供网友们参考。以Openfind为例,在首页的下方便有一「Q弟秘诀」详细的说明了Openfind搜索引擎的使用方式。建议大家在使用搜索引擎之前可以先参考一下使用说明,相信可以帮助大家更快找到所需的数据。


三、如何选择一个好的搜索引擎

1.User Friendly(完善的用户接口)

与其创造一个功能超强,却不知如何使用的搜索引擎,简单易懂的用户接口,将会是吸引网友前来使用的最大因素。


2.Quality(查询质量)

对于搜索引擎而言,搜寻到最多的数据并不代表搜寻到最有用的数据。如何依照搜寻到的数据的重要性进行排序(Ranking),将最重要的数据最先呈现给查询者,将是用户最关心的议题。


3.Performance(效能)

如何在最短的时间内,在数百万甚至数千万的网页数据库中找寻到符合搜寻者需要的数据将是搜索引擎一个非常大的挑战。毕竟网友们都不愿意为了一个关键词的查询在计算机屏幕前枯等数十秒。


4.Reliability(稳定性)

对于网络服务的提供者(入口网站)而言,网络的服务首重系统的稳定性。尤其是对于一个搜索引擎而言,它往往要服务数十万甚至数百万的用户,对于系统稳定性的要求也将会是有增无减。


5.Scalability(扩充性)

不管是网络上的数据或者网络的使用人口每年都以极快的速度在成长,对此所延伸出来的另一个问题就是,搜索引擎必须拥有良好的系统扩充性,才能够因应未来巨量的成长。


在谈完这么多的搜索引擎相关的东西后,下一次我们将针对现有国内外知名的搜索引擎作一个综合的分析与介绍,也和大家来谈一谈搜索引擎的现在与未来。我们下次见!


备注

参考网址:


Yahoo!:http://www.yahoo.com


Ask Jeeves:http://www.ask.com


Openfind:http://www.openfind.com.tw


(作者任职于网擎信息Openfind)


相关文章
搜寻引擎下一波机会在哪里?
大英百科全书网路传奇又一章
大英百科全书网络传奇又一章
从CMGI的雄心壮志看网络触及率
客户资源管理系统
comments powered by Disqus
相关讨论
  相关新闻
» 达梭系统携手CDR-Life 加速癌症治疗科学创新
» 宜鼎独创MIPI over Type-C解决方案突破技术局限,改写嵌入式相机模组市场样貌
» 鼎新电脑串连生态系夥伴 数智驱动智慧低碳未来制造
» 鼎新电脑携手和泰丰田解缺工 以数位劳动力开启储运新时代
» Fortinet SASE台湾网路连接点今年落成 全台巡??落实云地零信任资安


刊登廣告 新聞信箱 读者信箱 著作權聲明 隱私權聲明 本站介紹

Copyright ©1999-2024 远播信息股份有限公司版权所有 Powered by O3  v3.20.1.HK84SD4OKIGSTACUK9
地址:台北数位产业园区(digiBlock Taipei) 103台北市大同区承德路三段287-2号A栋204室
电话 (02)2585-5526 #0 转接至总机 /  E-Mail: webmaster@ctimes.com.tw