這里描述了菜鳥們搜索時容易犯的七個低級錯誤,正是因為你經(jīng)常犯這些錯誤,所以你總是得到無用的、荒謬的或者完全沒有意義的搜索結果。而一旦你認識到這些錯誤,將很容易把這些小鬼從你的搜索工具箱中永遠驅(qū)逐出去。
1:停用詞Sputtering on 'Stop Words'
=======================================
一些搜索引擎會忽略這些詞,當你把停用詞輸入搜索框時,不管網(wǎng)上有多少數(shù)量的相關文件,它們一個都不會找回來給你。
這些被叫做“停用詞”(stop words),因為搜索引擎在它的數(shù)據(jù)庫里碰到這些詞時不會搜索。
為什么不搜么?因為停用詞可能太常見了以至于無法搜索出有意義的結果,或者是語言中的副詞、連詞、介詞,或者是'be' 的變體如is、are、were、been等無意義的詞,除非它們在一個短語中且有重要的名詞和動詞相伴。
如果你在一個搜索請求中使用了停用詞,那么你得到大量毫不相關的搜索結果。比如,短語'searching the Web' 包含了兩個停用詞,'the' 和 'Web'。雖然這還不算特別常見的詞匯,但Web 在網(wǎng)絡上實在是太常見了,使它事實上不能幫你搜索到什么有用的內(nèi)容。
如果去掉停用詞,'searching the Web' 變成 'searching',這個關鍵詞帶給你的搜索結果會從搜索一個逃犯直到尋求啟蒙。(quests for enlightenment)—如果你夠幸運,當然也會得到一些關于“searching the Web”的搜索結果。
怎樣辨別停用詞呢?300個最常用的英文詞匯基本上都是停用詞,搜索引擎google在你的搜索關鍵詞中含有停用詞時,會把它忽略的每個停用詞告訴你,就顯示在搜索結果頁最上邊。你可以用一個含停用詞 'web' 的關鍵詞試一下。
2:布爾操作符Bungling with Boolean
=====================================
布爾操作符,象and、or 和not,能夠使你的搜索結果更精確——如果使用正確的話。
問題在于布爾操作符看上去太簡單了,似乎非常容易使用,這真的可能是一種誤解。
按《The Extreme Searcher's Guide to Web Search Engines》的作者Ran Hock的說法, 各種搜索引擎對布爾符都有自己的支持方法,并非完全相同。比如,同樣一種效果,有的搜索引擎只要用'not',有的搜索引擎卻要用'and not'才能達到。而且,有些搜索引擎要求布爾符必須是大寫的,另一些就沒有這種要求。
如果你真的想使用布爾符,請認真學習它的使用方法。
3:普通詞Being Ever So Vulgar
==================================
Vulgar來自拉丁語vulgus, 意思是普通。象一些有教養(yǎng)的詭辯家,搜索引擎對普通詞的搜索存在缺陷。不是因為它們妄自尊大或自命不凡。而是因為這些詞太常見了,以至于出現(xiàn)在成百萬上千萬的網(wǎng)頁中,使得它們事實上不能被用來幫你找到什么有用的內(nèi)容。
比如說“weather”, 有成千上萬的網(wǎng)站提供跟“weather”相關的信息,從地方天氣預報到學術論文到氣象學,
所以使用更多的關鍵詞或更明確的關鍵詞來搜索要比單單搜索'weather'好得多。 設計一個類似 'Cicely Alaska annual snowfall'這樣特殊的搜索關鍵詞,會給你真正有用的結果。
4:尋找玫瑰,Looking for a Rose, By Any Other Name
===================================================
要小心使用多義詞。 Kris Carpenter是Excite 的搜索服務主管,舉了'bond' 作為例子。我們不得不問自己,他們在找的信息是關于金融公債的、化學粘合劑的、還是大名鼎鼎的007邦德的?
最好的解決辦法是,在搜索引擎之前先問自己這個問題,然后用短語代替多義單詞作為關鍵詞。
搜索引擎也很容易被同拼法異音異義的詞迷惑,比如 'lead' ,發(fā)音LEED的時候, 意思是領導,發(fā)音LED的時候指的是一種金屬元素。
如果可以,盡可能使用意義明確的同義詞代替同拼法異音異義的字。例子可以看The Heteronym Home Page.
5:大寫字母Committing Capital Offenses
========================================
搜索者的另一個問題是要不要在關鍵詞中使用大寫字母。
有的搜索引擎是區(qū)分大小寫的,但也有搜索引擎是不分大小寫的。憑經(jīng)驗來說,總是使用小寫字母搜索是個好主意。
這樣搜索,會得到所有包含你的搜索關鍵詞的網(wǎng)頁,不管其中的關鍵詞首字母大寫還是小寫。
如果你在搜索關鍵詞中使用大寫字母,那么搜索引擎返回的結果將只有一種,其網(wǎng)頁中含有大小寫跟你的搜索關鍵詞完全相同的單詞。
象人名和地名之類關鍵詞使用大寫字母是個好選擇,但是其它對大小寫沒那么敏感的單詞,如果也使用大寫字母,可能使你錯過很多有用的網(wǎng)頁。 如果想知道哪個搜索引擎對大寫敏感,以及如何處理大小寫字母,就對Danny Sullivan的網(wǎng)站“Search Engine Watch”上的Search Engines And Capitalization花點時間吧。
6:Close, But No Cigar
==================================
多數(shù)搜索引擎對于 'Kosovo refugees' 或 'space shuttle missions' 這樣的短語搜索效果很好。然而,當你使用類似這一節(jié)的標題的短語“Close, But No Cigar”進行搜索時,就遇到問題了。 在一個主流搜索引擎中搜索'close but no cigar',得到的第二條結果是:The Common Cold: Relief But No Cure. Definitely no cigar!
兩個關鍵詞之間的距離稱為接近程度。 當你的搜索關鍵詞們分散在一個網(wǎng)頁的不同位置時,有些搜索引擎會給你一個積極的結果,不管它們是否彼此靠近,還是位于同一個短語中。
如果你希望你用的搜索關鍵詞們在搜索到的內(nèi)容里互相靠近,那么你的最好選擇是AltaVista 和Lycos, AltaVista 它允許你使用 NEAR 這個操作符號,而 Lycos 的高級搜索提供了多種設置關鍵詞接近程度的可能。
好,現(xiàn)在說最容易犯的那個搜索錯誤
7:在錯誤的地方搜索Searching for Hits in all the Wrong Places
========================================================
在你決定找某種內(nèi)容之前,先確認你對這次搜索任務使用了正確的工具。各種搜索引擎在搜索范圍、功能和質(zhì)量方面大相徑庭,如果沒有為你的每次搜索分別選擇正確的搜索工具,你將浪費自己大量的時間。
你應該使用Excite 還是HotBot? AltaVista 還是 InfoSpace? 分析你的需求,比較不同搜索引擎的強項和弱點,然后選擇最適合這次搜索任務的搜索工具。
如果你真的遇到怎么也搜索不到,那也不要太過苛求自己。我所聽過的最荒謬可笑的說法是:“你能在ingternet上找到任何東西”。這就象在說,你能在每一個煤礦里都找到鉆石。
也許聽上去有點異端邪說的味道,但是有個網(wǎng)絡搜索指南確實說過,有時你能選擇的最好搜索方法是放棄搜索,跑一趟附近的圖書館。圖書館里網(wǎng)上找不到的成噸的信息資源。而且圖書館員一般是受過訓練的的專家,它們通常會很樂意幫你找東西。當你在網(wǎng)上無處可去的時候,試一下真正的“人工智能搜索引擎”吧,你會發(fā)現(xiàn)它們真的非常優(yōu)秀 。
讓錯誤走開Begone, Mistakes!
===================================
在你逐漸獲得網(wǎng)絡搜索經(jīng)驗的過程中,避免這七個常見的搜索錯誤將成為一種自然而然的習慣。無論何時,當你得到意料之外和怪異的搜索結果時,記得檢查一下你用的搜索關鍵詞,弄明白發(fā)生了什么事。你可能發(fā)現(xiàn)又一個自己需要避免的搜索錯誤。
不可不信,也不可全信,呵呵!
1:停用詞Sputtering on 'Stop Words'
=======================================
一些搜索引擎會忽略這些詞,當你把停用詞輸入搜索框時,不管網(wǎng)上有多少數(shù)量的相關文件,它們一個都不會找回來給你。
這些被叫做“停用詞”(stop words),因為搜索引擎在它的數(shù)據(jù)庫里碰到這些詞時不會搜索。
為什么不搜么?因為停用詞可能太常見了以至于無法搜索出有意義的結果,或者是語言中的副詞、連詞、介詞,或者是'be' 的變體如is、are、were、been等無意義的詞,除非它們在一個短語中且有重要的名詞和動詞相伴。
如果你在一個搜索請求中使用了停用詞,那么你得到大量毫不相關的搜索結果。比如,短語'searching the Web' 包含了兩個停用詞,'the' 和 'Web'。雖然這還不算特別常見的詞匯,但Web 在網(wǎng)絡上實在是太常見了,使它事實上不能幫你搜索到什么有用的內(nèi)容。
如果去掉停用詞,'searching the Web' 變成 'searching',這個關鍵詞帶給你的搜索結果會從搜索一個逃犯直到尋求啟蒙。(quests for enlightenment)—如果你夠幸運,當然也會得到一些關于“searching the Web”的搜索結果。
怎樣辨別停用詞呢?300個最常用的英文詞匯基本上都是停用詞,搜索引擎google在你的搜索關鍵詞中含有停用詞時,會把它忽略的每個停用詞告訴你,就顯示在搜索結果頁最上邊。你可以用一個含停用詞 'web' 的關鍵詞試一下。
2:布爾操作符Bungling with Boolean
=====================================
布爾操作符,象and、or 和not,能夠使你的搜索結果更精確——如果使用正確的話。
問題在于布爾操作符看上去太簡單了,似乎非常容易使用,這真的可能是一種誤解。
按《The Extreme Searcher's Guide to Web Search Engines》的作者Ran Hock的說法, 各種搜索引擎對布爾符都有自己的支持方法,并非完全相同。比如,同樣一種效果,有的搜索引擎只要用'not',有的搜索引擎卻要用'and not'才能達到。而且,有些搜索引擎要求布爾符必須是大寫的,另一些就沒有這種要求。
如果你真的想使用布爾符,請認真學習它的使用方法。
3:普通詞Being Ever So Vulgar
==================================
Vulgar來自拉丁語vulgus, 意思是普通。象一些有教養(yǎng)的詭辯家,搜索引擎對普通詞的搜索存在缺陷。不是因為它們妄自尊大或自命不凡。而是因為這些詞太常見了,以至于出現(xiàn)在成百萬上千萬的網(wǎng)頁中,使得它們事實上不能被用來幫你找到什么有用的內(nèi)容。
比如說“weather”, 有成千上萬的網(wǎng)站提供跟“weather”相關的信息,從地方天氣預報到學術論文到氣象學,
所以使用更多的關鍵詞或更明確的關鍵詞來搜索要比單單搜索'weather'好得多。 設計一個類似 'Cicely Alaska annual snowfall'這樣特殊的搜索關鍵詞,會給你真正有用的結果。
4:尋找玫瑰,Looking for a Rose, By Any Other Name
===================================================
要小心使用多義詞。 Kris Carpenter是Excite 的搜索服務主管,舉了'bond' 作為例子。我們不得不問自己,他們在找的信息是關于金融公債的、化學粘合劑的、還是大名鼎鼎的007邦德的?
最好的解決辦法是,在搜索引擎之前先問自己這個問題,然后用短語代替多義單詞作為關鍵詞。
搜索引擎也很容易被同拼法異音異義的詞迷惑,比如 'lead' ,發(fā)音LEED的時候, 意思是領導,發(fā)音LED的時候指的是一種金屬元素。
如果可以,盡可能使用意義明確的同義詞代替同拼法異音異義的字。例子可以看The Heteronym Home Page.
5:大寫字母Committing Capital Offenses
========================================
搜索者的另一個問題是要不要在關鍵詞中使用大寫字母。
有的搜索引擎是區(qū)分大小寫的,但也有搜索引擎是不分大小寫的。憑經(jīng)驗來說,總是使用小寫字母搜索是個好主意。
這樣搜索,會得到所有包含你的搜索關鍵詞的網(wǎng)頁,不管其中的關鍵詞首字母大寫還是小寫。
如果你在搜索關鍵詞中使用大寫字母,那么搜索引擎返回的結果將只有一種,其網(wǎng)頁中含有大小寫跟你的搜索關鍵詞完全相同的單詞。
象人名和地名之類關鍵詞使用大寫字母是個好選擇,但是其它對大小寫沒那么敏感的單詞,如果也使用大寫字母,可能使你錯過很多有用的網(wǎng)頁。 如果想知道哪個搜索引擎對大寫敏感,以及如何處理大小寫字母,就對Danny Sullivan的網(wǎng)站“Search Engine Watch”上的Search Engines And Capitalization花點時間吧。
6:Close, But No Cigar
==================================
多數(shù)搜索引擎對于 'Kosovo refugees' 或 'space shuttle missions' 這樣的短語搜索效果很好。然而,當你使用類似這一節(jié)的標題的短語“Close, But No Cigar”進行搜索時,就遇到問題了。 在一個主流搜索引擎中搜索'close but no cigar',得到的第二條結果是:The Common Cold: Relief But No Cure. Definitely no cigar!
兩個關鍵詞之間的距離稱為接近程度。 當你的搜索關鍵詞們分散在一個網(wǎng)頁的不同位置時,有些搜索引擎會給你一個積極的結果,不管它們是否彼此靠近,還是位于同一個短語中。
如果你希望你用的搜索關鍵詞們在搜索到的內(nèi)容里互相靠近,那么你的最好選擇是AltaVista 和Lycos, AltaVista 它允許你使用 NEAR 這個操作符號,而 Lycos 的高級搜索提供了多種設置關鍵詞接近程度的可能。
好,現(xiàn)在說最容易犯的那個搜索錯誤
7:在錯誤的地方搜索Searching for Hits in all the Wrong Places
========================================================
在你決定找某種內(nèi)容之前,先確認你對這次搜索任務使用了正確的工具。各種搜索引擎在搜索范圍、功能和質(zhì)量方面大相徑庭,如果沒有為你的每次搜索分別選擇正確的搜索工具,你將浪費自己大量的時間。
你應該使用Excite 還是HotBot? AltaVista 還是 InfoSpace? 分析你的需求,比較不同搜索引擎的強項和弱點,然后選擇最適合這次搜索任務的搜索工具。
如果你真的遇到怎么也搜索不到,那也不要太過苛求自己。我所聽過的最荒謬可笑的說法是:“你能在ingternet上找到任何東西”。這就象在說,你能在每一個煤礦里都找到鉆石。
也許聽上去有點異端邪說的味道,但是有個網(wǎng)絡搜索指南確實說過,有時你能選擇的最好搜索方法是放棄搜索,跑一趟附近的圖書館。圖書館里網(wǎng)上找不到的成噸的信息資源。而且圖書館員一般是受過訓練的的專家,它們通常會很樂意幫你找東西。當你在網(wǎng)上無處可去的時候,試一下真正的“人工智能搜索引擎”吧,你會發(fā)現(xiàn)它們真的非常優(yōu)秀 。
讓錯誤走開Begone, Mistakes!
===================================
在你逐漸獲得網(wǎng)絡搜索經(jīng)驗的過程中,避免這七個常見的搜索錯誤將成為一種自然而然的習慣。無論何時,當你得到意料之外和怪異的搜索結果時,記得檢查一下你用的搜索關鍵詞,弄明白發(fā)生了什么事。你可能發(fā)現(xiàn)又一個自己需要避免的搜索錯誤。
不可不信,也不可全信,呵呵!