幾年前,當(dāng)我第一次為搜索初學(xué)者做一份書(shū)目指南之前,我不得不靜下心去想,到底什么是我能教給他們的最簡(jiǎn)單、最重要的東西?什么是我們職業(yè)搜索者知道的,而這些學(xué)生不懂的?什么課程是導(dǎo)致找到和找不到區(qū)別產(chǎn)生的原因以及是他們需要學(xué)習(xí)的?我的腦海中逐漸浮現(xiàn)四句話,我在辦公室中把它們寫(xiě)在一張紙上:我的四條搜索準(zhǔn)則。在逝去的這幾年中,我已在這基礎(chǔ)上加了一些內(nèi)容。但是,我和我的同行們?nèi)匀磺宄牧私獠⒃趯?shí)踐它們,在我看來(lái),這就是我們職業(yè)搜索者和普通用戶之所以區(qū)別的地方。
我沒(méi)有發(fā)明這些準(zhǔn)則,我只是使它們條理化文字化。條理化文字化--當(dāng)職業(yè)搜索者收到人們的問(wèn)題時(shí)做的另一件事。
準(zhǔn)則一: 去信息應(yīng)該在的地方
(Rule One:Go Where It Is )
普通人或許以為,象我們這樣擅長(zhǎng)搜索的人,一定是因?yàn)橹酪恍┦褂盟阉饕娴拿丶。其?shí),我們真正知道的,恰恰是這個(gè)事實(shí):對(duì)于很多問(wèn)題,是無(wú)法用搜索引擎解決的,因?yàn)榛ヂ?lián)網(wǎng)上并不存在所需信息。也許答案藏在1935年出版的一本《哈潑的》中(Harper's),或者藏在1865年出版的一張《紐約時(shí)報(bào)》中,或者藏在一本對(duì)比不同歐洲國(guó)家醫(yī)療保險(xiǎn)管理政策的書(shū)中,或者藏在一段未發(fā)表的論文中,或者藏在一份寶時(shí)潔(P&G)做的產(chǎn)權(quán)市場(chǎng)調(diào)查中,或者藏在1965年的一場(chǎng)參議院聽(tīng)證會(huì)記錄中。
當(dāng)任何人向我們提出一個(gè)問(wèn)題時(shí),無(wú)論是否熟悉該領(lǐng)域,我們做的第一件事,是搜尋我們腦海中積累的信息地理圖。當(dāng)我們說(shuō)出"讓我們?cè)囈幌侣?lián)機(jī)醫(yī)學(xué)文獻(xiàn)分析和檢索系統(tǒng)(MEDLINE)"時(shí),我們已經(jīng)評(píng)估過(guò)用戶的需求(關(guān)于某種醫(yī)藥環(huán)境下的特殊療法)和知識(shí)水平(醫(yī)學(xué)教授或?qū)W生),并確定了哪里最可能找得到符合他們需求的信息(醫(yī)療文獻(xiàn)中的文章)。
無(wú)論那問(wèn)題是什么,我們都會(huì)經(jīng)歷同樣的信息地理圖搜尋和確認(rèn)過(guò)程:被問(wèn)及藝術(shù)品的復(fù)制時(shí),我們會(huì)去搜尋藝術(shù)百科全書(shū)或者互聯(lián)網(wǎng);被問(wèn)及1966年1美元可以買(mǎi)到什么時(shí),我們會(huì)去搜尋《美國(guó)歷史統(tǒng)計(jì)》(Historical Statistics)或《美國(guó)統(tǒng)計(jì)摘要》(Statistical Abstracts)或者1966年的本地報(bào)紙廣告。不同的工具可以找回不同的信息,而圖書(shū)館員們的技巧正是了解哪一種工具可以最好的完成哪一種任務(wù)。
當(dāng)一個(gè)圖書(shū)館員問(wèn)我特拉華流域(Delaware watershed)的原始信息時(shí),我的第一個(gè)反應(yīng)是:
· 美國(guó)陸軍工程軍團(tuán)(Army Corps of Engineers).
· 美國(guó)漁業(yè)及野生動(dòng)物服務(wù)(U.S. Fish and Wildlife Service).
· 美國(guó)環(huán)保局(Environmental Protection Agency).
· 特拉華州的同類部門(mén)(equivalent agencies for the state of Delaware).
明確了這個(gè)主題,我就在searchgov.com作了一次搜索,果然,從聯(lián)邦政府的這幾個(gè)部門(mén)和其它部門(mén)發(fā)現(xiàn)了一大堆相關(guān)文件。但是聯(lián)想到大多數(shù)關(guān)心流域問(wèn)題的人都是科學(xué)家,我也用了SciSeek.com去搜索互聯(lián)網(wǎng)上的科學(xué)網(wǎng)站,那使我找到了大量其它與這個(gè)流域的環(huán)境、化學(xué)、工程相關(guān)的信息。
然后,我通過(guò)EBSCOhost 搜索多個(gè)全文數(shù)據(jù)庫(kù),那使我找到了從包括科學(xué)雜志、旅行雜志和體育雜志上的相關(guān)文章。
圖書(shū)館員們也明白,不同信息源的風(fēng)格是互相不可代替的。雜志和報(bào)紙會(huì)用讀者簡(jiǎn)明易懂的語(yǔ)言解釋復(fù)雜晦澀的主題,而學(xué)術(shù)和專業(yè)雜志則發(fā)表原始的研究文章(僅僅是普通用戶問(wèn)題中的"研究"可能自動(dòng)把我們送向一個(gè)雜志全文檢索庫(kù))。但是因?yàn)?quot;研究"必然被限制在一個(gè)主題的很小的、可掌控的領(lǐng)域,它就象一個(gè)難題的小塊。當(dāng)我們想看這一個(gè)小塊的風(fēng)格時(shí),或者當(dāng)我們想知道一個(gè)主題的廣泛背景時(shí),我們會(huì)去找書(shū),書(shū)會(huì)概括和讓你理解一個(gè)最初的研究。政府文件則會(huì)提供統(tǒng)計(jì)、法律、金融信息,甚至?xí)嘘P(guān)于"我們是誰(shuí)?"、"我們擁有什么?"、"我們已經(jīng)到了哪一步?"等公開(kāi)資料。
我們了解每一種信息源風(fēng)格的長(zhǎng)處和短處;ヂ(lián)網(wǎng)長(zhǎng)于圖片和示范,對(duì)于政府文件,對(duì)于FAQ文檔,對(duì)于討論組,對(duì)于傳輸全文數(shù)據(jù)庫(kù);但是我們也知道,互聯(lián)網(wǎng)對(duì)于1995年前的雜志和政府文件,幾乎是沒(méi)什么用的。對(duì)于這些資料,我們?nèi)匀恍枰褂梦覀兊呐f索引和期刊備份。我們也比僅僅信任互聯(lián)網(wǎng)權(quán)威和準(zhǔn)確性知道得更多,你也許會(huì)在互聯(lián)網(wǎng)上找到一段引證 -- 甚至它的好幾個(gè)版本-- 但是不要指望找到它的正確起源。我們對(duì)于互聯(lián)網(wǎng)信息源的態(tài)度是冷戰(zhàn)式的懷疑:信任它,但是只有在確證以后。
我們知道誰(shuí)最可能制造不同類別的信息。對(duì)于大多數(shù)嚴(yán)肅的統(tǒng)計(jì)數(shù)據(jù),我們會(huì)從《美國(guó)統(tǒng)計(jì)摘要》開(kāi)始,但是對(duì)于生活類統(tǒng)計(jì)數(shù)據(jù),我們會(huì)去搜尋那些為需要推廣產(chǎn)品的廣告主們做的專業(yè)的市場(chǎng)調(diào)研報(bào)告。被問(wèn)及美國(guó)男孩洗澡的頻度時(shí),我查詢了一個(gè)全文商業(yè)期刊數(shù)據(jù)庫(kù),查找會(huì)在諸如《美國(guó)人口統(tǒng)計(jì)數(shù)據(jù)》(American Demographics)等雜志上發(fā)表的市場(chǎng)調(diào)研報(bào)告。(順便提一下那問(wèn)題的答案,答案有違我們的直覺(jué):超過(guò)三分之一的男孩,每天至少洗澡兩次。)
我們知道,有時(shí)最好的信息源正是普通的人,作為個(gè)體的或作為群體之一的,對(duì)某主題有熱情的人。當(dāng)我們的用戶需要關(guān)于糖尿病的可靠的、權(quán)威的信息時(shí),我們會(huì)帶他們?nèi)ッ绹?guó)糖尿病協(xié)會(huì)(American Diabetes Association)的網(wǎng)站;當(dāng)我們的用戶想和有相同疾病經(jīng)驗(yàn)的人交流,想了解糖尿病患者如何生活時(shí),我們會(huì)帶他們?nèi)ハ嚓P(guān)的支持團(tuán)體。
當(dāng)我們想知道一種嶄新科技或策略是否有效時(shí),我們會(huì)去找互聯(lián)網(wǎng)上的相關(guān)討論組。而當(dāng)一個(gè)主題非常偏僻晦澀時(shí),我們會(huì)直接上網(wǎng),因?yàn)榛ヂ?lián)網(wǎng)是那些擁有古怪偏好(如風(fēng)笛、中世紀(jì)地圖、劣質(zhì)的涂鴉作品)的人們分享他們熱情的最佳場(chǎng)所。
我們職業(yè)搜索者,完全可以被描述成信息世界中旅行者的向?qū)? 我們之所以能幫助我們的旅行者快速到達(dá)目的地 ,是因?yàn)槲覀冎滥康牡卦谀睦,是因(yàn)槲覀冎雷罴训穆肪是什么,因?yàn)槲覀冎缿?yīng)該坐飛機(jī),火車,還是汽車。
準(zhǔn)則二: 你得到什么答案,取決于你怎么提問(wèn)
(Rule Two:The Answer You Get Depends on the Questions You Ask)
推論:?jiǎn)栴}決定答案,如果你不喜歡答案,那么換問(wèn)題吧
普通人或許以為,圖書(shū)館員們一定知道所有的答案。其實(shí),我們真正知道的,是如何問(wèn)出好問(wèn)題。我們知道如何在寬泛和特殊之間自如滑動(dòng)調(diào)節(jié)搜索范圍,直到我們找到那任務(wù)最關(guān)鍵的影響因素。
我們用來(lái)滑動(dòng)調(diào)節(jié)搜索范圍的方法之一,是語(yǔ)言。如果我們用一個(gè)特殊關(guān)鍵詞沒(méi)有發(fā)現(xiàn)足夠的信息,我們就會(huì)轉(zhuǎn)向概念更寬泛的一個(gè)層面;如果我們發(fā)現(xiàn)了太多信息,我們就會(huì)嘗試更特殊的關(guān)鍵詞。
舉例來(lái)說(shuō),當(dāng)我們被要求尋找這方面的研究資料:肥胖者與身材標(biāo)準(zhǔn)者做相同的工作,是否肥胖者掙的錢(qián)更少? 一些我們會(huì)嘗試的關(guān)鍵詞,可能是"肥胖"或"體重"(obesity or weight),"薪水"或"工資"或"收入"(salary or wages or pay),"歧視"或"區(qū)別"(discrimination or differential)。我們也有可能使用更寬泛的陳述:肥胖和雇用歧視(Obesity and employment discrimination),這或許會(huì)找回各種關(guān)于歧視的研究資料:面試,薪水,評(píng)估,提升,等等。不管我們用哪種關(guān)鍵詞組合,我們都知道,我們會(huì)得到不同的搜索結(jié)果,因此,我們當(dāng)然會(huì)使用所有想得到的合理關(guān)鍵詞。而且,當(dāng)我們點(diǎn)擊到有價(jià)值的新發(fā)現(xiàn)時(shí),我們還會(huì)使用我們從連續(xù)的搜索過(guò)程中遇到的網(wǎng)頁(yè)中發(fā)現(xiàn)的任何新關(guān)鍵詞。
此外,我們還使用其它方法來(lái)滑動(dòng)調(diào)節(jié)搜索范圍。當(dāng)我們決定搜索主題標(biāo)題時(shí),我們會(huì)從最特殊的關(guān)鍵詞開(kāi)始,以保證我們找回的文件和主題完全相關(guān)。當(dāng)我們對(duì)找到什么相關(guān)內(nèi)容幾乎不存指望,-- 當(dāng)我們需要的只是damn fool luck, -- 我們會(huì)從最寬泛的關(guān)鍵詞開(kāi)始搜索。一旦我們找到了什么資料,我們就會(huì)用盡技巧利用它,順藤摸瓜連本帶利找出更多相關(guān)資料。
當(dāng)我們從概念最寬泛的關(guān)鍵詞開(kāi)始搜索時(shí),我們會(huì)使用"OR"組織關(guān)鍵詞,就象用一個(gè)拖網(wǎng)捕捉到四分之一英里內(nèi)半徑內(nèi)的每一條魚(yú);并使用"AND"組織關(guān)鍵詞,用這個(gè)方法來(lái)滑動(dòng)調(diào)節(jié)到最狹窄的搜索范圍,就象扔掉不合格的魚(yú)。
當(dāng)我們想搜索無(wú)限信息宇宙中的一小塊時(shí),-- 一個(gè)卡片目錄,或者《聯(lián)機(jī)醫(yī)學(xué)文獻(xiàn)分析和檢索系統(tǒng)》,或者一個(gè)特殊搜索引擎如searchgov.com -- 我們也是在搜索一個(gè)統(tǒng)一體的狹窄概念領(lǐng)域。
狹窄搜索的風(fēng)險(xiǎn)是:某些相關(guān)信息中并不含有我們使用的關(guān)鍵詞,或者我們選擇的特殊搜索引擎或數(shù)據(jù)庫(kù)中并沒(méi)有索引某些相關(guān)信息,因此我們可能錯(cuò)過(guò)這些相關(guān)信息。而當(dāng)我們從最寬泛概念開(kāi)始搜索時(shí),也要冒只找到無(wú)效結(jié)果的風(fēng)險(xiǎn),比如當(dāng)我測(cè)遍搜索引擎尋找一個(gè)名叫"E."的歌手信息時(shí)。
通過(guò)在寬泛和狹窄的概念之間滑動(dòng)調(diào)節(jié);組合不同的關(guān)鍵詞、不同的搜索方法、不同的搜索資源;總是想著還能找到其它什么內(nèi)容;我們大幅度提高了這種可能性:不是為顧客發(fā)現(xiàn)一個(gè)答案,而是為顧客發(fā)現(xiàn)一個(gè)最佳答案。
準(zhǔn)則三: 答案必須迎合需求
(Rule Three:The Answer Should Match the Information Need)
圖書(shū)館員們需要理解的,不僅是問(wèn)題,還需要理解:哪一種答案會(huì)使顧客滿意。如果我們給他們的答案不是他們想要的那一種,那我們能算是回答了他們嗎:有人要一篇百科全書(shū)文章,你給他一摞書(shū),雖然那摞書(shū)中有答案?有人要一個(gè)特定問(wèn)題的口頭答案,你給他一個(gè)網(wǎng)站,雖然那網(wǎng)站中有答案?有位病人要了解他剛被診斷患上的一種疾病的信息,你給他一本專業(yè)醫(yī)學(xué)學(xué)術(shù)雜志上的晦澀文章,雖然那文章中有答案?有人僅僅想打印幾篇文章好帶回家去看,你給他一打文摘?
接受這個(gè)假設(shè):圖書(shū)館員是一群迷失在獵獲的戰(zhàn)栗中的好學(xué)者。我們總是能更頑強(qiáng)的追溯蛛絲馬跡,跟那些在某方面有需求或感興趣的顧客相比,我們總是能找到更多的信息。除非我們是在幫一個(gè)學(xué)者做研究,我們面臨的問(wèn)題通常不是找到信息,而是知道什么時(shí)候該停下來(lái)。-- 給一個(gè)禮貌的建議,當(dāng)然,存在其它用戶可采用的途徑,他們應(yīng)該要求更多。
準(zhǔn)則四: 搜索是一個(gè)多步驟的過(guò)程
(Rule four:Research Is a Multi-Stage Process)
有時(shí),獵獲過(guò)程只能是迂回曲折的。為了尋找歌手"E."的信息,我需要從一本搖滾百科全書(shū)或搖滾網(wǎng)站開(kāi)始,我去了"終極樂(lè)隊(duì)名單"(UBL.com),在那里找到了"E."的一個(gè)傳記,一個(gè)音樂(lè)唱片分類目錄,他現(xiàn)在的樂(lè)隊(duì)The Eels的信息,他們的官方網(wǎng)站,以及巡回演出信息。
如果有人真的想尋找某個(gè)主題所有最細(xì)枝末節(jié)的信息,這會(huì)激活我們偵探犬般靈敏的本能,引發(fā)我們擁有的每一絲技巧。首先,我們會(huì)去每一個(gè)我們認(rèn)為可能有所找信息的地方,搜索不止一個(gè)數(shù)據(jù)庫(kù),而是每一個(gè)似乎可能的數(shù)據(jù)庫(kù)。我們會(huì)搜尋期刊數(shù)據(jù)庫(kù),論文摘要,OCLC聯(lián)機(jī)聯(lián)合編目目錄(WorldCat),會(huì)議論文索引,等等。我們會(huì)急速走遍整個(gè)互聯(lián)網(wǎng),既使用普通搜索引擎,也使用特殊搜索引擎、專業(yè)網(wǎng)站和看不見(jiàn)的數(shù)據(jù)庫(kù)。
每當(dāng)我們發(fā)現(xiàn)什么的時(shí)候,我們都會(huì)從中觀察發(fā)掘更多線索。跟隨書(shū)目中的每一條信息,搜尋這些作者的更多作品,找到那些作者的e-mail,進(jìn)行引用搜索,查找誰(shuí)在引用他們的作品。每當(dāng)我們發(fā)現(xiàn)有用的新關(guān)鍵詞時(shí),我們都會(huì)回到我們已搜索過(guò)的地方,使用新關(guān)鍵詞再次搜索。當(dāng)我們找到一些正是我們的顧客腦海中所想信息時(shí),我們會(huì)極盡利用數(shù)據(jù)庫(kù)或搜索引擎提供的任何功能-- 可點(diǎn)擊的主題或者一個(gè)"more like this"的功能-- 尋找更多的類似條目。
準(zhǔn)則五: 信息本身是無(wú)意義的,只有人提問(wèn)之后才有價(jià)值
(Rule Five:信息 Is Meaningless Until Queried by Human Intelligence)
數(shù)據(jù):瑞典是最大的烹調(diào)醬用戶。
數(shù)據(jù):51%的圣路易士居民說(shuō)他們從未去過(guò)圣路易士拱門(mén)。
數(shù)據(jù):根據(jù)NEC研究院的資料,1.5% 的網(wǎng)站是色情網(wǎng)站。
現(xiàn)在你知道這些數(shù)據(jù)了,你更聰明了還是更happy了?事實(shí)上,你能有什么理由關(guān)心這些呢?沒(méi)有上下文,這些數(shù)據(jù)只是數(shù)據(jù),不是信息。只有在我們象這樣提問(wèn)時(shí),它們才成為有價(jià)值的信息:
· 如果我計(jì)劃在瑞典做銷售莎莎醬,會(huì)面臨什么樣的競(jìng)爭(zhēng)?
· 圣路易士是否應(yīng)該面向本地居民做旅行宣傳廣告?
· 互聯(lián)網(wǎng)上的色情問(wèn)題到底有多嚴(yán)重? (注意:解答這個(gè)問(wèn)題需要遠(yuǎn)超過(guò)以上數(shù)據(jù)的信息)
這個(gè)世界充滿了無(wú)窮無(wú)盡的內(nèi)容:箭頭,陶器碎片,軟體動(dòng)物化石,古老的文字和日記,五十年代的菜譜,壘高拼裝玩具,芭比娃娃。
所有這些數(shù)據(jù)都是無(wú)意義的,直到有人做一些事-- 提一個(gè)問(wèn)題,把它們與其它數(shù)據(jù)放在一起,思考它們的意義,直到有人歸并這些碎片并發(fā)現(xiàn)一個(gè)過(guò)去的文明,或者在破爛文字中發(fā)現(xiàn)政治陰謀的痕跡,或者從這些舊菜譜中得知罐裝湯和袋裝食品是什么時(shí)候開(kāi)始滲入我們生活的。
除非你知道自己要用它們做什么,隨便的數(shù)據(jù)堆積是無(wú)意義的。你必須從一個(gè)問(wèn)題開(kāi)始,或者一個(gè)主題,最好有一個(gè)明確的陳述不僅讓你明白什么信息是你需要的,而且讓你明白什么信息對(duì)你是無(wú)用的。如果你說(shuō)你想找到專利權(quán)的經(jīng)濟(jì)效果,你完全可以只聚焦于成功者和失敗者。
這意味著你可以忽略保護(hù)專利權(quán)的爭(zhēng)論以及什么發(fā)明可以授予專利的辯論。你的數(shù)據(jù)應(yīng)該聚焦于股價(jià)、資產(chǎn)平衡表、和價(jià)格目錄。
準(zhǔn)則六: 向你的答案提問(wèn) ―― 信息可能是真的,但仍然是錯(cuò)的
(Rule Six:Question Your Answers - Information May Be True But Still Wrong)
我住在愛(ài)荷華州的達(dá)芬波特市。2001年5月,我們招待了天知道多少網(wǎng)絡(luò)新聞?dòng)浾撸麄兌及阉麄兊南鄼C(jī)指向我們的,被密西西比河包圍和淹沒(méi)的,棒球館。那些相機(jī)顯示了我們的河流對(duì)這國(guó)家的驅(qū)動(dòng)-- 淹沒(méi)-- 小隊(duì)志愿者在填充沙袋。令人小小驚訝的是每一個(gè)我打過(guò)電話的親戚都提出送浮袋給我,但我不需要它。
這些記者一直在報(bào)道著事實(shí),直到我們離開(kāi)。他們忽略的是告訴剩余的故事,把相機(jī)鏡頭移向四周,或者移向旁邊。如果他們有那么做,那么這個(gè)國(guó)家就會(huì)認(rèn)識(shí)到:達(dá)芬波特市建在一座驚人高大的山上,99%的城區(qū)都沒(méi)有收到洪水的影響,只要不遇到更糟的情況。
洪峰到來(lái)的那一天,太陽(yáng)高照,而我正在監(jiān)督一隊(duì)建筑工人為我的房子蓋一個(gè)日光浴室。
這是一個(gè)令我們警醒的故事。這些記者無(wú)疑是誠(chéng)實(shí)的,他們不會(huì)故意歪曲事實(shí),但是某種程度上他們又確實(shí)這么做了。必須記住,某些我們利用的信息源,比如任何一方的政客在談到2000大選期間發(fā)生在佛羅里達(dá)的戲劇性變化時(shí),都使數(shù)據(jù)顯得支持他們那個(gè)版本的真實(shí)。我們必須明白,所有我們的知識(shí)都是不完整的的臨時(shí)的,會(huì)隨著新的證據(jù)和理論的出現(xiàn)而變化。三十年以前,恐龍還被認(rèn)為是冷血?jiǎng)游,但現(xiàn)在它們不是了?铸堊约簭膩(lái)沒(méi)變過(guò),是人,是新的證據(jù)和解釋使之變化。所以我們總是傾向于不完全肯定我們給別人的答案。
我們對(duì)如何向數(shù)據(jù)提問(wèn)有足夠的了解。當(dāng)我們確信一個(gè)不可能為零的搜索結(jié)果為零時(shí),我們會(huì)重新審視我們的搜索策略--我們是否拼錯(cuò)單詞或姓名了?我們是否找錯(cuò)地方了?我們向統(tǒng)計(jì)數(shù)據(jù)提問(wèn),問(wèn)"這是誰(shuí)說(shuō)的?",問(wèn)"他們是怎么知道的?quot;,問(wèn)"他們的方法是什么?",如果有人給我們成年美國(guó)人挖鼻孔的精確比例,我們足夠清楚必須懷疑有多少人會(huì)誠(chéng)實(shí)的回答這個(gè)問(wèn)題。我們不會(huì)滿足于獲得的第一個(gè)答案。我們不斷地求證,求證,再求證。
準(zhǔn)則七: 問(wèn)圖書(shū)館員
(Rule Seven:Ask a Lbrarian)
我們會(huì)……,廢話,我們當(dāng)然會(huì)問(wèn)圖書(shū)館員。
· 因?yàn)槲覀兝潇o的了解我們的收藏。
· 因?yàn)橛袝r(shí)人們?nèi)绻陬A(yù)期地點(diǎn)沒(méi)有找到預(yù)期答案,就會(huì)放棄。(有多少次真實(shí)的問(wèn)題被隱蔽在表面問(wèn)題的背后:"讀者指南在哪兒?")
· 因?yàn)槲覀兣Πl(fā)現(xiàn)人們真正需求的信息,并且把它轉(zhuǎn)化成我們的系統(tǒng)能理解的問(wèn)題。
· 因?yàn)槲覀兏瞄L(zhǎng)于面面俱到的考慮一個(gè)事物的前前后后-- 如果我們沒(méi)有關(guān)于暹羅貓的書(shū),我們還有關(guān)于貓類繁殖和飼養(yǎng)的書(shū);我們還有雜志索引和數(shù)據(jù)庫(kù)可能幫我們找到關(guān)于暹羅貓的文章;我們甚至可能在顧客不屑一顧的兒童書(shū)籍中找到一本合適的書(shū)。
· 因?yàn)槲覀兞私馊绾蚊罡鞣N數(shù)據(jù)庫(kù)起立、打滾、舔我們的臉。我們的用戶沒(méi)有找到答案的事實(shí),并不意味著答案不存在。(誠(chéng)然,事實(shí)可能是我們也找不到答案。)
· 因?yàn),跟我們的用戶不同,我們(cè)谌ラ_(kāi)始搜尋的時(shí)候,是帶著太平洋底的深信,深信答案存在,而以上帝的名義,憑作為圖書(shū)館員的榮譽(yù),我們會(huì)把它找出來(lái)。
問(wèn)題是,為什么會(huì)只有我們,幾乎沒(méi)有別人再懂這些?
這些準(zhǔn)則真被當(dāng)做準(zhǔn)則受到重視嗎?它們應(yīng)該是的,因?yàn)槲宜赖拿恳粋(gè)優(yōu)秀圖書(shū)館員,所有時(shí)間都在實(shí)踐它們。這可以用來(lái)解釋,為什么我們能夠如此一致的、輕易的,制造一些超越我們的目錄和計(jì)算機(jī)的神秘,找到使外行吃驚的答案。
我常常暗示我的學(xué)生,信息就象匹薩餅,-- 你越餓,你就吃得越多。你的搜索需求越徹底,你越需要徹底搜索所有可利用資源。這是我的猜測(cè),關(guān)于什么格式的信息分別占據(jù)了在過(guò)去3個(gè)世紀(jì)中累計(jì)總信息的多少百分比。我相信由地區(qū)、國(guó)家、國(guó)際政府創(chuàng)造的文件是這幾個(gè)世紀(jì)中最大的獨(dú)立信息源;然后是書(shū)和期刊;即使已有著超過(guò)10億網(wǎng)頁(yè),而且在以每天幾百萬(wàn)的速度增加,互聯(lián)網(wǎng)在能有競(jìng)爭(zhēng)力之前,還有很多需要迎頭趕上的地方;剩下的小塊還包括諸如論文、會(huì)議文獻(xiàn)、錄像、電影、圖片、地圖、數(shù)據(jù)庫(kù),等等。
這個(gè)信息匹薩餅的每一個(gè)小碎片,都還能被分割得最小,甚至一個(gè)如雜志或期刊這樣的小碎片,也還能被細(xì)分成索引不同內(nèi)容的不同數(shù)據(jù)庫(kù)--聯(lián)機(jī)醫(yī)學(xué)文獻(xiàn)分析和檢索系統(tǒng)(Medline), 科教資源信息中心(ERIC),生物學(xué)文摘(Biological Abstracts),美國(guó)國(guó)立農(nóng)業(yè)圖書(shū)館館藏檢索(Agricola)。如果你真的想進(jìn)行完整的搜索,檢查支離破碎的每一個(gè)可能小片。
下邊這些是最初的信息準(zhǔn)則,比我當(dāng)初寫(xiě)下時(shí)和謄寫(xiě)時(shí)已漂亮點(diǎn)了。從那以后它們已有所成長(zhǎng):
1. Go where it is.
2. The answer you get depends on the question you ask.
3. Research is a multi-stage process.
4. Ask a librarian.
我沒(méi)有發(fā)明這些準(zhǔn)則,我只是使它們條理化文字化。條理化文字化--當(dāng)職業(yè)搜索者收到人們的問(wèn)題時(shí)做的另一件事。
準(zhǔn)則一: 去信息應(yīng)該在的地方
(Rule One:Go Where It Is )
普通人或許以為,象我們這樣擅長(zhǎng)搜索的人,一定是因?yàn)橹酪恍┦褂盟阉饕娴拿丶。其?shí),我們真正知道的,恰恰是這個(gè)事實(shí):對(duì)于很多問(wèn)題,是無(wú)法用搜索引擎解決的,因?yàn)榛ヂ?lián)網(wǎng)上并不存在所需信息。也許答案藏在1935年出版的一本《哈潑的》中(Harper's),或者藏在1865年出版的一張《紐約時(shí)報(bào)》中,或者藏在一本對(duì)比不同歐洲國(guó)家醫(yī)療保險(xiǎn)管理政策的書(shū)中,或者藏在一段未發(fā)表的論文中,或者藏在一份寶時(shí)潔(P&G)做的產(chǎn)權(quán)市場(chǎng)調(diào)查中,或者藏在1965年的一場(chǎng)參議院聽(tīng)證會(huì)記錄中。
當(dāng)任何人向我們提出一個(gè)問(wèn)題時(shí),無(wú)論是否熟悉該領(lǐng)域,我們做的第一件事,是搜尋我們腦海中積累的信息地理圖。當(dāng)我們說(shuō)出"讓我們?cè)囈幌侣?lián)機(jī)醫(yī)學(xué)文獻(xiàn)分析和檢索系統(tǒng)(MEDLINE)"時(shí),我們已經(jīng)評(píng)估過(guò)用戶的需求(關(guān)于某種醫(yī)藥環(huán)境下的特殊療法)和知識(shí)水平(醫(yī)學(xué)教授或?qū)W生),并確定了哪里最可能找得到符合他們需求的信息(醫(yī)療文獻(xiàn)中的文章)。
無(wú)論那問(wèn)題是什么,我們都會(huì)經(jīng)歷同樣的信息地理圖搜尋和確認(rèn)過(guò)程:被問(wèn)及藝術(shù)品的復(fù)制時(shí),我們會(huì)去搜尋藝術(shù)百科全書(shū)或者互聯(lián)網(wǎng);被問(wèn)及1966年1美元可以買(mǎi)到什么時(shí),我們會(huì)去搜尋《美國(guó)歷史統(tǒng)計(jì)》(Historical Statistics)或《美國(guó)統(tǒng)計(jì)摘要》(Statistical Abstracts)或者1966年的本地報(bào)紙廣告。不同的工具可以找回不同的信息,而圖書(shū)館員們的技巧正是了解哪一種工具可以最好的完成哪一種任務(wù)。
當(dāng)一個(gè)圖書(shū)館員問(wèn)我特拉華流域(Delaware watershed)的原始信息時(shí),我的第一個(gè)反應(yīng)是:
· 美國(guó)陸軍工程軍團(tuán)(Army Corps of Engineers).
· 美國(guó)漁業(yè)及野生動(dòng)物服務(wù)(U.S. Fish and Wildlife Service).
· 美國(guó)環(huán)保局(Environmental Protection Agency).
· 特拉華州的同類部門(mén)(equivalent agencies for the state of Delaware).
明確了這個(gè)主題,我就在searchgov.com作了一次搜索,果然,從聯(lián)邦政府的這幾個(gè)部門(mén)和其它部門(mén)發(fā)現(xiàn)了一大堆相關(guān)文件。但是聯(lián)想到大多數(shù)關(guān)心流域問(wèn)題的人都是科學(xué)家,我也用了SciSeek.com去搜索互聯(lián)網(wǎng)上的科學(xué)網(wǎng)站,那使我找到了大量其它與這個(gè)流域的環(huán)境、化學(xué)、工程相關(guān)的信息。
然后,我通過(guò)EBSCOhost 搜索多個(gè)全文數(shù)據(jù)庫(kù),那使我找到了從包括科學(xué)雜志、旅行雜志和體育雜志上的相關(guān)文章。
圖書(shū)館員們也明白,不同信息源的風(fēng)格是互相不可代替的。雜志和報(bào)紙會(huì)用讀者簡(jiǎn)明易懂的語(yǔ)言解釋復(fù)雜晦澀的主題,而學(xué)術(shù)和專業(yè)雜志則發(fā)表原始的研究文章(僅僅是普通用戶問(wèn)題中的"研究"可能自動(dòng)把我們送向一個(gè)雜志全文檢索庫(kù))。但是因?yàn)?quot;研究"必然被限制在一個(gè)主題的很小的、可掌控的領(lǐng)域,它就象一個(gè)難題的小塊。當(dāng)我們想看這一個(gè)小塊的風(fēng)格時(shí),或者當(dāng)我們想知道一個(gè)主題的廣泛背景時(shí),我們會(huì)去找書(shū),書(shū)會(huì)概括和讓你理解一個(gè)最初的研究。政府文件則會(huì)提供統(tǒng)計(jì)、法律、金融信息,甚至?xí)嘘P(guān)于"我們是誰(shuí)?"、"我們擁有什么?"、"我們已經(jīng)到了哪一步?"等公開(kāi)資料。
我們了解每一種信息源風(fēng)格的長(zhǎng)處和短處;ヂ(lián)網(wǎng)長(zhǎng)于圖片和示范,對(duì)于政府文件,對(duì)于FAQ文檔,對(duì)于討論組,對(duì)于傳輸全文數(shù)據(jù)庫(kù);但是我們也知道,互聯(lián)網(wǎng)對(duì)于1995年前的雜志和政府文件,幾乎是沒(méi)什么用的。對(duì)于這些資料,我們?nèi)匀恍枰褂梦覀兊呐f索引和期刊備份。我們也比僅僅信任互聯(lián)網(wǎng)權(quán)威和準(zhǔn)確性知道得更多,你也許會(huì)在互聯(lián)網(wǎng)上找到一段引證 -- 甚至它的好幾個(gè)版本-- 但是不要指望找到它的正確起源。我們對(duì)于互聯(lián)網(wǎng)信息源的態(tài)度是冷戰(zhàn)式的懷疑:信任它,但是只有在確證以后。
我們知道誰(shuí)最可能制造不同類別的信息。對(duì)于大多數(shù)嚴(yán)肅的統(tǒng)計(jì)數(shù)據(jù),我們會(huì)從《美國(guó)統(tǒng)計(jì)摘要》開(kāi)始,但是對(duì)于生活類統(tǒng)計(jì)數(shù)據(jù),我們會(huì)去搜尋那些為需要推廣產(chǎn)品的廣告主們做的專業(yè)的市場(chǎng)調(diào)研報(bào)告。被問(wèn)及美國(guó)男孩洗澡的頻度時(shí),我查詢了一個(gè)全文商業(yè)期刊數(shù)據(jù)庫(kù),查找會(huì)在諸如《美國(guó)人口統(tǒng)計(jì)數(shù)據(jù)》(American Demographics)等雜志上發(fā)表的市場(chǎng)調(diào)研報(bào)告。(順便提一下那問(wèn)題的答案,答案有違我們的直覺(jué):超過(guò)三分之一的男孩,每天至少洗澡兩次。)
我們知道,有時(shí)最好的信息源正是普通的人,作為個(gè)體的或作為群體之一的,對(duì)某主題有熱情的人。當(dāng)我們的用戶需要關(guān)于糖尿病的可靠的、權(quán)威的信息時(shí),我們會(huì)帶他們?nèi)ッ绹?guó)糖尿病協(xié)會(huì)(American Diabetes Association)的網(wǎng)站;當(dāng)我們的用戶想和有相同疾病經(jīng)驗(yàn)的人交流,想了解糖尿病患者如何生活時(shí),我們會(huì)帶他們?nèi)ハ嚓P(guān)的支持團(tuán)體。
當(dāng)我們想知道一種嶄新科技或策略是否有效時(shí),我們會(huì)去找互聯(lián)網(wǎng)上的相關(guān)討論組。而當(dāng)一個(gè)主題非常偏僻晦澀時(shí),我們會(huì)直接上網(wǎng),因?yàn)榛ヂ?lián)網(wǎng)是那些擁有古怪偏好(如風(fēng)笛、中世紀(jì)地圖、劣質(zhì)的涂鴉作品)的人們分享他們熱情的最佳場(chǎng)所。
我們職業(yè)搜索者,完全可以被描述成信息世界中旅行者的向?qū)? 我們之所以能幫助我們的旅行者快速到達(dá)目的地 ,是因?yàn)槲覀冎滥康牡卦谀睦,是因(yàn)槲覀冎雷罴训穆肪是什么,因?yàn)槲覀冎缿?yīng)該坐飛機(jī),火車,還是汽車。
準(zhǔn)則二: 你得到什么答案,取決于你怎么提問(wèn)
(Rule Two:The Answer You Get Depends on the Questions You Ask)
推論:?jiǎn)栴}決定答案,如果你不喜歡答案,那么換問(wèn)題吧
普通人或許以為,圖書(shū)館員們一定知道所有的答案。其實(shí),我們真正知道的,是如何問(wèn)出好問(wèn)題。我們知道如何在寬泛和特殊之間自如滑動(dòng)調(diào)節(jié)搜索范圍,直到我們找到那任務(wù)最關(guān)鍵的影響因素。
我們用來(lái)滑動(dòng)調(diào)節(jié)搜索范圍的方法之一,是語(yǔ)言。如果我們用一個(gè)特殊關(guān)鍵詞沒(méi)有發(fā)現(xiàn)足夠的信息,我們就會(huì)轉(zhuǎn)向概念更寬泛的一個(gè)層面;如果我們發(fā)現(xiàn)了太多信息,我們就會(huì)嘗試更特殊的關(guān)鍵詞。
舉例來(lái)說(shuō),當(dāng)我們被要求尋找這方面的研究資料:肥胖者與身材標(biāo)準(zhǔn)者做相同的工作,是否肥胖者掙的錢(qián)更少? 一些我們會(huì)嘗試的關(guān)鍵詞,可能是"肥胖"或"體重"(obesity or weight),"薪水"或"工資"或"收入"(salary or wages or pay),"歧視"或"區(qū)別"(discrimination or differential)。我們也有可能使用更寬泛的陳述:肥胖和雇用歧視(Obesity and employment discrimination),這或許會(huì)找回各種關(guān)于歧視的研究資料:面試,薪水,評(píng)估,提升,等等。不管我們用哪種關(guān)鍵詞組合,我們都知道,我們會(huì)得到不同的搜索結(jié)果,因此,我們當(dāng)然會(huì)使用所有想得到的合理關(guān)鍵詞。而且,當(dāng)我們點(diǎn)擊到有價(jià)值的新發(fā)現(xiàn)時(shí),我們還會(huì)使用我們從連續(xù)的搜索過(guò)程中遇到的網(wǎng)頁(yè)中發(fā)現(xiàn)的任何新關(guān)鍵詞。
此外,我們還使用其它方法來(lái)滑動(dòng)調(diào)節(jié)搜索范圍。當(dāng)我們決定搜索主題標(biāo)題時(shí),我們會(huì)從最特殊的關(guān)鍵詞開(kāi)始,以保證我們找回的文件和主題完全相關(guān)。當(dāng)我們對(duì)找到什么相關(guān)內(nèi)容幾乎不存指望,-- 當(dāng)我們需要的只是damn fool luck, -- 我們會(huì)從最寬泛的關(guān)鍵詞開(kāi)始搜索。一旦我們找到了什么資料,我們就會(huì)用盡技巧利用它,順藤摸瓜連本帶利找出更多相關(guān)資料。
當(dāng)我們從概念最寬泛的關(guān)鍵詞開(kāi)始搜索時(shí),我們會(huì)使用"OR"組織關(guān)鍵詞,就象用一個(gè)拖網(wǎng)捕捉到四分之一英里內(nèi)半徑內(nèi)的每一條魚(yú);并使用"AND"組織關(guān)鍵詞,用這個(gè)方法來(lái)滑動(dòng)調(diào)節(jié)到最狹窄的搜索范圍,就象扔掉不合格的魚(yú)。
當(dāng)我們想搜索無(wú)限信息宇宙中的一小塊時(shí),-- 一個(gè)卡片目錄,或者《聯(lián)機(jī)醫(yī)學(xué)文獻(xiàn)分析和檢索系統(tǒng)》,或者一個(gè)特殊搜索引擎如searchgov.com -- 我們也是在搜索一個(gè)統(tǒng)一體的狹窄概念領(lǐng)域。
狹窄搜索的風(fēng)險(xiǎn)是:某些相關(guān)信息中并不含有我們使用的關(guān)鍵詞,或者我們選擇的特殊搜索引擎或數(shù)據(jù)庫(kù)中并沒(méi)有索引某些相關(guān)信息,因此我們可能錯(cuò)過(guò)這些相關(guān)信息。而當(dāng)我們從最寬泛概念開(kāi)始搜索時(shí),也要冒只找到無(wú)效結(jié)果的風(fēng)險(xiǎn),比如當(dāng)我測(cè)遍搜索引擎尋找一個(gè)名叫"E."的歌手信息時(shí)。
通過(guò)在寬泛和狹窄的概念之間滑動(dòng)調(diào)節(jié);組合不同的關(guān)鍵詞、不同的搜索方法、不同的搜索資源;總是想著還能找到其它什么內(nèi)容;我們大幅度提高了這種可能性:不是為顧客發(fā)現(xiàn)一個(gè)答案,而是為顧客發(fā)現(xiàn)一個(gè)最佳答案。
準(zhǔn)則三: 答案必須迎合需求
(Rule Three:The Answer Should Match the Information Need)
圖書(shū)館員們需要理解的,不僅是問(wèn)題,還需要理解:哪一種答案會(huì)使顧客滿意。如果我們給他們的答案不是他們想要的那一種,那我們能算是回答了他們嗎:有人要一篇百科全書(shū)文章,你給他一摞書(shū),雖然那摞書(shū)中有答案?有人要一個(gè)特定問(wèn)題的口頭答案,你給他一個(gè)網(wǎng)站,雖然那網(wǎng)站中有答案?有位病人要了解他剛被診斷患上的一種疾病的信息,你給他一本專業(yè)醫(yī)學(xué)學(xué)術(shù)雜志上的晦澀文章,雖然那文章中有答案?有人僅僅想打印幾篇文章好帶回家去看,你給他一打文摘?
接受這個(gè)假設(shè):圖書(shū)館員是一群迷失在獵獲的戰(zhàn)栗中的好學(xué)者。我們總是能更頑強(qiáng)的追溯蛛絲馬跡,跟那些在某方面有需求或感興趣的顧客相比,我們總是能找到更多的信息。除非我們是在幫一個(gè)學(xué)者做研究,我們面臨的問(wèn)題通常不是找到信息,而是知道什么時(shí)候該停下來(lái)。-- 給一個(gè)禮貌的建議,當(dāng)然,存在其它用戶可采用的途徑,他們應(yīng)該要求更多。
準(zhǔn)則四: 搜索是一個(gè)多步驟的過(guò)程
(Rule four:Research Is a Multi-Stage Process)
有時(shí),獵獲過(guò)程只能是迂回曲折的。為了尋找歌手"E."的信息,我需要從一本搖滾百科全書(shū)或搖滾網(wǎng)站開(kāi)始,我去了"終極樂(lè)隊(duì)名單"(UBL.com),在那里找到了"E."的一個(gè)傳記,一個(gè)音樂(lè)唱片分類目錄,他現(xiàn)在的樂(lè)隊(duì)The Eels的信息,他們的官方網(wǎng)站,以及巡回演出信息。
如果有人真的想尋找某個(gè)主題所有最細(xì)枝末節(jié)的信息,這會(huì)激活我們偵探犬般靈敏的本能,引發(fā)我們擁有的每一絲技巧。首先,我們會(huì)去每一個(gè)我們認(rèn)為可能有所找信息的地方,搜索不止一個(gè)數(shù)據(jù)庫(kù),而是每一個(gè)似乎可能的數(shù)據(jù)庫(kù)。我們會(huì)搜尋期刊數(shù)據(jù)庫(kù),論文摘要,OCLC聯(lián)機(jī)聯(lián)合編目目錄(WorldCat),會(huì)議論文索引,等等。我們會(huì)急速走遍整個(gè)互聯(lián)網(wǎng),既使用普通搜索引擎,也使用特殊搜索引擎、專業(yè)網(wǎng)站和看不見(jiàn)的數(shù)據(jù)庫(kù)。
每當(dāng)我們發(fā)現(xiàn)什么的時(shí)候,我們都會(huì)從中觀察發(fā)掘更多線索。跟隨書(shū)目中的每一條信息,搜尋這些作者的更多作品,找到那些作者的e-mail,進(jìn)行引用搜索,查找誰(shuí)在引用他們的作品。每當(dāng)我們發(fā)現(xiàn)有用的新關(guān)鍵詞時(shí),我們都會(huì)回到我們已搜索過(guò)的地方,使用新關(guān)鍵詞再次搜索。當(dāng)我們找到一些正是我們的顧客腦海中所想信息時(shí),我們會(huì)極盡利用數(shù)據(jù)庫(kù)或搜索引擎提供的任何功能-- 可點(diǎn)擊的主題或者一個(gè)"more like this"的功能-- 尋找更多的類似條目。
準(zhǔn)則五: 信息本身是無(wú)意義的,只有人提問(wèn)之后才有價(jià)值
(Rule Five:信息 Is Meaningless Until Queried by Human Intelligence)
數(shù)據(jù):瑞典是最大的烹調(diào)醬用戶。
數(shù)據(jù):51%的圣路易士居民說(shuō)他們從未去過(guò)圣路易士拱門(mén)。
數(shù)據(jù):根據(jù)NEC研究院的資料,1.5% 的網(wǎng)站是色情網(wǎng)站。
現(xiàn)在你知道這些數(shù)據(jù)了,你更聰明了還是更happy了?事實(shí)上,你能有什么理由關(guān)心這些呢?沒(méi)有上下文,這些數(shù)據(jù)只是數(shù)據(jù),不是信息。只有在我們象這樣提問(wèn)時(shí),它們才成為有價(jià)值的信息:
· 如果我計(jì)劃在瑞典做銷售莎莎醬,會(huì)面臨什么樣的競(jìng)爭(zhēng)?
· 圣路易士是否應(yīng)該面向本地居民做旅行宣傳廣告?
· 互聯(lián)網(wǎng)上的色情問(wèn)題到底有多嚴(yán)重? (注意:解答這個(gè)問(wèn)題需要遠(yuǎn)超過(guò)以上數(shù)據(jù)的信息)
這個(gè)世界充滿了無(wú)窮無(wú)盡的內(nèi)容:箭頭,陶器碎片,軟體動(dòng)物化石,古老的文字和日記,五十年代的菜譜,壘高拼裝玩具,芭比娃娃。
所有這些數(shù)據(jù)都是無(wú)意義的,直到有人做一些事-- 提一個(gè)問(wèn)題,把它們與其它數(shù)據(jù)放在一起,思考它們的意義,直到有人歸并這些碎片并發(fā)現(xiàn)一個(gè)過(guò)去的文明,或者在破爛文字中發(fā)現(xiàn)政治陰謀的痕跡,或者從這些舊菜譜中得知罐裝湯和袋裝食品是什么時(shí)候開(kāi)始滲入我們生活的。
除非你知道自己要用它們做什么,隨便的數(shù)據(jù)堆積是無(wú)意義的。你必須從一個(gè)問(wèn)題開(kāi)始,或者一個(gè)主題,最好有一個(gè)明確的陳述不僅讓你明白什么信息是你需要的,而且讓你明白什么信息對(duì)你是無(wú)用的。如果你說(shuō)你想找到專利權(quán)的經(jīng)濟(jì)效果,你完全可以只聚焦于成功者和失敗者。
這意味著你可以忽略保護(hù)專利權(quán)的爭(zhēng)論以及什么發(fā)明可以授予專利的辯論。你的數(shù)據(jù)應(yīng)該聚焦于股價(jià)、資產(chǎn)平衡表、和價(jià)格目錄。
準(zhǔn)則六: 向你的答案提問(wèn) ―― 信息可能是真的,但仍然是錯(cuò)的
(Rule Six:Question Your Answers - Information May Be True But Still Wrong)
我住在愛(ài)荷華州的達(dá)芬波特市。2001年5月,我們招待了天知道多少網(wǎng)絡(luò)新聞?dòng)浾撸麄兌及阉麄兊南鄼C(jī)指向我們的,被密西西比河包圍和淹沒(méi)的,棒球館。那些相機(jī)顯示了我們的河流對(duì)這國(guó)家的驅(qū)動(dòng)-- 淹沒(méi)-- 小隊(duì)志愿者在填充沙袋。令人小小驚訝的是每一個(gè)我打過(guò)電話的親戚都提出送浮袋給我,但我不需要它。
這些記者一直在報(bào)道著事實(shí),直到我們離開(kāi)。他們忽略的是告訴剩余的故事,把相機(jī)鏡頭移向四周,或者移向旁邊。如果他們有那么做,那么這個(gè)國(guó)家就會(huì)認(rèn)識(shí)到:達(dá)芬波特市建在一座驚人高大的山上,99%的城區(qū)都沒(méi)有收到洪水的影響,只要不遇到更糟的情況。
洪峰到來(lái)的那一天,太陽(yáng)高照,而我正在監(jiān)督一隊(duì)建筑工人為我的房子蓋一個(gè)日光浴室。
這是一個(gè)令我們警醒的故事。這些記者無(wú)疑是誠(chéng)實(shí)的,他們不會(huì)故意歪曲事實(shí),但是某種程度上他們又確實(shí)這么做了。必須記住,某些我們利用的信息源,比如任何一方的政客在談到2000大選期間發(fā)生在佛羅里達(dá)的戲劇性變化時(shí),都使數(shù)據(jù)顯得支持他們那個(gè)版本的真實(shí)。我們必須明白,所有我們的知識(shí)都是不完整的的臨時(shí)的,會(huì)隨著新的證據(jù)和理論的出現(xiàn)而變化。三十年以前,恐龍還被認(rèn)為是冷血?jiǎng)游,但現(xiàn)在它們不是了?铸堊约簭膩(lái)沒(méi)變過(guò),是人,是新的證據(jù)和解釋使之變化。所以我們總是傾向于不完全肯定我們給別人的答案。
我們對(duì)如何向數(shù)據(jù)提問(wèn)有足夠的了解。當(dāng)我們確信一個(gè)不可能為零的搜索結(jié)果為零時(shí),我們會(huì)重新審視我們的搜索策略--我們是否拼錯(cuò)單詞或姓名了?我們是否找錯(cuò)地方了?我們向統(tǒng)計(jì)數(shù)據(jù)提問(wèn),問(wèn)"這是誰(shuí)說(shuō)的?",問(wèn)"他們是怎么知道的?quot;,問(wèn)"他們的方法是什么?",如果有人給我們成年美國(guó)人挖鼻孔的精確比例,我們足夠清楚必須懷疑有多少人會(huì)誠(chéng)實(shí)的回答這個(gè)問(wèn)題。我們不會(huì)滿足于獲得的第一個(gè)答案。我們不斷地求證,求證,再求證。
準(zhǔn)則七: 問(wèn)圖書(shū)館員
(Rule Seven:Ask a Lbrarian)
我們會(huì)……,廢話,我們當(dāng)然會(huì)問(wèn)圖書(shū)館員。
· 因?yàn)槲覀兝潇o的了解我們的收藏。
· 因?yàn)橛袝r(shí)人們?nèi)绻陬A(yù)期地點(diǎn)沒(méi)有找到預(yù)期答案,就會(huì)放棄。(有多少次真實(shí)的問(wèn)題被隱蔽在表面問(wèn)題的背后:"讀者指南在哪兒?")
· 因?yàn)槲覀兣Πl(fā)現(xiàn)人們真正需求的信息,并且把它轉(zhuǎn)化成我們的系統(tǒng)能理解的問(wèn)題。
· 因?yàn)槲覀兏瞄L(zhǎng)于面面俱到的考慮一個(gè)事物的前前后后-- 如果我們沒(méi)有關(guān)于暹羅貓的書(shū),我們還有關(guān)于貓類繁殖和飼養(yǎng)的書(shū);我們還有雜志索引和數(shù)據(jù)庫(kù)可能幫我們找到關(guān)于暹羅貓的文章;我們甚至可能在顧客不屑一顧的兒童書(shū)籍中找到一本合適的書(shū)。
· 因?yàn)槲覀兞私馊绾蚊罡鞣N數(shù)據(jù)庫(kù)起立、打滾、舔我們的臉。我們的用戶沒(méi)有找到答案的事實(shí),并不意味著答案不存在。(誠(chéng)然,事實(shí)可能是我們也找不到答案。)
· 因?yàn),跟我們的用戶不同,我們(cè)谌ラ_(kāi)始搜尋的時(shí)候,是帶著太平洋底的深信,深信答案存在,而以上帝的名義,憑作為圖書(shū)館員的榮譽(yù),我們會(huì)把它找出來(lái)。
問(wèn)題是,為什么會(huì)只有我們,幾乎沒(méi)有別人再懂這些?
這些準(zhǔn)則真被當(dāng)做準(zhǔn)則受到重視嗎?它們應(yīng)該是的,因?yàn)槲宜赖拿恳粋(gè)優(yōu)秀圖書(shū)館員,所有時(shí)間都在實(shí)踐它們。這可以用來(lái)解釋,為什么我們能夠如此一致的、輕易的,制造一些超越我們的目錄和計(jì)算機(jī)的神秘,找到使外行吃驚的答案。
我常常暗示我的學(xué)生,信息就象匹薩餅,-- 你越餓,你就吃得越多。你的搜索需求越徹底,你越需要徹底搜索所有可利用資源。這是我的猜測(cè),關(guān)于什么格式的信息分別占據(jù)了在過(guò)去3個(gè)世紀(jì)中累計(jì)總信息的多少百分比。我相信由地區(qū)、國(guó)家、國(guó)際政府創(chuàng)造的文件是這幾個(gè)世紀(jì)中最大的獨(dú)立信息源;然后是書(shū)和期刊;即使已有著超過(guò)10億網(wǎng)頁(yè),而且在以每天幾百萬(wàn)的速度增加,互聯(lián)網(wǎng)在能有競(jìng)爭(zhēng)力之前,還有很多需要迎頭趕上的地方;剩下的小塊還包括諸如論文、會(huì)議文獻(xiàn)、錄像、電影、圖片、地圖、數(shù)據(jù)庫(kù),等等。
這個(gè)信息匹薩餅的每一個(gè)小碎片,都還能被分割得最小,甚至一個(gè)如雜志或期刊這樣的小碎片,也還能被細(xì)分成索引不同內(nèi)容的不同數(shù)據(jù)庫(kù)--聯(lián)機(jī)醫(yī)學(xué)文獻(xiàn)分析和檢索系統(tǒng)(Medline), 科教資源信息中心(ERIC),生物學(xué)文摘(Biological Abstracts),美國(guó)國(guó)立農(nóng)業(yè)圖書(shū)館館藏檢索(Agricola)。如果你真的想進(jìn)行完整的搜索,檢查支離破碎的每一個(gè)可能小片。
下邊這些是最初的信息準(zhǔn)則,比我當(dāng)初寫(xiě)下時(shí)和謄寫(xiě)時(shí)已漂亮點(diǎn)了。從那以后它們已有所成長(zhǎng):
1. Go where it is.
2. The answer you get depends on the question you ask.
3. Research is a multi-stage process.
4. Ask a librarian.