文獻信息檢索與利用基本知識介紹

一、網上電子資源檢索與利用

l 檢索方法的使用

1、布爾邏輯檢索

所謂布爾邏輯檢索(Boolean Logical)是用布爾邏輯算符將檢索詞、短語或代碼進行邏輯組配,指定文獻的命中條件和組配次序,凡符合邏輯組配所規定條件的為命中文獻,否則為非命中文獻。

常用的布爾邏輯運算有三種,分別是邏輯或、邏輯與、邏輯非。

邏輯或:運算符為“OR”、“or”、“+”,有時也可以用“|”表示。

檢索式A OR B ,表示包含檢索詞A的文獻或包含檢索詞B的文獻或者同時包含A和B的文獻均為命中文獻。使用邏輯或相當于增加檢索主題的同義詞與近義詞,擴大了檢索范圍。

例:華僑 OR 華人

邏輯與:運算符為“AND”、“and”、“*”,有時也可能用“&”表示。

檢索式A AND B,表示文獻中同時包含檢索詞A和檢索詞B的文獻才是命中文獻。使用邏輯與縮小了檢索范圍,增強了檢索的專指性。

例:華僑 AND 馬來西亞

邏輯非:運算符為“NOT”、“not”、“-”,有時也可能用“!”表示。

檢索式A NOT B,表示包含檢索詞A同時不包含檢索詞B的文獻為命中文獻。邏輯非排除了不希望出現的檢索詞,增強了檢索專指性。但在使用時要特別注意,因為它同時排除了有用的文獻。

例:華僑 NOT 馬來西亞

上述三種邏輯運算的關系見圖3.1。對于一個復雜的邏輯檢索式,檢索系統的處理是從左向右進行的。在有括號的情況下,先執行括號內的運算;有多層括號時,先執行最內層括號中的運算,逐層向外進行。在沒有括號的情況下,And、Or、Not的運算次序,在不同的系統中有不同的規定,例如DIALOG系統中依次為Not→And→Or;STAIRS系統和ORBIT系統中依次為And和Not按自然順序執行,然后執行Or運算。檢索時應注意了解各機檢系統的規定。

每個搜索引擎可以使用的布爾運算符是不同的,有的只允許使用大寫的“AND”、“NOT”、“OR”運算符,有的大小寫通用,有的可支持“&”、“|”、“!”符號操作,有的不支持或僅支持其中的一個等等。

例如,Google和”Yahoo!中國”都支持布爾邏輯檢索。Google可用”AND”、”and”、”&”進行邏輯”與”運算,但只能用大寫”OR”表示邏輯”或”,不支持”NOT”邏輯符操作,允許使用”-“符號代替邏輯”非”運算;”Yahoo!中國”可用”AND”、”and”、”&”進行邏輯”與”運算,以”OR”進行邏輯”或”運算,以”NOT”、”not”進行邏輯”非”運算。

確切地知曉每一種搜索引擎的檢索功能與特性,無需死記硬背。只要在使用時,查看幫助信息便是了。

2、詞組檢索

詞組檢索(phrase),也稱為短語檢索,或字符串檢索。它是將一個詞組或短語用雙引號“”””括起作為一個獨立運算單元,進行嚴格匹配,以提高檢索準確度的一種方法。檢索結果必須含有與提問式完全一樣 ( 包括次序 ) 的字串。幾乎所有的搜索引擎都支持詞組檢索。

例如,以”僑務新聞”作為提問關鍵詞檢索時,檢索結果則僅反饋僑務新聞的內容。

3、 位置檢索

位置檢索(Proximate)是在檢索詞之間使用位置算符(也稱鄰近算符Adjacent Operators),來規定算符兩邊的檢索詞出現在記錄中的位置,從而獲得不僅包含有指定檢索詞而且這些詞在記錄中的位置也符合特定要求的記錄。這種方法能夠提高檢索的準確性,當檢索的概念要用詞組表達,或者要求兩個詞在記錄中位置相鄰/相連時,可使用位置算符。機檢系統中常用的位置算符(按限制強度遞增順序排列)如下:

(1).(f)算符Field:要求被連接的檢索詞出現在同一字段中,字段類型和詞序均不限。例如 happiness(f)sadness and crying

(2).(s)算符Sub-field/Sentence:要求被連接的檢索詞出現在同一句子(同一子字段)中,詞序不限。例如 machine(s)plant

(3).(n)算符near:(n)要求被連接的檢索詞必須緊密相連,詞之間除允許有空格、標點、連字符外,不得夾單詞或字母,詞序不限;(Nn)表示兩個檢索詞之間最多可以夾N個詞(N為自然數1、2、3…),且詞序任意。例如 information(n)retrieval 可以檢出 information retrieval 和 retrieval information,又如econom ?? ?(2n) recovery 可以檢出economic recovery、recovery of the economy 、recovery from economic troubles

(4).(w)算符With:(w)要求檢索詞必須按指定順序緊密相連,詞序不可變,詞之間除允許有空格、標點、連字符外,不得夾單詞或字母;(Nw)表示連接的兩個詞之間最多可夾入N個詞(N為自然數),詞序不得顛倒。例如 input(w)output可檢出input output而wear(1w)materials可檢出wear materials、wear of materials

采用位置算符檢索時,通常最嚴謹的算符放在最左面,例如:

european(w)economic(w)community(f)patio,

redwood(3n)deck?(s)(swimming(w)pool?)

注意:不同的機檢系統,位置檢索的功能及算符不同,應參看機檢系統的說明。

4、截詞檢索

截詞檢索(Truncation)是指用給定的詞干做檢索詞,查找含有該詞干的全部檢索詞的記錄,也稱詞干檢索或字符屏蔽檢索。它可以起到擴大檢索范圍,提高查全率,減少檢索詞的輸入量,節省檢索時間,降低檢索費用等作用。檢索時,若遇到名詞的單復數形式,詞的不同拼寫法,詞的前綴或后綴變化時,均可采用此方法。

截詞的方式有多種,按截斷部位可分為右截斷、左截斷、中間截斷、復合截斷等;按截斷長度可以分為有限截斷和無限截斷。

(1).右截斷:截去某個詞的尾部,是詞的前方一致比較,也稱前方一致檢索。例如:輸入geolog?(?為截斷符號),將會把含有geological、geologic、geologist、geologize、geology等詞的記錄檢索出來。若輸入PY=199?,會把90年代的記錄全部查出來。

(2).左截斷:截去某個詞的前部,是詞的后方一致比較,也稱后方一致檢索。例如:輸入?magnetic 能夠檢出含有magnetic、electromagnetic、paramagnetic、thermo-magnetic等詞的記錄。

(3).中間截斷:截去某個詞的中間部分,是詞的兩邊一致比較,也稱兩邊一致檢索。例如:輸入organi?ation可以檢出organization、organisation;輸入f??t可查出foot、feet。

(4).復合截斷:是指同時采用兩種以上的截斷方式。例如?chemi?可以檢出chemical、chemist、chemistry、electrochemistry、electrochemical、physicochemical、thermochemistry等。

(5).有限截斷:是指允許截去有限個字符。例如“acid? ?”表示截去一個字符,它可檢出acid、acids,但不能檢出acidic、acidicity、acidity等詞。又如comput??? ?可檢出compute、computer、computers、computing等詞,不能檢出computable、computation、computerize等詞。注意:詞干后面連續的數個問號是截斷符,表示允許截去字符的個數,最后一個問號是終止符,它與截斷符之間要有一個空格,輸入時一定要注意。

(6).無限截斷:是指允許截去的字符數量不限,也稱開放式截斷。上面右截斷、左截斷所舉的例子均屬此類型。

由上述可見:任何一種截詞檢索,都隱含著布爾邏輯檢索的“或”運算。采用截詞檢索時,既要靈活、又要謹慎,截詞的部位要適當,如果截得太短(輸入的字符不得少于3個),將增加檢索噪聲,影響查準率。另外,不同的機檢系統使用的截詞符不同、各數據庫所支持的截斷類型也不同,例如DIALOG系統和STN系統用?、ORBIT系統用:、BRS系統用$、ESA-IRS系統用+等。

5、 字段檢索

字段檢索(field)是一種用于限定提問關鍵詞在數據庫記錄中出現的區域,控制檢索結果的相關性,提高檢索效果的檢索方法,多以字段限定方式實現。搜索引擎常用的字段有:Title/t、Subject、Text、host(主機)、URL/u、domain(域名)、link(鏈接)等。

Title:(或t:)表示查找標題中包含檢索提問式的頁面;

URL:(或/u:)表示查找URL中包含檢索提問式的頁面;

Link:表示查找含有鏈接至URL的頁面;

host:表示在指定的服務器上查找頁面;

domain:表示查找指定域名的各頁面;

subject:表示查找主題中包含檢索提問式的頁面;

text:表示文本中包含檢索提問式的頁面。

l 數據庫檢索的常用方法和技巧

1、數據庫常用的檢索字段有哪些?

數據庫常用的檢索字段列表:

西文數據庫常用字段 中文數據庫常用字段

字段名稱 ????????????????????字段代碼

Abstract AB ??????????????????文摘

Author AU ???????????????????作者

Corporate CS ?????????????????機構名稱

Descriptor/Subject DE ??????????敘詞/主題詞

Document Type DT ????????????文獻類型

Full-text FT ??????????????????全文

ISSN ISSN ???????????????????國際標準連續出版物號

Journal Name/Publication Title JN 期刊名稱

Keyword/Topic KW ????????????關鍵詞

Langage LA ??????????????????語言

Publication Year ?PY ???????????出版年

Title TI ??????????????????????題名

2、如何擴大檢索范圍?

對檢索數量比較少的結果,可以進行擴檢,提高查全率。常用措施有:

增加一些檢索詞,或將查詢檢索詞的上位類詞、近義詞等補充進去;

調整組配算符,如改AND為OR;

使用截詞檢索,如改center為cent*;

取消或放寬一些檢索限定,如年限、學科、文種等;

增加或修改檢索入口,如改題名為文摘或全文等。

3、如何進行縮小檢索范圍?

檢索結果過多是信息檢索過程中一個常見問題,從中挑選出相關度高的資料還要花費很長時間。當檢索結果過多時可考慮進行縮檢,提高查準率。常用措施與擴檢相反,如減少一些相關性不強的檢索詞,增加AND組配算符,增加檢索限定,減少檢索入口等。

4、數據庫比較通用的檢索功能主要有哪些?

比較通用的檢索功能主要有三種:

簡單檢索:為用戶提供一個簡單的檢索界面,頁面上通常只有一個檢索框。

復雜檢索:為專業用戶、資深用戶提供的比較復雜的檢索界面,可以構建比較細致的檢索式,幫助用戶進行精確檢索。

二次檢索:在檢索結果內進一步檢索,使檢索結果更精練、準確。

5、科技文獻類型有哪些?如何識別?

科技文獻類型主要包括:科技圖書、科技期刊、科技報告、專利文獻、會議文獻、學位論文、標準文獻、產品資料、技術檔案、政府出版物等。

類型 常用字樣

科技圖書 Sci-Tech book:Monograph, Anthology, Textbook,Reference book

科技期刊 Sci-Tech Journal:magazine, serial, periodical

科技報告 ?Sci-Tech Report

專利文獻 ?Patent Document:Patent specification/bulletin/aids

會議文獻 Conference paper:Proceedings, compilation, collected paper, records Meeting: workshop, seminar, colloquium, symposium, conference

學位論文 Dissertation, Thesis

6、如何找到與課題相關的文獻?

首先應利用本領域的核心數據庫。即根據課題內容歸納出中、英文關鍵詞,盡可能檢索可以利用的、與課題相關的文獻信息數據庫,從而獲得相關文獻;

其次注意通過引文途徑進一步獲取相關文獻。即利用已有文獻中的參考文獻作為獲取新文獻的線索,通過檢索引文數據庫獲得更多文獻;

有時通過瀏覽相關學會和研究機構的網站也能得到一些有用的信息。

最后從檢索結果中選出最感興趣的若干篇文獻,根據文獻的出處設法獲取原文。

7、如何識別數據庫的學科范圍?

一般數據庫都有自己特定的學科范圍、文獻類型。選擇數據庫時,關鍵是識別所選數據庫中是否收錄了所查找學科主題范圍內的文獻,是否有所需要的文獻類型。識別方法:

通過數據庫收錄的來源期刊的學科范圍識別;

通過圖書館網站中資源推介欄目中描述的每種數據庫的學科范圍來識別;

8、如何選擇最適合自己的數據庫?

選擇數據庫時要考慮以下幾個因素:

所需信息的水平:廣度、深度、專指度、學術性。

文獻類型:報紙、雜志、學術期刊、商業期刊、學位論文、會議文獻和科技報告等。

數據庫主題范圍:專業數據庫還是綜合性數據庫。

數據庫時間跨度:當你所需信息超出數據庫收錄文獻的時間跨度時,可查圖書館館藏數據庫的印本文獻。

另外,一定要多試幾個數據庫,因為不同數據庫的收錄范圍不同,甚至同一學科領域的數據庫收錄范圍也不相同。如果還有疑問,可向圖書館員咨詢請他們推薦合適的數據庫。

l 數據庫檢索策略

所謂檢索策略,廣義講是指為實現檢索目標而制定的全盤計劃和方案;狹義講是指檢索式。檢索式是用來表達用戶檢索提問的邏輯表達式,是檢索策略的綜合體現,通常由檢索詞和各種邏輯算符、位置算符及系統規定的其它連接符號構成。

在聯機檢索中,檢索策略直接關系到檢索結果的成敗,需要對檢索課題進行深入的分析并能運用各種檢索方法和技巧。

一般來說,構造檢索策略通常包括以下步驟:

  1. 分析課題。
  2. 選擇數據庫。
  3. 分析概念,選擇檢索詞
  4. 構造檢索式
  5. 進行檢索
  6. 獲取全文

以下舉例說明這些過程,假設我們要檢索華僑華人文獻信息專題數據庫建設方面的資料,

1.分析課題

現在,我們分析這個課題并描述之,顯然,本課題可描述為:華僑華人文獻信息專題數據庫建設。

另外,在明確了檢索課題的主題內容后,還應預期得到什么樣的檢索結果,是專業文獻還是一般性或通俗文章,對文獻類型、時間范圍及地理范圍有無特殊要求等。

顯然,課題要求得到有關該主題的專業文獻。

  1. 選擇數據庫。

選擇數據庫時要考慮以下幾個因素:

所需信息的水平:廣度、深度、專指度、學術性。

文獻類型:報紙、雜志、學術期刊、商業期刊、學位論文、會議文獻和科技報告等。

數據庫主題范圍:專業數據庫還是綜合性數據庫。

數據庫時間跨度:當你所需信息超出數據庫收錄文獻的時間跨度時,可查圖書館館藏數據庫的印本文獻。

另外,一定要多試幾個數據庫,因為不同數據庫的收錄范圍不同,甚至同一學科領域的數據庫收錄范圍也不相同。如果還有疑問,可向圖書館員咨詢請他們推薦合適的數據庫。

分析本課題,我們可以選擇維普和中國期刊網進行檢索。

3.分析概念,選擇檢索詞

一個檢索課題往往涉及多個概念,這一步的任務就是將檢索課題涉及的所有概念分離出來,并針對每一個概念選擇盡可能多的檢索詞。分析概念可從課題名稱入手。如本例中,“華僑華人”、“文獻”、“信息”、“數據庫”即為概念詞。

4.構造檢索式

構造檢索式需要使用各種檢索技術,如根據概念之間的邏輯關系需使用布爾邏輯檢索技術,根據詞與詞之間的位置關系需使用位置檢索等,關于信息檢索技術的詳細內容,詳見前述內容。

本例中,我們根據這幾個概念詞邏輯關系,構造如下檢索式:

華人華人*文獻*信息*數據庫

5.入庫檢索

進入相關數據庫,如維普數據庫,輸入以上檢索策略式

6.獲取全文

注意,不同的數據庫系統獲取全文的方式不完全一致,具體操作請參閱分庫使用指南。

l 免費電子報刊、電子圖書、電子論文的查找

1、本館的電子資源

說明:只有校園網用戶(包括校園寬帶網用戶和校園網撥號用戶)才能使用本館的網絡數據庫;如果設置了代理服務器,請去掉代理服務器后再使用;在網絡中心申請的出國代理不影響數據庫的使用。本館數據庫都有詳細的檢索幫助,如有困難,可參看幫助。

u 萬方數據庫

學位論文全文、數字期刊都有人文科學類,可以查到華僑華人研究的論文和資料。

u PQDD

美國博、碩士論文 ?1861年至今,可看到前24頁全文。

u UMI博士論文全文庫

美國博、碩士論文全文 ?提供PQDD論文全文。時間從1998年起至2003年。 注意:從PQDD中檢索到并非都能在此找到全文。

u 中國學術期刊網

期刊全文 ?要下載安裝CAJ瀏覽器。

u 維普中文期刊全文數據庫

要下載安裝維普全文瀏覽器。

u EBSCO

Academic Search Premier:綜合類期刊,可檢索到華僑華人方面的文章。

u SDOS

期刊全文 ???包含有社會科學。

u Kluwer

期刊全文 ???涵蓋20多個學科專題,包括生物法律、醫學、心理學、物理學、航空航天、哲學、數學、計算機科學、工程、電子工程、材料、地學、社會人文、化學、商業管理等

u 科學在線

期刊全文

數學 物理 天文學 地球科學 化學 材料科學 生物 醫學 計算機 環境科學 經濟 教育 歷史 哲學 心理學 社會科學,(免費期刊)

u 方正Apabi電子圖書

圖書全文 ?經濟、文學、藝術、數理化、生物、醫藥衛生、計算機科學

u 書生之家電子圖書

u NetLibrary 電子圖書

只能在線閱讀,不能下載。

2、互聯網上的電子資源

u HighWire Press ?(http://intl.highwire.org)

英文網站,需要出國帳號。

u CALIS高校學位論文庫 ?http://opac.calis.edu.cn/

CALIS學位論文數據庫以合作建設、資源共享為目的,建立為高校師生提供學位論文和會議論文的查詢、文摘索引的瀏覽、全文提供(傳遞)等配套服務。

u 畢業論文網 ?http://www.bylw.com/

免費,不需要注冊,有相當數量的論文。

u 論文庫 ?http://www.syiae.com/lunwen/

u 論文帝國 ?http://www.papersempire.com/

u 168論文網 ?http://www.168lunwen.com/

u 學生大論文 ?http://paper.studa.com/

u 無憂論文網 ?http://www.51lunwen.com/

只提供文摘和目錄,想獲取全文需要交費。

u 論文資料網 ?http://www.51paper.net/

只提供文摘和目錄,想獲取全文需要交費。

u 超星數字圖書館 ?http://www.ssreader.com/

有超星數字卡即可使用,要下載安裝超星圖書閱覽器。

l 常用搜索引擎簡介

1、Google搜索引擎 ?http://www.google.com/intl/zh-CN/

目前最優秀的支持多語種的搜索引擎之一,也是全球最常用的搜索引擎。約搜索3,083,324,652 張網頁。提供網站、圖像、新聞組等多種資源的查詢。包括35個國家和地區的語言的資源。

2、百度中文搜索引擎 ?http://www.baidu.com

全球最大中文搜索引擎。提供網頁快照、網頁預覽/預覽全部網頁、相關搜索詞、錯別字糾正提示、新聞搜索、Flash搜索、信息快遞搜索、百度搜霸、搜索援助中心。

3、 一搜搜索引擎 ?http://www.yisou.com/

“一搜”是雅虎中國推出的一個中文搜索網站。目前設立了網頁、圖片、MP3和網址四個頻道。“一搜”采用雅虎花費數十億美元打造出的搜索技術(YST),用戶可以抓取到全球50億網頁(其中3億個中文網頁)、9000萬張圖片、100多萬個免費音樂的海量資料。

4、 中國搜索(原慧聰搜索) ?http://www.zhongsou.com/

中國搜索擁有全球領先的中文搜索引擎技術,現在已被新浪、搜狐、網易、TOM四大門戶,以及1400多家聯盟成員網站所采用。每天有數千萬次的搜索服務是通過中搜的技術實現的。與一般的搜索引擎相比,中國搜索具有網頁覆蓋率高、數據更新快、支持中文模糊查詢、強大的個性化查詢、智能查詢、內容相關性分析、便利的專業信息查詢等優勢,被公認為第三代智能搜索引擎的代表。

5、 新浪分類搜索引擎 ?http://www.sina.com.cn

互聯網上規模最大的中文搜索引擎之一。設大類目錄18個,子目1萬多個,收錄網站20余萬。提供網站、中文網頁、英文網頁、新聞、漢英辭典、軟件、滬深行情、游戲等多種資源的查詢。

6、 搜狐分類搜索引擎 ?http://www.sohu.com

搜狐于1998年推出中國首家大型分類查詢搜索引擎,到現在已經發展成為中國影響力最大的分類搜索引擎。每日頁面瀏覽量超過800萬,可以查找網站、網頁、新聞、網址、軟件、黃頁等信息。

7、 網易分類搜索引擎 ?http://www.netease.com/

網易新一代開放式目錄管理系統。擁有近萬名義務目錄管理員。為廣大網民創建了一個擁有超過一萬個類目,超過25萬條活躍站點信息,日增加新站點信息500~1000條,日訪問量超過500萬次的專業權威的目錄查詢體系。

8、 北大天網中英文搜索引擎 ?http://e.pku.edu.cn/

由北京大學開發,簡體中文、繁體中文和英文三個版本。提供全文檢索、新聞組檢索、FTP檢索(北京大學、中科院等FTP站點)。目前大約收集了100萬個WWW頁面(國內)和14萬篇Newsgroup(新聞組)文章。支持簡體中文、繁體中文、英文關鍵詞搜索,不支持數字關鍵詞和URL名檢索。

9、 一些常用的英文搜索引擎

MSN Search、AOL Search、Terra Lycos、Altavista、ASK jeeves

二、館際互借介紹

  • 石牌六校館際互借

到本館辦理石牌六校通過閱覽證,即可到其他石牌六校中的任何一校的圖書館閱覽圖書資料。

l 清華大學、國家圖書館的館際互借

  • 服務內容

1、 清華大學圖書館

書、刊、會議論文、學位論文、報告、標準等文獻的復印件。另清華大學圖書館是國內館際互借中心,可代用戶向國內其他圖書館和國外圖書館申請復印。

2、中國國家圖書館

館藏中英文圖書的借閱及復印,包含如下文獻:

u 查詢參考工具書:百科全書、工具書、機構名錄、外文年鑒。中、英、俄等主要文種的社會及自然科學技術類文摘、索引。

u 國際組織和外國政府出版物:聯合國系統、歐洲共同體、經濟合作與發展組織及美國政府出版(圖書、期刊、文件)。

u 中國學位論文數據庫(1990-)(原文只提供紙本復印)

u 中國社科報刊數據庫(1993-)

u NTIS美國政府報告(1983-)

u 聲像資料

相關文章

版權聲明:

本網站(網站地址)刊載的所有內容,包括文字、圖片、音頻、視頻、軟件、程序、以及網頁版式設計等均在網上搜集。

訪問者可將本網站提供的內容或服務用于個人學習、研究或欣賞,以及其他非商業性或非盈利性用途,但同時應遵守著作權法及其他相關法律的規定,不得侵犯本網站及相關權利人的合法權利。除此以外,將本網站任何內容或服務用于其他用途時,須征得本網站及相關權利人的書面許可,并支付報酬。

本網站內容原作者如不愿意在本網站刊登內容,請及時通知本站,予以刪除。