信息檢索是指信息按一定的方式組織起來,并根據(jù)信息用戶的需要找出有關(guān)的信息的過程和技術(shù)。下面小編為大家搜索整理了關(guān)于網(wǎng)絡(luò)信息檢索論文,希望對大家有所幫助。
淺談網(wǎng)絡(luò)信息檢索的現(xiàn)狀及其發(fā)展趨勢
【摘要】隨著計(jì)算機(jī)技術(shù)及網(wǎng)絡(luò)技術(shù)的發(fā)展,網(wǎng)絡(luò)信息檢索顯得越發(fā)重要。本文主要綜述了網(wǎng)絡(luò)信息檢索的全文數(shù)據(jù)庫、搜索引擎、互聯(lián)網(wǎng)“超鏈接”等現(xiàn)行檢索模式及它的智能化、一站式化、可視化等發(fā)展趨勢。
【關(guān)鍵詞】網(wǎng)絡(luò)信息檢索;現(xiàn)狀;發(fā)展趨勢
1、信息檢索概述
信息檢索(Information Retrieval)是指將信息按照一定的方式組織和存儲起來,并能根據(jù)信息用戶的需要指出其中相關(guān)信息的過程,因此它的全稱叫“信息存儲與檢索”。
隨著互聯(lián)網(wǎng)的發(fā)展,人類社會的信息化、網(wǎng)絡(luò)化進(jìn)程大大加快。當(dāng)今出現(xiàn)的一系列新型檢索模式,包括網(wǎng)絡(luò)信息規(guī)范控制標(biāo)準(zhǔn)等為網(wǎng)絡(luò)檢索技術(shù)的未來展現(xiàn)了新希望,與之相適應(yīng)的信息檢索的交流平臺也迅速轉(zhuǎn)移到以WWW為核心的網(wǎng)絡(luò)應(yīng)用環(huán)境中,信息檢索步入網(wǎng)絡(luò)化時(shí)代,網(wǎng)絡(luò)信息檢索已基本取代了手工檢索。
2、網(wǎng)絡(luò)信息檢索的現(xiàn)狀
對大多數(shù)讀者而言,檢索并不意味著發(fā)現(xiàn),而是獲得。人們希望不僅僅是提供寬泛的檢索結(jié)果,而應(yīng)該是計(jì)算機(jī)能試圖理解用戶提問的意圖,并對檢索結(jié)果進(jìn)行適當(dāng)?shù)姆诸惡团判。但是,現(xiàn)有的搜索引擎大多是基于簡單的關(guān)鍵詞匹配,不能真正理解用戶的檢索意圖;各個(gè)搜索引擎的信息搜集和索引建立有很大的不同,每個(gè)搜索引擎平均只能涉及到整個(gè)網(wǎng)上資源的30%~50%,而其中真正有用的信息也只占很小的比例,這就意味著使用任何一個(gè)搜索引擎都只能檢索到網(wǎng)絡(luò)中的部分資源。目前網(wǎng)絡(luò)檢索面臨一系列的挑戰(zhàn),網(wǎng)絡(luò)信息量迅猛增加,人工已經(jīng)無法對它們進(jìn)行有效的分類、索引和利用;簡單的關(guān)鍵詞搜索,返回的信息量過大,已經(jīng)讓用戶無法承擔(dān);網(wǎng)絡(luò)信息組織的無序性;信息有用性評價(jià)困難;網(wǎng)絡(luò)信息日新月異的更變;信息媒體的多樣化;帶寬等其它因素的制約,這些都給因特網(wǎng)信息的獲取造成了極大的阻礙。這樣就造成了要求智能化、專業(yè)化、多元化、多媒體化的網(wǎng)絡(luò)信息檢索工具出現(xiàn)的呼聲越來越高,并且有更多的人參與到其中來。如此種種,給當(dāng)今的網(wǎng)絡(luò)信息檢索研究帶來了發(fā)展機(jī)遇,也給了它無限的發(fā)展空間。
3、網(wǎng)絡(luò)信息檢索的現(xiàn)行模式
3.1 網(wǎng)絡(luò)全文數(shù)據(jù)庫檢索
網(wǎng)絡(luò)全文數(shù)據(jù)庫是以全文數(shù)據(jù)為數(shù)據(jù)庫對象,并在網(wǎng)上提供全文檢索服務(wù)的數(shù)據(jù)庫。按數(shù)據(jù)庫的生產(chǎn)機(jī)構(gòu)分類,可分為出版商全文期刊數(shù)據(jù)庫和生產(chǎn)商全文期刊數(shù)據(jù)庫。前者主要是那些期刊出版單位在其出版的印刷期刊基礎(chǔ)上建立的網(wǎng)絡(luò)電子期刊全文數(shù)據(jù)庫。而后者則是由數(shù)據(jù)庫生產(chǎn)商根據(jù)一定的主題或一定的收錄范圍整合一定數(shù)量的期刊出版物而產(chǎn)生的全文數(shù)據(jù)庫。國內(nèi)全文數(shù)據(jù)庫主要有中國學(xué)術(shù)期刊全文數(shù)據(jù)庫。
3.2 網(wǎng)絡(luò)搜索引擎檢索
搜索引擎是一個(gè)專門的系統(tǒng),它可以對互聯(lián)網(wǎng)信息資源進(jìn)行搜索整理和分類,并將其儲存在網(wǎng)絡(luò)數(shù)據(jù)庫中供用戶查詢。搜索引擎包括搜集信息、分類和用戶查詢等三大部分。目前流行的搜索引擎有兩大類:關(guān)鍵詞全文檢索式搜索引擎和分類目錄式搜索引擎。
關(guān)鍵詞全文檢索式搜索引擎主要利用其內(nèi)部的搜索機(jī)器人和蜘蛛程序,自動(dòng)搜索來自互聯(lián)網(wǎng)上的各種內(nèi)容,在每一個(gè)關(guān)鍵詞和所有相關(guān)的網(wǎng)頁之間按照網(wǎng)頁相關(guān)性原理建立一個(gè)對應(yīng)關(guān)系,儲存在其網(wǎng)絡(luò)服務(wù)器的數(shù)據(jù)庫中。用戶只要輸入關(guān)鍵詞就可以找到符合該關(guān)鍵詞特征的所有被索引的網(wǎng)頁,搜索結(jié)果以超鏈接的方式列表,搜索結(jié)果有簡單介紹,用戶點(diǎn)擊相應(yīng)的鏈接就可以進(jìn)入相應(yīng)的網(wǎng)絡(luò)資源網(wǎng)站,從而找到所需信息。用這種方式搜索到的結(jié)果通常數(shù)以百萬計(jì),但是相關(guān)性越高的信息,在搜索結(jié)果列表中的位置越靠前。分類目錄式搜索引擎將互聯(lián)網(wǎng)信息按照一定的標(biāo)準(zhǔn)進(jìn)行收集和分類,并編入相應(yīng)目錄,以層級和逐次分項(xiàng)的方式管理目錄,查找信息可以按照分類目錄一層層進(jìn)入,最終找到所要的信息。
3.3 互聯(lián)網(wǎng)“超鏈接”搜索
Web信息以超文本鏈接方式組織,基本組織單元是信息節(jié)點(diǎn)而不是字符串,信息節(jié)點(diǎn)之間通過鏈接進(jìn)行聯(lián)系。超鏈接是網(wǎng)頁必不可少的一個(gè)元素,同一主題或相關(guān)的信息因超鏈接構(gòu)成了信息網(wǎng)。超文本信息檢索技術(shù),以超文本信息節(jié)點(diǎn)之間的多種鏈接關(guān)系為基礎(chǔ),根據(jù)思維聯(lián)想或查找信息的需要,通過鏈接從一個(gè)信息節(jié)點(diǎn)轉(zhuǎn)到另一個(gè)信息節(jié)點(diǎn)。
4、網(wǎng)絡(luò)信息檢索的未來發(fā)展趨勢
網(wǎng)絡(luò)技術(shù)的發(fā)展,給網(wǎng)絡(luò)信息檢索及信息的網(wǎng)絡(luò)化帶來的極大的便利,進(jìn)一步推動(dòng)了網(wǎng)絡(luò)信息檢索理論和技術(shù)的快速發(fā)展。怎樣為網(wǎng)絡(luò)用戶提供高質(zhì)量、高效率的檢索方式是網(wǎng)絡(luò)信息檢索研究者的努力方向。信息檢索的對象已從傳統(tǒng)的文本信息擴(kuò)展到如今開放、動(dòng)態(tài)、分布廣泛的多媒體信息。那么,網(wǎng)絡(luò)信息檢索的發(fā)展趨勢如何呢?
4.1 智能化信息檢索
智能化信息檢索是基于自然語言處理的檢索形式。檢索工具是對用戶提供的以自然語言表達(dá)的檢索要求進(jìn)行分析,從而形成檢索策略進(jìn)行檢索。檢索工具智能化的內(nèi)涵在于檢索工具具有學(xué)習(xí)、分析、辨別和推理的能力。近年來,因特網(wǎng)上不斷涌現(xiàn)的人工智能產(chǎn)品,如智能搜索引擎、智能瀏覽器、智能代理等,它們將提高網(wǎng)絡(luò)信息檢索的智能化程度,促進(jìn)智能信息檢索的發(fā)展。
網(wǎng)絡(luò)中的智能代理通常是一個(gè)專家系統(tǒng)、一個(gè)過程、一個(gè)模塊或一個(gè)求解單元。智能代理可以獲得用戶的信息需求,自動(dòng)檢索信息和推送檢索結(jié)果信息。多智能代理系統(tǒng)還具有信息發(fā)現(xiàn)、信息篩選、信息推送和信息導(dǎo)航功能,可滿足專業(yè)研究人員的特定需求,實(shí)現(xiàn)網(wǎng)絡(luò)信息檢索與服務(wù)的智能化。
4.2 一站式信息檢索
一站式(One Stop)信息檢索是指用戶通過一個(gè)檢索工具能滿足自己所有的信息檢索需求。一站式信息檢索將是網(wǎng)絡(luò)信息檢索服務(wù)的一種發(fā)展模式。一站式檢索服務(wù)是人性化服務(wù)的重要體現(xiàn),它將大量節(jié)約用戶的檢索時(shí)間。全球最大的搜索引擎Google正在朝著一站式服務(wù)的方向發(fā)展。2004年12月,Google宣布與紐約公共圖書館和包括哈佛大學(xué)圖書館在內(nèi)的4個(gè)主要圖書館合作,將這些圖書館的大約1500萬冊藏書掃描進(jìn)自己的數(shù)據(jù)主庫以提供網(wǎng)絡(luò)用戶檢索。目前,Google已經(jīng)為其用戶提供了某種程度上的一站式的檢索服務(wù)了。而其他越來越多的檢索服務(wù)提供商將向一站式檢索方向發(fā)展。
4.3 可視化
可視化指的是運(yùn)用計(jì)算機(jī)圖形學(xué)和圖像處理技術(shù),將數(shù)據(jù)轉(zhuǎn)換為圖形或圖像在屏幕上顯示出來,并進(jìn)行交互處理的理論、方法和技術(shù)。據(jù)統(tǒng)計(jì),獲取信息有70%~80%靠視覺,20%靠聽覺,10%靠觸覺。用圖像取代文字幫助人們檢索的優(yōu)點(diǎn)在于:圖像的表達(dá)更生動(dòng)、結(jié)束語形象、準(zhǔn)確,效率更高,具有交互性、多維性、可視性等特點(diǎn),可以大大加快檢索速度,使時(shí)刻都在產(chǎn)生的海量數(shù)據(jù)得到有效利用。
4.4 商業(yè)化
目前網(wǎng)絡(luò)信息檢索系統(tǒng)已成為新的投資熱點(diǎn),網(wǎng)絡(luò)信息檢索系統(tǒng)不再僅僅是一種檢索工具,而且是一種商業(yè)產(chǎn)品。2001年10月,全球最大的中文搜索引擎提供商百度聯(lián)合新浪等多家中文門戶網(wǎng)站,共同推廣“搜索引擎競價(jià)排名”全新網(wǎng)絡(luò)商業(yè)服務(wù)模式。網(wǎng)絡(luò)信息檢索的商業(yè)化還體現(xiàn)在聯(lián)機(jī)和光盤檢索逐漸進(jìn)入網(wǎng)絡(luò)環(huán)境。由于目前網(wǎng)絡(luò)信息檢索的檢準(zhǔn)率低,聯(lián)網(wǎng)的收費(fèi)聯(lián)機(jī)和光盤檢索依舊受到青睞,如世界著名的聯(lián)機(jī)信息系統(tǒng)DIALOG、OCLC、EBSCO、Silverplatter,國內(nèi)的萬方數(shù)據(jù)資源系統(tǒng)、中國學(xué)術(shù)期刊光盤、重慶維普公司系列光盤等都紛紛在網(wǎng)上設(shè)立自己的網(wǎng)絡(luò)檢索入口。許多著名科技期刊的上網(wǎng)豐富了網(wǎng)絡(luò)資源,它們大多數(shù)都是在提供印刷版的同時(shí)提供期刊的網(wǎng)上服務(wù),包括收費(fèi)檢索。
5、小結(jié)
在的網(wǎng)絡(luò)信息資源中尋找自己所需要的信息資源是一件極具挑戰(zhàn)性的工作。為此,許多信息專家正在積極地研究探索,并且取得了不少成果。我們相信隨著科學(xué)技術(shù)的進(jìn)步,網(wǎng)絡(luò)信息檢索發(fā)展會越來越快,人們所利用的檢索工具和手段的更替會更加頻繁。
參考文獻(xiàn)
[1]黃靜.網(wǎng)絡(luò)信息檢索發(fā)展方向展望[J].Journal of Library and Information Sciences in Agriculture,2008(1):15-19.
[2]霍小梅,王小蘭.網(wǎng)絡(luò)信息檢索的現(xiàn)狀及發(fā)展趨勢[J].圖書館論壇,2004(4):180-182.
[3]戴莉.網(wǎng)絡(luò)信息檢索的發(fā)展趨勢[J].情報(bào)探索,2005(2):52-54.
[4]徐謙.網(wǎng)絡(luò)信息檢索的智能化趨勢[J].圖書館理論與實(shí)踐,2006(2):63-65.
[5]謝新洲.網(wǎng)絡(luò)信息檢索技術(shù)與案例[M].北京:北京圖書館出版社,2005:9.
[6]易向軍.網(wǎng)絡(luò)信息檢索現(xiàn)狀及未來[J].合肥學(xué)院學(xué)報(bào),2007 (7):90-92.
來源:網(wǎng)絡(luò)整理 免責(zé)聲明:本文僅限學(xué)習(xí)分享,如產(chǎn)生版權(quán)問題,請聯(lián)系我們及時(shí)刪除。