計算機(jī)信息檢索的原理
計算機(jī)信息檢索過程是指用戶對檢索播求加以分析,明確檢索范圍。弄清主題概念,形成檢索標(biāo)識及檢索策略,愉入到計算機(jī)中進(jìn)行檢索。計算機(jī)按照用戶的要求將檢索策略轉(zhuǎn)換成一系列提問,在專用程序控制下,進(jìn)行離級邏輯運(yùn)算。選出符合要求的信息并輸出。計算機(jī)檢索的過程實(shí)際上是一個比較、匹配的過程,是用計算機(jī)代替人工檢索的匹配過程。計算機(jī)一方面接受檢索提問(即檢索提問表達(dá)式),另一方面從數(shù)據(jù)庫中接受文獻(xiàn)記錄。然后在兩者之間進(jìn)行匹配運(yùn)算,即計算機(jī)信息檢索把檢素提問與文獻(xiàn)記錄之間的相關(guān)性檢索轉(zhuǎn)變成了檢索詞與標(biāo)引詞之間的相似計算。目前.一般計算機(jī)信息檢索系統(tǒng)為進(jìn)行檢索詞與標(biāo)引詞之間的相似性運(yùn)算,所采用的方法可以分為以下幾個等級。
(1)單個整詞的比較.例如.檢索詞是psychoan目ysis,而標(biāo)引詞也是psyeh咖alys畜s,兩者全等,則為命中.全等是相似性的一種特殊形式,對于一些包含數(shù)值的詞,如出版年、文摘號等也可以進(jìn)行大于(>)、小于(<)的運(yùn)算.
(2)詞的片斷(主要是詞根)比較.例如,檢索詞是用截斷符號(如@)表示的Pscho@,則命中所有開頭與截斷符號之前相同的詞,如Psych。姍!ysis、Psychobiology等.這就是截詞檢索.截詞有右截斷、左截斷、左右同時截斷以及中間掩符等幾種形式。對截斷符之后的允許字符數(shù).可不限制,也可限制在若千字符之間。即可分有限截斷和無限截斷兩種模式。不論叮種,其基本原理都是進(jìn)行詞的片斷對比。這種對比不要求檢索詞和標(biāo)引詞全等.而是部分相等或近似.因此,這個級別的比較是一種較典型的相似性運(yùn)算。
(3)固定詞組的比較.例如,檢索詞是Libra卿and bformation science,而標(biāo)引詞也是LibraJ,and Info,ation science.這是由多個整詞構(gòu)成的詞組.但比較仍然是全等的運(yùn)算.
(4)多個整詞之間位置邏輯的比較。即可以指定兩個整詞,詞與詞之間至多相隔幾個字(即可以擂入其他的字或字毋.忽略不計).兩詞出現(xiàn)的先后次序可以指定為可以對換或不可以對換.例如.檢索Information(2w)Re州eval,可以命中Infonm舊lion stora朗andR。州cval.這種位宜邁輯的運(yùn)抹可以說是帶有貝活性的詞組比較,而這種比較是允許有一定范幽的相似性運(yùn)算。它稱為相鄰度檢索。
(5)由若干單獨(dú)的檢索詞或詞組構(gòu)成的定邏輯組合的比較。它的目標(biāo)不是檢索各個單獨(dú)的檢索詞或詞組.而是在愈義上彼此結(jié)合、互扣限定的詞(成詞組)的完整組合。例如.“信息”和“網(wǎng)絡(luò).,它們分別是兩個單獨(dú)的詞,而“信息網(wǎng)絡(luò)”是這兩個詞邏輯組合的一種形式。“信息網(wǎng)絡(luò)”不是“信息,和“網(wǎng)絡(luò).這兩個詞的混合,而是兩種愈義的結(jié)合,是兩種概念合成了一種新的概念。
建站流程
-
網(wǎng)站需求
-
網(wǎng)站策劃方案
-
頁面設(shè)計風(fēng)格
-
確認(rèn)交付使用
-
資料錄入優(yōu)化
-
程序設(shè)計開發(fā)
-
后續(xù)跟蹤服務(wù)
-
聯(lián)系電話
010-60259772
熱門標(biāo)簽
- 網(wǎng)站建設(shè)
- 食品網(wǎng)站建設(shè)
- 微信小程序開發(fā)
- 小程序開發(fā)
- 無錫網(wǎng)站建設(shè)
- 研究所網(wǎng)站建設(shè)
- 沈陽網(wǎng)站建設(shè)
- 廊坊網(wǎng)站建設(shè)
- 鄭州網(wǎng)站建設(shè)
- 婚紗攝影網(wǎng)站建設(shè)
- 手機(jī)端網(wǎng)站建設(shè)
- 高校網(wǎng)站制作
- 天津網(wǎng)站建設(shè)
- 教育網(wǎng)站建設(shè)
- 品牌網(wǎng)站建設(shè)
- 政府網(wǎng)站建設(shè)
- 北京網(wǎng)站建設(shè)
- 網(wǎng)站設(shè)計
- 網(wǎng)站制作
最新文章
推薦新聞
更多行業(yè)-
PHP特性有哪些?
PHP作為動態(tài)網(wǎng)站的服務(wù)器端腳本語言,最重要的特性之一就是其強(qiáng)大的數(shù)據(jù)...
2017-10-30 -
網(wǎng)絡(luò)營銷之10個博客搜索引擎提交地址
網(wǎng)絡(luò)營銷之10個博客搜索引擎提交地址在博客營銷的推廣過程中,不懂或沒有...
2011-12-09 -
網(wǎng)站建設(shè)應(yīng)當(dāng)突出哪些運(yùn)營優(yōu)勢
當(dāng)網(wǎng)站建設(shè)完畢之后,都會上線運(yùn)營的。此時,不少客戶在建站的時候,會關(guān)注...
2020-07-21 -
大家都知道好的域名對網(wǎng)站優(yōu)化的作用
大家都知道好的域名對SEO網(wǎng)站優(yōu)化有一個積極的作用,我們該怎樣對網(wǎng)站結(jié)...
2012-10-08 -
網(wǎng)站建設(shè)時對URL優(yōu)化的建議
網(wǎng)站的URL優(yōu)化,是被很多站長所忽略的,但是這對SEO網(wǎng)站優(yōu)化是非常重...
2013-12-21 -
網(wǎng)站建設(shè)—前端CSS塊狀元素和內(nèi)聯(lián)元素詳解
在css盒子模型中,我們提到了html元素中的塊元素和內(nèi)聯(lián)元素。那么它...
2019-03-06
預(yù)約專業(yè)咨詢顧問溝通!
免責(zé)聲明
非常感謝您訪問我們的網(wǎng)站。在您使用本網(wǎng)站之前,請您仔細(xì)閱讀本聲明的所有條款。
1、本站部分內(nèi)容來源自網(wǎng)絡(luò),涉及到的部分文章和圖片版權(quán)屬于原作者,本站轉(zhuǎn)載僅供大家學(xué)習(xí)和交流,切勿用于任何商業(yè)活動。
2、本站不承擔(dān)用戶因使用這些資源對自己和他人造成任何形式的損失或傷害。
3、本聲明未涉及的問題參見國家有關(guān)法律法規(guī),當(dāng)本聲明與國家法律法規(guī)沖突時,以國家法律法規(guī)為準(zhǔn)。
4、如果侵害了您的合法權(quán)益,請您及時與我們,我們會在第一時間刪除相關(guān)內(nèi)容!
聯(lián)系方式:010-60259772
電子郵件:394588593@qq.com