SEO學習網

同樣的夢想,不一樣的起步,SEO入門網將盡最大努力幫助“SEO學習者“學習搜索引擎優化.

SemCmd SEO學習網 > SEO入門 > 搜索引擎工作原理 搜索引擎檢索系統概述(一)

搜索引擎工作原理 搜索引擎檢索系統概述(一)

前面簡要介紹過了搜索引擎的索引系統,實際上在建立倒排索引的最后還需要有一個入庫寫庫的過程,而為了提高效率這個過程還需要將全部term以及偏移量保存在文件頭部,并且對數據進行壓縮,這涉及到的過于技術化在此就不多提了。今天簡要給大家介紹一下索引之后的檢索系統。

檢索系統主要包含了五個部分,如下圖所示:

 

(1)Query串切詞分詞即將用戶的查詢詞進行分詞,對之后的查詢做準備,以“10號線地鐵故障”為例,可能的分詞如下(同義詞問題暫時略過):

10 0x123abc

 0x13445d

 0x234d

地鐵 0x145cf

故障 0x354df

(2)查出含每個term的文檔集合,即找出待選集合,如下:

0x123abc 1 2 3 4 7 9…..

0x13445d 2 5 8 9 10 11……

……

……

 

(3)求交,上述求交,文檔2和文檔9可能是我們需要找的,整個求交過程實際上關系著整個系統的性能,這里面包含了使用緩存等等手段進行性能優化;

(4)各種過濾,舉例可能包含過濾掉死鏈、重復數據、色情、垃圾結果以及你懂的;

(5)最終排序,將最能滿足用戶需求的結果排序在最前,可能包括的有用信息如:網站的整體評價、網頁質量、內容質量、資源質量、匹配程度、分散度、時效性等等,之后會詳細給大家介紹。

 

如果大家對搜索引擎檢索還有別的疑問,大家可以到[學院同學匯][學習討論]《搜索引擎檢索系統概述》討論帖中發表自己的看法,我們的工作人員會關注這里并與大家進行探討。

本文由“SEO學習網 > SEO入門 ”整理:

原創文章如轉載,請注明: [ 搜索引擎工作原理 搜索引擎檢索系統概述(一) - "SEO學習網" ]
SEO學習網 - [ 提供SEO學習資料_免費SEO教程_經典SEO工具_系統式SEO培訓指導 ]
本文網址:

搜索引擎工作原理 搜索引擎檢索系統概述(一)
<< 百度蜘蛛識別 如何識別Baiduspider IP地址 搜索引擎工作原理 搜索引擎檢索系統概述(二) >>


網友評論 [ 請文明的留下您的足跡,你也來囧下吧!]

◎歡迎參與討論,請在這里發表您的看法、交流您的觀點。

    SEO學習網介紹

    “師傅領進門,修行在個人”

    Seo學習網 - 只能領你進入Seo這扇門,至于以后的發展,唯有靠自己靈性,去模仿/去揣摩它的意圖,才能徹底掌握這項技術.

    --------------------------

    系統式SEO培訓指導

    培訓方式:一對一 YY授課

    培訓機構:SEO學習網(SemCmd)

    培訓導師:DJ小向

    培訓宗旨:授課 + 實站指導

    聯系方式:QQ:8943459

    --------------------------

    在線文章編輯器   右擊SEO工具箱 關鍵詞密度查詢   關鍵詞組合器

    --------------------------

    暑假系統式SEO培訓班報名中

亲吻王子救援彩金