一、全文索引
全文搜索引擎從網(wǎng)站提取信息,建立網(wǎng)頁數(shù)據(jù)庫。搜索引的自動(dòng)信息搜集功能分為兩種。
一種是定期搜索,即每隔一段時(shí)間(如谷歌一般是28天),派出蜘蛛程序,對(duì)一定IP地址范圍內(nèi)的互聯(lián)網(wǎng)網(wǎng)站進(jìn)行檢索,一旦發(fā)現(xiàn)新的網(wǎng)站,會(huì)自動(dòng)提取網(wǎng)站的信息和網(wǎng)址并將其加入自己的數(shù)據(jù)庫。
另一種是提交網(wǎng)站搜索,即網(wǎng)站擁有者主動(dòng)向搜索引擎提交網(wǎng)址。搜索引擎在一定時(shí)間內(nèi)(2天到數(shù)月不等)向網(wǎng)站派出蜘蛛程序,掃描網(wǎng)站并將有關(guān)信息存入數(shù)據(jù)庫以備用戶查詢。后來,搜索引擎索引規(guī)則發(fā)生了很大變化,主動(dòng)提交網(wǎng)址并能不保證網(wǎng)站進(jìn)入搜索引擎數(shù)據(jù)庫,因此,較好的辦法是多獲得一些外部鏈接,讓搜索引擎有更多的機(jī)會(huì)找到并自動(dòng)收錄網(wǎng)站。
當(dāng)用戶以關(guān)鍵詞查找信息時(shí),搜索引擎會(huì)在數(shù)據(jù)庫中進(jìn)行搜尋。如果找到與用戶要求內(nèi)容相符的網(wǎng)站,便采用特殊的算法(通常根據(jù)網(wǎng)頁中關(guān)鍵詞的匹配程度、出現(xiàn)的位置、頻次、鏈接質(zhì)量)計(jì)算出各網(wǎng)頁的相關(guān)度及排名等級(jí),然后根據(jù)關(guān)聯(lián)度的高低,按順序?qū)⑦@些網(wǎng)頁鏈接返回給用戶。這種引擎的特點(diǎn)是搜全率比較高。
二、目錄索引
目錄索引也稱“分類檢索”,是因特網(wǎng)上更早提供WWW資源查詢的服務(wù)。它主要通過搜集和整理因特網(wǎng)的資源,根據(jù)搜索到的網(wǎng)頁內(nèi)容,將其網(wǎng)址分配到相關(guān)分類主題目錄的不同層次的類目之下,形成像圖書館目錄一樣的分類樹形結(jié)構(gòu)索引。目錄索引無須輸人任何文字,只要根據(jù)網(wǎng)站提供的主題分類目錄層層點(diǎn)擊進(jìn)入,便可查到所需的網(wǎng)絡(luò)信息資源。
目錄索引雖然有搜索功能,但在嚴(yán)格意義上它不是真正的搜索引擎,只是按目錄分類的網(wǎng)站鏈接列表而已。用戶完全可以按照分類目錄找到所需要的信息,不需依靠關(guān)鍵詞( Keyword)進(jìn)行查詢。
三、元搜索
元搜索(METASearch English)接受用戶查詢請(qǐng)求后,同時(shí)在多個(gè)搜索引擎上搜索,并將結(jié)果返回給用戶。著名的元搜索引擎有InfoSpace、Dogpile、Vivisimo等,中文元搜索引擎中具有代表性的是搜星搜索引擎。在搜索結(jié)果排列方面,有的直接按來源排列搜索結(jié)果,如Dogpile;有的則按自定規(guī)則將結(jié)果重新排列組合,如Vivisimo。
關(guān)于搜索引擎蜘蛛的種類就先介紹到這里,想進(jìn)一步了解這方面知識(shí),歡迎來電咨詢點(diǎn)子科技!