針對(duì)搭建線上服務平台的企業,網站流量是關乎于網站成(chéng)敗的關鍵。而網站流量的獲取又跟搜索引擎息息相關。像百度、搜狗、360、谷歌等這(zhè)些大家常用的搜索引擎,不一定會全部收錄企業網站的信息,沒(méi)有收錄就難以獲得好(hǎo)的排名,詢盤、訂單也會因此受到影響,導緻企業業績難以提升。
那麼(me),以百度爲主的搜索引擎收錄原理是什麼(me)呢?
搜索引擎工作過(guò)程大體分爲三個階段:爬行和抓取、預處理、排名。
一、蜘蛛的爬行和抓取
爲了在Internet上自動抓取數萬個網頁,搜索引擎必須具有完全自動化的頁面(miàn)抓取工具,這(zhè)個用來爬行和訪問頁面(miàn)的程序被(bèi)稱爲蜘蛛或爬蟲。蜘蛛是百度等搜索引擎的一種(zhǒng)重要抓取技術,也是網站被(bèi)收錄的來源,而源代碼就相當于它的網,讓它爬行于任意網頁的源代碼中。
當在源代碼中發(fā)現另一個新的鏈接時,它就會通過(guò)這(zhè)個鏈接穿梭到另一個頁面(miàn)繼續抓取→爬行→抓取→爬行…從而達到網頁被(bèi)收錄的目的。
權重越高的網站,蜘蛛的抓取頻率會越高。對(duì)于新站來說,至少養3個月到半年的時間,權重會有所提升。與此同時,新站還(hái)要保持較高的更新頻率。如果新站長(cháng)時間不更新内容,蜘蛛多次來時都(dōu)沒(méi)有發(fā)現可抓取的新信息,就會慢慢減少抓取頻率,從一個月一次到幾個月一次。
但在實際工作中,蜘蛛的帶寬資源,時間都(dōu)是有限的,不可能(néng)爬完所有頁面(miàn)。實際上最大的搜索引擎也隻是爬行和收錄了互聯網的一小部分。
二、預處理篩選
通過(guò)蜘蛛的爬行和抓取,原始數據庫建立完畢,搜索引擎會對(duì)網頁進(jìn)行文字提取的處理。除了頁面(miàn)上顯示的文字外,搜索引擎還(hái)會對(duì)諸如meta标簽、flash替代文件,錨文本、alt标簽等部分的文字進(jìn)行提取。并針對(duì)“的”、“了”、“呀”之類沒(méi)有實際意義的詞、大量重複内容和頁面(miàn)進(jìn)行剔除,從而提高搜索引擎的計算效率。
三、排名的相關性計算
網站排名相關性計算不是憑單一站點的優化或者站點的點擊率來判斷,是搜索引擎通過(guò)各種(zhǒng)綜合評分給出的排名。
1、關鍵詞位置的重要性
在網站的頁面(miàn)的源代碼中包含了很多标簽,有些标簽代表小标題,有些代表圖片…當關鍵詞出現在某些标簽位置時,關鍵詞和頁面(miàn)的相關性會更高,這(zhè)些位置往往會包含标題、黑體字體、圖片Alt标簽等等。
2、錨文本關鍵詞與鏈接内容
如果我們在外部網站如博客、論壇、社區平台,在相匹配的關鍵詞錨文本中添加了我們的網站頁面(miàn),這(zhè)對(duì)頁面(miàn)相關性的提升有很好(hǎo)的幫助。
3、頁面(miàn)權重越高,導入鏈接相關性越高
如果你的網站鏈接能(néng)夠出現在某一個權威性的網站,并且鏈接了與網站相關的錨文本關鍵詞,那麼(me)你的頁面(miàn)的相關性會越高。
近幾年,爲了引導廣泛合理的SEO行爲,打擊利用惡意手段獲取與網頁質量不符的排名行爲,使互聯網生态圈得到更加健康有序的發(fā)展,百度等各大搜索引擎不斷改進(jìn)算法規則,對(duì)用戶體驗及搜索結果質量影響嚴重的,去除作弊部分獲得的 權值并降低網站的權重,直至從搜索結果中徹底清理掉。因此,企業選擇一個專業的搜索營銷團隊是很重要的。
搜索引擎算法規則與搜索營銷行爲間是一種(zhǒng)良性的共生關系。專業的搜索營銷人員會根據企業發(fā)展需求适時調整規劃戰略,在算法規則允許的範圍内、利用正規的優化手段做搜索營銷,網站才能(néng)在最短時間内被(bèi)收錄,獲得穩定的排名,從而抓住更多成(chéng)單機會,促進(jìn)業務持續增長(cháng)。