久久毛片免费看一区二区三区,精品淑女少妇av久久免费,久久99精品久久久久久噜噜,久久久久日韩精品免费观看 ,精品日产卡一卡二卡麻豆

SEO優(yōu)化

首頁 > SEO優(yōu)化 > 濰坊網(wǎng)站優(yōu)化之搜索引擎抓取策略

濰坊網(wǎng)站優(yōu)化之搜索引擎抓取策略

搜索引擎的抓取是搜索引擎最基礎(chǔ)的工作,為后續(xù)的一切工作做鋪墊。抓取的少,抓取太多重復信息,抓取能力差直接影響用戶的使用體驗。連抓取能力都做不好也不用談后面的信息提取、分析了。因此,搜索引擎?zhèn)円恢倍荚谔岣咦约旱淖ト∧芰Α?/span>

一,頁面抓取流程。

搜索引擎通過自己原有的域名列表,來進入網(wǎng)站,再抓取網(wǎng)頁,在通過頁面的鏈接,再進到下一層網(wǎng)頁,從而建立起龐大的域名列表、URL列表。

二,頁面抓取的方式

1,         廣度優(yōu)先

廣度優(yōu)先:是指將網(wǎng)站的主欄目抓取之后,然后再抓取主欄目下面的子欄目。廣度優(yōu)先要注意以下幾點:

(1)重要網(wǎng)頁離主站點的一般比較近

(2)寬度優(yōu)先規(guī)則有利于多個爬蟲合作爬取,先抓站內(nèi)后抓站外,封閉性強

(3)萬維網(wǎng)的深度并不是想像中的深

           2,深度優(yōu)先

與廣度優(yōu)先正好相反,這種首先會選擇某個分支,繼而深入到不能深入的情況下才考慮其他分支的策略。通過這種方式能抓取到比較隱蔽的頁面,從而實現(xiàn)更多用戶的檢索要求

            3網(wǎng)頁重訪

由于頁面的更新的問題,所以需要重新訪問

            4不重復抓取

搜索引擎不會抓取信息幾乎一樣的兩個網(wǎng)頁。它會給原創(chuàng)的網(wǎng)頁予以更高權(quán)重。如何判斷原創(chuàng)?搜索引擎會根據(jù)修改時間,網(wǎng)站權(quán)重等因素綜合考慮。