天蠶在你身邊
不方便打電話?讓天蠶聯(lián)絡(luò)你
天蠶在你身邊
不方便打電話?讓天蠶聯(lián)絡(luò)你
什么是網(wǎng)頁(yè)噪音?
在我們?yōu)g覽網(wǎng)頁(yè),從中獲取所需信息的同時(shí),還會(huì)常??匆?jiàn)大量和我們所關(guān)心內(nèi)容無(wú)關(guān)的“噪音”內(nèi)容,如網(wǎng)頁(yè)的公共部分、廣告信息、版權(quán)信息等,有效的 去除和網(wǎng)頁(yè)主題內(nèi)容無(wú)關(guān)的噪音內(nèi)容,提取網(wǎng)頁(yè)的元數(shù)據(jù)信息,如關(guān)鍵詞、摘要、網(wǎng)頁(yè)內(nèi)容類(lèi)別等,是Web信息處理的一項(xiàng)重要內(nèi)容,同時(shí)也是我們做SEO優(yōu)化需要重點(diǎn)處理的部分。
網(wǎng)頁(yè)凈化明確搜索引擎重點(diǎn)分析的區(qū)域:在前面的文章當(dāng)中我分別介紹了什么是網(wǎng)頁(yè)表示模型,網(wǎng)頁(yè)特征項(xiàng)的提取, 我們?cè)谶M(jìn)行SEO優(yōu)化的時(shí)候,為了給搜索引擎搭建一個(gè)便于理解和分析的頁(yè)面我們需要根據(jù)關(guān)鍵詞的相關(guān)算法構(gòu)建網(wǎng)頁(yè)表示模型,模型的目的是什么呢?一是幫助 搜索引擎更準(zhǔn)確的理解我們的網(wǎng)頁(yè),二是能夠幫助它快速的提取出網(wǎng)頁(yè)特征項(xiàng),三是盡可能的降低網(wǎng)頁(yè)的噪音。這里我給大家舉一個(gè)例子,讓大家再深入的理解一下 這個(gè)噪音問(wèn)題跟我們搜索優(yōu)化的關(guān)系,當(dāng)我們建設(shè)好一個(gè)網(wǎng)站,通常情況下會(huì)有導(dǎo)航區(qū)域,也許左側(cè)還會(huì)有一些公共相關(guān)的區(qū)域。
我們每個(gè)頁(yè)面都是這樣的,大家思考一下,當(dāng)搜索引擎來(lái)抓取和分析我們網(wǎng)站的時(shí)候,這樣的公共部分會(huì)不會(huì)再繼續(xù)分析了,會(huì)不會(huì)重點(diǎn)分析了,我可以明確 的告訴大家公共區(qū)域可能不分析也不會(huì)做重點(diǎn)分析了,這樣就相當(dāng)于去除了噪音,而搜索引擎真正重點(diǎn)分析的區(qū)域就是那些你實(shí)實(shí)在在的內(nèi)容了,如果我們把這個(gè)內(nèi) 容理解成為一個(gè)變量,那么你的每一個(gè)頁(yè)面的“內(nèi)容”這個(gè)變量就都要五花八門(mén),盡量不要和其它頁(yè)面有太多相似的部分,所以我們要注意頁(yè)面的比例問(wèn)題,如果你 的“公共變量”大于了“內(nèi)容”變量,顯然這個(gè)頁(yè)面不太健康,搜索引擎會(huì)認(rèn)為你的頁(yè)面相似度太高,不予重視,不重視就是不會(huì)有高權(quán)重,如果你的每個(gè)頁(yè)面都如此,那么你的整個(gè)網(wǎng)站權(quán)重大降,排名就不會(huì)好,嚴(yán)重的甚至被降權(quán),被K。
如何加深一下你對(duì)網(wǎng)頁(yè)凈化和消重的理解:網(wǎng)頁(yè)凈化和消重是大規(guī)模搜索引擎系統(tǒng)預(yù)處理環(huán)節(jié)的重要組成部分。所謂網(wǎng)頁(yè)凈化(noise reduction)就是識(shí)別和清除網(wǎng)頁(yè)內(nèi)的噪音內(nèi)容(如廣告、版權(quán)信息等),并提取網(wǎng)頁(yè)的主題以及和主題相關(guān)的內(nèi)容;消重(replicas or near-replicas detection)是指去除所搜集網(wǎng)頁(yè)集合中主題內(nèi)容重復(fù)的網(wǎng)頁(yè)。建索引一般是在消重后的網(wǎng)頁(yè)集上進(jìn)行的,這樣就可以保證用戶在查詢時(shí)不會(huì)出現(xiàn)大量?jī)?nèi)容重復(fù)的網(wǎng)頁(yè)。
當(dāng)我們?yōu)g覽Web,從中獲取所需信息的同時(shí),還會(huì)常常看見(jiàn)大量和我們所關(guān)心內(nèi)容無(wú)關(guān)的導(dǎo)航條、廣告信息、版權(quán)信息以及調(diào)查問(wèn)卷等,我們稱之為“噪 音”內(nèi)容。有時(shí)候,我們可能從這些噪音內(nèi)容中得到一些意外的驚喜;另一些時(shí)候,我們可能不喜歡這些東西消耗人類(lèi)寶貴的注意力資源。同時(shí),噪音內(nèi)容往往會(huì)導(dǎo)致相互鏈接的網(wǎng)頁(yè)常常并無(wú)內(nèi)容相關(guān)性。
重慶網(wǎng)絡(luò)公司
地址:重慶市渝中區(qū)上清寺鑫隆達(dá)B座28-8
郵編:400015
電話:023-63612462
EMAIL:cnjl_net@163.com