我們?cè)谝恍┱鹃L論壇都看到很多這樣的文章,說原創(chuàng)是我們優(yōu)化的必要條件,無論是對(duì)搜索引擎還是對(duì)網(wǎng)民,原創(chuàng)都很重要的。懂得SEO的人知道,
搜索引擎在收錄網(wǎng)站的時(shí)候會(huì)有3大步驟,
第一步:搜索引擎會(huì)派搜索程序就是我們所說的蜘蛛或機(jī)器人它會(huì)對(duì)網(wǎng)站進(jìn)行爬行,抓取頁面的HTML,這其中有很多原理,當(dāng)它在抓取頁面內(nèi)容的時(shí)候會(huì)有消除噪音,去停止詞,也就是你的文章如果是把別人的文章簡單的增加(刪除)幾個(gè)字或者幾個(gè)詞搜索引擎大致就可以判斷出你的文章是抄襲別人的,不會(huì)對(duì)你的文章抓取,當(dāng)然這種偽原創(chuàng)的方法是最讓人鄙視。蜘蛛在這個(gè)階段會(huì)有重復(fù)內(nèi)容的檢測,也就是說如果你的文章是別人發(fā)布的,你又簡單的修改,是逃不出蜘蛛的火眼的,現(xiàn)在的搜索引擎智商比你想象的要高,當(dāng)然也會(huì)有列外,如果你在網(wǎng)站日志當(dāng)中發(fā)現(xiàn)了蜘蛛,但是蜘蛛沒有爬行,很有可能是這個(gè)原因。
第二步:蜘蛛對(duì)抓取的頁面進(jìn)行處理,把網(wǎng)站
xjskma.com的導(dǎo)航,友情連接去除之后,留下中間的部分,也就是網(wǎng)站的主體部分,蜘蛛會(huì)根據(jù)MD5算法對(duì)文章進(jìn)行關(guān)鍵字的挑選,一般挑選10個(gè)左右,多了沒有太大用途,就這幾個(gè)關(guān)鍵字蜘蛛可根據(jù)指紋來計(jì)算文章的相關(guān)性,也就是說你的偽原創(chuàng)在高明,別人寫的文章關(guān)鍵字就那幾個(gè),除非你用自己的關(guān)鍵字,否則搜索引擎還是不會(huì)對(duì)你感冒,再說蜘蛛對(duì)于一篇原創(chuàng)文章的關(guān)鍵字設(shè)定又不是你可以猜出來的。
總而言之:在文章MD5算法中是決定文章偽原創(chuàng)的成敗,除非你能逃避蜘蛛選定的關(guān)鍵字,不然不要浪費(fèi)時(shí)間在偽原創(chuàng)上。