一篇文章幫你解決關(guān)于百度收錄的所有疑惑
作者:晉城網(wǎng)站建設(shè) 日期:2011-01-22
這是一個(gè)真實(shí)的故事,時(shí)間發(fā)生在幾月前。起因QQ上一位朋友向ranch咨詢她的一個(gè)網(wǎng)站百度為什么不收錄?初步查看了下這個(gè)站的一些信息,site和domain沒有數(shù)據(jù),查看域名的注冊時(shí)間,一個(gè)月之前注冊的,谷歌已經(jīng)收錄了90來?xiàng)l數(shù)據(jù),打開網(wǎng)站后,是個(gè)企業(yè)站,建站為了節(jié)省時(shí)間,一些關(guān)鍵位置部分如底部版權(quán)信息等都直接用圖片來代替,總體版面文字稀少,alt標(biāo)簽缺失。我繼續(xù)打開了內(nèi)頁的企業(yè)簡介頁面,和首頁相似度達(dá)到了80%以上。查看下蜘蛛文件,果然沒有。再查看下外部鏈接,只有幾個(gè)B2B平臺的鏈接。為了更仔細(xì)的分析,ranch向?qū)Ψ秸埱蟮骄W(wǎng)站的蜘蛛排名日志文件,從中確信百度蜘蛛未抓取到網(wǎng)頁字節(jié),且在訪問robots文件時(shí)留下404錯(cuò)誤的狀態(tài)碼(表示該文件不存在)。
ranch在看完之后,建議對方對網(wǎng)站做如下修改。
1、增加首頁文本的內(nèi)容,減少與內(nèi)頁面的雷同度。
2、將底部的圖片換成文字,添加好網(wǎng)站所在地地址,聯(lián)系方式,版權(quán)信息,備案信息等
3、添加robots.txt文件,同時(shí)可制作網(wǎng)站地圖,在robots.txt中添加sitemap:網(wǎng)站地圖url,方面百度蜘蛛爬行
4、也是最關(guān)鍵的一步。利用論壇簽名,軟文,留言,老站資源等給網(wǎng)站添加外部鏈接。如果這些資源都沒有,那么只能每天手工向百度提交幾次。
大概半個(gè)月后,百度終于收錄,因?yàn)檫@位朋友沒有什么鏈接資源,只能采用手工向百度提交的方式來使網(wǎng)站收錄。這個(gè)案例中筆者已經(jīng)將百度收錄的一些常見原因和方法都寫進(jìn)去了。但是解決關(guān)于百度收錄的所有疑惑,ranch還需要更深入的來分析百度。
雖然搜索引擎的算法是搜索引擎的核心,但多年的SEO實(shí)踐和眾多seoer的努力,我們還是能略微窺測到一些。一個(gè)公認(rèn)的事實(shí)是百度對于原創(chuàng)文章判定更加嚴(yán)格,因?yàn)槠溆幸惶缀诵牡姆衷~系統(tǒng),更能理解文章的內(nèi)容(百度的分詞以及如何識別文章內(nèi)容筆者在分析SEO關(guān)鍵詞密度應(yīng)如何分布這篇文章有一定的分析),同時(shí)更能理解國人的思維方式,譬如采集站(比較下發(fā)布時(shí)間就知道是不是采集了)。百度為什么不收錄?不外乎三個(gè)原因:一是不值得,你的內(nèi)容我的數(shù)據(jù)庫中有很多了;二是不愿意,收錄了可能會(huì)給我?guī)砺闊?敏感信息,違法信息等);三是不能夠,你的網(wǎng)站自身原因(程序代碼,服務(wù)器硬件等)讓我想收錄也收錄不了。
處理了這三點(diǎn),最終來檢驗(yàn)我們是否正確還是看最終是否被收錄。多長時(shí)間收錄是一個(gè)正常的時(shí)間呢?15天到2個(gè)月內(nèi)ranch都認(rèn)為這是一個(gè)正常的范圍。當(dāng)然如果你有資源且運(yùn)氣不錯(cuò),1天收錄也不覺得奇怪。還是哪句話,做好我們自己網(wǎng)站的內(nèi)容,如果我們的內(nèi)容夠優(yōu)質(zhì),百度不收錄,那是百度自己的損失,ranch認(rèn)為,做站如做人,當(dāng)有這份尊嚴(yán)和自信。
ranch在看完之后,建議對方對網(wǎng)站做如下修改。
1、增加首頁文本的內(nèi)容,減少與內(nèi)頁面的雷同度。
2、將底部的圖片換成文字,添加好網(wǎng)站所在地地址,聯(lián)系方式,版權(quán)信息,備案信息等
3、添加robots.txt文件,同時(shí)可制作網(wǎng)站地圖,在robots.txt中添加sitemap:網(wǎng)站地圖url,方面百度蜘蛛爬行
4、也是最關(guān)鍵的一步。利用論壇簽名,軟文,留言,老站資源等給網(wǎng)站添加外部鏈接。如果這些資源都沒有,那么只能每天手工向百度提交幾次。
大概半個(gè)月后,百度終于收錄,因?yàn)檫@位朋友沒有什么鏈接資源,只能采用手工向百度提交的方式來使網(wǎng)站收錄。這個(gè)案例中筆者已經(jīng)將百度收錄的一些常見原因和方法都寫進(jìn)去了。但是解決關(guān)于百度收錄的所有疑惑,ranch還需要更深入的來分析百度。
雖然搜索引擎的算法是搜索引擎的核心,但多年的SEO實(shí)踐和眾多seoer的努力,我們還是能略微窺測到一些。一個(gè)公認(rèn)的事實(shí)是百度對于原創(chuàng)文章判定更加嚴(yán)格,因?yàn)槠溆幸惶缀诵牡姆衷~系統(tǒng),更能理解文章的內(nèi)容(百度的分詞以及如何識別文章內(nèi)容筆者在分析SEO關(guān)鍵詞密度應(yīng)如何分布這篇文章有一定的分析),同時(shí)更能理解國人的思維方式,譬如采集站(比較下發(fā)布時(shí)間就知道是不是采集了)。百度為什么不收錄?不外乎三個(gè)原因:一是不值得,你的內(nèi)容我的數(shù)據(jù)庫中有很多了;二是不愿意,收錄了可能會(huì)給我?guī)砺闊?敏感信息,違法信息等);三是不能夠,你的網(wǎng)站自身原因(程序代碼,服務(wù)器硬件等)讓我想收錄也收錄不了。
處理了這三點(diǎn),最終來檢驗(yàn)我們是否正確還是看最終是否被收錄。多長時(shí)間收錄是一個(gè)正常的時(shí)間呢?15天到2個(gè)月內(nèi)ranch都認(rèn)為這是一個(gè)正常的范圍。當(dāng)然如果你有資源且運(yùn)氣不錯(cuò),1天收錄也不覺得奇怪。還是哪句話,做好我們自己網(wǎng)站的內(nèi)容,如果我們的內(nèi)容夠優(yōu)質(zhì),百度不收錄,那是百度自己的損失,ranch認(rèn)為,做站如做人,當(dāng)有這份尊嚴(yán)和自信。