網(wǎng)站SEO快速診斷的方法(二)
6、內(nèi)部鏈接
網(wǎng)站SEO快速診斷的方法(二) 內(nèi)部鏈接數(shù)的另外一個作用是反映出網(wǎng)站收錄頁面數(shù)。Google的site:指令也不太準(zhǔn)確,而且現(xiàn)在越來越不準(zhǔn)確,經(jīng)常不能反映出收錄數(shù)字。網(wǎng)管工具中內(nèi)部鏈接部分列出的首頁內(nèi)部鏈接總數(shù),大致上就相當(dāng)于Google收錄的頁面總數(shù),因?yàn)榫W(wǎng)站上每一個頁面都應(yīng)該有到首頁的鏈接。
7、抓取錯誤及統(tǒng)計(jì)
抓取錯誤部分列出404錯誤(頁面不存在)、被robots文件禁止而不能收錄的頁面等。
網(wǎng)管工具顯示的404錯誤其中404錯誤對檢查網(wǎng)站上是否存在錯誤鏈接很有用。對每個404錯誤,網(wǎng)管工具都列出了到這個網(wǎng)址的鏈接。
如果到不存在頁面的鏈接是網(wǎng)站內(nèi)部發(fā)出的,說明這些鏈接頁面上的鏈接地址有錯誤。
如果鏈接向不存在頁面的是其他網(wǎng)站,站長可以嘗試聯(lián)系對方更改錯誤鏈接到正確位置。
網(wǎng)管工具也列出抓取統(tǒng)計(jì)信息。
假如一篇博客每天抓取頁面數(shù)平均為400多頁,對于一個只有幾百篇帖子的博客來說很正常。如果是幾十萬上百萬頁面的大中型網(wǎng)站,平均每天抓取幾百個頁面就太糟糕了,照這個速度,要把整個網(wǎng)站更新一遍,恐怕得好幾年時(shí)間。大中型網(wǎng)站每天抓取幾萬頁面是最低標(biāo)準(zhǔn)。如果抓取頻率太低,
網(wǎng)站SEO人員必須在外部鏈接建設(shè)及網(wǎng)站結(jié)構(gòu)上多下工夫。
查看Google的HTML建議是尋找網(wǎng)站上可能出現(xiàn)的復(fù)制內(nèi)容的最簡便方法。
網(wǎng)管工具列出了重復(fù)的元說明(也就是說明標(biāo)簽)及標(biāo)題標(biāo)簽個數(shù)和具體頁面。筆者的博客存在的重復(fù)標(biāo)題標(biāo)簽如圖3-48所示。
標(biāo)題標(biāo)簽重復(fù),實(shí)際上經(jīng)常意味著這些頁面本身內(nèi)容重復(fù),往往是網(wǎng)站結(jié)構(gòu)造成的。
要注意的是,有時(shí)候網(wǎng)管工具中列出的數(shù)據(jù)并不完整,一般來說博客上標(biāo)題標(biāo)簽重復(fù)的頁面絕不止兩頁。
9、模擬蜘蛛抓取
站長可以輸入自己網(wǎng)站上的任何一個網(wǎng)址,網(wǎng)管工具會發(fā)出Google蜘蛛,實(shí)時(shí)抓取頁面內(nèi)容,并顯示出抓取的HTML代碼,包括服務(wù)器頭信息和頁面代碼。
這個工具也可以用來檢查頁面是否被黑。有的時(shí)候黑客放入的代碼會檢查瀏覽器類型,如果是用戶使用的普通瀏覽器訪問則返回正常內(nèi)容,如果是搜索引擎蜘蛛訪問,才返101
回黑客加上去的垃圾內(nèi)容和垃圾鏈接。所以站長自己訪問網(wǎng)站看不出異樣,Google蜘蛛抓到的卻不是站長自己看到的內(nèi)容。這個工具可以幫助站長檢查頁面是否存在安全漏洞。
10、網(wǎng)站性能
網(wǎng)站速度現(xiàn)在越來越被重視,不僅可能對排名產(chǎn)生影響,對用戶體驗(yàn)也有很大影響。
這個網(wǎng)頁打開時(shí)間并不是Google蜘蛛抓取文件所要花的時(shí)間,而是Google工具條記錄的普通用戶打開頁面要花的時(shí)間。所以網(wǎng)站服務(wù)器地理位置并不影響網(wǎng)站性能部分列出的數(shù)據(jù)。Google蜘蛛都是從美國發(fā)出的,但網(wǎng)站服務(wù)器放在中國不意味著比放在美國載入時(shí)間要長,因?yàn)镚oogle記錄的是普通用戶訪問網(wǎng)站的快慢。