不論是大的網(wǎng)站的還是小的網(wǎng)站,對(duì)于Google seo優(yōu)化人員來說都是需要進(jìn)行日志文件分析的。?本篇文章將為您詳細(xì)介紹何為網(wǎng)站日志文件?借助日志文件可以分析什么等。
日志文件是什么:
日志文件是包含有關(guān)向網(wǎng)站服務(wù)器發(fā)出請(qǐng)求的人員和內(nèi)容的詳細(xì)日志的文件。每次機(jī)器人向您的站點(diǎn)發(fā)出請(qǐng)求時(shí),數(shù)據(jù)(例如時(shí)間,日期IP地址,用戶代理等)都存儲(chǔ)在此日志中。這些有價(jià)值的數(shù)據(jù)允許任何SEO找出Googlebot和其他抓取工具在您的網(wǎng)站上正在做什么。與常規(guī)抓取不同,例如Screaming Frog SEO Spider,這是真實(shí)世界的數(shù)據(jù) - 而不是估計(jì)您的網(wǎng)站被抓取的方式。它是您網(wǎng)站抓取方式的精確概述。
通過日志文件分析什么內(nèi)容:
1、Google總體抓取量(以及趨勢(shì))
搜索引擎的收錄是由抓取量以及文章質(zhì)量來決定的,當(dāng)文章質(zhì)量不變的情況下,蜘蛛抓取量越大,那么收錄的就會(huì)越多。所以我們通過日志分析,可知道網(wǎng)站每天的抓取量,以及預(yù)測(cè)之后的發(fā)展趨勢(shì)。
2、統(tǒng)計(jì)Google抓取的狀態(tài)碼
當(dāng)Google抓取了你的頁(yè)面后,不但抓取了你的內(nèi)容,而且還會(huì)有一個(gè)抓取返回碼的,這些返回碼我們要記錄下來,特別是一些類似301、404、500等這些狀態(tài)碼,我們從這些狀態(tài)碼中我們找出網(wǎng)站的一些潛在的問題。
3、統(tǒng)計(jì)搜索引擎蜘蛛來的次數(shù)、來的時(shí)間
統(tǒng)計(jì)出Google蜘蛛每天來的次數(shù),一天一共在我們網(wǎng)站停留了多久,有沒有IP蜘蛛一天24小時(shí)都在我們網(wǎng)站不停的抓取,這樣的蜘蛛越多越好,往往是你網(wǎng)站權(quán)重提升的表現(xiàn)。
日志文件如何打開:
日志文件一般是log為擴(kuò)展名的文件,有的是GZ壓縮后的文件,我們下載下來,可以直接用記事本打開log文件,可看到里面的爬取記錄。