據(jù)了解目前還有10%的公司或者個(gè)人站長(zhǎng)并不知道什么是網(wǎng)站的LOG日志,還有30%知道網(wǎng)站LOG日志,但是卻從來沒有做過分析的。
??事實(shí)上你知道嗎?
??網(wǎng)站的LOG日志就是站點(diǎn)的晴雨表,通過LOG日志的查看,可以精準(zhǔn)的了解到網(wǎng)站目前存在的非常多的問題,而放棄了LOG日志的分析,網(wǎng)站規(guī)模越大的網(wǎng)站,則意味著放棄的機(jī)會(huì)也就越多。
??作為網(wǎng)站負(fù)責(zé)人,每天看著流量不增長(zhǎng),是什么感受?煎熬!流量為什么不增長(zhǎng)?你所理解的SEO還只是做外鏈,發(fā)文章嗎?如果是這樣的話,那么真的只能說是活該了!
??網(wǎng)站有沒有問題,LOG日志文件,精明的站長(zhǎng)和企業(yè)都不會(huì)忽視他的價(jià)值,通過LOG日志的檢查,來發(fā)現(xiàn)那些隱藏在背后的刀芒,今天優(yōu)度項(xiàng)目經(jīng)理就帶大家走進(jìn)LOG日志的世界。
??一:查看目錄抓取概況
??目錄抓取,可以準(zhǔn)確的的查看到不同的蜘蛛爬行過哪些目錄,這些目錄有抓取的必要嗎?在SEO上會(huì)有產(chǎn)生的結(jié)果的可能嗎?如果任由抓取,只會(huì)浪費(fèi)蜘蛛給予的抓取配額,和降低對(duì)網(wǎng)站質(zhì)量的認(rèn)可程度。除此之外,通過蜘蛛對(duì)目錄的抓取頻率,還可以看住一個(gè)目錄的重要性和薄弱點(diǎn),如果善加利用起來,讓其實(shí)現(xiàn)更高和更平衡的抓取頻率,對(duì)SEO上的幫助也是極大的,不過真正能把控這一點(diǎn)的人只是極少數(shù)罷了。
??二:查看頁面抓取概況
??頁面抓取可以準(zhǔn)確的查看到蜘蛛爬行的每一個(gè)頁面,我們通常會(huì)見到,有些蜘蛛抓取的頁面居然是網(wǎng)站中前臺(tái)看不到的,比如:有人惡意提交一些不存在的動(dòng)態(tài)鏈接,如:www.xxx.com/?www.qq.com這種類型的鏈接?;蛘哒f,網(wǎng)站雖然做了偽靜態(tài)或者靜態(tài)的處理了,但是蜘蛛為什么抓取到動(dòng)態(tài)鏈接了呢?這種都是可以通過LOG日志來直接看到的問題,某個(gè)頁面抓取頻率越高,通常代表這個(gè)頁面更有價(jià)值。
??如果你想優(yōu)化的頁面,抓取頻率偏低,那么就要為其增加適當(dāng)?shù)钠毓舛?,來達(dá)成你想要的結(jié)果。
??三:查看狀態(tài)碼信息
??狀態(tài)碼分為兩種,一種是蜘蛛狀態(tài)碼,另一種是用戶狀態(tài)碼,通過蜘蛛狀態(tài)碼可以準(zhǔn)確的查看到網(wǎng)站是否存在抓取問題。例如:404代表的是錯(cuò)誤頁,301、302代表的是重定向,還有一些:504、500、等狀態(tài)碼,值得說的是:除去200狀態(tài)碼,出現(xiàn)其他的狀態(tài)碼都是應(yīng)當(dāng)值得注意的,其中最容易出現(xiàn)的可能會(huì)是50X以及301、302、304、404這幾個(gè)狀態(tài)碼,那么這些狀態(tài)碼是什么含義呢?
??A,50X狀態(tài)碼,X可以是0也可以是2、3、4等數(shù)值,但是這種狀態(tài)碼如果出現(xiàn),通常的問題就是“服務(wù)器異?!?,少量偶爾出現(xiàn)沒有任何問題,但是如果大批量的出現(xiàn),或者連續(xù)多天都有此類型的問題,務(wù)必要解決,否則100%對(duì)網(wǎng)站權(quán)重造成影響,甚至直接導(dǎo)致站點(diǎn)降權(quán)。
??B,40X狀態(tài)碼,這種頁面基本上代表的是頁面無法打開了,可能是權(quán)限問題,也可能是頁面被刪除的問題,我們最容易見到的是404這種“死鏈接”如果大批量出現(xiàn),務(wù)必要在百度資源平臺(tái)進(jìn)行死鏈接的主動(dòng)提交才可以。
??C,301、302狀態(tài)碼,這種可以單獨(dú)理解為“跳轉(zhuǎn)”一個(gè)頁面跳轉(zhuǎn)到另一個(gè)頁面就會(huì)產(chǎn)生這種情況,如果站點(diǎn)近期沒有做過特殊操作,卻出現(xiàn)了大量此類型鏈接,務(wù)必排查源頭,將其處理為正常的200狀態(tài)碼才可以。
??D,304狀態(tài)碼,量少無任何影響,如果每天出現(xiàn)幾百條或者更多,務(wù)必進(jìn)行處理,大批量的304狀態(tài)碼100%造成網(wǎng)站降權(quán)。
??上面說的是一些LOG日志工具都有的功能,而接下來我們?cè)僬f一下一些進(jìn)階類型的東西:
??A:如果想要更多有效的著陸頁被蜘蛛更多的抓取,那么請(qǐng)進(jìn)行結(jié)構(gòu)內(nèi)鏈的完善,提升需要展現(xiàn)頁面的曝光率。
??B:不希望蜘蛛抓取那些沒有優(yōu)化意義的頁面上,那么robots.txt上來進(jìn)行封閉,比如一些評(píng)論頁、留言頁、或者是不可能出現(xiàn)排名的頁面。
??C:“蜘蛛陷阱”無止盡的循環(huán),浪費(fèi)抓取配額,通過頁面抓取,都可以直觀看到,常見的通常是“三個(gè)條件”的篩選鏈接比如,項(xiàng)目/城市/縣/這樣的3個(gè)條件的篩選。
??D:曝光力度夠了,蜘蛛一樣不抓取,只能說頁面價(jià)值太低,需要進(jìn)一步優(yōu)化,頁面價(jià)值太低,往往是不同的頁面有用的文字太少了,頁面區(qū)別性太小了造成的。
??E:我們希望每個(gè)頁面的下載時(shí)間足夠快,可以在有效的時(shí)間內(nèi)抓取更多的頁面。
??F:不是所有的蜘蛛都是真的蜘蛛,要學(xué)會(huì)查看蜘蛛是否為“采集”和“模擬”,如果出現(xiàn)一些如www.xxx.com/zip 這樣的蜘蛛訪問形式,或者是www.xxx.com/admin/conifg這樣的蜘蛛形式,十有八九都是虛假蜘蛛,正常的蜘蛛不會(huì)抓取不存在的目錄,有人惡意在掃描網(wǎng)站。
??G:分析每天的蜘蛛,可以查看上升或者下降的趨勢(shì),明顯變化,網(wǎng)站會(huì)出事的,當(dāng)然了這個(gè)也可以在百度資源平臺(tái)的“抓取頻率”上來進(jìn)行查看。
H:如果網(wǎng)站規(guī)模較大,服務(wù)器經(jīng)常峰值,或者成本太高,那么降低或者封禁不會(huì)帶來流量的蜘蛛,以減少服務(wù)器壓力,對(duì)大型網(wǎng)站很重要,比如:雅虎、有道、微軟,這些亂七八糟的蜘蛛,作用都微乎其微。
好了,這篇文章帶大家熟悉了一下log日志,如果還有不明白的地方,可以打網(wǎng)頁上面的電話咨詢哦!