此文章答案提供者為百度負(fù)責(zé)抓取收錄的工程師,以及ITSEO創(chuàng)始人夜息,可謂題題經(jīng)典!新站必看,老站也未必知道這么詳細(xì)哦!
01
問(wèn):在使用百度統(tǒng)計(jì)進(jìn)行廣告追蹤的時(shí)候,配置的URL鏈接會(huì)很長(zhǎng)。這個(gè)追蹤會(huì)不會(huì)影響SEO?
答:這種存在多個(gè)URL版本的統(tǒng)計(jì)代碼,SEO肯定有影響。針對(duì)這種情況有兩個(gè)建議,一個(gè)是真正Spider爬行和用戶(hù)顯示使用兩套u(yù)rl。還有一 種是不使用百度統(tǒng)計(jì)了,可以改使用谷歌里面的追蹤,他可以使用#號(hào)鏈接,事件追蹤,參考美團(tuán)網(wǎng)。所有鏈接加上事件追蹤。如果產(chǎn)生的話(huà),也是通過(guò)#號(hào)產(chǎn)生, 不增加額外參數(shù)。
02
問(wèn):假如一個(gè)頁(yè)面開(kāi)始是不符合百度的SEO標(biāo)準(zhǔn),后來(lái)將它改成符合標(biāo)準(zhǔn),百度多久可以反饋很好的結(jié)果?
答:不同的站,貢獻(xiàn)流量可能不一樣。所以Spider爬行的重點(diǎn)不一樣,有的站可能更多去發(fā)現(xiàn)新鏈接,有的站可能去看舊鏈接。建議推送給百度,像首頁(yè)這種抓取的話(huà)一般沒(méi)有問(wèn)題。
03
問(wèn):推送多久會(huì)有審核,一個(gè)星期或者半個(gè)月?
答:推送如果說(shuō)是能夠達(dá)到抓取標(biāo)準(zhǔn),立即能抓。
04
問(wèn):網(wǎng)站有新老兩種URL,交替大概有兩年時(shí)間,現(xiàn)在舊的URL,跳轉(zhuǎn)到新的URL。因服務(wù)器問(wèn)題,出現(xiàn)半小時(shí)斷網(wǎng),之后搜索關(guān)鍵詞出現(xiàn)老的url,現(xiàn)在基本用所有的手法恢復(fù)不過(guò)來(lái),這種情況我們?cè)趺醋觯?/strong>
答:用改版工具重新提交一下,確保是改版成功就不會(huì)有問(wèn)題。再發(fā)現(xiàn)有問(wèn)題截屏然后反饋給工程師這邊追查。
05
問(wèn):因?yàn)榫W(wǎng)站使用境外域名(暫時(shí)變換不了),不知道有沒(méi)有什么辦法可以更好的提高搜索量或者抓取量?
答: 如果是pc頁(yè)面的話(huà) 會(huì)算到pc的索引量里面。和使用什么工具打開(kāi)沒(méi)有關(guān)系。
06
問(wèn):有的網(wǎng)站注冊(cè)使用了很多域名,很多域名是并不想用戶(hù)搜索出來(lái)的。現(xiàn)在取消了這些域名,但是還能搜出來(lái),關(guān)掉過(guò)一次,后來(lái)沒(méi)有效果,不知道這個(gè)怎么處理?
答:如果不需要那些站嗎?可以把那些關(guān)掉就可以了。新域名在短暫時(shí)間的關(guān)閉,可能給用戶(hù)調(diào)起一個(gè)老域名,當(dāng)這一個(gè)域名關(guān)閉的情況下,我們不會(huì)給用戶(hù)做長(zhǎng)線(xiàn)。也不會(huì)找到這些東西。
07
問(wèn):網(wǎng)站是母嬰類(lèi)網(wǎng)站,在PC端上搜索流量很差。想問(wèn)有沒(méi)有方法?
答:類(lèi)似像醫(yī)療、養(yǎng)生、保健、母嬰這樣的問(wèn)題,百度對(duì)搜索結(jié)果的展現(xiàn)是非常謹(jǐn)慎。百度只給優(yōu)質(zhì)網(wǎng)站開(kāi)放他們的展現(xiàn)可能性,網(wǎng)站在很長(zhǎng)時(shí)間內(nèi)拿不到流 量都非常有可能。如果網(wǎng)站在SEO上沒(méi)有出現(xiàn)很大問(wèn)題,可以審視內(nèi)容方面是否都在競(jìng)爭(zhēng)一些熱門(mén)詞。建議整個(gè)網(wǎng)站的權(quán)重和流量達(dá)到一定規(guī)模之后,再做熱門(mén) 詞。如果一開(kāi)始做這樣的關(guān)鍵詞,在網(wǎng)站信譽(yù)度不是很高的情況下,就會(huì)出現(xiàn)沒(méi)有流量的情況。這種情況下,網(wǎng)站最好找到自己的一個(gè)差異化跟相關(guān)的詞可能會(huì)更 好。
08
問(wèn):網(wǎng)站是教育行業(yè)的,現(xiàn)在通過(guò)官網(wǎng)的認(rèn)證,就是安全或者權(quán)威性的認(rèn)證,認(rèn)證之后會(huì)不會(huì)有潛在的特殊看待或者是無(wú)所謂。
答:認(rèn)證這事比如說(shuō)你是真的,還有一個(gè)假的,從用戶(hù)的感知來(lái)講你是官網(wǎng)。
09
問(wèn):數(shù)據(jù)化的問(wèn)題,軟件和PDF和Word展示,包括什么類(lèi)型,多大資源?放出來(lái)要以文章的內(nèi)容放出來(lái),還是PDF和文章是一樣? 還有個(gè)矛盾點(diǎn),產(chǎn)品和運(yùn)營(yíng)希望用戶(hù)下載完之后是直接可用,不會(huì)對(duì)PDF和WORD產(chǎn)生一些壓縮或工具化處理,有些用戶(hù)會(huì)經(jīng)意或者不經(jīng)意之間引導(dǎo)去下 Word,應(yīng)該怎么做?
答:百度搜索條現(xiàn)在默認(rèn)叫網(wǎng)頁(yè)搜索,顧名思義是我們給用戶(hù)展現(xiàn)都是一個(gè)網(wǎng)頁(yè)。后面還有一個(gè)文庫(kù)的文件格式。搜索出來(lái)都是讓用戶(hù)下載用的,可以去好好研究,在文庫(kù)里面把內(nèi)容展現(xiàn)出來(lái)。
10
問(wèn):有沒(méi)有一個(gè)通道告訴搜索引擎我們的頁(yè)面內(nèi)容發(fā)生變化了,通常怎么處理?一個(gè)舊的頁(yè)面已經(jīng)被收錄、被排序,一定周期之后他發(fā)動(dòng)新的資源的補(bǔ)充和變化?
答:現(xiàn)在還沒(méi)有這樣的通道。首先Spider這邊會(huì)check一些東西,他發(fā)現(xiàn)網(wǎng)站經(jīng)常出現(xiàn)這種狀況,他相關(guān)的check流量會(huì)增加,不放心的話(huà)還是把他放到sitemap里。
11
問(wèn):網(wǎng)站本來(lái)只是一個(gè)首頁(yè),就是一個(gè)APP下載。我們現(xiàn)在把內(nèi)容放出來(lái),以前這些內(nèi)容不可抓取,現(xiàn)在用目錄或者子域名放出需要提交改版么?
答:這個(gè)就放在域名下,用一個(gè)子目錄把分門(mén)別類(lèi)的東西放進(jìn)去,不存在改版。首頁(yè)改一下,其他不存在改版的問(wèn)題。使用主動(dòng)推送的工具效果還是非常明顯,如果內(nèi)容質(zhì)量很OK,可以把配額都用光。
12
問(wèn):自動(dòng)推送的份額是多長(zhǎng)的周期調(diào)一次?因?yàn)槲矣X(jué)得對(duì)我們海量千萬(wàn)級(jí)或者是百萬(wàn)級(jí)數(shù)據(jù)量來(lái)說(shuō)你那個(gè)份額太少。
答:我們也關(guān)注一個(gè)網(wǎng)站是否有這種爆發(fā)性,突然增量這么多,我們認(rèn)為這很不正常。你還是循序漸進(jìn),別短平快,一夜吃成個(gè)胖子。第二個(gè),你有這么多優(yōu)秀的數(shù)據(jù),你可以關(guān)注百度另外一個(gè)平臺(tái),你變成API讓別人使用你的數(shù)據(jù)。別人對(duì)你的數(shù)用量做付費(fèi),可以關(guān)注這個(gè)。
13
問(wèn):超鏈接做URL的絕對(duì)路徑和相對(duì)路徑會(huì)有影響嗎?改版之后,我們頁(yè)面有翻頁(yè),翻頁(yè)鏈接是12345,上面帶標(biāo)簽。每次抓的時(shí)候不會(huì)抓到12345里面去。模擬抓取,感覺(jué)抓取不到里面。頁(yè)面上的A標(biāo)簽,Spider都會(huì)去抓么?
答:沒(méi)有太大的影響,正常可以訪(fǎng)問(wèn)就OK。不管是絕對(duì)路徑還是相對(duì)路徑,只要說(shuō)這個(gè)地址對(duì)于Spider或者是對(duì)于用戶(hù)來(lái)講都是暢通的,在頁(yè)面呈現(xiàn)的時(shí)地址是完整,這個(gè)路徑都是能夠順暢來(lái)做抓取。
不收錄的問(wèn)題,可以參考其他的一些點(diǎn),比如是不是本身頁(yè)面就沒(méi)被訪(fǎng)問(wèn)到還是目錄層級(jí)比較高。頁(yè)面首頁(yè)推送的鏈接百度都會(huì)去抓,一層一層的。路徑如果正常Spider路徑都是從首頁(yè)開(kāi)始抓取。
首先就要看不被收錄的鏈接志有沒(méi)有被抓獲,如果被抓獲沒(méi)有被收錄,可能是頁(yè)面本身的問(wèn)題。也可以看一個(gè)周期,因?yàn)槲覀冇靡惶鞎r(shí)間。第二個(gè)是看日志里面有沒(méi)有長(zhǎng)尾,是不是隱藏或者層級(jí)搭建的時(shí)候沒(méi)有做有效的抓取或者是有效推薦。如果能看日志,可以看日志去分析一下。
可以調(diào)整首頁(yè)的變化,做一個(gè)推薦,做一個(gè)測(cè)試,看是鏈接的問(wèn)題還是蜘蛛沒(méi)有抓的問(wèn)題。還有推送等等方式都可以解決,從而判斷不收錄的原因是什么。學(xué)院有一個(gè)文檔解決關(guān)于諸多的問(wèn)題題,類(lèi)似于流程圖一樣。當(dāng)這環(huán)做到了,原因是什么?如果夠長(zhǎng),就可以走下面的分支看看。
14
問(wèn):站點(diǎn)之前是所有框架通過(guò)JS展現(xiàn),后來(lái)百度不收錄,又進(jìn)行了PHP改版。樣子是一樣,現(xiàn)在感覺(jué)這個(gè)PHP寫(xiě)的不太規(guī)范,百度對(duì)這個(gè)不太規(guī)范收錄是什么樣的?
答:很多酒店行業(yè)的的內(nèi)容都通不是實(shí)時(shí)加載出來(lái),是通過(guò)JS慢慢獲取頁(yè)面上的內(nèi)容。搜索引擎抓的話(huà)就是一個(gè)導(dǎo)航,就是這樣的問(wèn)題。以前空白頁(yè)面收錄很多,質(zhì)量很不好。關(guān)于Pattern認(rèn)為這就低質(zhì)量的Pattern,內(nèi)容可能也就這樣,所以考慮換一個(gè)目錄。