搜索引擎不(bù)抓取頁面 服務器端的(de)五個(gè)問題

2022-05-01 欄目:行業動态 查看(2,912)

1、錯誤的(de)封禁

在(zài)百度的(de)robots.txt的(de)更新上(shàng),如果多次點擊“檢測并更新”就(jiù)會出(chū)現時(shí)常可以(yǐ)更新,但是(shì)又時(shí)常無法更新的(de)問題。如此一(yī / yì /yí)來(lái):不(bù)應當被收錄的(de)東西,在(zài)robots.txt上(shàng)禁止的(de)被收錄了(le/liǎo),又删除就(jiù)很正常了(le/liǎo)。那麽它的(de)問題是(shì)什麽呢?并非服務器負載過度,而(ér)是(shì)因爲(wéi / wèi)防火牆錯誤的(de)将部分Baiduspider列入了(le/liǎo)黑名單。

2、服務器異常

常規的(de)服務器就(jiù)不(bù)說(shuō)了(le/liǎo),大(dà)家都知道(dào)的(de),北上(shàng)廣的(de)一(yī / yì /yí)般都不(bù)錯。不(bù)過有一(yī / yì /yí)些特殊服務器,想必絕大(dà)多數的(de)站長都不(bù)知道(dào)吧?例如西部數碼的(de)“港台服務器”就(jiù)很有趣,真的(de)是(shì)港台的(de)嗎?本身機房在(zài)國(guó)内,還算什麽港台?爲(wéi / wèi)了(le/liǎo)逃避備案而(ér)用一(yī / yì /yí)個(gè)港台的(de)IP,數據全部在(zài)國(guó)内。

這(zhè)樣有什麽不(bù)好呢?我們會發現:站點的(de)服務器是(shì)經過CDN的(de),哪怕是(shì)你上(shàng)傳的(de)一(yī / yì /yí)張圖片,都會顯示爲(wéi / wèi)“302狀态碼”,訪問速度是(shì)提升上(shàng)去了(le/liǎo),可是(shì)這(zhè)樣利于(yú)SEO嗎?

3、獲取不(bù)到(dào)真實IP

規模較大(dà)的(de)網站,一(yī / yì /yí)般都會使用CDN加速,但是(shì)有些站點不(bù)僅僅對“設備”使用了(le/liǎo)CDN加速,而(ér)且還對Spider使用了(le/liǎo)加速功能。後的(de)結果是(shì)什麽呢?如果CDN節點不(bù)穩定,那麽對網站spider來(lái)講,這(zhè)個(gè)問題将是(shì)緻命的(de)。

很多大(dà)型站點開放CDN的(de)原因就(jiù)是(shì)容易被攻擊,這(zhè)個(gè)時(shí)候如果不(bù)做“蜘蛛回源”就(jiù)可想而(ér)知了(le/liǎo)。你的(de)站點做了(le/liǎo)CDN了(le/liǎo)嗎?請登錄百度站長平台查看一(yī / yì /yí)下spider是(shì)否可以(yǐ)抓取真實IP地(dì / de)址吧!

掃二維碼與項目經理溝通

我們在(zài)微信上(shàng)24小時(shí)期待你的(de)聲音

解答本文疑問/技術咨詢/運營咨詢/技術建議/互聯網交流

鄭重申明:濟南佳信信息科技有限公司以(yǐ)外的(de)任何單位或個(gè)人(rén),不(bù)得使用該案例作爲(wéi / wèi)工作成功展示!