百度站长学院前几天公布了一个案例,里面提到一些细节,特别值得站长重视。
它这个页面对爬虫爬取做的优化,直接将图片二进制内容放到了html中导致页面长度过长,大小164K,导致内容不被百度收录。

网站如果针爬虫做优化,那么网页的长度最要在128K以内,不要过长。不然爬虫抓取内容后,页面内容过长被截断,已抓取部分无法识别到主体内容,最终导致页面被认定为空短而不收录。
言下之意,这可能是百度技术缺陷导致,如果网页在128K以上,爬虫无法抓取就无法收录。如果各位站长的网站内容过长,尽量删除一部分不太重要的信息,以保证内容收录。
百度工程师建议:
1、不建议站点使用js生成主体内容,如js渲染出错,很可能导致页面内容读取错误,页面无法抓取
2、 如站点针对爬虫爬取做优化,建议页面长度在128k之内,不要过长
3、针对爬虫爬取做优化,请将主题内容放于前方,避免抓取截断造成的内容抓取不全
2023-12-18 22:56:45 admin
论坛版本更新提示2023-12-18 22:56:45 admin
论坛版本更新提示2023-12-17 23:59:39 zjracxj110
小妖精美化倒计时怎么弄 小妖精美...2023-12-17 22:49:53 冷公子
杭州seo优化哪家最优惠?2023-12-17 22:22:51 五行缺钱173
SEO在国内的发展,SEOER的...2023-12-17 21:38:42 niede1213
帮你的网页进行升级2023-12-17 20:15:30 hhkj
如何成为排名第一的实践2021-01-05 22:35:01 wammmmaw
介绍金花站长工具的功能技巧2020-12-27 18:25:01 lll_asd
公司招聘:深圳市翕捷物流有限公司...2020-12-25 20:15:01 小罗
网站建设公司的业务员从哪些方面征...2021-01-08 08:55:01 rcscwyf
网站优化的URL路径2021-01-07 07:30:02 wolfssss
如何三条链接就轻松做seo排名2021-01-04 06:15:02 x06x06
企业构建网站如何提升排名获取用户...2020-12-24 15:45:01 wqmh
高校档案馆网站建设的定位及功能分...2020-12-25 08:00:01 gxya
深圳网站建设:在友情链接交换时如...2020-12-25 21:45:02 lixd
公司招聘:深圳市米尔科技有限公司...2020-12-26 19:50:01 ccvoodoo
广州网站建设公司的优势有哪些?2020-12-27 04:45:02 asjakj
公司招聘:广州富仓网络技术有限公...2020-12-27 05:15:01 二图
从SEO的角度来设计网站中的UR...2021-07-02 02:30:01 rockmanalpha
做商城网站要以转化为主要目标2021-01-10 08:50:02 shuiduo
小企业网站建设,企业网站怎么建设2021-04-30 06:30:02 苯小孩
网站建设公司这么多,网站具备什么...2021-06-20 22:30:01 wandererfy
制作英文网站需要细心的地方2021-07-19 22:30:02 powerdream
4042021-08-21 04:30:01 cnlxtx
行业网站对客户展示产品的方法营销...