【院长帮帮忙】页面无用时间信息导致网页不被爬虫抓取（第一期）_威海佰年网络技术有限公司_网站建设_软件开发_私有云_商标注册_公众号_小程序_APP_物联网

【院长帮帮忙】页面无用时间信息导致网页不被爬虫抓取（第一期）

威海Spider 威海院长帮帮忙
2024

在【院长帮帮忙】栏目露过面的站点是编织汇（www.bianzhihui.com），该站点通过反馈中心反馈页面内容迟迟不被抓取，经百度工程师追查，原来是因为页面上的无用时间信息——没有想到是不是？同学们快来看看这个案例吧。也想让院长帮助追查吗？快来看看这里！

站点求助：现象

编织汇网站内容发布后几个礼拜都未曾收录。案例如下：

http://www.bianzhihui.com/t/6717（教程详细页面举例）

http://www.bianzhihui.com/u/12306 （用户页面举例）

http://www.bianzhihui.com/h/154 （编织花样页面举例）

我们已将这些url放入sitemap，并使用了百度统计的集成的JS推荐，但是未曾有改善。

站点求助：自查

根据反馈中心的回复，使用抓取异常工具诊断：未发现异常

院长出手，内部追查

工程师结论： spider抓取很及时，但因为该网站没有设置内容产出时间，网站底部却有个老旧时间日期，导致spider误以为网页内容老旧（具体策略较复杂，在此不做赘述）。建议增加页面内容产生时间，去掉没有必要的时间信息

*以上为旧页面截图，“2014年9月9日”对时间识别造成干扰。

站点总结：

1，网页上切忌勿乱加时间，如我们网站的（始于2014年9月9日）这种时间是一个大忌

2，网页内容尽可能加上产出时间，也就是发布时间

3，百度site的结果时间和权重并无太多关系

4，跟百度沟通的时候，一定要条例清晰，证据确凿。自身的问题一定要先排查准确。

来源：百度搜索资源平台百度搜索学堂

Public @ 2015-07-21 15:22:04

如何判断是否冒充Baiduspider的抓取？

威海Spider 威海Baiduspider
1212

建议您使用DNS反向查找和DNS正向查找相结合的方式来确定抓取来源的ip是否属于百度，根据平台不同验证方法不同，如linux/windows/os三种平台下的验证方法分别如下： 6.1 在linux平台下：（1）使用host ip命令反解ip来判断是否来自Baiduspider的抓取。Baiduspider的hostname以 *.baidu.com 或 *.b

Public @ 2021-10-08 15:56:48

什么是蜘蛛池

威海Spider 威海蜘蛛池
1602

蜘蛛池是指由多个区块链矿池共同组成的联合挖矿系统，旨在提高比特币等加密货币的挖矿效率和收益。蜘蛛池由一个或多个节点汇聚而成，矿工可以连接到节点以共同挖矿，每个节点都会分配一定数量的工作量证明（Proof of Work, PoW）任务给矿工，然后将挖出的加密货币按比例分配给参与挖矿的矿工。蜘蛛池的作用是让矿工们能够更加高效地挖矿，共享挖矿收益，同时降低挖矿的成本。

Public @ 2023-06-03 15:00:14

【院长帮帮忙】我的网站排名为什么突然下降？（第十期）

可能有多种原因导致您网站排名突然下降，以下是一些可能的原因及解决方法： 1. 竞争对手优化反击：您的竞争对手执行了更好的搜索引擎优化策略，导致他们的网站排名上升，您的网站排名下降。解决方法：通过了解您的竞争对手的优化策略，制定更好的策略，例如添加更好的关键词、更好的网站内容以及实施更专业的SEO技巧。 2. 网站内容更新不及时或质量下降：搜索引擎对网站内容有一定的要求，如果您的网站缺乏新的

Public @ 2023-06-03 06:00:25

【院长帮帮忙】移动适配不稳定、不生效，可能是这些原因造成的！（第五期）

1. 未设置Viewport Viewport是指浏览器中用于控制页面布局和缩放比例的元标签，如果未设置Viewport，则移动端浏览器会将页面按照PC端浏览器默认的布局来显示，导致页面排版错乱。因此，需要在head部分加入Viewport的设置，例如： ```html ``` 2. 媒体查询错误在进行移动适配时，我们通常会使用媒体查询来针对不同设备进行样式的调整。但是，如果媒体查询的

Public @ 2023-04-04 12:50:29

Categories

Tags