robots.txt：如何让搜索引擎不要抓取没用的页面_威海佰年网络技术有限公司_网站建设_软件开发_私有云_商标注册_公众号_小程序_APP_物联网

robots.txt：如何让搜索引擎不要抓取没用的页面

| 什么是robots文件？

Robots是站点与spider沟通的重要渠道，是网站与搜索引擎爬虫之间的协议，告知哪些可抓取哪些不允许。

| 为什么要做robots文件？

网站上总有一些页面是禁止蜘蛛抓取的。例如：搜索页面、筛选页面、后台登录地址等。

| 如何制作 robots文件？

编写robots.txt文件并上传到网站根目录。

| 制作 robots.txt注意事项

● 所有搜索引擎则用星号表示

● Allow（允许）和Disallow（不允许）优先级

● 至少屏蔽一个，可以屏蔽：搜索结果页面/404页面

● 记得将sitemap放到Robots文件中

● 可以陆续放入更多，而不是一次性决定所有

● 网站后台地址/图片地址/下载文件地址/错误链接（搜外网）

Public @ 2019-03-13 16:09:27

本文更新了百度官方提供的301问题汇总，参见文章结尾。这篇文章可看可不看，以前讲301重定向都是回复别人的评论，而没在自己博客上发布过一篇详细关于301重定向的文章，在我印象中，已经有好几位朋友让我发布一篇关于301重定向的文章。索性今天我就详细写一下吧，也许此文对你有用，也许此文对大多数人已经是再常见不过的问题了，你说是吧weiking。301永久重定向对SEO无任何不好的影响，而且网页A的关键

Public @ 2020-04-05 16:09:13

360搜索对Robots协议的支持

360搜索支持Robots协议的主要命令，以下为具体说明：1. user-agent360搜索各产品的爬虫user-agent为：- 网页搜索 360Spider- 图片搜索 360Spider-Image- 视频搜索 360Spider-Video2. Allow站长可通过Allow命令指定建议收录的文件、目录。3. Disallow站长可通过Disallow命令指定不建议收录的文件、目录。

Public @ 2019-06-30 16:09:34

robot 禁止抓取图片

可以在Robot协议文件中添加"User-agent:*"以及"Disallow: /images/"，这样Robot就会禁止抓取图片。

Public @ 2023-02-24 10:24:06

robot.txt在SEO中的作用

鉴于网络安全与隐私的考虑，搜索引擎遵循robots.txt协议。通过根目录中创建的纯文本文件robots.txt，网站可以声明不想被robots访问的部分。每个网站都可以自主控制网站是否愿意被搜索引擎收录，或者指定搜索引擎只收录指定的内容。当一个搜索引擎的爬虫访问一个站点时，它会首先检查该站点根目录下是否存在robots.txt，如果该文件不存在，那么爬虫就沿着链接抓取，如果存在，爬虫就会按照该文

Public @ 2023-01-27 16:09:31

Categories

Tags