Categories


Tags


Robots文件是否支持中文目录

有同学问百度站长学堂一个关于robots的问题:我们有个站点的目录结构使用的是中文,这样式儿的:www.a.com/冒险岛/123.html,那在制作robots文件和sitemap文件的时候,可以直接使用中文吗?百度能获取到吗?在实际操作中我们发现,sitemap中有文件是可以生效的,但robots封禁貌似没有反应,所以想确认一下:robots文件是否支持中文?

工程师解答:Baiduspider目前(2016年10月)在robots里是不支持中文的。

同学追问:那我们进行UrlEncode编码会不会支持呢?比如这种:http://www.a.cn/%E7%89%B9%E6%AE%8A:%E6%B5%8F%E8%A7%88/%E7%94%9F%E6%AD%BB%E7%8B%99%E5%87%BB:%E7%99%BD%E9%93%B6%E5%8A%A0%E7%89%B9%E6%9E%97

工程师解答:robots文件支持这种写法。但是否生效,还要取决于当时BaiduSpider抓取的是哪种形式结构的链接,如果是UrlEncode编码就可以生效,如果是中文就非常不幸了。

来源:百度搜索资源平台 百度搜索学堂


Public @ 2013-01-02 16:08:54

404页面该怎么做?

404页面是指用户请求的页面不存在或者无法访问时,服务器返回的错误页面。对于用户来说,404页面给人一种网站失误或不可靠的印象,但如果设计得当,404页面也可以是有趣的、有创意的,并可以引导用户继续浏览网站。 以下是404页面设计的一些建议: 1. 提供清晰的错误提示:页面应该提供简短明了的错误提示,让用户知道他们访问的页面不存在。 2. 保持网站风格一致:404页面应该与网站的设计风格一致

Public @ 2023-05-28 12:00:23

内部链接nofollow控制权重分布

Nofollow属性推出以后,Matt Cutts多次说过,nofollow既可以用在论坛,博客等的留言中,代表这些链接不是站长能控制和背书的,也可以用在某些内部链接,以达到控制内部链接权重和PR流动及分布的目的。最常见的应用是在网站联系我们,隐私权政策,用户条款等链接上。这些网页往往都是整站有链接,如果没有使用nofollow,整站的链接权重都会平等的流动到这些网页上。而像隐私权政策这些网页一般

Public @ 2017-01-19 16:08:47

网站误封Robots该如何处理

robots文件是搜索生态中很重要的一个环节,同时也是一个很细节的环节。很多站长同学在网站运营过程中,很容易忽视robots文件的存在,进行错误覆盖或者全部封禁robots,造成不必要损失!那么如果误操作封禁了robots怎么办?今天我们请到了厦门258网站运营负责人——郑军伟,为我们分享网站robots误封禁后该如何操作?【案例背景】网站开发2.0版本,技术选择了在线开发,为了避免搜索引擎抓取开

Public @ 2009-10-29 16:08:56

头条搜索Robots匹配说明

在今日头条中,根据用户输入的关键字进行搜索,系统针对关键字进行多维度搜索,内容形成聚合后,统一展示给用户。同时,今日头条采用了多种Robot来爬取和抓取用户的相关关键字,然后精确的匹配给用户,技术上主要是Robot学习算法,和文本分析算法。 Robot算法主要是爬取网站上的关键字,并根据搜索词语进行匹配。Robot算法还可以根据语义分析算法来进行分析和匹配,优化搜索效果。Robot算法也可以

Public @ 2023-02-26 03:54:31

更多您感兴趣的搜索

0.510092s