Categories


Tags


建立符合搜索抓取习惯的网站

编者按:前两周简要地给大家介绍了搜索抓取系统工作原理,根据该工作原理今天简要介绍一下如何建立网站是符合搜索引擎抓取系统习惯的。

1、简单明了的网站结构

Spider抓取相当于对web这个有向图进行遍历,那么一个简单明了结构层次分明的网站肯定是它所喜欢的,并尽量保证spider的可读性。

(1)树型结构最优的结构即“首页—频道—详情页”;

(2)扁平首页到详情页的层次尽量少,既对抓取友好又可以很好的传递权重。

(3)网状保证每个页面都至少有一个文本链接指向,可以使网站尽可能全面的被抓取收录,内链建设同样对排序能够产生积极作用。

(4)导航为每个页面加一个导航方便用户知晓所在路径。

(5)子域与目录的选择相信有大批的站长对此有疑问,在我们看来,当内容较少并且内容相关度较高时建议以目录形式来实现,有利于权重的继承与收敛;当内容量较多并且与主站相关度略差时建议再以子域的形式来实现。

2、简洁美观的url规则

(1)唯一性网站中同一内容页只与唯一一个url相对应,过多形式的url将分散该页面的权重,并且目标url在系统中有被滤重的风险;

(2)简洁性动态参数尽量少,保证url尽量短;

(3)美观性使得用户及机器能够通过url即可判断出页面内容的主旨;

我们推荐如下形式的url:url尽量短且易读使得用户能够快速理解,例如使用拼音作为目录名称;同一内容在系统中只产生唯一的url与之对应,去掉无意义的参数;如果无法保证url的唯一性,尽量使不同形式的url301到目标url;防止用户输错的备用域名301至主域名。

3、其他注意事项

(1)不要忽略倒霉的robots文件,默认情况下部分系统robots是封禁搜索引擎抓取的,当网站建立后及时查看并书写合适的robots文件,网站日常维护过程中也要注意定期检查;

(2)建立网站sitemap文件、死链文件,并及时通过百度站长平台进行提交;

(3)部分电商网站存在地域跳转问题,有货无货建议统一做成一个页面,在页面中标识有无货即可,不要此地区无货即返回一个无效页面,由于spider出口的有限性将造成正常页面无法收录。

(4)合理利用站长平台提供的robots、sitemap、索引量、抓取压力、死链提交、网站改版等工具。

如果大家对搜索抓取还有别的疑问,大家可以到[学堂同学汇][学习讨论] 《建立符合搜索抓取习惯的网站》讨论帖中发表自己的看法,我们的工作人员会关注这里并与大家进行探讨。

来源:百度搜索资源平台 百度搜索学堂


Public @ 2021-12-30 16:12:04

站点地图创建方法

1. 用所需软件打开网站:   打开一个文本编辑器,比如 Notepad 或者 Sublime Text,用来编辑 xml 文件; 2. 组织网站地图:   列出网站中每一个页面的具体地址,用符号 * 表示页面间的关联结构; 3. 用 xml 标准编写网站地图:   将网站地图的内容按照 xml 的规范编写;   主要的元素有,<urlset>,<url>,

Public @ 2023-03-02 11:48:25

绝对路径和相对路径与SEO

(6月18号注: 昨天很多读者大概没看到这篇帖子,而且整天忙着处理不可抗力造成的问题很累,今天就不更新了。)经常看到有人在论坛里问URL的绝对路径和相对路径问题,在网站中应该使用哪种?对SEO有什么影响?这实际上没有绝对的答案,两者各有优缺点。Google员工JohnMu前几天在Google Groups中做了一个挺全面的总结。下面半翻译半解释评论。绝对路径URL优点是:+)如果有人抄袭采集你的内

Public @ 2014-04-06 16:11:47

网站的结构和导航设置应该注意什么?

1. 明确网站宗旨和目标用户,设计网站结构和导航应该紧密围绕宗旨和用户需求进行,体现网站的主题和核心功能。 2. 确定清晰的导航条及其位置,在整个网站中保持一致性和易于理解,使用户可以快速找到所需信息。 3. 设计页面布局要尽量简洁明了,结构分明,尤其是在导航条中,可以用颜色、字体、位置等方式来突出指示当前所在页面。 4. 设置导航条中的标签栏,标签的名称要简洁明了、易于理解,避免使用过于复杂的术

Public @ 2023-04-03 14:00:15

网站结构有哪些类型1:什么是树状结构

网站结构有以下类型: 1. 线性结构:网页按照线性顺序呈现,用户只能按照给定的路径进行操作。 2. 并列结构:网页中的多个页面并列展示,用户可以按照自己的意愿任意选择。 3. 分层结构:根据主题或类别将网页分成不同的层次,并且每一层都有相应的子页链接。 4. 网状结构:网页中的所有页面都可以互相连接,没有明确的层次结构。 5. 混合结构:以上几种结构的组合。 树状结构是一种分层结构,也称为层次

Public @ 2023-04-16 03:50:18

更多您感兴趣的搜索

0.423272s