Categories


Tags


ICO算法—本次针对重复内容清理

处理量级:10亿以上

处理网页特点:

该算法主要是针对重复内容进行清理,对用户没有价值的内容页面,内容时效性强且过期的页面,采集站类,URL地址含有无效参数的页面等。

例如:招聘类网站不同子站中内容相同的页面,小说采集站尤其处理对用户无价值的页面,旧新闻页且内容重复的页面也会处理一部分,以及其他的部分无效页面。


Public @ 2010-08-09 15:21:22

360搜索“后羿算法2.0”升级公告

尊敬的用户: 360全球互联网安全中心(Qihoo 360 Internet Security Center)非常荣幸地宣布,我们将于近期发布后羿算法2.0版本,以进一步提高搜索结果的质量和准确性。 此次升级,主要从以下几个方面进行优化: 1. 强化用户体验方面,更精准的搜索结果,并加快搜索速度; 2. 利用大数据和深度学习技术提高搜索结果的准确性,以更好地满足用户的需求; 3. 针对一

Public @ 2023-06-17 02:50:31

360搜索“后羿”算法上线公告

尊敬的用户: 360搜索近期上线的“后羿”算法,是我们在人工智能领域的一次重要探索,旨在让搜索结果更加精准、优质、智能。我们在算法设计和优化中,注重统计学习和深度学习的结合,以及NLP(自然语言处理)、信息抽取和图像识别等技术的应用,从而实现对文本、音视频、图片等多种信息形态的全面理解和深入分析。 经过反复实验和数据验证,后羿算法的上线将会为用户提供以下几方面的优化: 1.更加精准的搜索结果

Public @ 2023-06-26 14:50:33

ICO算法—本次针对重复内容清理

处理量级:10亿以上处理网页特点:该算法主要是针对重复内容进行清理,对用户没有价值的内容页面,内容时效性强且过期的页面,采集站类,URL地址含有无效参数的页面等。例如:招聘类网站不同子站中内容相同的页面,小说采集站尤其处理对用户无价值的页面,旧新闻页且内容重复的页面也会处理一部分,以及其他的部分无效页面。

Public @ 2010-08-09 15:21:22

360搜索ICO算法简介

360搜索ICO算法是指“Intelligent Content Optimization”,即智能内容优化算法。它是360搜索引擎针对搜索结果的排序和评定所采用的机器学习算法,通过分析网页内容、外部链接和用户行为等多种因素,对页面内容进行打分和排序,从而提高搜索结果的质量和相关度。 ICO算法主要包含以下几个方面: 1.内容评估:对网页内容进行详细评估,包括原创性、更新频率、引用来源等因素,

Public @ 2023-04-23 10:50:10

更多您感兴趣的搜索

0.482559s