捜索引擎如何排名


12.1.3捜索引擎如何排名

究竞搜索引擎足如何排名的呢?研究各大搜索U擎不难发现,搜索引幣都会经 历儿个相同的工作阶段:搜集信息—建立索引—关键词处理—排名。

1.搜集信息

网络蜘蛛能够不断优化算法,在抓取网页时会采取两种方式:广度优先抓取策 略和深度优先抓取策略。

?广度优先抓取策略:首先扫描件抓取一个网页,并同时抓取该网页上的所 有页面,再选择其中的一个页卤,抓取该网页中的链掊网页,逐级深入。 ?深度优先抓取策略:扫描并抓取一个起始页面,然后从当前页面的链掊 逐级跟踪扣描,抓取链掊页面后洱继续跟踪扫描下一个链接豇面,直至 抓取完成。

在抓取过程中,M络蜘蛛一方面读取网页内容,分析超级链接,将超级链掊的 页面放入待抓取列表中,另一方卤分析网贞中除超级链掊地址外的文字。由干抓取

第12章搜索引轚优化

的站点很多,需要借胁多线程技术来提高速度。

2.建立索引

s?书时,借助目录和索引可以快速査找信息。搜索引笮的索4与图书n录功 相同,也能够提供检索功能。搜索引笮用-定的规则.算法建立索引,将信息汇总, 太-掉网页中的无用信息,提取精华部分,确保查询结果的准确性。

上一篇:捜索引擎如何抓到抄袭的数据 下一篇:没有了