基于DNS的网页搜索引擎——由集中式向分布式转变

目前搜索引擎的不足:

1几乎所有的网页搜索引擎的数据平均更新周期都达到一个月。

2 没有一个搜索引擎能够覆盖超过50%的互联网全部网页。

3 搜索结果千人一面,缺少个性化。

问题的根源:

1 搜索引擎遇到的这些瓶颈性问题很大程度上是由其集中式结构造成的,一般的搜索引擎都有一个或多个大的数据中心,在此执行全部的网页下载和索引工作。如著名搜索引擎Google就有上万台服务器来并行完成此工作。但由于WWW系统的地域分布式特性以及网络基础条件等方面的限制,随着WWW系统的迅速扩张,这种集中式系统必然会遇到覆盖率和更新率方面的瓶颈问题。

2 搜索引擎个性化则需要人工智能技术的进一步发展,同时建立一个更加开发的搜索平台,促进搜索技术的改进。

我们的解决方案:

1 采用地域分布式结构。整个WWW系统的地域分布式特性和现有搜索引擎的集中式体系结构之间的矛盾是造成搜索引擎两个瓶颈性问题的主要原因,要解决这两个问题必须构建一种地域上分布式的搜索引擎。

2 将搜索构建于Internet之上,使搜索引擎变为一种公共的平台。

详细介绍