![]() |
|
![]() |
DRIS简介 整合校园网资源仅是数字图书馆研究的第一步,下一步我们自然会想到如何去整合各个大学的资源、整个国内的互联网上资源、直到整合互联网上的所有信息资源。而数字图书馆的一个权威定义就是“数字图书馆是下一代互联网上信息资源的管理模式,它是一种互联网的组织模式而非图书馆的专用名词,它将从根本上改变目前互联网资源分散无序、使用不便的状况”。为了实现这一目的,我们提出了一种全新的信息检索系统,域内资源整合系统(Domain resources Integrated system,DRIS). 目前互联网上有几十亿个网页,成千上万种各类特色数据库,还有FTP,BBS等其它各类资源。事实上仅仅是网页资源搜索一项,以Google为代表的网络搜索引擎已经显得力不从心。网页资源是以几何级数增长的,任何一个搜索引擎的数据库都不可能和整个互联网的增长保持同步。事实上,目前所有的网页搜索引擎的覆盖率都小于60%,而且其更新速度一般都在一个月左右。仅仅是此一类资源就尚且如此,我们很难想象某个搜索搜索引擎能够管理检索互联网上的所有类型的资源。 每个搜索引擎都在力图为用户提供全面而准确的信息,但是它们却不能建立一个可以镜像整个互联网的数据库系统。这是当前互联网搜索引擎的一个内在的基本矛盾。“作为整个互联网信息的管理者”这一目标很难由现有的搜索引擎实现。我们需要一种全新的信息检索系统,而数字图书馆研究则从一个新的角度为问题的解决提供了思路。DRIS正是其中一种可行的方案。 DRIS的要点如下: DRIS思路来源:DRIS研究主要来源于对数字图书馆两个基本问题,即馆内资源整合研究和数字图书馆联盟建设的研究,同时结合和搜索引擎和网格技术的相关研究。 DRIS的基本原则: 采用了DNS的地域分布式构架建立一种新的信息资源整合与检索平台。其在合适的范围内,采用不同的信息检索体系统,建立一种一种适合整个互联网信息管理的基本构架。DRIS可简单描述为(组织级—常规数据库检索系统)—(主干网级—元数据采集系统)—(国家级—分布式检索系统) ,而其服务管理则采用了XML/Web services/UDDI的形式。 DRIS的基本理念:信息检索应成为互联网的内在功能,每个人都应该有自己的搜索引擎,DRIS将建立互联网信息检索的基础建筑,而不是最终的搜索引擎。
|