最早的FTP搜索引擎是基于文本显示的Archie。Archie实际上是一个大型的数据库,再加上与这个大掘氏型数据库相关联的一套检索方法。该数据库中包括大量可通过FTP下载的文件资源的有关信息,包括这些资源的文件名、文件长度、存放该文件的计算机名及目录名等。可以通过远程登录到Archie主机来使用Archie服务器,用Archie作为登录名。一旦登录成功,一个Archie程序将自动执行,这时一次输入一条命令,告诉Archie想查寻的内容,Archie将检索自己的数据库并显示检索的结果。如果用户对自己想要的东西并不太清楚,Archie还提供"whatis"服务项目,该服务提供成千上万个程序、数据文件和文档判乎散的简短说明。 WWW的出现改变了Archie在文件搜索方面的统治地位,在美观、方便的WWW页面上搜索ftp文件成为用户的自然需求,即人们需要有一种基于Web的FTP搜索引擎。在功能上,基于Web的ftp搜索引擎与Archie基本一样,都是对用户提交的查询匹配串找到可以下载的ftp站点链接。但基于Web的ftp搜索引擎也有很多特色的功能,比如天网ftp搜索引擎的文件分类功能就大大便利了用户查找文件的过程,提高了查准率。基于Web的ftp搜索引擎也采用了很多WWW搜索引擎的策略,比如使用Spider自动收集数据,采用倒排索引,智能换页链接技术以顷歼及大型ftp搜索引擎必须采用的分布收集和服务技术。 天网FTP搜索引擎是北京大学计算机系网络与分布式系统实验室开发的一个产品,目前已经在bingle.pku.edu.cn上提供服务,搜集文件数据量超过一千万,每日用户访问超过40万次,是目前国内规模最大的FTP搜索引擎,也是国际FTP搜索引擎中的佼佼者(试在Google查询"ftp搜索引擎"!)。以下我们将天网FTP搜索引擎与多个著名的国内外FTP搜索引擎进行分析比较,从而得到全球FTP搜索引擎的现状并探讨其发展趋势。