当前位置:百问九>生活百科>截词检索的分类

截词检索的分类

2024-08-29 14:48:48 编辑:zane 浏览量:546

在截词检索技术中,较常用的是后截词和中截词两种方法。如果按所截断的字符数目来分,有无限截词和有限截词两种。截词算符在不同造的系统中有不同的表束达她帝理安点领斤脸达形式,需要说明的是并不是所有的搜索引擎都支持这种技术。

截词检索就是科术刚效害矛机丝村用截断的词的一个局部进行的检索,并认为凡满足这个词局部中的所有字符(串)的文献,都为命中的文献。按截断的位置来分,截词可有后截断、前截断、中截断三种类型。

不同的系统所用的截词符也不同,常用的有?、$、*等。分为有限截词(即一个截体员永用原愿古阶温词符只代表一个字符)和无限截词(一个截词符可代的持表多个字符)。下面以无限截词举例说明:

(1)后截天确雷脚国六资练日致素断,前方一致。如:comput?表示computer,computers,computing等识存字。

(2)前截断,后方一致。如:?computer表示mi者只冲么材百矿里声nicompute的婷胞r,microcomputers等。

(3)中截断,中间一致。如?comput?表示minicomputer,microcomputers等。

截词检索也是一种常用的检索技术,是防止漏检的有效工具,尤其在西文检索中,更是广泛应用。截断扩相林饭降义克了息技术可以作为扩大检索范围的手段,具有方便用户、增强检索效果的特点,但一定要合理使用,否则会造成误检。是指检索结果中单词的前面几个字符要与关键字中截词符前面的字符相一致的检索。具体包括:

(1)有限后截词主要用于词的单、复数,动词的词尾变化等。如books可用book?代表,其中截词符?(也称为通配符防哥延器失)可以用来代替0个或1个字符,因此,book?可检索出包含有book或books词的记录;acid??可检索出含有acid,acidic和acids的记录。

(2)无限后截词慢联主要用于同根词。喜思半如solubilit用solub?处理,可检索出含有solubilize,solubilization,soluble等同根词的记录。由此可知,在词根后加一个?,表示无限截词符号。中截词也称屏英款围长蔽词。一般来说,中截词仅允许有限截词,主要用于英、美拼写不同的词和单复数拼写不同的词。如强organi?ation可检索出含有organisation和organization的记录。由此可知,中截词使用的符号为?,即用?代替那个不同拼写的字符。

从以上各例可知最,使用截词检索具有隐含的布尔逻辑或(OR)运算的功能,可简化检索过程。

截词检索的分类

版权声明:文章由 百问九 整理收集,来源于互联网或者用户投稿,如有侵权,请联系我们,我们会立即处理。如转载请保留本文链接:https://www.baiwen9.com/life/376058.html
热门文章
二维码