二、截词检索
  截词是指把检索词在某个位置上截断。截词检索是用截断的词的一个局部进行检索,并认为凡是包含这个词局部的文献即为命中文献。
  截词检索常用于对词干相同的派生词的检索,在英文检索系统中使用最多。
  截词检索有多种方式。按截断的字符数量分,包括:有限截断和无限截断。有限截断是指要说明截去字符的数量;无限截断是指不说明截去字符的数量。按截断的位置分,包括:后截断、前截断和中截断。
  截词检索使用的截词符通常有两个:“?”和“*”。“?”代表0到一个字符,可以重叠使用;“*”代表0到任意多个字符。使用“?”实现的是有限检索,使用“*”实现的是无限检索。
  1.后截断
  后截断是把截词符放在字符串右边,以表示在右边截去了有限或无限个字符。后截断是最常用的截词检索技术。
  例如,输入“computer*”,能检出含有computer、computers、computering、computerigation、computered、computer-aided等词的文献;输入“computer??”,能检出含有computer、computers、computered的文献。
  后截断主要应用于以下几种情况:
  词的单复数,如“bag?”、“box??”。
  年代,如“199?”、“19??”。
  作者,如“Lancaster*”可检出所有姓Lancaster的作者。
  同根词,如“politic*”可检出所有含politic的同根词。
  另外应注意:使用后截断可能检出很多无关词汇,因此在使用后截断,尤其是在后截断中使用无限截断时,所选词干不能太短,否则将造成大量误检。
  2.前截断
  前截断是把截词符放在字符串左边,以表示在左边截去了有限或无限个字符。前截断在检索复合词的情况下应用较多。
  例如,输入“*magnetic”,可以检出含有magnetic、electro-magnetic、paramagnetic、thermo-magnetic、thermomagnetic等词的文献。
  3.中截断
  中截断是把截词符放在检索词的中间,以表示在中间截去了某些字符。一般来说,中截断只允许有限截断。
  中截断主要用于解决英文词汇中一些拼写形式不同、复数形式不同的词的输入。在可能变化的字母处使用截词符,可以提高查全率。
  例如,输入“organi?ation”,可以检出含有organization、organisation的文献。