信息检索语言主要的分类标准是:
1. 以内容特征为分类标准,信息检索语言分为主题语言和分类语言。
2. 以外部特征为分类标准,信息检索语言分为名称语言、著者语言和序号语言。
主题语言的含义:以自然语言中语词文字为基础,以反映特定事物为中心,以主题词字顺为基本结构的一种检索语言。
主题语言的特点:
1. 集中性。
2. 直观性。
3. 灵活性。
分类语言的含义:分类语言亦称体系分类语言,是以学科范畴和学科体系为基础来划分事物的一种检索语言。
分类语言的特点:分类语言最明显的特征是系统性,具有族性检索功能,有利于人们从科学专业的角度进行全面性的检索。
目前,世界上的信息检索语言有几千种,依其划分方法的不同,其类型也不一样。(一)按照标识的性质与原理划分,(二)按照表达文献的特征划分。
按照标识的性质与原理划分检索语言 分类语言是指以数字、字母或字母与数字结合作为基本字符,采用字符直接连接并以圆点(或其他符号)作为分隔符的书写法,以基本类目作为基本词汇,以类目的从属关系来表达复杂概念的一类检索语言。
以知识属性来描述和表达信息内容的信息处理方法称为分类法。著名的分类法有《国际十进分类法》、《美国国会图书馆图书分类法》、《国际专利分类表》、《中国图书馆图书分类法》等。 关键词是指出现在文献标题、文摘、正文中,对表征文献主题内容具有实质意义的语词,对揭示和描述文献主题内容是重要的、关键性的语词。关键词法主要用于计算机信息加工抽词编制索引,因而称这种索引为关键词索引。在检索中文医学文献中使用频率较高的《CMCC》数据库就是采用关键词索引方法建立的。
3、代码语言代码语言是指对事物的某方面特征,用某种代码系统来表示和排列事物概念,从而提供检索的检索语言。例如,根据化合物的分子式这种代码语言,可以构成分子式索引系统,允许用户从分子式出发,检索相应的化合物及其相关的文献信息。
按照表达文献的特征划分检索语言 表达文献外部特征的检索语言主要是指文献的篇名(题目)、作者姓名、出版者、报告号、专利号等。将不同的文献按照篇名、作者名称的字序进行排列,或者按照报告号、专利号的数序进行排列,所形成的以篇名、作者及号码的检索途径来满足用户需求的检索语言。
表达文献内容特征的检索语言主要是指所论述的主题、观点、见解和结论等。
信息检索语言是为查找信息服务的,因此,它必须具备以下的功能。
1.信息检索语言应可表示文献内容、数据或其他信息形式。为了满足不同信息用户的需要,信息检索语言应能根据不同的信息需求,表达不同的类型。例如,检索某种器材的性能时,信息检索语言应能表达某些数据指标;而在检索某种物质结构时,又能表达物质名称和物质结构方式。
2.有专用概念表示用户的信息提问。信息检索不单纯是字面上的组合,而是一种概念上的匹配。例如,计算机绘图,这里有两个名词,既可拆又可合。拆开后,依据“计算机”可查出“计算机解题”、“计算机控制”、“计算机维修”、“计算机绘图”等信息;但“绘图”却涉及到美术绘图、工程绘图、计算机绘图等
信息检索语言是为查找信息服务的,因此,它必须具备以下的功能。
1.信息检索语言应可表示文献内容、数据或其他信息形式。为了满足不同信息用户的需要,信息检索语言应能根据不同的信息需求,表达不同的类型。
例如,检索某种器材的性能时,信息检索语言应能表达某些数据指标;而在检索某种物质结构时,又能表达物质名称和物质结构方式。 2.有专用概念表示用户的信息提问。
信息检索不单纯是字面上的组合,而是一种概念上的匹配。例如,计算机绘图,这里有两个名词,既可拆又可合。
拆开后,依据“计算机”可查出“计算机解题”、“计算机控制”、“计算机维修”、“计算机绘图”等信息;但“绘图”却涉及到美术绘图、工程绘图、计算机绘图等。
检索语言的种类很多。按描述文献的内容性质划分,可分为分类语言和主题语言。
1、分类语言。用分类号和相应的分类款目来表达各种概念,以学科体系为基础将各种概念按学科性质和逻辑层次结构进行分类和系统排序,能反映事物的从属派生关系,便于按学科门类进行族性检索。按照分类方式的不同,分类语言又分为体系分类语言、组配分类语言和混合分类语言。
2、主题语言。主题语言就是对表达信息主题内容特征的主题词汇概念,经规范化处理所形成的检索语言。由于主题词汇表达概念准确,所以主题途径是检索信息的主要途径。主题语言按照主题性质的不同,它又可分为标题词语言、单元词语言、叙词语言、关键词语言和引文语言。
主题法检索语言是另一种从内容角度标引和检索信息资源的方法。它不象分类法以学科体系为中心,而是利用词语来表达信息资源中论述的主题概念。用来表达信息内容的词语称为主题词。主题词不同于自然语言,它是将自然语言中的词语经过人工规范后的语言,即经过词汇控制的词语。所谓主题法,就是以自然语言中的词语或规范化的词语作为揭示文献主题的标识,并以此标识编排组织和查找文献的排检方法。主题指文献所具体论述的对象和研究的问题,它以语词作为检索标识,按字顺排列,直观性强,也是一种普遍使用的信息组织方法。该方法提供了一种直接面向具体对象、事实或概念的信息组织方法和信息检索途径。主题的类型主要有:
1、标题法
标题法,也称标题词法,是主题法系统中最早出现的-种,它是以标题词(规范的事物名称、名词术语)作为文献主题内容的标识和检索标识。标题法的主要特征是事先编表,标题词以固定的组合方式组织在主题表中,形成标题,检索按既定组配执行。标题表通常由一个主表和若干个辅助表组成。《美国国会图书馆标题表》(LCSH)是当今最著名的标题表。标题法比较直观、容易掌握;查找速度快,但查全一门学科或具某一属性事物的文献却较为困难。
2、叙词法
叙词法,又称为主题词法。是将自然语言的语词概念,经过规范化和优选处理,通过组配来标识文献主题的方法。叙词具有概念性、描述性、组配性的特点。叙词法综合了多种信息检索语言的原理和方法,采用灵活的概念组配,并在词与词之间建立参照系统。叙词法适用于计算机和手工检索系统,是目前应用较广的一种主题检索语言。CA、EI等著名检索工具都采用了叙词法进行编排。我国目前使用最广的《中国分类主题词表》(前身是《汉语主题词表》)就是属于叙词法,有电子版和印刷版两种形式。《中国分类主题词表》是分类主题一体化的词表,与《中图法》相互对应,这对文献信息的组织和检索十分方便。
文献检索途径包括以下几种:
一、著者途径 许多检索系统备有著者索引、机构(机构著者或著者所在机构)索引,专利文献检索系统有专利权人索引,利用这些索引从著者、编者、译者、专利权人的姓名或机关团体名称字顺进行检索的途径统称为著者途径。
二、题名包括书名、刊名、篇名等途径。 一些检索系统中提供按题名字顺检索的途径,如书名目录和刊名目录。
三、分类途径 按学科分类体系来检索文献。这一途径是以知识体系为中心分类排检的,因此,比较能体现学科系统性,反映学科与事物的隶属、派生与平行的关系,便于我们从学科所属范围来查找文献资料,并且可以起到"触类旁通"的作用。从分类途经检索文献资料,主要是利用分类目录和分类索引。
四、主题途径 通过反映文献资料内容的主题词来检索文献。由于主题法能集中反映一个主题的各方面文献资料,因而便于读者对某一问题、某一事物和对象作全面系统的专题性研究。我们通过主题目录或索引,即可查到同一主题的各方面文献资料。
五、引文途径 文献所附参考文献或引用文献,是文献的外表特征之一。利用这种引文而编制的索引系统,称为引文索引系统,它提供从被引论文去检索引用论文的一种途径,称为引文途径。
六、序号途径 有些文献有特定的序号,如专利号、报告号、合同号、标准号、国际标准书号和刊号等。文献序号对于识别一定的文献,具有明确、简短、唯一性特点。依此编成的各种序号索引可以提供按序号自身顺序检索文献信息的途径。
七、代码途径 利用事物的某种代码编成的索引,如分子式索引、环系索引等,可以从特定代码顺序进行检索。
八、专门项目途径 从文献信息所包含的或有关的名词术语、地名、人名、机构名、商品名、生物属名、年代等的特定顺序进行检索,可以解决某些特别的问题。
(1)按照信息搜集方法分类
按照信息搜集方法的不同,搜索引擎系统可以分为三大类:
·目录式搜索引擎(Directory Search Engine)
自动方式搜集信息,由编辑员查看信息之后,人工形成信息摘要,并将信息置于事先确定的分类框架中。信息大多面向网站。这类搜索引擎代表是:Yahoo!、LookSmart、Ask Jeeves、Snap、Open Directory。
·机器人搜索引擎(Crawler-Based Search Engine):
由一个称为蜘蛛(Spider)的机器人程序以某种策略自动地在Internet中搜集和发现信息,由索引器为搜集到的信息建立索引,由检索器根据用户的查询输入检索索引库,并将查询结果返回给用户。服务方式是面向网页的全文检索服务。这类搜索引擎的代表是:AltaVista、Northern Light、Excite、Infoseek、Inktomi、FAST、Lycos、Google。
·元搜索引擎(Meta Search Engine):
这类搜索引擎没有自己的数据,而是将用户的查询请求同时向多个搜索引擎递交,将返回的结果进行重复排除、重新排序等处理后,作为自己的结果返回给用户。服务方式为面向网页的全文检索。这类搜索引擎的代表是WebCrawler、InfoMarket。
目前,商业的搜索引擎站点正在结合各种搜索引擎的优点,在类型上有逐渐融合的趋势。另外搜索引擎站点?“门户化”的倾向。
(2)按照检索软件分类
按照服务提供方式的不同,检索软件也可以分为三大类:全文数据库检索软件、非全文数据库检索软件、主题指南类检索软件。
全文数据库检索软件正常运作的前提是网站拥有大量的信息,因此必须依靠强大的数据库作为后盾。它能够提供完整的文献和信息检索,查全率很高。
非全文数据库检索软件具有速度快、使用简便、索引量大的特点。
主题指南类检索软件是目前网络检索中最常用的检索软件。这种软件查准率高,速度快,使用方便。现大部分网站都具备主题指南类检索功能。
(3)按照检索语言分类
成熟完备的信息检索语言应具有以下几项功能。
1)对文献的信息内容(及某些外表特征)加以标引的功能。要求利用检索语言能够正确标引文献信息内容及其外表特征。
2)集中文献的功能。对内容相同及相关的文献信息加以集中或揭示其相关性,提高信息检索效率。
3)信息组织的功能。对大量文献信息加以系统化或组织化,使文献信息的存储集中化、系统化,便于信息检索者按照一定的排列次序进行有序化检索。
4)一致性功能。便于将标引用语和检索用语进行相符性比较,保证不同检索人员表述相同文献内容的一致性,以及检索人员与标引人员对相同文献内容表述的一致性。
5)获得最高查全率和查准率的功能。保证检索者在按不同需要检索文献时,都能获得最高的查全率和查准率。
6)桥梁和纽带功能。在文献信息标引者和检索者之间发挥桥梁和纽带作用,使二者在理解和表达文献信息主题方面达到一致,以提高信息检索的准确性。
声明:本网站尊重并保护知识产权,根据《信息网络传播权保护条例》,如果我们转载的作品侵犯了您的权利,请在一个月内通知我们,我们会及时删除。
蜀ICP备2020033479号-4 Copyright © 2016 学习鸟. 页面生成时间:3.585秒