8 年
手机商铺
公司新闻/正文
810 人阅读发布时间:2025-04-07 20:02
关键词是科技论文的有机组成部分,准确规范的关键词标引能将论文中起关键作用的,最能说明问题的,代表论文内容特征的信息在摘要的配合下准确、迅速、科学地反映出来。关键词的规范标引可以方便使用者高效率地查找需要的信息,也便于信息的管理。可以说,标引是检索的前提,因为没有正确的标引,也就不可能有正确的检索,因此,标引科技论文的关键词,首先应遵循以下规则。
一是对论文进行主题分析,提炼主题概念。从论文的题名、摘要、标题、结束语中查找那些能反映文章主题,具有实质意义的词语,必要时应通读全文,要了解和判别文献所论述与研究的对象或问题。在进行论文主题分析时,要注意以下几点:
1.全面性。把符合检索要求的所有主题都提炼出来。注意不要遗漏隐含的主题概念。
2.专指性。每一个关键词只表达一个概念,不允许存在一词多义或词义不清。提炼出来的主题概念的外延和内涵应与论文中所论述的主题概念的外延和内涵一致。
3.实用性。充分考虑检索系统目标和用户的需求,选定论文中有检索意义的关键词。
正确理解和判断论文中的主要内容和要点,抓住创新观点和最有价值的方法和结果,经分析、判断形成主题“概念”,然后将主题概念转换成关键词这一检索标志,向传播者输出包含充分能量的信息,使文献利用者能从关键词就能准确判断出文章的价值。
二是将主题概念转换为正式的标引词。主题概念转换的实质就是将论文中提炼出来的主题要素(自由语言)转换为主题词表中的正式主题词,即将选出来的自由词做规范化处理,变成符合检索要求的关键词。关键词标引的优先顺序为:
1.直接标引。将所选的主题概念逐一在相关主题词表中查找,与论文主题概念直接相对应的专指主题词作为直接标引词。
2.组配标引。如果汉语主题词表没有与之对应的主题概念时,应选两个或两个以上的叙词进行组配标引。组配标引主要有两种类型:一是交叉组配,指两个或两个以上具有概念交叉关系的叙词所进行的组配,其结果表达一个专指概念;二是方面组配,指一个表示事物的叙词和另一个表示事物某个属性或某个方面的叙词所进行的组配,其结果表达一个专指概念。
在组配标引时,应优先考虑交叉组配,然后考虑方面组配。参与组配的叙词必须是与论文主题概念关系最密切、最邻近的叙词,以避免越级组配。如果无法用组配方法表达主题概念时,可选用最直接的上位词或相关词标引。
3.自由词标引。一些表达新学科、新论点、新材料、新技术等出现的概念以及词表中未收录的产品、地区、人物等的名词可采用自由词标引。要求概念明确、词形简练、实用性强。
其次,进行必要的加工:
1.尽量使用规范的主题词(叙词)标引关键词。科技论文应按照叙词的标引方法标引关键词,并尽可能将自由词规范化为叙词。由于关键词包括规范的主题词(叙词)与未规范的自由词,主题词是从自然语言中精选出来,经过规范化处理以后,能与概念一一对应的受控词汇,它的最大好处是能够排除自然语言中一词多义、多词一义以及词义含糊的现象。叙词标引是按叙词语言的规范要求,严格遵循概念组配的原则进行,具有较高的检索效率。
作为规范的专指度最高的关键词,利用叙词标引关键词是未来检索的方向。但是,利用叙词标引关键词的同时应注意由于目前的叙词量难以对文献进行适度标引,只有在主题词不能完全覆盖相关专业的主题概念,或没有与新学科新专业相对应的主题概念时,使用自由词标引作为主题词标引的补充。
对于以下四种情况可采用自由词标引:一是主题词表中明显漏选的主题概念词;二是表达新学科、新理论、新技术、新材料等新出现的概念;三是词表中未收录的地区、人物、文献、产品等名称及重要数据名称;四是某些概念采用组配,其结果出现多义时,被标引概念也可用自由词标引。但是选用的自由词必须达到概念明确、实用性强,尽量避免自由词成为无效的检索语言进入检索过程。
2.关键词的抽取及确定。关键词选取时,首先要认真审核论文,熟悉论文的主题内容。从题名、摘要、正文等处将表示学科范畴、科学研究对象、研究方法、技术方法、生产工艺、加工技术、设施设备、环境条件等能充分揭示论文的主题内容的名词术语抽取出来,确保关键词标引的系统性和完整性。
抽取的关键词是描述文献主题内容的自然语言,还不能完全形成检索表识,要将关键词转换为专业词表中正式的主题词和规范的自由词,为了符合信息检索的要求,关键词转换时应注意从主题概念的涵义上进行转换。而对于无法转换的关键词,将自由词规范为本学科领域通用的和具有检索意义的关键词。
3.关键词标引的数量和排序。标引深度是指对一篇文献所给予的全部检索标志的数量之和,它标志着关键词所达到的对文献主题揭示的程度。关键词标引一般以3~8个为宜,过少,容易造成漏标或少标,所选择的主题词不能完全代表论文中心内容;过多,容易造成过度标引和重复标引,这两种情况都将影响关键词标引质量和科技文献利用率。适当的标引深度应该是在文献的查全率和查准率之间达到某种平衡。另外,科技论文关键词的排列顺序必须有利于清楚明晰、层层深入地反映文献主题。应该按照重要性递减的顺序排列所确定的关键词。
此外,还要避免以下几种情况:
1.避免使用禁用词。所谓禁用词,就是不适于做标目的非关键词。如冠词、代词、连词、感叹词、副词、形容词和某些动词不宜使用,化学结构式、反映式和数学式原则上不用,某些不能表示所属学科专用概念的不足以反映实质内容的词,如方法、问题、理论、报告、试验、研究、分析等不应作为关键词。
2.避免使用英文缩略语、符号作为关键词。关键词要求词义明确,一词一意,以利于检索内容的确定。英文缩略语或符号一般不能满足这一要求,一个缩略语或符号常有多种含义。虽然在特定的场合使用这些缩略语和符号的含义是明确的,不致产生误解,但计算机并不能识别它们究竟是哪种含义,使用缩略语或符号检索,必然造成大量的误检,因此,中英文关键词均不宜使用英文缩略语,即使这些缩略语已被广泛使用。
3.避免使用复杂的短语。有些人为了在标引时,加了许多限定成分的短语作为关键词。如“新型甘蓝型油菜品种”、“荒漠黑土滩改造”等,这些短语虽然概念明确,也能反映文章的主题内容,但对文献检索并没什么价值,因为计算机检索系统中,关键词途径的检索一般是以选择的主题词的“与”、“或”、“非”的逻辑来限定要查找的文章内容,而不是使用加了限定词的复杂的短语等限定主题内容。
关键词标引总的原则是为了便于文献检索,所列出的关键词与其他词汇不混淆、无歧义,是该论文的一个检索入口,避免自由词成为无效的检索语言进入检索过程。在信息社会的今天,越来越多的科技人员利用计算机通过关键词检索相关信息和文献,这一切都要求编辑人员和作者高度重视关键词的标引,确保关键词标引的准确性和正确性,以提高检索效率和文献的引用率,为读者查阅相关文献提供全面、准确的检索语言,发挥科技期刊的重要传媒作用。
