学术论文百科

医学信息检索论文2000字怎么写

发布时间:2024-07-06 11:16:12

医学信息检索论文2000字怎么写

信息检索技术论文 – 基于网格的面向专业内容的Web信息检索 1 引言 近年来,互联网得到了迅速的发展,网上信息资源愈来愈庞大,且信息具有量大、分散、异构等特性,因此,传统的Web信息检索工具开始暴露出它性能低下的一面,具体体现在现有的信息检索工具对用户的要求常常是找出了几千甚至上万条记录,根本无法从中再细找,或者找到的内容和要找的内容不是一个专业领域的,造成信息无效的现象。但随着人们信息意识的增强,对信息内容及信息服务的需求也在不断的演变和发展,对获取信息的专业化、实效性等方面有了新的要求。如何针对专业领域中特定的用户群为他们提供专业的、度身量造的信息服务,使用户在尽可能短的时间内有效的找到最需要的信息内容是大家普遍关注的一个问题。本文利用网格计算、集群系统、XML等技术设计了一个基于网格的面向专业内容的Web信息检索体系结构,它能将地理位置分散的、异构的信息按地区按专业内容从逻辑上进行合理的组织和管理,为用户快速、有效地获取自己所需要的信息提供了一种方法。 2 基于网格的面向专业内容的Web信息检索体系结构的设计 网格计算是近年来国际上兴起的一种重要信息技术,其目的是将网上各种资源组织在一个统一的大框架下,为解决大型复杂计算、数据服务和各种网络信息服务提供一个方便用户使用的虚拟平台,实现互联网上所有资源的全面连通,实现信息资源的全面共享。 为解决不同领域复杂科学计算与海量信息服务问题,人们以网络互连为基础构造了不同的网格,他们在体系结构,要解决的问题类型等方面各不相同,但网格计算至少需要具有三种基本功能:资源管理、任务管理、任务调度。本文设计的信息检索体系结构,围绕网格计算的基本功能及信息检索的特点,主要有以下三个层次组成:见图1 (1) 网格结点:结点是网格计算资源的提供者,本系统主要是由一系列的集群系统组成,它们在地理位置上是分布的,构成了一个分布检索群体,作为信息共享的基础结构平台。集群系统负责整个集群范围内的信息管理,维护和查询。 (2) 网格计算中间件:中间件是信息资源管理和用户任务调度、任务管理的工具。它是整个网格信息资源管理的核心部分,它根据用户的信息请求任务,在整个网格内负责信息资源的匹配、定位,实现用户任务到集群系统的映射。 (3) 网格用户层:主要为用户应用提供接口,支持用户对所需要的信息资源进行描述、创建、提交等。 图1 本系统的主要思想是在逻辑上将地理位置分散的、异构的信息划分、组建成多个集群系统,集群系统对集群内的资源进行管理和任务调度,再利用网格中间件对各集群系统进行管理,从而形成对整个网格资源的管理,并对用户的信息需求进行统一的管理和调度。这种管理模型既可以尊重各个集群系统的本地信息管理策略,又可利用中间件在全局意义上对网格信息资源进行管理。 1 集群系统的设计 由于Web信息资源数量十分庞大,用户在利用现有搜索引擎检索信息时面临一个海量数据的查询问题,往往造成在消耗巨大的通信资源后依然存在资源查不准、查不全的问题。目前基于单一系统映射的Web服务器集群系统能把若干服务器用局域网连接成一个整体,并使其从客户端看来就如同一台服务器在服务,这使得在逻辑上合并、组织地理位置分布的信息资源成为可能。因此本文首先考虑采用分布协作策略,将Web信息资源按地区按专业内容分割,一方面使信息资源数量相对缩小,便于数据的组织、管理和维护,另一方面按专业内容易于制定一个公用的XML规范,便于集群内各类信息资源的描述,从而可建立一个基于XML的面向专业内容的信息集成系统。集群系统的具体结构见图2。 集群服务器主要由接口Agent,基于专业内容的XML信息集成系统、资源服务Agent、资源发布Agent等组成。其中接口Agent根据任务提供的接口参数登记、接收、管理各种信息资源请求任务,并提供安全认证和授权。资源服务Agent根据信息资源请求任务,利用XML信息集成系统提供的数据,为用户提供实际的资源检索操作,并将检索结果信息发送给用户。资源发布Agent用于向网格中间件提供本地信息资源的逻辑数据及接口参数。 下面主要说明基于专业内容的XML信息集成系统的构造方法: XML(the eXtensible Markup Language)是 W3C于1998年宣布作为Internet上数据表示和数据交换的新标准,它是一种可以对信息进行自我描述的语言,它允许开发人员通过创建格式文件DTD(Document Type Definitions)定制标记来描述自己的数据,DTD规范是一个用来定义XML文件的语法、句法和数据结构的标准。 XML使用普通文本,因此具有跨平台的优点,XML的优点在于(1)简单、规范性:XML文档基于文本标签,有一套严谨而简洁的语法结构,便于计算机、用户理解;(2)可扩展性:用户可以自定义具有特定意义的标签,自定义的标签可以在任何组织、客户、应用之间共享;(3)自描述性:自描述性使其非常适用不同应用间的数据交换,而且这种交换是不以预先定义一组数据结构为前提,因此具有很强的开放性;(4)互操作性:XML可以把所有信息都存于文档中传输,而远程的应用程序又可以从中提取需要的信息。XML数据是不依赖于某个特定的平台的应用,因此它为基于特定专业内容的表达提供了一种极好的手段,可以作为表示专业内容的语言。 目前人们研制Web信息集成系统其基本方法可分成两类:存入仓库法(the ware-housing approach)和虚拟法(the virtual approach),可使用这两类方法利用XML在数据组织和交换方面的优越性,采用格式文件DTD和XML文档表示基于专业内容的集成模式和集成模式与资源之间的映射,建立基于XML的Web信息集成系统,其结构与获取信息的工作过程参见文献[2]。 图2 2 网格中间件的设计 图3所示的网格中间件的主要功能是(1)消除不同用户与集群系统之间数据表达的差异,使信息资源数据对用户来说是透明的;(2)管理、维护Web上分布的各集群系统,网格中间件以关系数据库方式记录所有集群系统及其所包含的专业内容的逻辑信息,对关系数据库的操作可维护集群系统的分布式逻辑,使本结构在可变性和扩充性上具有柔性;(3)接受用户的信息请求任务,能快速定位于满足要求的集群系统,通过对关系数据库的查询实现用户信息请求任务与集群系统的对应关系。 内部主要功能模块说明如下: (1) 接收Agent模块:主要用于登记、接收、管理各种信息资源请求任务,并提供安全认证和授权。 (2) 关系数据库及数据服务Agent:关系数据库记录了所有集群系统及其所包含的专业内容的逻辑信息。数据服务Agent提供集群系统对关系数据库的使用权限和对数据记录的增加、删除、检索和修改等操作。 (3) 格式转换Agent模块:提供用户信息资源请求文档与各集群系统中文档的格式转换功能。由于XML是自定义的,各用户对同一数据有不同的表示方法(对信息资源描述存在差异)由于XML文档中这种格式差异体现在与之相关的DTD/Schema上,因此经过格式转换,可使信息资源的格式对用户是透明的。 (4) XML文档分析Agent模块:提取格式转换后的XML文档中各个标签,通过查询网格中间件中的关系数据库,实现用户信息请求任务与集群系统的对应关系,并得到满足条件的集群系统的相关信息,获取各集群系统的接口参数。 (5) 发送Agent模块:将转换过的信息资源请求XML文档发送到相应的集群系统中。 其中Agent技术是解决分布式智能应用问题的关键技术,Agent是指能够自主地、连续地在一动态变化的、存在于其它系统中运行的、且不断于环境交互的实体。在系统中引入Agent可使系统具有人的特征,代表用户完成用户的任务,并能动态适应环境的变化更好地满足用户的需求,提高信息检索的能力。

2011-07-24 回答医学论文一般有几种类型:综述、个案报道、病例分析、临床研究、科研课题论著、学位论文等等。医学论文的撰写要看你的经历和年资,这决定了您对问题理解、了解的深度和广度,也就是能力,简要建议如下:1、在校学生,一般只能写综述等理论探讨型的论文;2、低年资者,综述、病例个案报道、回顾性病例分析等。3、高年资者哪一种类型的论文都可以。至于怎么写医学论文,以下步骤供参考:结合自己平时的工作和学习,借助数据库查找相关的参考资料,大量参阅相关文献,筛选自己喜欢的、熟悉的内容,找出具有科学性、实用性的论点,着手撰写。以下内容供参考:医学论文的基本格式及写作方法(一)标题(title)标题要求:阐述具体、用语简洁:一般不超过20个字。文题相称、确切鲜明:标题体现内容,内容说明标题。重点突出、主题明确:突出论文主题,高度概括,一目了然。不足以概括论文内容时,可加副标题(破折号、括号或加序码)。(二)作者署名(author)作者署名的意义(1)明确论文责任:文责自负(2)获得应有的荣誉:载入科技发展的史册(3)文献检索的需要:著者检索(4)明确著作权:人身权和财产权作者署名的原则署名的个人作者,只限于选定研究课题和制定研究方案,直接参加全部或主要部分研究工作并做出贡献,以及参加撰写论文并对内容负责的人。(GB7713-87《科学技术报告、学位论文和学术论文的编写格式》)作者署名的要求(1)分为集体署名和个人署名。(2)第一作者应是论文课题的创意者、设计者、执行者,是论文的执笔者。(3)多人合写时,主在前,次在后;多单位合写时,用脚注标明。(4)作者人数不易过多,一般不超过6人。(5)指导、协作、审阅者可列入致谢中。(三)摘要(abstract)摘要内容和格式一般格式:(1)目的(objective):说明论文要解决的问题及其起源、由来。(2)方法(methods):说明研究时间、参加完成研究的患者或受试者的人数和研究的主要方法。(3)结果(results):说明研究内容中主要结果,包括数据和统计学检验结果。(4)结论(conclusions):说明主要结论,包括直接的临床应用。其它格式(1)目的(objective, purpose, aim, background):论文要解决的问题及其起源、由来、研究背景。(2)设计(design):论文基本研究设计。(3)地点(setting):研究地点、单位、等级。(4)对象(subjects, patients):论文研究的时间、参加完成研究的患者或受试者的人数和研究的主要方法。(5)处理(intervention):论文的临床治疗和其它处理方法。(6)检测(measures):论文为评定结果而进行的主要测试项目。(7)结果(results):说明研究内容中主要结果和数据。(8)结论(conclusions):说明主要结论,包括直接的临床应用。摘要的写作要求(1)连续写出,不分段落,不加小标题,不举例证。(2)格式规范化。(3)简短、完整,一般占全文文字的10%左右。(4)文字性资料,不用图、表、化学结构式。(5)内容基本一致的英文摘要。(四)关键词(key words)关键词是表达科技文献的要素特征,是具有实际意义的词或词组。主题词是规范化的关键词,关键词是具有灵活性和广泛性的自由语言。现阶段关键词和主题词都作为检索语言使用。由于关键词是自然语言,同义词、近义词、多意词未统一,造成检索误差,故目前多采用从医学主题词表(MeSH)中选择。关键词格式3-8个词或词组,之间空一格书写,不加标点符号。外文字符之间可加逗号,除专有名词的字首外,余均小写。选择关键词的方法(1)可从标题、摘要和全文内容中选择,以从标题中选择最常用。(2)要严格筛选,充分、准确、全面地反映文章的中心内容。(3)查阅医学主题词表确认。(五)引言(introduction)引言的基本内容(1)简要叙述研究此项工作的起因和目的(2)研究此项工作的历史背景(3)国内外对研究此项工作的研究现状和研究动态(4)强调此项工作的重要性、必要性和研究意义(5)适当说明研究此项工作的时间、材料和方法引言的写作要求(1)简明扼要,重点突出:一般为200-500字,约占全文的1/8-1/10。(2)实事求是、客观评价:不能蓄意贬低前人,切忌妄下断言。(3)少用套话:水平如何,自有共论。(4)勿与摘要相同,避免与正文重复:不涉及结果或结论。(5)一般不写“引言”字样标题。(六)材料与方法(materials and methods)材料与方法的主要内容(1)实验对象:①动物:名称、品种、数量、来源、年龄、性别、分组标准与方法。②微生物或细胞:种、型、株、系、培养条件和实验室条件。③临床病例:来源、数量、性别、年龄、病因、病程、病理诊断、分型标准、选择标准。(2)实验仪器:仪器设备名称、生产厂家、型号、操作方法、改进之点。(3)实验材料:药品和试剂的名称、成份、规格、纯度、来源、出厂时间、批号、浓度、剂量、给药方法、途径、用药总量。(4)实验方法与条件:①临床病例:观察方法、指标、治疗方法、药物名称、剂量、使用方法、疗程。②手术与标本:手术名称、术式、麻醉方法、标本制备过程。③实验室:实验与记录手段、观察步骤、指标、注意事项、方法改进及依据。(5)统计学方法:(七)结果(results)结果是论文价值所在,是研究成果的结晶。全文的结论由此得出,讨论由此引发,判断推理和建议由此导出。结果的内容(1)数据:不用原始数据,要经统计学处理。(2)图表:用于显示规律性和对比性。(3)照片:能形象客观地表达研究结果。(4)文字:对数据、图表、照片加以说明。结果的写作要求(1)按实验所得到的事实材料进行安排,可分段、分节,可加小标题。(2)解释客观结果,不要外加作者的评价、分析和推理。(3)结果要真实性,不可将不符合主观设想的数据或其它结果随意删除。(4)因图表和照片所占篇幅较大,能用文字说明的问题,尽可能少用或不用图表或照片。(八)讨论(discussion)讨论是论文的重要主体部分,是作者对所进行的研究中所得到的资料进行归纳、概括和探讨,提出自己的见解,评价其意义。讨论的内容(1)对实验观察过程中各种数据或现象的理论分析和解释。(2)评估自己结果的正确性和可靠性,与他人结果比较异同,并解释其原因。(3)实验结果的理论意义及对实践的指导作用和应用价值。(4)作用机制或变化规律的探讨。(5)同类课题国内外研究动态及与本文的关系。《如何写作和发表医学论文》写作和发表归纳为二十步,可供大家参考。信息来源:创 新 医 学 网(1)所写论文能否用一简单句子说明信息,其实亦即初步的主题。(2)是否值得写?以前有无类似的报道,这样一方面可避免重复,另一方面又可从以往作者的报道中有所借鉴,如表格的设计等。(3)论文的重要性。作者在论文中能否提出某些新论点或实践经验,供争论或参考。(4)根据所投杂志,写作时宜限定读者对象。(5)仔细浏览拟投稿杂志内容,了解该杂志性质,是否国外发行。(6)检索文献,通常从近5年开始,如资料不足,可再往前找5年,直到满意为止。(7)考虑参与本论文写作的作者名单。(8)分头收集、整理原始资料。9)仔细阅读稿约,这是动手写作前的重要步骤,务必符合其规则,所谓投其所好。(10)论文基本结构,是属论著、病历报告抑或综述。(11)列出原始草稿提纲。(12)写出草稿原文。(13)推敲、修改稿件至满意为止。(14)用准确、简练和流畅的文体书写。(15)应符合科学性要求。(16)选用适当的图表。(17)重修底稿以达到刊出要求。(18)复印留底,论文附介绍信寄编辑部。(19)答复编辑部来函的有关问题,修正后迅速寄出。(20)对将刊出的稿样细心、认真、逐字校对后(所谓校红)寄回编辑部,静候佳音。

你是哪个学校的 = = 我要写3000字的 快写完了

医学信息检索论文2000字

先介绍医学信息检索的用途。把下面的修改下写上。常用中文医学文献光盘数据库 第一节 中国生物医学文献数据库(CBMdisc) 第二节 中文生物医学期刊数据库(CMCC) 第三节 中国学术期刊数据库(光盘板)(CAJ-CD) 中国生物医学文献数据库(CBMdisc)收录了自1978年以来1600余种中国生物医学期刊约300万篇文献,著录内容既包括简单的题录信息也包括引文在内的摘要数据。检索功能与时俱进,原文索取、定题服务、期刊定制、限定检索、副主题词扩展功能的增加;主题、分类、期刊、浏览查询功能的提出和新的主题分类词表的应用,充分体现了该系统以用户需求为发展,诚信用户服务方向的理念。中国生物医学文献数据库及其检索以其年代跨度大、数据标引规范、加工手段先进、检索界面友好,功能与流行数据库检索系统相兼容,而深受医学信息领域用户的肯定的和欢迎。 十年中,伴随着中国医学信息网络的建立和数字图书馆建设时代的来临,中国生物医学文献数据库及其检索系统坚持技术引路,积极开展前沿学科的研究,加强基础设施的建设,培养造新了医学信息专业人才,也为CBMdisc注入新的发展活力,提高了数据加工的效率,增强了技术水平和含量,率先实现了二次文献数据库与异构数据库系统基于中文期刊文献数字唯一标识符和XML规范的全文链接。 文献计算机协助标引、联机标引以及文献相关性研究为开发新型数据库系统,实现从文献管理到知识管理的跃升奠定了坚定的基础。 中文生物医学期刊文献数据库(简称CMCC)是由解放军医学图书馆数据库研究部开发的中文生物医学文献目录型数据库,面向医院、医学院校、医学研究所、医药工业、医药信息机构、图书馆和医学出版社提供长期稳定的最新医学文献信息检索服务。内容涵盖医药卫生各个领域,收刊全、更新快是该数据库的主要特点。CMCC自1994年创建以来在中国内地和港澳拥有广泛的用户,是国家卫生部门认可的重要检索工具之一,同时也是信息资源共享、检索查新的必备工具。经过不断系统更新和数据扩容,目前已成为获取中国内地生物医学文献信息的重要信息来源,并得到广大用户的认可和支持,享誉甚佳。CMCC数据库依托解放军医学图书馆丰富的馆藏资源,并可提供优质原文获取服务。 中国医学学术会议论文数据库 DATABASE ON CHINA MEDICAL ACADEMIC CONFERENCE PAPERS(CMAC) 多年来,解放军医学图书馆在中华医学会和各地分会的支持下,搜集了大量的医学学术会议论文集并建立了较好的收集渠道。为了不断满足用户的需求,增加医学信息量,建立了《中国医学学术会议论文数据库》,该数据库为目录型数据库,收录了中华医学会所属各专业分会及各省分会等组织1994年以来的全国医学学术会议论文集中的医学文献约15万余篇。该数据库与CMCC共享同一检索软件,分为单机版和网络版,数据库半年更新一次。 ●数据库规模:CMCC收录了自1994年以来1200余种中文生物医学期刊, 约180万条文献记录,并以每年26余万条速度 递增,含盖中国内地全部重要刊和核心刊。 ●收录范围:基础医学,临床医学,预防医学,医学生物学,中医药学,药学,医院管理,医学信息学等卫生相关 信息。 ●更新周期:每半月更新一期光盘, 一年24期, 几乎与到馆期刊同步。 ●字段项目:中文题名,英文题名,全部作者,第一作者地址,关键词,文摘,文献类型,出处,参考文献数,资 助项目。 ●检索功能: →支持硬盘数据库镜像,数据库选择和多库联检功能 →浏览器模式全文检索界面 →支持Win98,Win2000和Windows-NT平台 →字段(文献著录项)限定检索 →字段浏览检索:对某一字段内容进行检索,其方式可以是:等于、前缀、后缀、包含、不包含等;可选取多个字 段内容检索 →通配符(*,?) 截词检索 →高级逻辑组配检索(AND,OR,NOT) →核心刊,文献类型,出版年代,摘要标记限定检索 →检索史的保存、修改、删除,检索策略的反复调用和重新组配 →中文生物医学期刊概况浏览查询 ●输出功能: →多种输出方式:联机打印,磁盘下载,在线摘录 →加输出标记,便于批量存盘或打印 →对输出文献按不同字段进行排序 →输出字段可任意选择 →多种输出格式,任意选择 ●系统特征: →采用领先的索引技术,使检索速度更快 →操作简便,方便维护 →简洁、流畅、图标驱动的用户友好界面 →中文提示 ●运行环境:单机版:WINDOWS95以上 中文平台 网络版:WINDOWS NT局域网 中文平台 ●CMCC在医学信息业中的作用: →医学文献检索,最新中文医学期刊信息浏览 →立题查新,成果鉴定及科研课题信息跟踪服务 →图书馆资源共享 →定题服务及主动信息服务 →专题数据库基础数据源 →科研产出能力评价检索服务 →配合临床提供相关信息 →编写信息通报,撰写论文选题 然后想想学了这门课如何为你们带来了方便。让你们简单快速的就能够获得信息就行了。

问答题简述信息、知识、文献的概念及其三者之间的关系。答:信息:是事物存在方式、运动状态及其特征的反映,是事物发出的信号、消息。知识:是人类对自然界、人类社会中各种现象、规律的信息反映进行思维分析,加工提炼,经过系统化、理论化的结果。文献:记录有知识的一切载体三者从概念范畴上看,信息大于知识大于文献,知识是信息的一部分,是理论化系统化的信息,文献是知识中记载下来的那部分。文献按载体形式不同分为哪几种类型,并举例说明。答:文献按载体形式的不同分为:手写型文献,如甲骨文、金文印刷型文献,如图书、期刊缩微型文献,如缩微胶卷、缩微胶片视听型文献,如录像带、录音带、科技电影电子型文献,如数据库文献和网络文献文献的级别及其相互关系。答:文献按照加工程度不同分为零次、一次、二次和三次文献四种。其中零次文献是指未公开出版的实验记录、原始录音(像)、书信、手稿、口头交流的信息或实物等;零次文献在作者的加工处理后公开出版进入社会流通领域就变成一次文献;根据一次文献的各种特征按照一定的规则和方法对其进行整理、加工、浓缩,后形成的文献就是二次文献;利用二次文献线索对大量的一次文献内容进行综合、分析、加工、提炼后形成的文献就是三次文献。在计算机检索中,如何缩小检索范围?答:在计算机检索中,缩小检索范围的方法包括:(1)增加用and连接的检索词,或用“二次检索”(2)用特定的副主题词进行限定(3)用字段限定检索,如标题词检索、主题词检索、加权检索等(4)进行文献类型、语种、重要期刊、临床核心期刊、年份等的限定检索(5)进入更专指的分类范围内输词检索获取文献全文的方法有哪些?答:获取全文的方法包括:(1)检索网上全文数据库(2)利用网上出版社、杂志(3)利用图书馆馆藏目录(馆藏联合目录)(4)利用“网上全文传递服务”(5)向著者索取常用的检索途径有哪些?答:常用的检索途径包括:主题途径、分类途径、关键词途径,著者途径、机构检索、题名途径、号码途径等简述信息检索的原理答:信息检索的原理是:将描述特定用户所需信息的提问特征,与信息存储的检索标识进行异同的比较,从中找出与提问特征一致或基本一致的信息。本质是用户的信息需求与存储在信息集合中的信息进行比较和选择, 即匹配的过程。计算机检索通常包括哪些步骤?答:信息检索的步骤包括:(1)分析检索课题,明确目的和要求(2)选择合适的检索工具(3)选择检索途径,确定检索标识。(4)查找文献线索。(5)浏览检索结果,获取原始文献。 简述IM主题索引的编排规则。答:主题索引的排列规则如下(1)整个索引按主题词字顺排(2)同一主题词下按副主题词字顺排(3)相关内容的文献题录分别纳入相应的主题词或者主题词/副主题词之下;一般总论性文献直接入主题词下,专指性文献入相应的副主题词下;同一文献题录可入多个主题词之下(4)同一主题词或副主题词下的文献题录,先排列英文文献,后排列非英文文献,非英文文献的英译标题用"[ ]"括起,以示区别(5)英文文献按刊名缩写字顺排(6)非英文文献先按文种缩写字顺排,同一文种下按刊名缩写字顺排。《医学主题词表》(MeSH)字顺表的参照系统有哪几种?举例说明其意义。答:第一组:用代参照,用于处理词与词间的等同关系。在MeSH词表中,对于多个同义词只采用其中一个比较科学而通用的词作规范化主题词,其它的词作为非主题词(即款目词)。用“款目词see主题词”和“主题词X款目词”表示。如:Cancer see Neoplasms Neoplasms X Cancer第二组:属分参照,用于处理词与词之间的等级关系,即整体与部分,上位概念与下位概念之间的关系。如某些范畴较小的主题概念主题词,包含在某些范畴较大的主题词之下,内容范围较广的词是主题词,其下的内容范围较窄的词不作主题词,只作为次要主题词。用“次要主题词see under 主题词”和“主题词XU 次要主题词”表示。如:Health Priorities see under Health Planning Health Planning XU Health Priorities 从1991年开始取消此种参照关系,所有次要主题词升格为主题词。第三组:相关参照,用于处理词间的相关关系,达到扩大检索,提高查全率的目的。用“主题词see related 主题词”和“主题词XR主题词”表示。如:Population Control see related Family Planning Family Planning XR Population Control为提高查全率和方便检索,MeSH词表于1991年和1992年又先后增设了“还应考虑参照(consider also)”和“主题词/副主题词组配参照”。按照存储内容的不同,数据库通常分为哪些类型?答:书目数据库、事实数据库、数值数据库、全文数据库、图像数据库什么叫主题词的扩展检索,它的优越性何在?答:选择主题词的扩展功能可以同时检索主题词和它的所有下位词,这样就可检出用所选主题词和更专指主题词标引的所有文献,可以更好的提高检索的查全率。不扩展的情况下只会检出用所选主题词标引的文献,不会检出它的下位词,即那些更专指主题词标引的文献。什么是查全率和查准率,二者之间有何关系?答:查全率是指系统在进行某一检索时,检出的相关文献量与系统文献库中相关文献总量的比率,它反映该系统文献库中实用的相关文献量在多大程度上被检索出来。查全率=【检出相关文献量/文献库内相关文献总量】×100%查准率是指系统在进行某一检索时,检出的相关文献量与检出文献总量的比率,它反映每次从该系统文献库中实际检出的全部文献中有多少是相关的。查准率=【检出相关文献量/检出文献总量】×100%查全率与查准率是呈互逆关系的。要想做到查全,势必会要对检索范围和限制逐步放宽,则结果是会把很多不相关的文献也带进来,影响了查准率。企图是查全率和查准率都同时提高,不是很容易的。强调一方面,忽视另一方面,也是不妥当的。应当根据具体课题的要求,合理调节查全率和查准率,保证检索效果。影响查全率和查准率的因素有哪些?答:(1)影响查全率的因素影响查全率的因素从文献存储上来看,主要有:文献库收录文献不全;索引词汇缺乏控制和专指性;词表结构不完整;词间关系模糊或不正确;标引不详;标引前后不一致;标引人员遗漏了原文的重要概念和用词不当等。此外,从情报检索来看,主要有:检索策略过于简单;选词和进行逻辑组配不当;检索途径和方法太少;检索人员业务不熟悉和缺乏耐心;检索系统不具备截词功能和反馈功能,检索时不能全面地描述检索要求等。(2)影响查准率的因素影响查准率的因素主要有:索引词不能准确描述文献主题和检索要求;组配规则不严密;选词及词间关系不正确;标引过于详尽;组配错误;检索时所使用检索词专指度不够,检索面宽于检索要求;检索系统不具备逻辑“非”功能和反馈功能;检索式中允许容纳的词数量有限;截词部位不当,检索式中使用逻辑“或”不当等。独立型搜索引擎的工作原理是什么?答:独立式搜索引擎的工作原理是:定期运行搜索软件(或人工),搜集网络信息。利用索引软件进行自动标引,建立数据库。以Web页面形式向用户提供有关的信息资源导航、目录索引及检索界面,由用户输入检索式。通过检索软件进行检索,匹配,按相关度排序输出。如何提高检索的查全率?答:提高查全率的方法:(1)降低检索词的专指度,选出一些上位词和相关词补充到检索式中。(2)调节检索式的网罗度,减少逻辑“与”的组配面。(3)进行族性检索,可采用分类检索,或用一组同义词、近义词和相关词,用“或”连接在检索式中。(4)采用截词技术,取消某些限制过严的限制符。如何提高检索的查准率?答:提高查准率的方法:(1)提高检索词的专指度,换用专指度较强的规范词或自由词。(2)增加“与”连接,进一步限定主题概念。(3)限定检索词所在的可检字段,用位置算符控制检索词的词间顺序与位置。(4)限制输出文献的外部特征,如限制年限、语种、文献类型等。(5)用逻辑“非”限制与提问不相关的文献的输出。(6)用主题词检索,不用或少用自由词检索。依据我国专利法专利有哪几种类型 各种类型的专利有效期为多长?答:依据专利法保护对象分三种类型:发明专利、实用新型专利、外观设计专利发明专利,是专利法主要的保护对象。发明专利权有效期各国不同,我国为自申请之日起20年。实用新型专利,在我国实用新型专利权有效期为自申请之日起10年。外观设计专利,在我国外观设计专利权有效期为自申请之日起10年。信息检索系统的基本要素是什么?答:信息检索系统的构成包括:(1)检索文档,即文献检索标识的有机集合。(2)技术设备,即能存储信息及其标识,并实现存储和检索操作的各种技术设备。(3)作用于系统的人如:文献加工者、用户、系统维护人员、管理人员。(4)检索工具如:检索语言、文献标引规则、输入输出标准等。何谓数据库的顺排文挡和倒排文挡?答:顺序文档(Sequential file)是以文献记录作为信息存储单元,按文献记录入藏的存取号从小到大顺序排列而形成的目录式文档,由于它存储有关于每篇文献的最完整信息,所以通常又把它称为主文档(Master File),相当于印刷型检索工具的正文部分。倒排文档(Inverted file)就是把记录中一切可检字段或属性值抽出,按某种顺序重新加以组织后所得到的一种文档。倒排档从主文档中派生出来,所以,又叫做辅助文档。获取网络信息资源的主要工具有哪些?答:获取网络信息资源的主要工具包括:(1)电子邮件(2)FTP(3)Archie(4)Telnet(5)Gopher(6)Usenet(7)www浏览器(8)搜索引擎 核心期刊的主要特点是什么?答:少数刊载某一学科大量高质量专业论文的期刊称为核心期刊,其主要特点为:(1)刊载专业文献密度高,信息含量高;(2)水平较高,代表本学科的最新发展水平;(3)出版相对稳定,所载文献寿命较长;(4)利用率和被引率较高。试述因特网搜索引擎的概念、类型。答:搜索引擎是Internet上具有查询功能的网页的统称,即允许用户递交查询,检索出与查询相关的网页结果列表,并且排序输出。根据检索内容分为:综合性搜索引擎和专业性搜索引擎;根据检索功能分类:目录式搜索引擎、全文式搜索引擎、智能式搜索引擎;根据检索范围分类:独立搜索引擎和元搜索引擎。简述会议论文的概念和特点,国内和国外会议论文的检索系统有哪些?答:会议文献是指各种科学技术会议上所发表的论文、报告稿、讲演稿等与会议有关的文献。会议文献的主要特点是:传播信息及时、论题集中、内容新颖、专业性强、质量较高,数量较大,出版类型多种多样,往往代表某一学科或专业领域内最新学术研究成果,基本上反映了该学科或专业的学术水平、研究动态和发展趋势。会议文献是科技查新中重要的信息源之一。国外会议论文检索工具包括:ISI的Proceedings(ISTP+ISSHP);Papers First(OCLC first search的一个子库);IEEE/IEE Electronic Library;AIPCofference Proceedings国内可以进行会议论文检索的系统包括:中国学术会议论文全文数据库(万方数据);中国重要会议论文全文数据库(CNKI) 周红同学在检索一个课题时,第一次检索的结果有 172 条文献,你建议一下她采用何种方式来缩小检索范围?答:缩小检索范围的方法包括:(1)提高检索词的专指度,换用专指度较强的规范词或自由词。(2)增加“与”连接,进一步限定主题概念。(3)限定检索词所在的可检字段。(4)用位置算符控制检索词的词间顺序与位置。(5)限制输出文献的外部特征,如限制年限、语种、文献类型等。(6)用逻辑“非”限制与提问不相关的文献的输出。(7)用主题词检索,不用或少用自由词检索。Medline和Pubmed有什么区别?答:Pubmed和MEDLINE的区别主要体现在:(1)文献的收录范围:Pubmed除了收录MEDLINE数据库之外,还收录了PREMEDLINE数据库,以及出版商直接提供给Pubmed的数据。(2)数据库的更新时间:MEDLINE联机数据库为周更新,MEDLINE光盘的报道时差为1-3个月,而Pubmed为每天更新(3)检索机理:MEDLINE的检索途径只有两个主题和作者,掌握Mesh表是检索的首要条件,而Pubmed具有词汇自动转换匹配功能和主题词自动扩展功能。(4)连接功能:Pubmed具有与原文链接、相关文献链接、相关图书链接、相关分子生物学数据库链接的功能(5)免费全文:Pubmed提供超过60中期刊的免费全文浏览和检索功能。(6)费用:MEDLINE光盘需每年租赁数据库,Pubmed免费。专利文献的概念及特点是什么?答:专利文献是实行专利制度的国家及国际组织在审批专利过程中产生的官方文件及其出版物的总称。专利文献具有以下特点:(1)专利文献集技术、法律和经济信息于一体,是一种数量巨大、内容广博的战略性信息资源;(2)利文献传播最新技术信息;(3)专利文献的格式统一规范,高度标准化,并且具有统一的分类体系,便于检索、阅读;(4)专利文献对发明创造的揭示完整详尽,技术内容相对可靠。如果要查找有关“乙型肝炎流行病学”方面的中外文文献,可以选择哪些数据库?请选择其中一种数据库,简要检索策略。答:查找“乙型肝炎的流行病学”的文献可选用的中文检索系统包括:CNKI、维普、万方、CBM等,可选的外文检索系统包括:MEDLINE、Pubmed、EDSCO、springerlink、Open Access等其中,在CNKI中的检索策略为:检索项:篇名;检索词:乙型肝炎;逻辑:或者检索项:篇名;检索词:乙肝; 逻辑:并且检索项:主题;检索词:流行病学在CBM中的检索策略为:肝炎,乙型/[扩展全部树]流行病学通过哪些检索系统可以查明济宁医学院图书馆是否有“computer communications”这本期刊?答:可以选用的检索系统包括:图书馆联机检索系统、超星数字图书、书生数字图书馆 请列出5个Google高级检索语法,并举例说明其用法。答:可在下列语法中任选5个举例(1)“link”运算符: 查找与某一特定网页建立链接的所有网页,亦可在高级检索模式下实现(2)“related”运算符:自动查找与某一网页处于同一级别的相似网页,亦可通过高级检索模式及检索结果界面的“类似网页”实现(3)“info”运算符:可获取Google库存的有关某一网页的全部信息(4)“site”运算符: 将检索结果限制在某一网域中,也可以通过高级检索界面的“网域”选项来(5)“Allintitle”运算符:要求提问词全部在网页标题中出现(6)“allinurl”运算符:要求提问词全部在URL中出现(7)“inurl”运算符:要求提问词部分在URL中出(8)“filetype:”运算符是Google开发的非常强大实用的一个搜索语法。后面接文档类型,可限制获取某一文档类型的网页,后可接文献类型举例。 在CBMW0版中的查找某作者发表的文献有几种方式?分别是什么? 答:有四种“基本检索”中的著者检索有三种方式:一是在“检索入口”下拉彩旦中选择“作者”字段,然后在检索提问框内输入著者姓名;二是直接在检索提问框内输入著者姓名,后加“in au”;三是直接在检索提问框内输入“au=”,后跟著者姓名,“作者检索”方式:直接在检索提问框内输入著者姓名。 循证医学证据的主要类型有哪些?依据按质量和可靠程度大体可分为以下五级(可靠性依此降低):一级:按照特定病种的特定疗法收集所有质量可靠的随机对照试验后所作的系统评价或Meta分析;二级:单个的样本量足够的随机对照试验结果;三级:设有对照组但未用随机方法分组的研究;四级:无对照的系列病例观察;五级:专家意见或基于生理、病理生理和基础研究的证据。 列举6种可以检索引文的数据库。答:可以检索引文的数据库有:(任写以下6种均可)(1) SCI(2) SSCI(3) H&ACI(4) 《中国科技论文与引文数据库》(CSTPC)(5) 《中国科学引文数据库》(6) 《中文社会科学引文索引》(7) 《中文科技期刊引文数据库》(8) 中国知识基础设施工程中的中国引文数据库(9) 《中国生物医学文献数据库》信息检索的类型及特点。答(1)个人信息源:聚集大量从事某工作领域的个人信息及有关各种事物的发展动态信息。(2)组织机构信息源:主要指组织机构中的内部信息源。(3)实物型信息源:以实物如文物、产品样本、模型、雕塑等形式表现的信息资源。(4)文献型信息源:以文字、图片、符号等各种方式记录在各种载体上的知识和信息资源。1)图书:图书也称为书籍,是指内容比较成熟、资料比较系统、有完整定型装帧形式的出版物。2)期刊:期刊也称杂志,是指那些定期或不定期出版,汇集了多位作者论著的连续出版物。3)学位论文:是本科生、研究生为取得学位资格而撰写的专业性研究论文。4)科技报告:是作为科研成果的正式报告。5)专利文献:由政府专门机构出版、有创造发明的设计、制作工艺的详细说明,表明在一定时限内发明所有者享有制造、使用、销售占有权的法律性文献。6)标准文献:由权威机构批准、颁发的、可供人们执行的技术规格的规范性文献。7)产品样本:厂商为介绍推销其产品而印发的文献。8)会议文献:是指在国际和各国国内专业学术会议上所发表的论文和报告。9)政府出版物:由政府机构制作指定出版机构出版的文献。(5)电子型信息源:主要是指通过使用电子技术实现信息存储和传播的信息。数据库的组成。答:数据库由文档、记录和字段组成。(1)文档:是按一定结构组织的相关记录和结合。(2)记录:是构成文档的基本数据单元。(3)字段:是比记录更小的单元,是组成记录的基本单元。分类语言。答:分类语言是按文献的学科属性,给予相应的分类号,用分类号来表达文献的主题概念,根据分类表中的顺序编排成分类索引,提供分类途径共检索文献使用。分类语言是运用逻辑分类原理,按文献内容的学科、专业集中文献,从知识分类的角度揭示各类文献在内容上的区别和联系。分类语言较好地体现了学科和专业的系统性。分类语言可分为体系分类语言和组配语言两种,目前国内普遍采用前者。主题语言。答:主题语言是以高度概括的语词解释文献的主题,并以此为标识组织检索系统的语言。主题语言分为标题词、元词、关键词和叙词。(1)标题词:是从自然语言中选取并经过规范化处理,表示事物概念的词、词组或短语。(2)元词:是指能够用以描述文献所论及主体的最小、最基本词汇。(3)叙词:使用能表达文献主题并经过严格规范化的词语。(4)关键词:是直接从文献的标题,文献或全文中抽选具有实质意义、能表达文献主题概念,未经规范化处理的自然词语词汇。信息检索途径。答:分类文献:是按文献内容所属的学科类别来检索文献的途径,通过分类号或类别进行检索。主题途径:是通过反应文献内容主题的词语来检索文献的途径。关键词途径:是用非规范化词语自由标引,直接取自原文中能够表达文献内容主题、起关键作用的词语。著者途径:是指按文献的作者、编者、译者的姓名或机构团体名称字顺检索文献的途径。题名途径:是指按书名、刊名或文章篇名的字顺进行检索的一种途径。号码途径:是利用文献代码、序号编排成的“号码索引”的一种途径。信息检索素养的内涵。答:信息意识:指信息在人脑中的反应即人对各种信息的自觉心里反应,反应人在信息活动中对信息的认识、态度、价值趋向和一定需求。信息知识:是指与信息有关的理论、知识和方法。信息能力:是指有效利用信息技术和信息资源获取信息、加工处理信息以及创造和交流新信息的能力。信息道德:是指在信息获取、使用、创造和传播过程中应该遵守一定的伦理规范。信息检索策略。答:分析检索课题,明确目的要求。信息检索总是按照一定的课题需要进行的,每一项检索课题都有明确的目的和具体的要求,因此在进行检索之前,首先要对检索课题进行认真而细致的分析研究,明确检索的目的和要求。因为目的不同,要求也不同,选择连锁工具、连锁方法等就有所不同。检索系统和数据库的选择。信息检索和数据库的选择主要主要考虑其所收录的学科范围、存贮年限、更新周期、标引质量、独特性、所需费用、系统性能和辅助服务等方面考虑,还要注意综合性和专业性数据库配合使用。选择检索途径、确定检索标识。所谓检索途径也就是数据库中的检索项(字段),是指从哪个角度或哪个方向入手进行检索。检索标识是指确切表达文献信息内容及外表特征使用的符号或词语,如分类号、主题词、关键词、作者姓名、期刊刊名等,检索时要求准确找出检索标识,以避免误检。编辑检索表达、调整检索策略。检索表达式是用来表达检索提问的逻辑检索表达式,有选择好的检索标识根据检索要求运用不同的运算符号进行组配,以达到较为理想的检索效果。但是实际的检索过程中,用既定的检索表达式检出的结果往往不能一次就达到满意,这就需要根据检索情况分析原因及时调整检索策略。获得原始文章。通过上述步骤的查找获得的如不是文献全文,可通过以下方式获得。(1)检索网上全文数据库。(2)利用网上出版社、杂志。(3)利用图书馆馆藏目录(馆藏联合目录)。(4)利用“网上全文传递服务”。(5)直接向著者索取。

信息检索技术论文 – 基于网格的面向专业内容的Web信息检索 1 引言 近年来,互联网得到了迅速的发展,网上信息资源愈来愈庞大,且信息具有量大、分散、异构等特性,因此,传统的Web信息检索工具开始暴露出它性能低下的一面,具体体现在现有的信息检索工具对用户的要求常常是找出了几千甚至上万条记录,根本无法从中再细找,或者找到的内容和要找的内容不是一个专业领域的,造成信息无效的现象。但随着人们信息意识的增强,对信息内容及信息服务的需求也在不断的演变和发展,对获取信息的专业化、实效性等方面有了新的要求。如何针对专业领域中特定的用户群为他们提供专业的、度身量造的信息服务,使用户在尽可能短的时间内有效的找到最需要的信息内容是大家普遍关注的一个问题。本文利用网格计算、集群系统、XML等技术设计了一个基于网格的面向专业内容的Web信息检索体系结构,它能将地理位置分散的、异构的信息按地区按专业内容从逻辑上进行合理的组织和管理,为用户快速、有效地获取自己所需要的信息提供了一种方法。 2 基于网格的面向专业内容的Web信息检索体系结构的设计 网格计算是近年来国际上兴起的一种重要信息技术,其目的是将网上各种资源组织在一个统一的大框架下,为解决大型复杂计算、数据服务和各种网络信息服务提供一个方便用户使用的虚拟平台,实现互联网上所有资源的全面连通,实现信息资源的全面共享。 为解决不同领域复杂科学计算与海量信息服务问题,人们以网络互连为基础构造了不同的网格,他们在体系结构,要解决的问题类型等方面各不相同,但网格计算至少需要具有三种基本功能:资源管理、任务管理、任务调度。本文设计的信息检索体系结构,围绕网格计算的基本功能及信息检索的特点,主要有以下三个层次组成:见图1 (1) 网格结点:结点是网格计算资源的提供者,本系统主要是由一系列的集群系统组成,它们在地理位置上是分布的,构成了一个分布检索群体,作为信息共享的基础结构平台。集群系统负责整个集群范围内的信息管理,维护和查询。 (2) 网格计算中间件:中间件是信息资源管理和用户任务调度、任务管理的工具。它是整个网格信息资源管理的核心部分,它根据用户的信息请求任务,在整个网格内负责信息资源的匹配、定位,实现用户任务到集群系统的映射。 (3) 网格用户层:主要为用户应用提供接口,支持用户对所需要的信息资源进行描述、创建、提交等。 图1 本系统的主要思想是在逻辑上将地理位置分散的、异构的信息划分、组建成多个集群系统,集群系统对集群内的资源进行管理和任务调度,再利用网格中间件对各集群系统进行管理,从而形成对整个网格资源的管理,并对用户的信息需求进行统一的管理和调度。这种管理模型既可以尊重各个集群系统的本地信息管理策略,又可利用中间件在全局意义上对网格信息资源进行管理。 1 集群系统的设计 由于Web信息资源数量十分庞大,用户在利用现有搜索引擎检索信息时面临一个海量数据的查询问题,往往造成在消耗巨大的通信资源后依然存在资源查不准、查不全的问题。目前基于单一系统映射的Web服务器集群系统能把若干服务器用局域网连接成一个整体,并使其从客户端看来就如同一台服务器在服务,这使得在逻辑上合并、组织地理位置分布的信息资源成为可能。因此本文首先考虑采用分布协作策略,将Web信息资源按地区按专业内容分割,一方面使信息资源数量相对缩小,便于数据的组织、管理和维护,另一方面按专业内容易于制定一个公用的XML规范,便于集群内各类信息资源的描述,从而可建立一个基于XML的面向专业内容的信息集成系统。集群系统的具体结构见图2。 集群服务器主要由接口Agent,基于专业内容的XML信息集成系统、资源服务Agent、资源发布Agent等组成。其中接口Agent根据任务提供的接口参数登记、接收、管理各种信息资源请求任务,并提供安全认证和授权。资源服务Agent根据信息资源请求任务,利用XML信息集成系统提供的数据,为用户提供实际的资源检索操作,并将检索结果信息发送给用户。资源发布Agent用于向网格中间件提供本地信息资源的逻辑数据及接口参数。 下面主要说明基于专业内容的XML信息集成系统的构造方法: XML(the eXtensible Markup Language)是 W3C于1998年宣布作为Internet上数据表示和数据交换的新标准,它是一种可以对信息进行自我描述的语言,它允许开发人员通过创建格式文件DTD(Document Type Definitions)定制标记来描述自己的数据,DTD规范是一个用来定义XML文件的语法、句法和数据结构的标准。 XML使用普通文本,因此具有跨平台的优点,XML的优点在于(1)简单、规范性:XML文档基于文本标签,有一套严谨而简洁的语法结构,便于计算机、用户理解;(2)可扩展性:用户可以自定义具有特定意义的标签,自定义的标签可以在任何组织、客户、应用之间共享;(3)自描述性:自描述性使其非常适用不同应用间的数据交换,而且这种交换是不以预先定义一组数据结构为前提,因此具有很强的开放性;(4)互操作性:XML可以把所有信息都存于文档中传输,而远程的应用程序又可以从中提取需要的信息。XML数据是不依赖于某个特定的平台的应用,因此它为基于特定专业内容的表达提供了一种极好的手段,可以作为表示专业内容的语言。 目前人们研制Web信息集成系统其基本方法可分成两类:存入仓库法(the ware-housing approach)和虚拟法(the virtual approach),可使用这两类方法利用XML在数据组织和交换方面的优越性,采用格式文件DTD和XML文档表示基于专业内容的集成模式和集成模式与资源之间的映射,建立基于XML的Web信息集成系统,其结构与获取信息的工作过程参见文献[2]。 图2 2 网格中间件的设计 图3所示的网格中间件的主要功能是(1)消除不同用户与集群系统之间数据表达的差异,使信息资源数据对用户来说是透明的;(2)管理、维护Web上分布的各集群系统,网格中间件以关系数据库方式记录所有集群系统及其所包含的专业内容的逻辑信息,对关系数据库的操作可维护集群系统的分布式逻辑,使本结构在可变性和扩充性上具有柔性;(3)接受用户的信息请求任务,能快速定位于满足要求的集群系统,通过对关系数据库的查询实现用户信息请求任务与集群系统的对应关系。 内部主要功能模块说明如下: (1) 接收Agent模块:主要用于登记、接收、管理各种信息资源请求任务,并提供安全认证和授权。 (2) 关系数据库及数据服务Agent:关系数据库记录了所有集群系统及其所包含的专业内容的逻辑信息。数据服务Agent提供集群系统对关系数据库的使用权限和对数据记录的增加、删除、检索和修改等操作。 (3) 格式转换Agent模块:提供用户信息资源请求文档与各集群系统中文档的格式转换功能。由于XML是自定义的,各用户对同一数据有不同的表示方法(对信息资源描述存在差异)由于XML文档中这种格式差异体现在与之相关的DTD/Schema上,因此经过格式转换,可使信息资源的格式对用户是透明的。 (4) XML文档分析Agent模块:提取格式转换后的XML文档中各个标签,通过查询网格中间件中的关系数据库,实现用户信息请求任务与集群系统的对应关系,并得到满足条件的集群系统的相关信息,获取各集群系统的接口参数。 (5) 发送Agent模块:将转换过的信息资源请求XML文档发送到相应的集群系统中。 其中Agent技术是解决分布式智能应用问题的关键技术,Agent是指能够自主地、连续地在一动态变化的、存在于其它系统中运行的、且不断于环境交互的实体。在系统中引入Agent可使系统具有人的特征,代表用户完成用户的任务,并能动态适应环境的变化更好地满足用户的需求,提高信息检索的能力。

提高查全率的措施:(1)尽量采取主题词与关键词想组合进行检索(2)主题词检索时要进行扩展检索和使用全部副主题词检索(3)分类检索时要进行扩建检索和全部复分检索(4)删除某个不甚重要的的概念组面,减少AND运算(5)多用近义词进行OR运算检索(6)多用截词检索5 提高查准率的方法(1)采用规划范的主题词与副主题词组配进行检索,少用或不用主题词(2)采用限定主要概念主题词字段的加权方法。(3)增加概念组面,用AND运算符进行连接(4)用NOT算符排除无关概念(5)限制检索字段,如文献类型,语种,作者,刊名等(6)调整放宽位置算符等。信息检索策略(制定)(步骤):(1),分析检索课题,明确目的和要求(2),检索系统和数据库 的选择(3),选择检索途径,确定检索标识(4),编制检索表达式,调整检索策略(5),获取原始文献

医药信息检索论文2000字怎么写

直接去看看(临床医学进展)上的文献吧

创新医学网 有医学硕士生毕业论文的写作指导哪里,有专家教授讲座指导,创新医学网为医务工作者提供专业知识学习(职称晋升政策、专科文献、执业医师模拟考试、期刊阅读)、论文写作辅导(论文写作知识、论文写作讲座)、进行学术交流(了解医学期刊知识、选择医学期刊投稿)、展示医学成就。一直与国内各大专业图书出版社、国家级、省级医学杂志社及医学杂志编辑部、相关医学学术机构、医药研发、生产、供应机构、各大医学院校、各级医疗机构及医院高层管理者进行着深度的合作,使广阔的资源优势在诚信的专业态度和科学的管理方式基础上得到了整合性的利用。成功的实现了网络上的医学信息化、医院网络化、医药在线化!

首先,登录中国期刊全文数据库、万方数据库或者 维普数据库(此为中国三大专业文献数据库)或Pubmed/Medline等国外专业数据库,然后搜索相关的文献,写出您的文章。其次,再去以上数据库中搜索相关专业期刊编辑部信息,找到投稿联系方式,这样的方法避免网上很多钓鱼网站,确保您投稿的期刊是合法的。最后,祝好运。欢迎交流。静石医疗,竭诚为您服务。

医药信息检索论文2000字

先介绍医学信息检索的用途。把下面的修改下写上。常用中文医学文献光盘数据库 第一节 中国生物医学文献数据库(CBMdisc) 第二节 中文生物医学期刊数据库(CMCC) 第三节 中国学术期刊数据库(光盘板)(CAJ-CD) 中国生物医学文献数据库(CBMdisc)收录了自1978年以来1600余种中国生物医学期刊约300万篇文献,著录内容既包括简单的题录信息也包括引文在内的摘要数据。检索功能与时俱进,原文索取、定题服务、期刊定制、限定检索、副主题词扩展功能的增加;主题、分类、期刊、浏览查询功能的提出和新的主题分类词表的应用,充分体现了该系统以用户需求为发展,诚信用户服务方向的理念。中国生物医学文献数据库及其检索以其年代跨度大、数据标引规范、加工手段先进、检索界面友好,功能与流行数据库检索系统相兼容,而深受医学信息领域用户的肯定的和欢迎。 十年中,伴随着中国医学信息网络的建立和数字图书馆建设时代的来临,中国生物医学文献数据库及其检索系统坚持技术引路,积极开展前沿学科的研究,加强基础设施的建设,培养造新了医学信息专业人才,也为CBMdisc注入新的发展活力,提高了数据加工的效率,增强了技术水平和含量,率先实现了二次文献数据库与异构数据库系统基于中文期刊文献数字唯一标识符和XML规范的全文链接。 文献计算机协助标引、联机标引以及文献相关性研究为开发新型数据库系统,实现从文献管理到知识管理的跃升奠定了坚定的基础。 中文生物医学期刊文献数据库(简称CMCC)是由解放军医学图书馆数据库研究部开发的中文生物医学文献目录型数据库,面向医院、医学院校、医学研究所、医药工业、医药信息机构、图书馆和医学出版社提供长期稳定的最新医学文献信息检索服务。内容涵盖医药卫生各个领域,收刊全、更新快是该数据库的主要特点。CMCC自1994年创建以来在中国内地和港澳拥有广泛的用户,是国家卫生部门认可的重要检索工具之一,同时也是信息资源共享、检索查新的必备工具。经过不断系统更新和数据扩容,目前已成为获取中国内地生物医学文献信息的重要信息来源,并得到广大用户的认可和支持,享誉甚佳。CMCC数据库依托解放军医学图书馆丰富的馆藏资源,并可提供优质原文获取服务。 中国医学学术会议论文数据库 DATABASE ON CHINA MEDICAL ACADEMIC CONFERENCE PAPERS(CMAC) 多年来,解放军医学图书馆在中华医学会和各地分会的支持下,搜集了大量的医学学术会议论文集并建立了较好的收集渠道。为了不断满足用户的需求,增加医学信息量,建立了《中国医学学术会议论文数据库》,该数据库为目录型数据库,收录了中华医学会所属各专业分会及各省分会等组织1994年以来的全国医学学术会议论文集中的医学文献约15万余篇。该数据库与CMCC共享同一检索软件,分为单机版和网络版,数据库半年更新一次。 ●数据库规模:CMCC收录了自1994年以来1200余种中文生物医学期刊, 约180万条文献记录,并以每年26余万条速度 递增,含盖中国内地全部重要刊和核心刊。 ●收录范围:基础医学,临床医学,预防医学,医学生物学,中医药学,药学,医院管理,医学信息学等卫生相关 信息。 ●更新周期:每半月更新一期光盘, 一年24期, 几乎与到馆期刊同步。 ●字段项目:中文题名,英文题名,全部作者,第一作者地址,关键词,文摘,文献类型,出处,参考文献数,资 助项目。 ●检索功能: →支持硬盘数据库镜像,数据库选择和多库联检功能 →浏览器模式全文检索界面 →支持Win98,Win2000和Windows-NT平台 →字段(文献著录项)限定检索 →字段浏览检索:对某一字段内容进行检索,其方式可以是:等于、前缀、后缀、包含、不包含等;可选取多个字 段内容检索 →通配符(*,?) 截词检索 →高级逻辑组配检索(AND,OR,NOT) →核心刊,文献类型,出版年代,摘要标记限定检索 →检索史的保存、修改、删除,检索策略的反复调用和重新组配 →中文生物医学期刊概况浏览查询 ●输出功能: →多种输出方式:联机打印,磁盘下载,在线摘录 →加输出标记,便于批量存盘或打印 →对输出文献按不同字段进行排序 →输出字段可任意选择 →多种输出格式,任意选择 ●系统特征: →采用领先的索引技术,使检索速度更快 →操作简便,方便维护 →简洁、流畅、图标驱动的用户友好界面 →中文提示 ●运行环境:单机版:WINDOWS95以上 中文平台 网络版:WINDOWS NT局域网 中文平台 ●CMCC在医学信息业中的作用: →医学文献检索,最新中文医学期刊信息浏览 →立题查新,成果鉴定及科研课题信息跟踪服务 →图书馆资源共享 →定题服务及主动信息服务 →专题数据库基础数据源 →科研产出能力评价检索服务 →配合临床提供相关信息 →编写信息通报,撰写论文选题 然后想想学了这门课如何为你们带来了方便。让你们简单快速的就能够获得信息就行了。

提高查全率的措施:(1)尽量采取主题词与关键词想组合进行检索(2)主题词检索时要进行扩展检索和使用全部副主题词检索(3)分类检索时要进行扩建检索和全部复分检索(4)删除某个不甚重要的的概念组面,减少AND运算(5)多用近义词进行OR运算检索(6)多用截词检索5 提高查准率的方法(1)采用规划范的主题词与副主题词组配进行检索,少用或不用主题词(2)采用限定主要概念主题词字段的加权方法。(3)增加概念组面,用AND运算符进行连接(4)用NOT算符排除无关概念(5)限制检索字段,如文献类型,语种,作者,刊名等(6)调整放宽位置算符等。信息检索策略(制定)(步骤):(1),分析检索课题,明确目的和要求(2),检索系统和数据库 的选择(3),选择检索途径,确定检索标识(4),编制检索表达式,调整检索策略(5),获取原始文献

问答题简述信息、知识、文献的概念及其三者之间的关系。答:信息:是事物存在方式、运动状态及其特征的反映,是事物发出的信号、消息。知识:是人类对自然界、人类社会中各种现象、规律的信息反映进行思维分析,加工提炼,经过系统化、理论化的结果。文献:记录有知识的一切载体三者从概念范畴上看,信息大于知识大于文献,知识是信息的一部分,是理论化系统化的信息,文献是知识中记载下来的那部分。文献按载体形式不同分为哪几种类型,并举例说明。答:文献按载体形式的不同分为:手写型文献,如甲骨文、金文印刷型文献,如图书、期刊缩微型文献,如缩微胶卷、缩微胶片视听型文献,如录像带、录音带、科技电影电子型文献,如数据库文献和网络文献文献的级别及其相互关系。答:文献按照加工程度不同分为零次、一次、二次和三次文献四种。其中零次文献是指未公开出版的实验记录、原始录音(像)、书信、手稿、口头交流的信息或实物等;零次文献在作者的加工处理后公开出版进入社会流通领域就变成一次文献;根据一次文献的各种特征按照一定的规则和方法对其进行整理、加工、浓缩,后形成的文献就是二次文献;利用二次文献线索对大量的一次文献内容进行综合、分析、加工、提炼后形成的文献就是三次文献。在计算机检索中,如何缩小检索范围?答:在计算机检索中,缩小检索范围的方法包括:(1)增加用and连接的检索词,或用“二次检索”(2)用特定的副主题词进行限定(3)用字段限定检索,如标题词检索、主题词检索、加权检索等(4)进行文献类型、语种、重要期刊、临床核心期刊、年份等的限定检索(5)进入更专指的分类范围内输词检索获取文献全文的方法有哪些?答:获取全文的方法包括:(1)检索网上全文数据库(2)利用网上出版社、杂志(3)利用图书馆馆藏目录(馆藏联合目录)(4)利用“网上全文传递服务”(5)向著者索取常用的检索途径有哪些?答:常用的检索途径包括:主题途径、分类途径、关键词途径,著者途径、机构检索、题名途径、号码途径等简述信息检索的原理答:信息检索的原理是:将描述特定用户所需信息的提问特征,与信息存储的检索标识进行异同的比较,从中找出与提问特征一致或基本一致的信息。本质是用户的信息需求与存储在信息集合中的信息进行比较和选择, 即匹配的过程。计算机检索通常包括哪些步骤?答:信息检索的步骤包括:(1)分析检索课题,明确目的和要求(2)选择合适的检索工具(3)选择检索途径,确定检索标识。(4)查找文献线索。(5)浏览检索结果,获取原始文献。 简述IM主题索引的编排规则。答:主题索引的排列规则如下(1)整个索引按主题词字顺排(2)同一主题词下按副主题词字顺排(3)相关内容的文献题录分别纳入相应的主题词或者主题词/副主题词之下;一般总论性文献直接入主题词下,专指性文献入相应的副主题词下;同一文献题录可入多个主题词之下(4)同一主题词或副主题词下的文献题录,先排列英文文献,后排列非英文文献,非英文文献的英译标题用"[ ]"括起,以示区别(5)英文文献按刊名缩写字顺排(6)非英文文献先按文种缩写字顺排,同一文种下按刊名缩写字顺排。《医学主题词表》(MeSH)字顺表的参照系统有哪几种?举例说明其意义。答:第一组:用代参照,用于处理词与词间的等同关系。在MeSH词表中,对于多个同义词只采用其中一个比较科学而通用的词作规范化主题词,其它的词作为非主题词(即款目词)。用“款目词see主题词”和“主题词X款目词”表示。如:Cancer see Neoplasms Neoplasms X Cancer第二组:属分参照,用于处理词与词之间的等级关系,即整体与部分,上位概念与下位概念之间的关系。如某些范畴较小的主题概念主题词,包含在某些范畴较大的主题词之下,内容范围较广的词是主题词,其下的内容范围较窄的词不作主题词,只作为次要主题词。用“次要主题词see under 主题词”和“主题词XU 次要主题词”表示。如:Health Priorities see under Health Planning Health Planning XU Health Priorities 从1991年开始取消此种参照关系,所有次要主题词升格为主题词。第三组:相关参照,用于处理词间的相关关系,达到扩大检索,提高查全率的目的。用“主题词see related 主题词”和“主题词XR主题词”表示。如:Population Control see related Family Planning Family Planning XR Population Control为提高查全率和方便检索,MeSH词表于1991年和1992年又先后增设了“还应考虑参照(consider also)”和“主题词/副主题词组配参照”。按照存储内容的不同,数据库通常分为哪些类型?答:书目数据库、事实数据库、数值数据库、全文数据库、图像数据库什么叫主题词的扩展检索,它的优越性何在?答:选择主题词的扩展功能可以同时检索主题词和它的所有下位词,这样就可检出用所选主题词和更专指主题词标引的所有文献,可以更好的提高检索的查全率。不扩展的情况下只会检出用所选主题词标引的文献,不会检出它的下位词,即那些更专指主题词标引的文献。什么是查全率和查准率,二者之间有何关系?答:查全率是指系统在进行某一检索时,检出的相关文献量与系统文献库中相关文献总量的比率,它反映该系统文献库中实用的相关文献量在多大程度上被检索出来。查全率=【检出相关文献量/文献库内相关文献总量】×100%查准率是指系统在进行某一检索时,检出的相关文献量与检出文献总量的比率,它反映每次从该系统文献库中实际检出的全部文献中有多少是相关的。查准率=【检出相关文献量/检出文献总量】×100%查全率与查准率是呈互逆关系的。要想做到查全,势必会要对检索范围和限制逐步放宽,则结果是会把很多不相关的文献也带进来,影响了查准率。企图是查全率和查准率都同时提高,不是很容易的。强调一方面,忽视另一方面,也是不妥当的。应当根据具体课题的要求,合理调节查全率和查准率,保证检索效果。影响查全率和查准率的因素有哪些?答:(1)影响查全率的因素影响查全率的因素从文献存储上来看,主要有:文献库收录文献不全;索引词汇缺乏控制和专指性;词表结构不完整;词间关系模糊或不正确;标引不详;标引前后不一致;标引人员遗漏了原文的重要概念和用词不当等。此外,从情报检索来看,主要有:检索策略过于简单;选词和进行逻辑组配不当;检索途径和方法太少;检索人员业务不熟悉和缺乏耐心;检索系统不具备截词功能和反馈功能,检索时不能全面地描述检索要求等。(2)影响查准率的因素影响查准率的因素主要有:索引词不能准确描述文献主题和检索要求;组配规则不严密;选词及词间关系不正确;标引过于详尽;组配错误;检索时所使用检索词专指度不够,检索面宽于检索要求;检索系统不具备逻辑“非”功能和反馈功能;检索式中允许容纳的词数量有限;截词部位不当,检索式中使用逻辑“或”不当等。独立型搜索引擎的工作原理是什么?答:独立式搜索引擎的工作原理是:定期运行搜索软件(或人工),搜集网络信息。利用索引软件进行自动标引,建立数据库。以Web页面形式向用户提供有关的信息资源导航、目录索引及检索界面,由用户输入检索式。通过检索软件进行检索,匹配,按相关度排序输出。如何提高检索的查全率?答:提高查全率的方法:(1)降低检索词的专指度,选出一些上位词和相关词补充到检索式中。(2)调节检索式的网罗度,减少逻辑“与”的组配面。(3)进行族性检索,可采用分类检索,或用一组同义词、近义词和相关词,用“或”连接在检索式中。(4)采用截词技术,取消某些限制过严的限制符。如何提高检索的查准率?答:提高查准率的方法:(1)提高检索词的专指度,换用专指度较强的规范词或自由词。(2)增加“与”连接,进一步限定主题概念。(3)限定检索词所在的可检字段,用位置算符控制检索词的词间顺序与位置。(4)限制输出文献的外部特征,如限制年限、语种、文献类型等。(5)用逻辑“非”限制与提问不相关的文献的输出。(6)用主题词检索,不用或少用自由词检索。依据我国专利法专利有哪几种类型 各种类型的专利有效期为多长?答:依据专利法保护对象分三种类型:发明专利、实用新型专利、外观设计专利发明专利,是专利法主要的保护对象。发明专利权有效期各国不同,我国为自申请之日起20年。实用新型专利,在我国实用新型专利权有效期为自申请之日起10年。外观设计专利,在我国外观设计专利权有效期为自申请之日起10年。信息检索系统的基本要素是什么?答:信息检索系统的构成包括:(1)检索文档,即文献检索标识的有机集合。(2)技术设备,即能存储信息及其标识,并实现存储和检索操作的各种技术设备。(3)作用于系统的人如:文献加工者、用户、系统维护人员、管理人员。(4)检索工具如:检索语言、文献标引规则、输入输出标准等。何谓数据库的顺排文挡和倒排文挡?答:顺序文档(Sequential file)是以文献记录作为信息存储单元,按文献记录入藏的存取号从小到大顺序排列而形成的目录式文档,由于它存储有关于每篇文献的最完整信息,所以通常又把它称为主文档(Master File),相当于印刷型检索工具的正文部分。倒排文档(Inverted file)就是把记录中一切可检字段或属性值抽出,按某种顺序重新加以组织后所得到的一种文档。倒排档从主文档中派生出来,所以,又叫做辅助文档。获取网络信息资源的主要工具有哪些?答:获取网络信息资源的主要工具包括:(1)电子邮件(2)FTP(3)Archie(4)Telnet(5)Gopher(6)Usenet(7)www浏览器(8)搜索引擎 核心期刊的主要特点是什么?答:少数刊载某一学科大量高质量专业论文的期刊称为核心期刊,其主要特点为:(1)刊载专业文献密度高,信息含量高;(2)水平较高,代表本学科的最新发展水平;(3)出版相对稳定,所载文献寿命较长;(4)利用率和被引率较高。试述因特网搜索引擎的概念、类型。答:搜索引擎是Internet上具有查询功能的网页的统称,即允许用户递交查询,检索出与查询相关的网页结果列表,并且排序输出。根据检索内容分为:综合性搜索引擎和专业性搜索引擎;根据检索功能分类:目录式搜索引擎、全文式搜索引擎、智能式搜索引擎;根据检索范围分类:独立搜索引擎和元搜索引擎。简述会议论文的概念和特点,国内和国外会议论文的检索系统有哪些?答:会议文献是指各种科学技术会议上所发表的论文、报告稿、讲演稿等与会议有关的文献。会议文献的主要特点是:传播信息及时、论题集中、内容新颖、专业性强、质量较高,数量较大,出版类型多种多样,往往代表某一学科或专业领域内最新学术研究成果,基本上反映了该学科或专业的学术水平、研究动态和发展趋势。会议文献是科技查新中重要的信息源之一。国外会议论文检索工具包括:ISI的Proceedings(ISTP+ISSHP);Papers First(OCLC first search的一个子库);IEEE/IEE Electronic Library;AIPCofference Proceedings国内可以进行会议论文检索的系统包括:中国学术会议论文全文数据库(万方数据);中国重要会议论文全文数据库(CNKI) 周红同学在检索一个课题时,第一次检索的结果有 172 条文献,你建议一下她采用何种方式来缩小检索范围?答:缩小检索范围的方法包括:(1)提高检索词的专指度,换用专指度较强的规范词或自由词。(2)增加“与”连接,进一步限定主题概念。(3)限定检索词所在的可检字段。(4)用位置算符控制检索词的词间顺序与位置。(5)限制输出文献的外部特征,如限制年限、语种、文献类型等。(6)用逻辑“非”限制与提问不相关的文献的输出。(7)用主题词检索,不用或少用自由词检索。Medline和Pubmed有什么区别?答:Pubmed和MEDLINE的区别主要体现在:(1)文献的收录范围:Pubmed除了收录MEDLINE数据库之外,还收录了PREMEDLINE数据库,以及出版商直接提供给Pubmed的数据。(2)数据库的更新时间:MEDLINE联机数据库为周更新,MEDLINE光盘的报道时差为1-3个月,而Pubmed为每天更新(3)检索机理:MEDLINE的检索途径只有两个主题和作者,掌握Mesh表是检索的首要条件,而Pubmed具有词汇自动转换匹配功能和主题词自动扩展功能。(4)连接功能:Pubmed具有与原文链接、相关文献链接、相关图书链接、相关分子生物学数据库链接的功能(5)免费全文:Pubmed提供超过60中期刊的免费全文浏览和检索功能。(6)费用:MEDLINE光盘需每年租赁数据库,Pubmed免费。专利文献的概念及特点是什么?答:专利文献是实行专利制度的国家及国际组织在审批专利过程中产生的官方文件及其出版物的总称。专利文献具有以下特点:(1)专利文献集技术、法律和经济信息于一体,是一种数量巨大、内容广博的战略性信息资源;(2)利文献传播最新技术信息;(3)专利文献的格式统一规范,高度标准化,并且具有统一的分类体系,便于检索、阅读;(4)专利文献对发明创造的揭示完整详尽,技术内容相对可靠。如果要查找有关“乙型肝炎流行病学”方面的中外文文献,可以选择哪些数据库?请选择其中一种数据库,简要检索策略。答:查找“乙型肝炎的流行病学”的文献可选用的中文检索系统包括:CNKI、维普、万方、CBM等,可选的外文检索系统包括:MEDLINE、Pubmed、EDSCO、springerlink、Open Access等其中,在CNKI中的检索策略为:检索项:篇名;检索词:乙型肝炎;逻辑:或者检索项:篇名;检索词:乙肝; 逻辑:并且检索项:主题;检索词:流行病学在CBM中的检索策略为:肝炎,乙型/[扩展全部树]流行病学通过哪些检索系统可以查明济宁医学院图书馆是否有“computer communications”这本期刊?答:可以选用的检索系统包括:图书馆联机检索系统、超星数字图书、书生数字图书馆 请列出5个Google高级检索语法,并举例说明其用法。答:可在下列语法中任选5个举例(1)“link”运算符: 查找与某一特定网页建立链接的所有网页,亦可在高级检索模式下实现(2)“related”运算符:自动查找与某一网页处于同一级别的相似网页,亦可通过高级检索模式及检索结果界面的“类似网页”实现(3)“info”运算符:可获取Google库存的有关某一网页的全部信息(4)“site”运算符: 将检索结果限制在某一网域中,也可以通过高级检索界面的“网域”选项来(5)“Allintitle”运算符:要求提问词全部在网页标题中出现(6)“allinurl”运算符:要求提问词全部在URL中出现(7)“inurl”运算符:要求提问词部分在URL中出(8)“filetype:”运算符是Google开发的非常强大实用的一个搜索语法。后面接文档类型,可限制获取某一文档类型的网页,后可接文献类型举例。 在CBMW0版中的查找某作者发表的文献有几种方式?分别是什么? 答:有四种“基本检索”中的著者检索有三种方式:一是在“检索入口”下拉彩旦中选择“作者”字段,然后在检索提问框内输入著者姓名;二是直接在检索提问框内输入著者姓名,后加“in au”;三是直接在检索提问框内输入“au=”,后跟著者姓名,“作者检索”方式:直接在检索提问框内输入著者姓名。 循证医学证据的主要类型有哪些?依据按质量和可靠程度大体可分为以下五级(可靠性依此降低):一级:按照特定病种的特定疗法收集所有质量可靠的随机对照试验后所作的系统评价或Meta分析;二级:单个的样本量足够的随机对照试验结果;三级:设有对照组但未用随机方法分组的研究;四级:无对照的系列病例观察;五级:专家意见或基于生理、病理生理和基础研究的证据。 列举6种可以检索引文的数据库。答:可以检索引文的数据库有:(任写以下6种均可)(1) SCI(2) SSCI(3) H&ACI(4) 《中国科技论文与引文数据库》(CSTPC)(5) 《中国科学引文数据库》(6) 《中文社会科学引文索引》(7) 《中文科技期刊引文数据库》(8) 中国知识基础设施工程中的中国引文数据库(9) 《中国生物医学文献数据库》信息检索的类型及特点。答(1)个人信息源:聚集大量从事某工作领域的个人信息及有关各种事物的发展动态信息。(2)组织机构信息源:主要指组织机构中的内部信息源。(3)实物型信息源:以实物如文物、产品样本、模型、雕塑等形式表现的信息资源。(4)文献型信息源:以文字、图片、符号等各种方式记录在各种载体上的知识和信息资源。1)图书:图书也称为书籍,是指内容比较成熟、资料比较系统、有完整定型装帧形式的出版物。2)期刊:期刊也称杂志,是指那些定期或不定期出版,汇集了多位作者论著的连续出版物。3)学位论文:是本科生、研究生为取得学位资格而撰写的专业性研究论文。4)科技报告:是作为科研成果的正式报告。5)专利文献:由政府专门机构出版、有创造发明的设计、制作工艺的详细说明,表明在一定时限内发明所有者享有制造、使用、销售占有权的法律性文献。6)标准文献:由权威机构批准、颁发的、可供人们执行的技术规格的规范性文献。7)产品样本:厂商为介绍推销其产品而印发的文献。8)会议文献:是指在国际和各国国内专业学术会议上所发表的论文和报告。9)政府出版物:由政府机构制作指定出版机构出版的文献。(5)电子型信息源:主要是指通过使用电子技术实现信息存储和传播的信息。数据库的组成。答:数据库由文档、记录和字段组成。(1)文档:是按一定结构组织的相关记录和结合。(2)记录:是构成文档的基本数据单元。(3)字段:是比记录更小的单元,是组成记录的基本单元。分类语言。答:分类语言是按文献的学科属性,给予相应的分类号,用分类号来表达文献的主题概念,根据分类表中的顺序编排成分类索引,提供分类途径共检索文献使用。分类语言是运用逻辑分类原理,按文献内容的学科、专业集中文献,从知识分类的角度揭示各类文献在内容上的区别和联系。分类语言较好地体现了学科和专业的系统性。分类语言可分为体系分类语言和组配语言两种,目前国内普遍采用前者。主题语言。答:主题语言是以高度概括的语词解释文献的主题,并以此为标识组织检索系统的语言。主题语言分为标题词、元词、关键词和叙词。(1)标题词:是从自然语言中选取并经过规范化处理,表示事物概念的词、词组或短语。(2)元词:是指能够用以描述文献所论及主体的最小、最基本词汇。(3)叙词:使用能表达文献主题并经过严格规范化的词语。(4)关键词:是直接从文献的标题,文献或全文中抽选具有实质意义、能表达文献主题概念,未经规范化处理的自然词语词汇。信息检索途径。答:分类文献:是按文献内容所属的学科类别来检索文献的途径,通过分类号或类别进行检索。主题途径:是通过反应文献内容主题的词语来检索文献的途径。关键词途径:是用非规范化词语自由标引,直接取自原文中能够表达文献内容主题、起关键作用的词语。著者途径:是指按文献的作者、编者、译者的姓名或机构团体名称字顺检索文献的途径。题名途径:是指按书名、刊名或文章篇名的字顺进行检索的一种途径。号码途径:是利用文献代码、序号编排成的“号码索引”的一种途径。信息检索素养的内涵。答:信息意识:指信息在人脑中的反应即人对各种信息的自觉心里反应,反应人在信息活动中对信息的认识、态度、价值趋向和一定需求。信息知识:是指与信息有关的理论、知识和方法。信息能力:是指有效利用信息技术和信息资源获取信息、加工处理信息以及创造和交流新信息的能力。信息道德:是指在信息获取、使用、创造和传播过程中应该遵守一定的伦理规范。信息检索策略。答:分析检索课题,明确目的要求。信息检索总是按照一定的课题需要进行的,每一项检索课题都有明确的目的和具体的要求,因此在进行检索之前,首先要对检索课题进行认真而细致的分析研究,明确检索的目的和要求。因为目的不同,要求也不同,选择连锁工具、连锁方法等就有所不同。检索系统和数据库的选择。信息检索和数据库的选择主要主要考虑其所收录的学科范围、存贮年限、更新周期、标引质量、独特性、所需费用、系统性能和辅助服务等方面考虑,还要注意综合性和专业性数据库配合使用。选择检索途径、确定检索标识。所谓检索途径也就是数据库中的检索项(字段),是指从哪个角度或哪个方向入手进行检索。检索标识是指确切表达文献信息内容及外表特征使用的符号或词语,如分类号、主题词、关键词、作者姓名、期刊刊名等,检索时要求准确找出检索标识,以避免误检。编辑检索表达、调整检索策略。检索表达式是用来表达检索提问的逻辑检索表达式,有选择好的检索标识根据检索要求运用不同的运算符号进行组配,以达到较为理想的检索效果。但是实际的检索过程中,用既定的检索表达式检出的结果往往不能一次就达到满意,这就需要根据检索情况分析原因及时调整检索策略。获得原始文章。通过上述步骤的查找获得的如不是文献全文,可通过以下方式获得。(1)检索网上全文数据库。(2)利用网上出版社、杂志。(3)利用图书馆馆藏目录(馆藏联合目录)。(4)利用“网上全文传递服务”。(5)直接向著者索取。

疾病A(并发症)导致疾病B(病因学)药物A(副作用)导致疾病B(化学诱导)药物(治疗应用)治疗疾病(药物疗法)

信息检索论文2000字怎么写

论文肯定得自己写啦,给网址也没得用啊,那都是别人写好了的。专业写作发表。

信息检索技术论文 – 基于网格的面向专业内容的Web信息检索 1 引言 近年来,互联网得到了迅速的发展,网上信息资源愈来愈庞大,且信息具有量大、分散、异构等特性,因此,传统的Web信息检索工具开始暴露出它性能低下的一面,具体体现在现有的信息检索工具对用户的要求常常是找出了几千甚至上万条记录,根本无法从中再细找,或者找到的内容和要找的内容不是一个专业领域的,造成信息无效的现象。但随着人们信息意识的增强,对信息内容及信息服务的需求也在不断的演变和发展,对获取信息的专业化、实效性等方面有了新的要求。如何针对专业领域中特定的用户群为他们提供专业的、度身量造的信息服务,使用户在尽可能短的时间内有效的找到最需要的信息内容是大家普遍关注的一个问题。本文利用网格计算、集群系统、XML等技术设计了一个基于网格的面向专业内容的Web信息检索体系结构,它能将地理位置分散的、异构的信息按地区按专业内容从逻辑上进行合理的组织和管理,为用户快速、有效地获取自己所需要的信息提供了一种方法。 2 基于网格的面向专业内容的Web信息检索体系结构的设计 网格计算是近年来国际上兴起的一种重要信息技术,其目的是将网上各种资源组织在一个统一的大框架下,为解决大型复杂计算、数据服务和各种网络信息服务提供一个方便用户使用的虚拟平台,实现互联网上所有资源的全面连通,实现信息资源的全面共享。 为解决不同领域复杂科学计算与海量信息服务问题,人们以网络互连为基础构造了不同的网格,他们在体系结构,要解决的问题类型等方面各不相同,但网格计算至少需要具有三种基本功能:资源管理、任务管理、任务调度。本文设计的信息检索体系结构,围绕网格计算的基本功能及信息检索的特点,主要有以下三个层次组成:见图1 (1) 网格结点:结点是网格计算资源的提供者,本系统主要是由一系列的集群系统组成,它们在地理位置上是分布的,构成了一个分布检索群体,作为信息共享的基础结构平台。集群系统负责整个集群范围内的信息管理,维护和查询。 (2) 网格计算中间件:中间件是信息资源管理和用户任务调度、任务管理的工具。它是整个网格信息资源管理的核心部分,它根据用户的信息请求任务,在整个网格内负责信息资源的匹配、定位,实现用户任务到集群系统的映射。 (3) 网格用户层:主要为用户应用提供接口,支持用户对所需要的信息资源进行描述、创建、提交等。 图1 本系统的主要思想是在逻辑上将地理位置分散的、异构的信息划分、组建成多个集群系统,集群系统对集群内的资源进行管理和任务调度,再利用网格中间件对各集群系统进行管理,从而形成对整个网格资源的管理,并对用户的信息需求进行统一的管理和调度。这种管理模型既可以尊重各个集群系统的本地信息管理策略,又可利用中间件在全局意义上对网格信息资源进行管理。 1 集群系统的设计 由于Web信息资源数量十分庞大,用户在利用现有搜索引擎检索信息时面临一个海量数据的查询问题,往往造成在消耗巨大的通信资源后依然存在资源查不准、查不全的问题。目前基于单一系统映射的Web服务器集群系统能把若干服务器用局域网连接成一个整体,并使其从客户端看来就如同一台服务器在服务,这使得在逻辑上合并、组织地理位置分布的信息资源成为可能。因此本文首先考虑采用分布协作策略,将Web信息资源按地区按专业内容分割,一方面使信息资源数量相对缩小,便于数据的组织、管理和维护,另一方面按专业内容易于制定一个公用的XML规范,便于集群内各类信息资源的描述,从而可建立一个基于XML的面向专业内容的信息集成系统。集群系统的具体结构见图2。 集群服务器主要由接口Agent,基于专业内容的XML信息集成系统、资源服务Agent、资源发布Agent等组成。其中接口Agent根据任务提供的接口参数登记、接收、管理各种信息资源请求任务,并提供安全认证和授权。资源服务Agent根据信息资源请求任务,利用XML信息集成系统提供的数据,为用户提供实际的资源检索操作,并将检索结果信息发送给用户。资源发布Agent用于向网格中间件提供本地信息资源的逻辑数据及接口参数。 下面主要说明基于专业内容的XML信息集成系统的构造方法: XML(the eXtensible Markup Language)是 W3C于1998年宣布作为Internet上数据表示和数据交换的新标准,它是一种可以对信息进行自我描述的语言,它允许开发人员通过创建格式文件DTD(Document Type Definitions)定制标记来描述自己的数据,DTD规范是一个用来定义XML文件的语法、句法和数据结构的标准。 XML使用普通文本,因此具有跨平台的优点,XML的优点在于(1)简单、规范性:XML文档基于文本标签,有一套严谨而简洁的语法结构,便于计算机、用户理解;(2)可扩展性:用户可以自定义具有特定意义的标签,自定义的标签可以在任何组织、客户、应用之间共享;(3)自描述性:自描述性使其非常适用不同应用间的数据交换,而且这种交换是不以预先定义一组数据结构为前提,因此具有很强的开放性;(4)互操作性:XML可以把所有信息都存于文档中传输,而远程的应用程序又可以从中提取需要的信息。XML数据是不依赖于某个特定的平台的应用,因此它为基于特定专业内容的表达提供了一种极好的手段,可以作为表示专业内容的语言。 目前人们研制Web信息集成系统其基本方法可分成两类:存入仓库法(the ware-housing approach)和虚拟法(the virtual approach),可使用这两类方法利用XML在数据组织和交换方面的优越性,采用格式文件DTD和XML文档表示基于专业内容的集成模式和集成模式与资源之间的映射,建立基于XML的Web信息集成系统,其结构与获取信息的工作过程参见文献[2]。 图2 2 网格中间件的设计 图3所示的网格中间件的主要功能是(1)消除不同用户与集群系统之间数据表达的差异,使信息资源数据对用户来说是透明的;(2)管理、维护Web上分布的各集群系统,网格中间件以关系数据库方式记录所有集群系统及其所包含的专业内容的逻辑信息,对关系数据库的操作可维护集群系统的分布式逻辑,使本结构在可变性和扩充性上具有柔性;(3)接受用户的信息请求任务,能快速定位于满足要求的集群系统,通过对关系数据库的查询实现用户信息请求任务与集群系统的对应关系。 内部主要功能模块说明如下: (1) 接收Agent模块:主要用于登记、接收、管理各种信息资源请求任务,并提供安全认证和授权。 (2) 关系数据库及数据服务Agent:关系数据库记录了所有集群系统及其所包含的专业内容的逻辑信息。数据服务Agent提供集群系统对关系数据库的使用权限和对数据记录的增加、删除、检索和修改等操作。 (3) 格式转换Agent模块:提供用户信息资源请求文档与各集群系统中文档的格式转换功能。由于XML是自定义的,各用户对同一数据有不同的表示方法(对信息资源描述存在差异)由于XML文档中这种格式差异体现在与之相关的DTD/Schema上,因此经过格式转换,可使信息资源的格式对用户是透明的。 (4) XML文档分析Agent模块:提取格式转换后的XML文档中各个标签,通过查询网格中间件中的关系数据库,实现用户信息请求任务与集群系统的对应关系,并得到满足条件的集群系统的相关信息,获取各集群系统的接口参数。 (5) 发送Agent模块:将转换过的信息资源请求XML文档发送到相应的集群系统中。 其中Agent技术是解决分布式智能应用问题的关键技术,Agent是指能够自主地、连续地在一动态变化的、存在于其它系统中运行的、且不断于环境交互的实体。在系统中引入Agent可使系统具有人的特征,代表用户完成用户的任务,并能动态适应环境的变化更好地满足用户的需求,提高信息检索的能力。

我们对一个问题研究之后,如何将其展现于众人面前是一个重要的工作。在这里我们结合具体的事例,给大家介绍科研的一个重要部分枣论文的一般格式及其注意事项。当然,要写出一篇好的论文,绝不是单单这么一个简要的介绍就够了,还需自己多写、多练。 随着科学技术的发展,越来越多的学者涉及到学术论文的写作领域,那么怎样写学术论文、学术论文写作是怎样要求的、格式如何,下面就介绍一下学术论文的写作,希望能对您论文写作有所帮助。 (一)题名(Title,Topic) 1、论文格式的论文题目:(下附署名)要求准确、简练、醒目、新颖。 论文题目是一篇论文给出的涉及论文范围与水平的第一个重要信息,也是必须考虑到有助于选定关键词不达意和编制题录、索引等二次文献可以提供检索的特定实用信息。 论文题目十分重要,必须用心斟酌选定。有人描述其重要性,用了下面的一句话:论文题目是文章的一半。 对论文题目的要求是:准确得体;简短精炼;外延和内涵恰如其分;醒目。对这四方面的要求分述如下。 1.准确得体 要求论文题目能准确表达论文内容,恰当反映所研究的范围和深度。 常见毛病是:过于笼统,题不扣文。关键问题在于题目要紧扣论文内容,或论文内容民论文题目要互相匹配、紧扣,即题要扣文,文也要扣题。这是撰写论文的基本准则。 2.简短精炼 力求题目的字数要少,用词需要精选。至于多少字算是合乎要求,并无统一的硬性规定,一般希望一篇论文题目不要超出20个字,不过,不能由于一味追求字数少而影响题目对内容的恰当反映,在遇到两者确有矛盾时,宁可多用几个字也要力求表达明确。 若简短题名不足以显示论文内容或反映出属于系列研究的性质,则可利用正、副标题的方法解决,以加副标题来补充说明特定的实验材料,方法及内容等信息使标题成为既充实准确又不流于笼统和一般化。 3.外延和内涵要恰如其分 外延和内涵属于形式逻辑中的概念。所谓外延,是指一个概念所反映的每一个对象;而所谓内涵,则是指对每一个概念对象特有属性的反映。 命题时,若不考虑逻辑上有关外延和内涵的恰当运用,则有可能出现谬误,至少是不当。 4.醒目 论文题目虽然居于首先映入读者眼帘的醒目位置,但仍然存在题目是否醒目的问题,因为题目所用字句及其所表现的内容是否醒目,其产生的效果是相距甚远的。 有人对36种公开发行的医学科持期刊1987年发表的论文的部分标题,作过统计分析,从中筛选100条有错误的标题。在100条有错误的标题中,属于省略不当错误的占20%;属于介词使用不当错误的占12%)。在使用介词时产生的错误主要有: ①省略主语枣第一人称代词不达意后,没有使用介词结构,使辅助成分误为主语; ②需要使用介词时又没有使用; ③不需要使用介词结构时使用。属主事的错误的占11%;属于并列关系使用不当错误的占9%;属于用词不当、句子混乱错误的各占9%,其它类型的错误,如标题冗长、文题不符、重复、歧意等亦时有发生。 (二)作者姓名和单位(Author and department) 这一项属于论文署名问题。署名一是为了表明文责自负,二是记录作用的劳动成果,三是便于读者与作者的联系及文献检索(作者索引)。大致分为二种情形,即:单个作者论文和多作者论文。后者按署名顺序列为第一作者、第二作者厖。重要的是坚持实事求是的态度,对研究工作与论文撰写实际贡献最大的列为第一作者,贡献次之的,列为第二作者,余类推。注明作者所在单位同样是为了便于读者与作者的联系。 (三)摘要(Abstract) 论文一般应有摘要,有些为了国际交流,还有外文(多用英文)摘要。它是论文内容不加注释和评论的简短陈述。其他用是不阅读论文全文即能获得必要的信息。 摘要应包含以下内容: ①从事这一研究的目的和重要性; ②研究的主要内容,指明完成了哪些工作; ③获得的基本结论和研究成果,突出论文的新见解; ④结论或结果的意义。 论文摘要虽然要反映以上内容,但文字必须十分简炼,内容亦需充分概括,篇幅大小一般限制其字数不超过论文字数的5%。例如,对于6000字的一篇论文,其摘要一般不超出300字。 论文摘要不要列举例证,不讲研究过程,不用图表,不给化学结构式,也不要作自我评价。 撰写论文摘要的常见毛病,一是照搬论文正文中的小标题(目录)或论文结论部分的文字;二是内容不浓缩、不概括,文字篇幅过长。 (四)关键词(Key words) 关键词属于主题词中的一类。主题词除关键词外,还包含有单元词、标题词的叙词。 主题词是用来描述文献资料主题和给出检索文献资料的一种新型的情报检索语言词汇,正是由于它的出现和发展,才使得情报检索计算机化(计算机检索)成为可能。 主题词是指以概念的特性关系来区分事物,用自然语言来表达,并且具有组配功能,用以准确显示词与词之间的语义概念关系的动态性的词或词组。 关键词是标示文献关建主题内容,但未经规范处理的主题词。关键词是为了文献标引工作,从论文中选取出来,用以表示全文主要内容信息款目的单词或术语。一篇论文可选取3~8个词作为关键词。 关键词或主题词的一般选择方法是: 由作者在完成论文写作后,纵观全文,先出能表示论文主要内容的信息或词汇,这些住处或词江,可以从论文标题中去找和选,也可以从论文内容中去找和选。例如上例,关键词选用了6个,其中前三个就是从论文标题中选出的,而后三个却是从论文内容中选取出来的。后三个关键词的选取,补充了论文标题所未能表示出的主要内容信息,也提高了所涉及的概念深度。需要选出,与从标题中选出的关键词一道,组成该论文的关键词组。 关键词与主题词的运用,主要是为了适应计算机检索的需要,以及适应国际计算机联机检索的需要。一个刊物增加关键词这一项,就为该刊物提高引用率、增加知名度开辟了一个新的途径。 (五)引言(Intorduction) 引言又称前言,属于整篇论文的引论部分。其写作内容包括:研究的理由、目的、背景、前人的工作和知识空白,理论依据和实验基础,预期的结果及其在相关领域里的地位、作用和意义。 引言的文字不可冗长,内容选择不必过于分散、琐碎,措词要精炼,要吸引读者读下去。引言的篇幅大小,并无硬性的统一规定,需视整篇论文篇幅的大小及论文内容的需要来确定,长的可达700~800字或1000字左右,短的可不到100字。 (六)正文(Main body) 正文是一篇论文的本论,属于论文的主体,它占据论文的最大篇幅。论文所体现的创造性成果或新的研究结果,都将在这一部分得到充分的反映。因此,要求这一部分内容充实,论据充分、可靠,论证有力,主题明确。为了满足这一系列要求,同时也为了做到层次分明、脉络清晰,常常将正文部分人成几个大的段落。这些段落即所谓逻辑段,一个逻辑段可包含几个自然段。每一逻辑段落可冠以适当标题(分标题或小标题)。段落和划分,应视论文性质与内容而定。 编写要求 页面要求:毕业论文须用A4(210×297)标准、70克以上白纸,一律采用单面打印;毕业论文页边距按以下标准设置:上边距为30mm,下边距为25mm,左边距和右边距为25mm;装订线为10mm,页眉16mm,页脚15mm。 页眉:页眉从摘要页开始到论文最后一页,均需设置。页眉内容:浙江广播电视大学汉语言文学类本科毕业论文,居中,打印字号为5号宋体,页眉之下有一条下划线。 页脚:从论文主体部分(引言或绪论)开始,用阿拉伯数字连续编页,页码编写方法为:第×页共×页,居中,打印字号为小五号宋体。 前置部分从中文题名页起单独编页。 字体与间距:毕业论文字体为小四号宋体,字间距设置为标准字间距,行间距设置为固定值20磅。

相关百科
热门百科
首页
发表服务