全文数据库包括哪些
全文数据库即收录有原始文献全文的数据库,以期刊论文、会议论文、政府出版物、研究报告、法律条文和案例、商业信息等为主。全文数据库免去了文献标引著录等加工环节,减少了数据组织中的人为因素,因此数据更新速度快,检索结果查准率更高;同时由于直接提供全文,省去了找到原文的麻烦,因此深受用户喜爱。
本教程操作系统:windows11系统、Dell G3电脑。
全文数据库即收录有原始文献全文的数据库,以期刊论文、会议论文、政府出版物、研究报告、法律条文和案例、商业信息等为主。全文数据库免去了文献标引著录等加工环节,减少了数据组织中的人为因素,因此数据更新速度快,检索结果查准率更高;同时由于直接提供全文,省去了找到原文的麻烦,因此深受用户喜爱。全文数据库的数量扶摇直上,当前,全文数据库的数量与书目数据库的比例大约已达到2:1,而且数量仍然呈上升趋势。
数据库的结构定义,全文数据库的数据内容,全文系统中所用词表、存储空间的利用统计及调整。
分类
根据全文数据库中的信息内容呈现形式划分,全文数据库的类型主要有电子版图书、电子杂志、电子报纸等。
电子版图书一般与印刷版平行出版,并具有浏览、检索、排序、打印、套录等功能。电子图书可上网,提高了文献传输效率和文献的可获得性。电子图书的出现将改善(改变)人们的读书习惯。
电子杂志可使文献的检索同原始文献的获得结合起来。包含多期刊的全文库,可进行跨学科、跨刊种的全文检索,扩大获取资料的来源范围。由中国学术期刊(光盘版)
电子杂志社和清华同方光盘股份有限公司建设的中国学术期刊网(http://WWW.cnki.net),其中的中国期刊全文数据库收录的期刊3000多种,文献量600万余篇。
电子报纸把报纸文章和新闻报道通过数据库存储和管理,并可进行网上检索查询。《纽约时报》全文库Information Bank是这类数据库的先驱,后来被收入Mead数据中心的NEXIS系统之中。我国《人民日报》社和北京金盘电子有限公司合作发行的《人民日报全文数据库》光盘版,《中国日报》社和中国科技资料进出口总公司合作发行的《中国日报全文数据库》光盘版,是我国第一批新闻报业的全文数据库。
结构
全文数据库有多种结构形式。
一种结构是全文数据库由若干文库组成,每个文库划分为若干个文档,文档由若干信息载体组成,信息载体又细分为若干片断,片断指构成文本的自然段落,相当于字段。美国Mead数据中心的LEXIS就是这种结构。它是一个菜单驱动系统,一级菜单显示文库目录,二级菜单显示文档目录,待文库和文档选定后,系统开始接收提问。
另一种结构是全文数据库由若干个数据库组成,数据库下不设文档这一级结构,而是直接把信息载体分成字段存储。美国西部出版公司的WESTLAW就是这种结构,该系统中设有法院字段、审判员字段等,可提供多种检索手段。全文数据库结构与书目数据库相似,其主文档是以顺排形式组织的文本文件,倒排档则是对应于信息载体记录可检字段的索引文件。全文数据库记录的磁带格式一般也分头标、目次和数据部等几部分,在已有的全文数据库中,根据领域信息载体、数据库用户和设备的不同情况,采取不同的实现方法。
特点
与其他数据库相比,全文数据库有许多特点,主要表现如下。
①包含信息的原始性。库中信息基本上是未加工的原始文献,因而具有客观性。
②信息检索的彻底性。任何词、句、字皆可检索,还有可能看到某些边缘性信息。
③检索语言的自然性。可使用自然语言检索,并可使用布尔检索和位置检索,因而要涉及自然语言的理解。
④数据结构基本上是非结构化的,除了某些可规范的数据外,大量文本属于非结构化的,不便于关系数据库的处理。
⑤专业的全文数据库系统一般都采用“自动切词”技术
⑥好的全文数据库还备有知识库,可具有推理能力和联想式检索。
⑦基本上是封闭性的,数据不需更新,具有较大的稳定性。
⑧全文数据库一般占用的存储空间非常庞大,系统开销大,如何提高检索速度是一大难题。 [2]
【文章原创作者:站群服务器 http://www.558idc.com/mggfzq.html 欢迎留下您的宝贵建议】