《信息检索与利用第1讲信息基础知识.ppt》由会员分享,可在线阅读,更多相关《信息检索与利用第1讲信息基础知识.ppt(84页珍藏版)》请在三一文库上搜索。
1、1 信息检索与利用 第一讲第一讲 信息检索基础信息检索基础 1 2 1.1 信息、知识、情报、文献 1.2 信息源、信息源分类及识别 1.3 信息检索原理、类型、途径、方法 、语言 内容提要 2 3 vv 信息信息(information)(information) 信息论的创始人信息论的创始人香农香农:凡是在一种情况下能减:凡是在一种情况下能减 少不确定性的任何事物都叫做信息。少不确定性的任何事物都叫做信息。 控制论的创始人控制论的创始人维纳维纳认为:信息就是信息,既认为:信息就是信息,既 不是物质也不是能量,而是与物质和能量相并列的不是物质也不是能量,而是与物质和能量相并列的 三大要素之一
2、。三大要素之一。 可以被看成是物质的一种属性,是对客观世界可以被看成是物质的一种属性,是对客观世界 中各种事物的变化和特征的反应;是客观事物之间中各种事物的变化和特征的反应;是客观事物之间 相互作用和联系的表现;是客观事物经过感知或认相互作用和联系的表现;是客观事物经过感知或认 识的再现。识的再现。 1.1 信息、知识、情报、文献 3 v 知识知识(knowledge):(knowledge): 是人类认识世界的成果或结晶。 它包括经验知识和理论知识。 即:即:理性化、优化、系统化理性化、优化、系统化了的信息。了的信息。 v 情报 解决特定问题所需要的特殊知识和信息。 v 文献 记录有知识的一
3、切载体。 是传递知识和信息的工具。 4 5 信息、知识、文献之间的关系 原料载体 信息 知识 加工、提炼加工、提炼 文献 系统化系统化 信息 知识 情报 文献 5 信息的特性 客观普遍 性 依附性 可传递性 时效性 共享性 可转换性 可识别性 6 7 信息源:信息的来源,信息来源于自然 界、人类社会及人类的思维活动。 分为: 口头信息源 实物信息源 文献信息源 1.2 信息源 7 按载体形态划分 电子型、网络型 8 文献信息源的分类方法:文献信息源的分类方法: vv 按载体形态划分按载体形态划分 vv 按出版类型划分按出版类型划分 vv 按加工层次划分按加工层次划分 vv 按公开程度划分按公开
4、程度划分 1.2 信息源 9 文献信息源按照载体形态形态分为: 将所得余数取11的 补数, 得出校验位。当余数为0时, 校验位为0;余数为1时, 校验位为 10, 用罗马数字X表示。 地区号 出版社代码 书序码 校验码 国际标准书号国际标准书号 图书类代码 20 定义:有固定名称、用卷、期或年、月顺 序编号,成册的连续出版物。 特点:数量大、品种多,内容丰富,出版 周期短,内容新颖、报道速度较快,传播、 流通面十分广泛,连续性强 馆藏地:阅览室、期刊库 电子资源:中国期刊网、维普、万方、 EI、SCI、 AIAA、IEL、Springer、 Elsevier、Kluwer 科研利用率: 65%
5、, 最重要的一次文献 2) 期刊(Serial) 21 刊号 ISSNInternational Standard SInternational Standard Serial NumberNumber (国际标准刊号) 根据国际标准ISO3297制定,目的是使每一种 不同题名、不同版本的连续出版物有一个唯一代码 标识。 由设在巴黎的国际ISDS中心管理。编号以 ISSN为前缀,由8位数字组成:7位标准号+1位校验 号 如:ISSN 1005-2615(南京航空航天大学学报 ) CN(国内统一刊号) 以GB2659规定的中国国别代码“CN”为 识别标志,由报刊登记号和分类号两部分组 成,即:报
6、刊登记号+中图法分类 号 如:CN32-1429/V (南京航空航天大学 学报) 22 23 科技报告:也称技术报告、研究报告,指国家 政府部门或科研生产单位关于某项研究成果的总 结报告,或是研究过程中的阶段进展报告,是科 研工作的系统总结。 各篇单独成册, 统一编号, 由主管机构连续出版 。 特点: 内容新颖、详细、专业性强、出版及时 、传递信息快, 发行范围控制严格, 不易获取原文 。 馆藏地:外文期刊库 电子资源:特种文献数据库、国家科技文献中 心、剑桥科学文摘 CSA (NTIS) 3) 科技报告 (Sci-Tech Report) 23 NTISNational Technical
7、Information Service (美国政府科技报告 ) u 美国国家技术情报社出版的美国政府报告文摘题录数据 库,收录美国政府立项研究及开发的项目报告为主。包括项 目进展过程中所做的一些初期报告、中期报告、最终报告等 ,反映最新政府重视的项目进展。该库75的文献是科技报 告,75%的文献是美国的文献;90的文献是英文文献。 专业内容覆盖科学技术各个领域。 u AD报告 u PB报告 u DOE/DE报告 u NASA报告 24 25 AD报告 是美国国防技术信息中心(DTIC)出版 的报告,主要报道美国国防部所属的军事机 构与合同单位所完成的科研项目。 内容涉及与国防有关的各个领域,
8、如 航天航空、舰船、兵器、核能、军用电子等 38类,是目前国防科研部门使用价值和频率 最高的大宗科技文献。 美国政府科技报告 25 26 PB报告 PB报告由美国商务部国家技术情报服 务局(NTIS)报道美国政府资助的科研项 目成果。 PB报告的内容已逐步从军事科学转向 民用,内容涉及广泛,包含自然科学与工 程技术领域所有学科领域。现主要侧重于 民用工程技术、城市规划、环境污染和生 物医学方面。 美国政府科技报告 26 27 DOE报告 由美国能源部科学技术情报局( DOE/OSTI)统一编目通报。 来源主要为五大能源技术中心和十八个 大型实验室(如匹兹堡能源技术中心、巴特 尔斯维尔能源技术中
9、心等;洛斯阿拉莫斯科 学实验室、橡树岭国立实验室、诺尔斯原子 动力实验室等),其他来源还包括俄罗斯、 加拿大、以色列及欧盟诸国。 内容包括能源保护、矿物燃料、化学化 工、风能、核能、太阳能与低热、环境与安 全与地球科学等。 美国政府科技报告 27 28 NASA报告 美国国家航空宇航局出版。 内容侧重于航空和空间科学技术领域,广泛 涉及空气动力学、飞行器、生物技术、化工、冶金 、气象、天体物理、通信技术、激光、材料等。 它的主要任务在于拓展人类认识宇宙的知识 。 美国政府科技报告 28 29 定义:学术会议上宣读或交流的论文、 会议录中收集的论文或报告。 特点:内容新颖、学术性强,能反映某 专
10、业国内外最新发展水平。 馆藏地:阅览室、期刊库 电子资源:AIAA、EI、INSPEC、IEL、 ISTP、SPIE等 4)会议文献(conference paper) 29 30 定义;标准是政府职能部门制定的、要求有 关从业人员共同遵守的统一规定。 特点:有法律约束力,适用范围明确,是从 事生产、设计、管理、产品检验、商品流通、科 学研究的共同依据。 识别标准文献的主要依据有:标准级别、标 准名称、标准号、审批机构、颁布时间、实施时 间。 馆藏地:民用航空文献阅览室、期刊库 电子资源:万方(中外标准数据库)、IEL等 5) 标准文献(Standard Literature) 30 31 标
11、准分为: 国际标准(ISO) 国家标准(GB) 行业标准 企业标准 5) 标准文献 31 32 国际标准 ISO+顺序号+分册号+年份如 ISO 9592-3a-1992 5) 标准文献 标准编号(标准号)是由 标准代号+顺序号+年代号 32 中国国家标准代号 GB 强制性国家标准 如GB 19482-2004 GB/T 推荐性国家标准 如GB/T 3287-2000 GB/Z 国家标准指导性技术文件 如GB/Z 20177-2006 GJB 国家军用标准 如GJB 390A-2008 5) 标准文献 33 中国行业标准代号 HB/T 航空行业标准 如HB 9102-2008 5) 标准文献
12、34 Master Thesis 6)学位论文 Doctor Dissertation 定义:学生为获得学位而撰写的学术性研究 论文。 特点:不公开发表,一般在本单位收藏和流 通 馆藏地:明故宫图书馆民用航空阅览室 电子资源:PQDD/PQDT、国家科技文献中心、 南航博硕士论文全文数据库、中国期刊网、万方 35 1.2.4 1.2.4 按公开程度划分按公开程度划分 白色文献源: 公开出版的,通过正式渠道发行 、流通的出版物。包括图书、报纸、期刊等。 灰色文献源: 非公开出版的,通过非正式渠道 发行、流通的文献。包括学位论文、技术报告等。 黑色文献源: 人们未破译、未辨识或不愿公开 的文献。包
13、括个人日记、私人信件、内部档案等。 36 文献信息源的分类文献信息源的分类 v 文献所依附的载体 v 文献信息加工的深度 v 文献的出版发行类型 v 文献内容的公开程度 37 参考文献行文基本格式参考文献行文基本格式 作者作者. . 论文题目论文题目/ /书名书名 文献类型文献类型. . 论文出论文出 处处, , 年代年代, ,卷、期卷、期( (出版社,出版年出版社,出版年): ): 起止页码起止页码 (见例1、例2、例3、例4、例5、例6、例7) 1.2.5 1.2.5 文文献信息源识别献信息源识别 38 例1 图书(有文献类型标识符) Bandat J, Piersiol A. Rando
14、m data, analysis and measurement procedures M. USA: New York: John Wiley 判断其在分类法中属于哪一大类,然后再从大类一级一级往下 寻找,直到查到具体类目为止,记下分类号。 根据查到的分类号在检索工具(OPAC)中检索,便可查得该 类文献若干种,选择需要的那种,记下该种文献的索书号和馆藏地,至 实地取原始文献。 方法二:利用中国分类主题词表 http:/ 获得 所需文献的分类号,然后步骤同 方法三: 选择你所熟悉的一种文献,在检索工具(OPAC)中检索,获 得该种文献的分类号。然后步骤同 注:前提之一,该学科已经被分类法收录
15、;前提之二,OPAC中该 类文献多种,而你正好知晓其中之一。 76 主题检索语言是一种以自然语言中的词语或经过人工 规范后的词语作为揭示文献主题(主题指文献所具体论述 的对象和研究的问题)的标识,并以此标识组织文献和检 索文献的检索语言。标识之间按字顺排列。 主题检索语言提供了一种直接面向具体对象、事实或 概念的信息组织方法和信息检索途径。 其具体表现是主题法,主要有以下四种类型: u标题词法/标题法 u叙词法 u关键词法 u自然语言法 主题语言(内容特征) 3 77 u 标题词法:是主题法系统中最早出现的一种,以标题 词作为文献主题内容的标识和检索标识。标题词是经过 规范化处理的名词术语(包
16、括词和短语)。 u 例如:飞机:plane、airplane、aeroplane、aircraft 用aircraft来表示所有“飞机”概念,以此作为规范词. 使用aircraft一词的检索结果将包括全部有飞机概念的文 献。 u 标题词法的主要特征是事先编表,标题词以固定的 组合方式组织在主题表中,形成标题,检索按既定组配 执行。 u 美国国会图书馆标题表(LCSH) 主题语言(内容特征) 3 78 主题语言(内容特征) u叙词法,是将自然语言的词语概念,经过规范化和优选处理(叙 词),通过概念组配来标识文献主题的方法。 u叙词法综合了多种信息检索语言的原理和方法,如单元词语言的 单词组配原理
17、、标题词语言的词汇规范和参照系统、分类语言知识分类 的方法,并创新。是应用较广的一种主题检索语言。概念组配是决定其 特性的基本原理。 u叙词表,叙词的结合。一般由字顺表和辅助表组成。 u通常使用的叙词表有: 国内中国分类主题词表 http:/ 英国科学文摘使用的INSPEC Thesaurus, 美国工程索引使用的Ei Thesaurus等。 运输飞机设计 运输飞机设计 运输飞机飞机设计 3 79 80 81 EI(Thesaurus) 82 u 关键词法:关键词是从文献标题、文摘或正 文中抽出,具有实质意义,能够表达文献主题内 容的重要的关键性的词语。关键词可直接用于文 献标引。使用关键词对文献进行描述、建立主题 检索系统的方法即关键词法。 u 关键词法应用广泛。各种各样的搜索引擎、 数据库大多采用关键词法组织信息资源。 主题语言(内容特征) 3 83 u 自然语言法:是不进行标引,直接利用 计算机的功能,通过自然语言中的词汇或 词组组配对文本形式的信息资源进行匹配 检索的方法。 u 自然语言法发展:自由文本检索全 文本检索超文本检索超媒体检索 主题语言(内容特征) 3 84
链接地址:https://www.31doc.com/p-3242216.html