科学知识图谱讲座软件操作.ppt
《科学知识图谱讲座软件操作.ppt》由会员分享,可在线阅读,更多相关《科学知识图谱讲座软件操作.ppt(55页珍藏版)》请在三一文库上搜索。
1、科学知识图谱方法与应用 绘制图谱的主要软件操作 侯海燕 博士 大连理工大学人文社会科学学院 科技伦理与科技管理研究中心 网络-科学-信息-经济计量实验室WISE LAB 2009年9月12日,讲座提纲,科学知识图谱的主要研究方法 科学知识图谱的主要数据来源 科学知识图谱的主要应用软件 绘制图谱的软件操作演示,科学知识图谱的主要研究方法 Methods,共引分析 Co-citation analysis Journal co-citation analysis (JCA) 期刊共引分析 Author co-citation analysis (ACA) 作者共引分析 Document co-ci
2、tation analysis (DCA) 文献共引分析 共词分析 Co-word analysis 关键词共词分析Co-word analysis of keywords 主题词共词分析Co-word analysis of title words 多元统计分析方法 因子分析(主成分分析)factor analysis PCA 多维尺度分析MDS-multidimensional scaling 聚类分析Cluster analysis 词频分析方法 Frequency analysis of words 社会网络分析方法 Social network analysis,科学知识图谱的主要数
3、据来源 Data,主要数据来源:Web of Science 科学文献数据: 科学引文索引数据库(SCI) 社会科学引文索引数据库(SSCI) 专利文献数据:德温特创新索引Derwent Innovations Index 国际会议文献数据:Conference Proceedings Citation Index - Science (CPCI-S) 分析的基本数据单元: 作者 author 标题 title 关键词 keywords 摘要 Abstract 引文 cited references(被引作者、被引期刊、被引文献) 作者地址(机构合作、国家合作),应用的主要软件Software
4、 共引分析、共词分析软件,Bibexcel http:/www.umu.se/inforsk/Bibexcel/ - a free-ware on-line developed by Olle Persson bibliometrics citation analysis co-citation analysis bibliographic coupling cluster analysis,SPSS 多元统计分析及可视化软件 Correlation analysis, PCA(factor analysis), MDS, cluster analysis Wordsmith Tools 词频
5、分析软件 Frequency analysis of words,应用的主要软件Software,科学计量学主要的分支学科及其代表人物 图3-1 科学计量学学科结构知识图谱,1978-2004,科学计量学在亲本学科科学学中的位置,科学计量学与相邻学科关系 图3-4 科学计量学与相邻学科关系知识图谱,科学计量学主流研究领域知识图谱,1978-2004,科学计量学研究领域的演变 图4-8 1978-1986年科学计量学主流研究领域知识图谱,科学计量学研究领域的演变 图4-10 1987-1995年科学计量学主流研究领域知识图谱,科学计量学研究领域的演变 图4-12 1996-2004年科学计量学前
6、沿研究领域知识图谱,Pajek Social network analysis UCINET Social network analysis,应用的主要软件Software 社会网络分析软件、可视化软件,UCINET,最流行的社会网分析软件,其中包括一维与二维数据分析的NetDraw,同时集成了Pajek用于大型网络分析的免费应用软件程序。 http:/ 不同的社会网软件的文件都具有自己的格式,但是也可以自由转换。譬如,利用UCINET软件可以读取文本文件、KrackPlot、Pajek、Negopy、VNA等格式的文件。,Pajek,Pajek (Program Analysis for L
7、arge Network),由卢布尔雅那大学的Vladimir Batagelj 和Andrej Mrvar于1997年1月15日正式发布0.1版,是一项基于Windows的免费社会科学软件,主要用于社会网络分析,特点是可视化。 该软件可以提供非商业应用的免费下载,下载网址: http:/vlado.fmf.uni-lj.si/pub/networks/pajek/ CreatPajek可以把excel格式的文件转换为Pajek格式的软件。,科学计量学合作网络知识图谱,1978-2004,科学计量学合作网络结构的演变 图5-4 科学计量学合作网络的微观结构图谱,1978-1986,科学计量学合
8、作网络结构的演变 图5-5 科学计量学合作网络的微观结构图谱,1987-1995,科学计量学合作网络结构的演变 图5-6 科学计量学合作网络的微观结构图谱,1996-2004,应用的主要软件Software 多视角共引分析可视化软件,citespace - a free-ware on-line developed by Chaomei Chen 1、通过引文网络分析,找出学科领域演化的关键路径 2、找出学科领域演化的关键点文献(知识拐点) 3、分析学科前沿热点 4、探测学科知识基础,文献共引图谱,国际纳米研究领域的主要期刊分布图谱,物理期刊,化学期刊、纳米期刊、及其他,期刊共引图谱,物理期刊
9、,化学期刊、纳米期刊、及其他,期刊共引图谱,期刊共引图谱,作者共引图谱,作者合作网络图谱,2纳米粒子,1纳米薄膜、纳米晶体、纳米线、纳米结构、碳纳米管,4 纳米管吸附、纳米硅,6纳米棒阵列、氧化锌纳米线,3光谱分析、纳米金、纳米簇,5 纳米复合材料、纳米输运、纳米器件、纳米技术、纳米场效应晶体管,7碳纳米管场发射机理,8纳米传感器、蛋白质纳米技术,图9 国际纳米研究热点知识图谱,共词图谱,2纳米粒子,1纳米薄膜、纳米晶体、纳米线、纳米结构、碳纳米管,4 纳米管吸附、纳米硅,6纳米棒阵列、氧化锌纳米线,3光谱分析、纳米金、纳米簇,5 纳米复合材料、纳米输运、纳米器件、 纳米技术、纳米场效应晶体管
10、,7碳纳米管场发射机理,图9 国际纳米研究热点知识图谱,8纳米传感器、蛋白质纳米技术,共词图谱,CiteSpace 软件介绍,学科领域图谱,The CiteSpace Homepage http:/cluster.cis.drexel.edu/cchen/citespace,CiteSpace 始开发于2004年9月13日,于2007年3月20日最近更新(CiteSpace2.0.11b) 由美国德雷克塞尔大学(费城)信息科学与技术学院(The College of Information Science and Technology, Drexel University)Chaomei Ch
11、en教授研究开发。,Chaomei Chen教授研究的Information Visualization CiteSpace是近几年来在全美信息分析中最具有特色和影响力的可视化信息软件。 从2000年至今,在这一研究领域中Chaomei Chen 教授发表了研究论文65篇,出版了6部研究专著。现担任美国Information Visualization期刊的总编。,CiteSpace是Java的应用程序,可免费获得使用。 http:/cluster.cis.drexel.edu/cchen/citespace/download.html 它要求JRE1.4.2或是更高的版本作为运行环境。尽管C
12、iteSpace能够通过 PubMed 或者大量的网络服务获取额外的信息,但是互联网对CiteSpace而言并不是必须的。,citespace输入的数据文件应该是ISI输出的格式,即从web of science下载的格式。 citespace带有一个数据转换器,可以将从网络上保存的数据进行转换。,软件运行之前的基本步骤: 1.为citespace准备数据。将数据文件放在一个文件夹。每个数据文件名必须以“download”开头,并以“.txt”结尾,例如“download-mass-extinction-2006.txt” 2.开始用citespace创建一个新的项目之前,你需要具体制定两个路
13、径,一个是数据存储路径,一个是项目存储路径,在项目存储路径可以找到你保存的图谱和输出文件。 3.根据相应的时间分段调整time slicing 。 4.按“GO”按钮,你就会看到软件处于运行状态,当运行过程结束的时候你会发现弹出一个新的窗口。,CiteSpace相关名词术语,Thresholds selection criteria used by CiteSpace items must have measures above threshold values to be included in modeling and visualization processes. Time slici
14、ng a divide-and-conquer strategy that divides a period of time into a series of smaller windows. Betweenness centrality a metric of a node in a network that measures how likely an arbitrary shortest path in the network will go through the node. Burst terms single or multi-word phrases extracted from
15、 the title, abstract, or other fields of a bibliographic record and the frequency of the term bursts, i.e. sharply increases, over a period of time. Citation an instance that a publication references to another publication.,Co-authors authors who appear in the author field of the same bibliographic
16、record. Co-citation an instance in which two items, such as authors, documents, or journals, that are cited by a publication. Time-zone view a restricted view in which the movement of nodes is limited to vertical time zones corresponding to the time of their publication. Turning points nodes of high
17、 betweenness centralities ( 1.00). Such nodes tend to be critical in network transitions from one time slice to another. Cluster view a network is visualized in a modified spring-embedder node placement algorithm. Pathfinder network scaling a network scaling algorithm that removes links that violate
18、 triangle inequality conditions so as to simplify a network by retaining salient links and paths only.,CiteSpace的简要操作步骤,1.Access/Obtain CiteSpace and how to run 获取和运行 The CiteSpace Homepage http:/cluster.cis.drexel.edu/cchen/citespace 两种方法运行citespace a. Use Java WebStart directly 通过网络直接启动 b. 下载cites
19、pace.jar文件(网页download) 方法a:能保证始终用到最新版本,且运行速度快,2. Prepare Bibliographic Data Files 准备文献数据 从web of science 检索和保存数据方法: a. Make a general search in Web of Science b. Mark all search results c. Save the records, including Cited References, in field tagged format. d. Name your files as download*.txt E.g.
20、downloadScience1999a.txt, download2004.txt e. Save all data files in a folder on your computer.,3. What information in bibliographic data is used by CiteSpace?CiteSpace 使用下载数据的那些信息? A: Authors 作者 B: Title, Descriptors, Identifiers, Abstract 题目、主题词、关键词、摘要 C: Cited References 引用的参考文献 D: Times Cited 引用
21、次数 E: Year of Publication 发表年份,BLAZER DG, 1994, AM J PSYCHIAT, V151, P979 EATON L, 2001, NY TIMES 1116, A1 FOTHERGILL A, 1999, DISASTERS, V23, P156 FULLERTON CS, 1999, AVIAT SPACE ENVIR MD, V70, P902 GINEXI EM, 2000, AM J COMMUN PSYCHOL, V28, P495 GOENJIAN AK, 2001, AM J PSYCHIAT, V158, P788 GREEN B
22、L, 1990, J APPL SOC PSYCHOL, V20, P1033 HANSON RF, 1995, J CONSULT CLIN PSYCH, V63, P987 HARVEY AG, 1999, J CONSULT CLIN PSYCH, V67, P985 KAWACHI I, 2001, J URBAN HEALTH, V78, P458 KESSLER RC, 1995, ARCH GEN PSYCHIAT, V52, P1048 KILPATRICK DG, 1987, CRIME DELINQUENCY, V33, P479 MADAKASIRA S, 1987, J
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 科学知识 图谱 讲座 软件 操作
链接地址:https://www.31doc.com/p-3224202.html