XX医院多模态大数据一体化平台项目(一期)采购需求.docx
《XX医院多模态大数据一体化平台项目(一期)采购需求.docx》由会员分享,可在线阅读,更多相关《XX医院多模态大数据一体化平台项目(一期)采购需求.docx(34页珍藏版)》请在三一文库上搜索。
1、XX医院多模态大数据一体化平台项目(一期)采购需求一、建设背景1、健康中国建设背景2016年,中共中央、国务院印发了“健康中国2030”规划纲要,提出健康中国2030主题”共建共享、全民健康”,要求大力加强国家临床医学研究中心和协同创新网络建设,加强资源整合和数据交汇,建设临床医学数据示范中心,深化健康医疗大数据在临床和科研领域的应用.推动健康科技创新.推进医学科技进步。2、国家大数据战略背景2016年6月,国务院办公厅发布了关于促进和规范健康医疗大数据应用发展的指导意见,将健康医疗大数据纳入了国家大数据战略,体现了国家对健康医疗信息化的重视。指导意见提出,夯实健康医疗大数据应用基础,推动健康
2、医疗大数据资源共享开放;全面深化健康医疗大数据应用,推进健康医疗行业治理大数据应用和健康医疗临床和科研大数据应用,培育健康医疗大数据应用新业心、O3、先进技术发展背景近年来,大数据、人工智能、多模态数据融合等先进技术迅猛发展,如海量数据处理与存储技术、机器学习技术、NLP技术、大模型技术、以及数据融合技术等,扩展了医疗数据可用模态与维度,对医疗数据在临床、科研、运营等智慧应用中提供了新的思路和研究方法。二、建设目标一期项目建设XXXX医疗中心多模态大数据一体化平台,赋能医院学科建设和临床发展,促进高质量科研成果产出和转化,进一步提升医院高质量发展水平和全国影响力。汇聚XXXX医疗中心一院多区临
3、床、科研等业务数据,数据模态覆盖结构化数据、临床文本、影像、病理、生信等全维度、多模态数据;通过大数据和AI等先进技术,对不同模态数据进行汇集、标注、提取、处理,实现数据统一结构、统一标准、统一管控,覆盖数据采集、治理、服务和监管等全生命周期;建设湖仓一体大数据平台,在此基础上建设临床专病数据库与多模态Al科研平台,支持医院相关人员开展数据资产管理、科研数据管理、医学研究、数据分析、模型验证等活动,挖掘多模态数据价值,持续提升临床医疗质量、科研效率和科研水平,加速医疗数据治理及成果转化,带动医疗水平迈上新台阶。同时按DCNM三级标准建立医院多模态数据全生命周期管理体系。三、建设范围一期项目建设
4、范围覆盖XXXX医疗中心一院五区HISEMR,LISRISPACS、重症、手麻、科研等相关业务系统;数据模态覆盖结构化数据、临床文本数据、影像数据、病理数据、生信数据等。四、建设要求4.1整体要求(1)须根据医院信息平台建设标准以及建设目标进行整体规划设计,提供详细的设计和建设方案,并符合国家一系列医疗信息化建设标准和规范。(2)系统应满足医院湖仓一体多模态大数据平台与科研应用的总体需求。各应用系统的软、硬件设计均应考虑满足总体需求,有统一数据结构和术语体系。(3)符合现行医院体系结构、科研模式和业务流程,能够满足医院一定时期内对多模态数据治理与临床、科研、运营等工作的需求;能够提高医疗质量与
5、医学科研效率,提升医疗与科研水平。(4)系统设计需要充分考虑医院现有信息化建设情况,遵循现有以医院信息集成平台为核心的业务架构,并支持与医院信息集成平台、CDR等平台进行对接,改善医院现有架构体系,提升运行效率。(5)系统应达到国内领先的水平。系统应该具备在今后五年时间里的生存能力,并且在可持续发展性上应具有灵活扩展与升级空间;在大数据技术、AI技术选择方面,以及软件功能编制方面,均应具有一定程度的超前性和扩展性。(6)系统建设期间需要根据医院要求免费定制相关功能,以满足医院发展需要。同时平台建设满足医院国产化信创的相关要求。4.2建设依据和参考规范(1)国家卫生信息化标准基础框架(2)中国卫
6、生信息标准基础数据集(3)中国医院信息基本数据集标准(4)卫生信息数据规范指南(5)电子病历基本数据集(6)国家卫生与人口信息字典(7)卫生信息数据元目录(8)医学数据影像通信基本数据集(9)电子病历基本架构与数据标准(Io)临床检验结果共享系统互操作行规范(三)基于电子病历的医院信息平台建设技术解决方案(12)卫生综合管理信息平台建设指南(13)全国医院信息化建设标准与规范(试行)(14)医院信息平台应用功能指引(15)医院信息建设应用技术指引(试行)(16)医疗机构医疗大数据平台建设指南(征求意见稿)(17)国际疾病分类(ICD-9、ICD-10、ICD-H)(18)医学数字化影像通讯标准
7、DICOM3(19)规范化临床医学术语标准SNOMEDCT(20)观测指标标识符逻辑命名与编码系统LoINC(21)医疗卫生领域信息交换标准HL7V3(22)临床文档架构CDAR2(23)医疗信息系统集成规范IHE(24)中华人民共和国计算机信息系统安全保护条例(国务院令第147号)(25)计算机信息系统安全保护等级划分准则(GB17859-1999)(26)信息安全等级保护管理办法(公通字200743号)(27)卫生行业信息安全等级保护工作的指导意见(卫办发(2On)85号)(28)信息系统安全等级保护实施指南(GB/T25058-2010)(29)信息系统安全等级保护基本要求(GB/T22
8、239-2008)(30)信息系统等级保护安全设计技术要求(GB/T25070-2010)(31)信息系统安全等级保护测评要求(GB/T28448-2012)(32)信息安全技术网络安全等级保护测评要求(GB/T28448-2019)(33)中华人民共和国个人信息保护法4.3架构要求采用目前主流大数据架构技术体系,保证具有未来3-5年的技术先进性。使用数据湖仓一体化技术进行医院数据资源架构设计,构建医院数据资源底座。多模态大数据支撑平台进行多模态数据的统一采集和整合,采集方式包括批式、流式和接口等不同方式,采集数据类型包括结构化数据、半结构化数据、非结构化数据,并进行数据异构整合与处理,包括自
9、然语言处理、数据标化、特征提取、逻辑转换等,支持数据治理流程化、可视化、标准化等,支持数据溯源管理。湖仓一体化数据中心需支持医院基于多模态数据应用场景,满足全方位的科研数据需求;满足数据要素交易及医院临床、运营等相关数据需求。4.4基本技术要求(1)支持多层的应用架构,支持B/S、C/S架构。(2)支持基于组件的设计:用户可以根据需要按角色组合和配置组件。(3)支持跨数据库平台数据存取技术:在物理存储层,系统应该具有良好的跨数据库平台技术。(4)支持虚拟化及超融合技术:实现服务器虚拟化、存储虚拟化、网络虚拟化和桌面虚拟化等。(5)全面支持国产信创相关要求。(6)支持用户自定义配置的工作流程管理
10、提供工具和功能,根据因环境或内部流程的变化而配置产品,使之能良好适应需求的变化,持续支撑医院业务发展。(7)支持医院自定义:医院可以灵活的使用现有功能组件建立自己的应用,支持将开发的组件通过应用程序工具加入到应用。(8)支持TCP/IP协议、HTTP、HTTPS;(9)对数据库的访问支持ODBC,COM和JDBC;(10)支持XML、WebSerVice、HL7、ICD-10、SNOMEDASTM协议等国际信息交换标准;(U)支持DlCoM标准、支持UNICODE编码。(12)支持信息安全技术:医院信息化需要引入技术手段来保障信息系统的安全性,如身份认证、受限数据访问、数字签名、数据留痕、数
11、据审计、数据加密、数据脱敏等。(13)平台各项技术参数与性能要求满足DCMM3级相关要求。4.5平台要求(1)支持平台技术架构设计:实现医疗业务协同和统一管理。(2)以消息机制为技术核心。(3)通过预制的适配器能融合多种技术,如.NET、JAVAo(4)支持开发定制化的适配器。(5)能融合多种数据库,如事务性数据库ORACLE、Cache,SQLServer和分析型数据库MPP、Hive,全面支持国产信创数据库。(6)支持多种应用标准,如XML、Jsono(7)支持多种通讯协议,如TCP/IP。(8)支持WEBSERVICES。(9)提供平台性能监视器功能,能对设定的关键指标进行监控。五、技术
12、要求5.1多模态大数据平台(数据资产平台)序号功能模块技术参数要求1总体要求整合XXXX医疗中心一院五区临床、科研、运营数据,包括医院历史数据和未来产生的实时数据,形成一个数据资源覆盖全面的、实时的多模态大数据中心。支持将一院五区多源异构数据进行聚合,为保证数据中心存储数据的准确性,在将数据进入中心前,源数据将经过“抽取一转换一加载”等过程,将医院相关信息系统的历史数据及增量数据进行集成接入。通过多模态大数据平台,对医院临床、科研、运营数据进行结构化、标准化的整合治理,形成院级规范化、标准化、高质量的智能大数据中心。要求进行统一的医院数据资源架构设计,确保医院数据资源管理和使用合理,避免重复建
13、设、多头采集、数据治理不统一等问题。2数据湖与数据仓库支持建设湖仓一体化架构的医院数据资源底座,采用主流的数据湖管理平台,统一对接临床、科研、运营各类业务系统数据,进行数据的统一采集和整合。支持多种采集方式,包括但不限于批式、流式和接口等不同方式。支持各种类型数据采集,包括但不限于结构化数据、半结构化数据、非结构化数据。要求医院湖仓一体化数据中心将支撑医院未来临床、科研、运营应用层面的数据需求。原则上未来其它基于医院数据分析相关应用系统,不再直接对接原生产系统,所需数据均从数据湖中获取。支持各类临床数据内容,包括但不限于结构化临床数据、影像序歹U、病理标本、基因样本和测序原始数据,将数据进行整
14、合关联,形成数据湖。支持数据进行T+1或者实时的增量和补全。序号功能模块技术参数要求支持将数据湖中的数据资源依照OMOPCDM模型进行映射,建立患者主索引、重构相关的临床表关系、进行归一、处理无效的映射数据的关联关系、依照标准进行数据字段清洗、进行医学标准化、形成标准的医学数据仓库。支持根据医院信息,获取医院的系统信息生成数据源,可获取医院下的所有的表生成表信息;通过这些表信息可以创建HIVE表(采集表、增量溯源表、全量采集表、全量溯源表、备份采集表等)。提供选择工具,通过数据源信息,选择数据源以及数据源下的表获取该表字段,生成数据传输的语句,进行执行。支持选择数据合并、备份、复制所需的源库与
15、源表;以及目标库和目标表就可以生成合并所需要的语句,执行合并、备份、复制操作。支持选择所需要补全的表,可以向父级补全和向子级补全。支持根据mapping工作台创建项目,在项目下创建数据表进行原始数据到CDM及字典数据的转换,运行映射语句。支持进行数据推送,推送到OraCIe、CliCkhoUse、MySQL等数据库中。3数据采集与汇聚元数据采集:元数据信息文件导入和元数据信息自动采集,包括数据表结构、字段长度、字段类型等信息。数据模型维护:标准数据模型的维护,包括新增、查询、编辑模型等。采集统计:支持针对数据抽取、数据处理的情况进行统计和可视化展示,包括采集的数据量、数据合并处理的情况等。数据
16、源管理:对抽取数据源的可视化管理,可对数据源禁用、启用等操作,数据源敏感信息加密处理。采集信息管理:采集系统信息的透明化管理,包括采集的系统情况、数据表范围情况、数据表关联关系等;序号功能模块技术参数要求数据抽取配置:支持全院业务系统数据抽取,包括患者基本信息、患者就诊记录、医嘱、手术、诊断、放化疗、电子病历文本等数据;支持多种数据抽取引擎,满足多源异构的数据类型及数据库类型;支持输入、输出组件自定义配置,输入输出组件多样化,灵活应用;支持采集SQL解析功能,自动解析抽取所需元数据;支持全量/增量不同类型抽取项目配置,分类管理;支持采集优先级、采集时间、采集周期可视化配置;执行项目分类管理,抽
17、取项目可并行、串行执行配置;抽取日志记录,详细记录抽取数量,抽取执行开始、结束时间,抽取耗时,抽取执行过程日志详细展示,支持日志分析,报错告警处理。数据合并管理:支持数据合并可视化操作配置,按照不同的数据类型,执行不同的数据合并方式。数据质检:支持数据抽取质检,保证源和目标数据的一致性;支持数据合并、补全等数据处理过程环节质检。4数据深度治理数据治理是针对采集完成后的数据,进行一系列ETL转换生产下游各个应用可以使用的数据的过程o数据治理过程主要以后端任务的方式执行,配合前端一些日志、统计、配置、部署和质检功能。数据治理总览提供可视化的数据治理流程架构图,能够清晰的展示数据从数据源采集、数据治
18、理过程、到形成各类主题的全过程可视化。数据清洗支持EMPl(主索引)、数据去重、前归一、表关系重构、基础清洗、增量ID记录、自定义清洗、病人维度病例维度数据补全和CDM数据合并等数据清洗功能,序号功能模块技术参数要求支持所有任务均按照配置化的方式是实现,可以通过更改配置表的内容变更数据的治理内容,同时包含任务日志记录、异常监控、参数调优等功能支持按照任务模块详细记录数据清洗任务的维护、排错、修改流程。数据解析支持对非结构化EMR数据,如入院记录,出院记录,病程记录,首次病程记录,放疗记录,化疗记录,手术记录,死亡记录等原始数据(XML,HTML,TEXT)通过预处理,解析规则(关键字匹配,CD
19、M映射),后处理的方式解析成结构化数据的功能。数据标化支持基于数据清洗后的数据,将需要标化的数据依照SNOMEDCT标准(也支持ICD标准)进行数据标准化,形成标准数据集。5自然语言处理自然语义处理NLP支撑处理医学信息的非结构化数据(如病理、病历、检查报告等)的自然语义解析,可以通过自然语义平台自动识别解析医学信息,同时提供手动勾选不同医学信息的后结构化处理选项,支持中文分词、词性标注、句法分析、依存关系及与SNOMEDeT的映射;除此以外,自然语言处理提供了词法级、句法级、篇章级、向量级以及综合文本审核等数十个模块的文本处理能力,帮助医院为日常工作或运营降本、增效和创新。支持自定义结构化提
20、取内容,支持自定义结构化颗粒细度。支持集成可视化文本标注功能,标注人员可对直接文本进行标注。支持文本上传后,自动进行分词和断句。支持集成实体和关系模板设定的功能,满足对所需要提取的实体名和关系进行设定,具有自动化显示标注内容和实体间关系的功能。支持模型训练功能,自然语言处理模型可以通过标注好的文本数序号功能模块技术参数要求据进行主动学习和训练,使标注准确率得到提升。支持字典匹配、否定词识别、时间表达式抽取、正则表达式以及RUTA规则等。支持根据词与词之间的得分、信息牖、词频等信息来发现新词。系统训练模型功能:根据医院的数据情况,对系统中自然语言处理模型进行训练,以便自然语言处理模型能够更加精确
21、的处理医院各项临床文本数据。训练模型:包括训练预标注模型、训练日志查看等功能。其它功能:显示控制、新建项目、日志管理等功能。支持语料学习功能,建立满足后续训练和实际数据结构化处理需求的语料库,包括医学语料学习集(测试集、训练集管理)、模型管理、实体/关系库管理(添加实体、添加关系)等功能。提供至少100种文本自然语言处理模型,提供具体的模型清单,至少包括主诉现病史、个人史、婚育史、月经史、既往史、家族史、体格检查、生命体征、入院评分、专科检查、首次病程记录、病程记录、抢救记录、出院记录、临床诊断等。支持基于大模型技术的自然语言处理。6智能术语映射支持术语构建,根据自己设置的术语集规则,建立自己
22、的术语;支持术语查询、审核、设置等功能;支持国际标准临床术语SNOMEDCT(临床医学系统术语)、LOINC(观测指标标识符逻辑命名与编码系统)、MedDRA(国际医学用语词典)、ICD-IO编码(国际疾病分类TO)(国标版)的对照映射;支持建立术语映射或标化任务等任务管理功能;支持术语映射,用户可对术语映射进行手工调整;支持智能算法推荐,通过智能算法进行批量的映射,提高效率;支持术语审核,对标化人员标化的结果进行审核。支持基于大模型技术的术语智能映射。序号功能模块技术参数要求7数据质控管理对治理的全流程进行数据质控,数据质控的环节包括数据入湖、数据入仓、数据仓库内的清洗转换,以及专病库。针对
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- XX 医院 多模态大 数据 一体化 平台 项目 一期 采购 需求
