《大数据ETL》课程标准(含课程思政).docx
《《大数据ETL》课程标准(含课程思政).docx》由会员分享,可在线阅读,更多相关《《大数据ETL》课程标准(含课程思政).docx(19页珍藏版)》请在三一文库上搜索。
1、大数据ETL课程标准课程代码21921039XQ适用专业大数据技术专业适用学制5年一贯制(5+2贯通培养)编制人审核人版本号202302一、课程名称大数据ETLo二、适用专业大数据技术专业。三、课程学时与学分72学时,4学分。四、课程性质本课程是大数据技术专业的一门专业核心课程,是从事数据采集工程师、ETL工程师、数据仓库工程师等岗位必须学习的课程,将为后续学习大数据集群运维监控、大数据集群运行问题排查、调优、数据仓库建设等课程奠定基础。本课程开设在第8学期,学习该课程之前需具备一定的SQL编程、数据采集、数据处理、数据分析能力,互联网数据采集、大数据组件安装部署、数据清洗与预处理是该课程的前
2、导课程。本课程学习的知识和技能可以为第9、10学期考取大数据分析与应用X证书(初级)、华为HClA-BigData大数据认证证书做知识和技能准备。五、课程目标通过本课程的学习,能完成医疗数据中台数据汇总任务、商务机构交易数据汇总任务、汽车制造行业供应链数据汇总任务、传统生产系统数字化转型数据仓库数据建设任务、能源行业数字化转型数据仓库数据建设任务,达到以下具体目标:(一)素养目标1 .培养学生的政治思维、政治洞察力与政治敏感性,培养学生的社会主义核心价值观、爱国主义情操。(培养规格1)2 .能够熟练掌握与本专业从事职业活动相关的国家法律、行业规定,掌握信息数据安全、网络安全防护、质量管理等相关
3、知识与技能,了解大数据、网络信息等产业文化,遵守职业道德准则和行为规范,具备社会责任感和担当精神。(培养规格2)3 .具备大数据思维,具备较强的逻辑思维能力。(培养规格5)4 .关心国内外科技发展趋势,具备使用大数据技术服务于社会的意识,具备良好的自我管理能力,拥有较为清晰的职业与人生目标以及较好的职业生涯规划能力。(培养规格4)5 .具备自学能力,能适应大数据行业的不断变革发展,具备解决实际问题、持续学习的能力,能从事实际的数据采集工作,具有较强的规划观念、精益求精意识。(培养规格5)(二)知识目标1.掌握不同类型的数据库接口操作方法。(培养规格12)6 .熟练掌握至少一门脚本语言(SQL/
4、Python/SheIl等)。(培养规格12)7 .掌握常见的数据清洗方法、数据转换策略。(培养规格13)8 .熟悉SqoOp、Hive、SPark等大数据组件的使用方法。(培养规格5)9 .了解数据仓库设计方法。(培养规格5)10 熟悉Kettle等ETL工具的使用方法与常见技术问题的解决方法。(培养规格18)11 了解数据采集与处理中的法律与政策规范、主流行业的数据标准规范。(培养规格6)(三)能力目标1 .能够基于数据仓库设计规范和数据源系统制定ETL策略,使用ETL工具将业务数据导入数据仓库。(培养规格18,培养规格23)2 .能够使用脚本语言(SQL/Python/Shell等)操作
5、数据,完成数据清洗与处理。(培养规格18)3 .能够使用SqoopHiveSPark等组件,完成数据转换,将数据转换结果装载至目标数据仓库。(培养规格18)4 .能够使用Kettle等ETL工具进行工作流控制。(培养规格18)5 .能够对输出数据质量进行核验,对不符合要求的数据进行纠偏。(培养规格18)6 .能够基于数据仓库提供面向业务的报表、封装数据提取接口。(培养规格12)7 .具备大数据分析与应用X证书(初级)、华为HClABigData大数据认证证书的能力。(培养规格18)六、课程内容与要求本课程以不同行业的数据仓库ETL任务为载体,坚持立德树人的根本要求,结合学生学习特点,遵循职业教
6、育人才培养规律,有机融入思想政治教育内容,落实课程思政要求,紧密联系工作实际,突出应用性和实践性,注重学生职业能力和可持续发展能力的培养。合理设计:学习单元、能力点、学习内容与要求。本课程按照行业类型,知识点覆盖范围从小到大、技能点从单一到综合的规律确定学习模块内容,合理序化教学内容。学习单元1、2、3、4、5分别涉及健康医疗行业、商务行业、汽车制造业、传统生产行业、能源(石化)行业,在知识体系上是并列关系,在难易度上,1、2、3属于基础ETL任务,4、5为进阶ETL任务,涉及数据仓库的内容。表1课程内容与要求序号学习单元能力点学习内容与要求学习成果建议学时1医疗数据中台数据汇总1 .能够对接
7、医疗业务系统数据接口,参与制定ETL策略,使用ETL工具将业务数据导入数据仓库。2 .能够编写脚本操作数据,完成医疗数据清洗与处理。3 .能够使用Kettle等ETL工具进行工作流控制。4 .能够使用Sqoop组件完成数据转换,将数据转换结果装载至目标数据仓库。5 .能对输出数据质量进行核验,对不符合要求的数据进行纠偏。1. 了解医疗机构的多源异构数据,包括医院信息系统数据、电子病历数据、公共卫生信息数据、移动医疗健康监测数据等,了解医疗数据的结构化和标准化规范。2. 了解医疗机构的医疗数据指标体系,了解医疗业务数据系统接口,理解数据指标与原始数据的映射关系。3. 了解医疗领域不同数1 .医疗
8、多元异构数据分析报告1份。2 .医疗大数据平台基础数据1份。16据源的存储方式(如关系型数据库,文本,非关系型数据库等)。4 .熟悉医疗数据源的特点,掌握使用Sqoop等工具完成医疗数据源的抽取的方法。5 .掌握通过SQL语句、Python脚本等方法清洗,处理数据的方法。6 .了解通过双人录入规则实现数据质量稽核的方法。2商务机构交易数据汇总1 .能够对接商务机构上游数据接口,参与制定ETL策略,使用ETL工具将业务数据导入数据仓库。2 .能够编写SQL/Python/Shell脚本操作数据,完成商务机构交易数据的清洗与处理。3 .能够使用Kettle等ETL工具进行工作流控制。4 .能够使用
9、Sqoop等组件,完成数据转换,将数据转换结果装载至目标数据仓库。5 .能对输出数据质量进行核验,对不符合要求的数据进行纠偏。L了解商务机构的交易数据,交易数据的含义、特点与意义。2 .了解商务机构交易数据来源如用户数据、供应商数据、订单数据、销售数据等。3 .掌握商务机构数据平台的数据治理体系,了解数据质量现状。4 .了解商务机构交易数据仓库的指标体系,理解数据指标与元数据的映射关系。5 .掌握通过SqoopKettleFlume等ETL工具进行数据抽取,转1.商务机构交易数据源分析报告1份。2.数据源ETL策略报告1份。3.商务机构交易数据仓库基础数据1份。12换,加载的方法。6 .掌握从
10、商务机构交易数据系统中抽取数据的方法。7 .掌握通过SQL语句、Python脚本等方法清洗、处理数据的方法。8 .根据数据治理规范,学习编写SQL语句、Python脚本程序,使用ETL工具对数据进行清洗和转换,实现数据质量稽核。9 .了解商务机构交易数据分析的业务需求和数据仓库设计规范。3汽车制造行业供应链数据汇总1 .能够对接汽车制造行业供应链系统数据接口,参与制定ETL策略,使用ETL工具将业务数据导入数据仓库。2 .能够编写SQL/Python/Shell脚本操作数据,完成汽车制造行业供应链数据清洗与处理。3 .能够使用Kettle等ETL工具进行工作流控制。4 .能够使用SqoopHi
11、veSpark等组件,完成数据转换,将数据转换结果装载至目标数据仓库。5.能对输出数据质量进行核验,对不符合要求的数据进1 .了解汽车制造行业的供应链的涵义。2 .理解并掌握生产物料、产品生产、产品订单、供应商管理、产品物流、财务合同、产品等供应链环节的业务系统数据特点。3 .针对多个供应链环节的业务系统类型和数据特点,选择合适的ETL工具,并制定相应的ETL策略。4 .了解供应链数据治理1.汽车制造行业供应链数据解析报告1份。2.汽车制造行业数据中台基础数据1份。16纠偏。5.能够参与汽车制造行业数据仓库ETL流程优化,解决ETL相关技术问题。的目标和规范。5 .掌握供应链数据中台的数据指标
12、体系。6 .掌握使用Kettle等ETL工具抽取业务系统数据源,导入到数据平台的方法。7 .掌握通过SQL语句、Python脚本等方法清洗,处理数据的方法。8 .了解在数据加载和转换过程中,完成简单的数据清洗任务(如数据填补、重复数据检测等)的方法。4传统生产系统数字化转型数据仓库数据建设1 .能够对接生产系统的数据接口,参与制定ETL策略,使用ETL工具将生产数据导入数据仓库。2 .能够编写SQL/Python/Shell脚本操作数据,完成生产数据的清洗与处理。3 .能够使用Kettle等ETL工具进行工作流控制。4 .能够使用SqoopHiveSpark等组件,完成数据转换,将数据转换结果
13、装载至目标数据仓库。5 .能够基于数据仓库提供面向业务的报表、封装数据提取接1. 了解传统生产系统(如MES)的工作流程、存储数据的特点。2. 了解传统生产系统的数字化转型需求和目林。3. 了解基于传统上产系统的数据仓库设计方法。4. 熟悉生产系统数据仓库的数据指标体系,数据字段含义。5. 掌握通过SqoopKettleFlume等ETL工具进行数据抽取,转L数据仓库选型、数据模型设计报告I份。2.基于生产系统的数据仓库贴源层基础数据1份。12口。6.能对输出数据质量进行核验,对不符合要求的数据进行纠偏。换,加载的方法。6 .掌握通过SQL语句、Python脚本等方法清洗,处理数据的方法。7
14、了解数据仓库数据模型设计规范。8 .掌握编写脚本程序完成数据仓库指标计算的方法。9 .了解通过双人录入规则实现数据质量稽核的方法。5能源行业数字化转型数据仓库数据建设1 .能够对接能源业务系统的数据接口,参与制定ETL策略,使用ETL工具将生产数据导入数据仓库。2 .能够编写SQL/Python/Shell脚本操作数据,完成能源系统数据的清洗与处理。3 .能够使用Kettle等ETL工具进行工作流控制。4 .能够使用Sqoop、HiVe、SPark等组件,完成数据转换,将数据转换结果装载至目标数据仓库。5 .能够基于数据仓库提供面向业务的报表、封装数据提取接口。6 .能够对数据仓库有关数据问
15、题进行监控并提供解决方案建1. 了解能源行业(如石化)的数字化转型需求和目标,理解能源行业业务系统存在的问题如数据孤岛等。2. 了解能源企业的生产过程,包括原料采集、产品化验、工艺运行(如脱硫)、生产控制、生产设备维护等环节。3. 了解能源企业生产过程的业务系统,掌握数据特点。4. 了解能源行业数据平台数据仓库的设计与构建方法。5. 熟悉能源行业数据仓库的数据指标体系。1.能源行业业务系统数据分析报告1份。2.数据仓库选型、数据模型设计策略1份。16议。7.能对输出数据质量进行核验,对不符合要求的数据进行纠偏。6 .掌握通过SqOop、Kettle、Flume等ETL工具进行数据抽取,转换,加
16、载的方法。7 .掌握通过SQL语句、Python脚本等方法清洗,处理数据的方法。8 .了解数据仓库数据模型设计规范。9 .掌握编写脚本程序完成数据仓库指标计算的方法。10 .了解使用编程工具完成数据稽核任务的方法。七、课程实施(一)师资队伍1、专任教师职业能力:具备优秀的专业课教学开展与组织能力,掌握大数据组件安装部署、Python编程能力、SQL编程能力、ETL工具操作使用能力,能够以情境任务要求搭建数据仓库,完成ETL过程。知识结构:了解ETL工程师、数据仓库工程师的各项职业岗位要求;在专业领域中,具备数据采集、数据仓库等较为深入的专业知识背景。资质:具备中职学校专业课任教资格和企业实践经
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 大数据ETL 数据 ETL 课程标准 课程
