《自然语言处理技术与应用》课程标准.docx
《《自然语言处理技术与应用》课程标准.docx》由会员分享,可在线阅读,更多相关《《自然语言处理技术与应用》课程标准.docx(9页珍藏版)》请在三一文库上搜索。
1、自然语言处理技术与应用课程标准一、课程概述(一)课程性质本课程是高等职业院校人工智能专业的专业核心课之一,是该专业的一门必修课,是一门理论和实践相结合的课程。(二)课程任务本课程主要针对人工智能算法工程师、人工智能系统运维工程师、人工智能技术支持工程师、人工智能训练师、数据标注工程师等岗位开设,主要任务是培养学生在自然语言处理的需求分析、方案制定、文本数据处理、文本分类聚类算法选型、应用的能力。(三)课程设计思路本课程以高等职业院校“人工智能技术应用”专业的学生就业为导向,将教学内容与工作岗位对专业人才的知识要求与技能要求结合起来,将项目实践提升到一个较重要的位置,按照“理论一项目构建一项目实
2、施”的组织结构进行课程设计。本课程共分5个项目,分别是基础NLP、文本分类与聚类、情感分析、中文命名实体识别、机器翻译,通过5个项目系统介绍了自然语言处理的实践技术。课程在介绍自然语言处理技术应用后,重点阐述自然语言处理技术的项目开发,突出了自然语言处理技术在实际项目中的应用。在内容的编排上淡化了学科性,避免介绍过多偏深的理论,而注重自然语言处理技术在具体运用中的要点、方法和技术操作,逐层分析和自然语言处理技术进行实际项目的开发。(四)前后续课程序号前续课程名称前续课程为本课程支撑的主要能力1机器学习技术应用机器学习应用能力2深度学习技术应用深度学习技术应用能力序号后续课程名称本课程为后续课程
3、支撑的主要能力1智能语音与对话机器人智能语音对话机器人开发能力二、课程目标(一)总体目标本课程要求学习了解自然语言处理技术,培养学生具备高职人工智能技术专业所需要的自然语言处理的基本知识和技能,熟悉并能使用人工智能相关技术进行自然语言处理的相关操作,具备对人工智能技术领域出现的新技术、新思想进一步学习的能力。希望通过本课程的学习,加深对自然语言处理技术的理解,为进一步研究和从事人工智能技术实践提供良好的基础和参考。(二)具体目标1) 知识目标D了解常见的中文分词方法2) 了解TF-IDF算法思想3) 了解独热编码、Distributedrepresentation、WorCl2Vec、CIOC
4、2vec的原理4) 了解分类、聚类的方法5) 了解情感分析方法6) 了解命名实体识别的定义及过程7) 了解机器翻译方法2 .能力目标D具备文本处理、解析、向量化的能力2)具备划文本分类与聚类的能力3)具备情感分析的能力4)具备中文命名实体识别模型构建和训练的能力5)具备中英翻译模型构建和训练的能力6)具备使用yolov3定位图片中文字区域的能力7)具备使用mediapie手势检测功能的能力3 .素质目标I)培养谦虚、好学、勤于思考、认真做事的良好习惯严谨的开发流程和正确编程思路;2)培养团队协作能力相互沟通、互相帮助、共同学习、共同达到目标;3)提升自我展示能力讲述、说明、表述和回答问题;4)
5、培养自我学习能力利用书籍或网络上的资料帮助解决实际问题。三、课程内容及情境设计本课程以基础NLP、文本分类与聚类、情感分析、中文命名实体识别、机器翻译5个小项目为载体,与企业合作设计选取16个典型工作任务,根据岗位工作任务要求,确定学习任务内容;本课程采取项目驱动教学模式,以学生为主体,以任务为导向组织教学考核。项目一基础NLP单元序号第1单元项目名称基础NLP培养能力1 .具备文本预处理的能力2 .具备中文分词的能力3 .具备关键词提取的能力4 .具备文本向量化的能力项目任务知识要求技能要求学时文本预处理L了解自然语言处理的基本概念,包括应用领域和基本技术2.了解NLTK的使用方法1 .能够
6、正确使用python函数进行字符串处理2 .能够使用正则表达式进行字符串匹配3 .能够完成利用NLTK库做英文文本处理2中文文本处理与解析L了解词性标注的基本概念2. 了解常用的分词工具3. 了解常见的中文分词方法1 .能够根据样例编写基于规则方法的分词代码2 .能够使用Jieba库进行默认分词和自定义分词3 .能够掌握去除停用词的方法4 .能够掌握Jieba库进行词性标注的方法2关键词提取1 .TTF-IDF算法思想2 .了解PageRank算法思想3 .了解常见的关键词提取算法,包括有监督和无监督算法1 .能够掌握关键词提取技术;2 .掌握TFIDF算法和抽取流程3 .掌握TextRank
7、算法和抽取流程2文本向量化1. 了解文本向量化的概念与意义2. 了解独热编码、Distributedrepresentationword2Vecdoc2vec的原理3. 了解常见语料库1 .能够查找并下载相应的语料资源2 .能够使用jiebagenism等工具进行数据预处理3 .能够使用gensim的函数进行文本向量化模型训练4 .能够利用己训练的模型进行测试2教学情境项目驱动、演示、边讲边做、自学探究项目总学时16项目二文本分类与聚类单元序号第2单元项目名称文本分类与聚类培养能力1 .具备文本分类的能力2 .具备使用LDA模型的能力3 .具备文本主题分类能力4 .具备文本聚类的能力项目任务知
8、识要求技能要求学时中文垃圾邮件分类L了解NLP中的机器学习常用方法2 .了解分类器的方法,包括朴素贝叶斯、SVM.GBDT3 .了解评估方法,如精度Fl值、召回率1 .能够正确使用SklCarn库进行朴素贝叶斯模型训练与评估2 .能够使用Sklearn库进行SVM模型训练与评估3 .能够完成利用Sklearn库进行GBDT的模型训练与评估4LDA模型应用:一眼看穿邮件1 .了解LDA模型的原理2 .了解词袋模型1 .能够正确编写文本预处理代码,清洗文本中无用的信息2 .能够使用词袋模型建立语料库3 .能够基于LDA模型开发文本主题模型,提取邮件的主题4文本主题分类1 .了解Bert模型构架以及
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 自然语言处理技术与应用 自然语言 处理 技术 应用 课程标准
