《自然语言处理技术》——实训1 配置NLP环境.docx
《《自然语言处理技术》——实训1 配置NLP环境.docx》由会员分享,可在线阅读,更多相关《《自然语言处理技术》——实训1 配置NLP环境.docx(19页珍藏版)》请在三一文库上搜索。
1、目录项目I迸入自然语言处理世界1可.fNLP11 实训目标12 实训环境13 实训说明I4 实训步骤24.1 安装Pyihon环境24.2 安装NLP相关年104.3 下找数据集154.4 测试环境配置是否成功155 实训小结15项目1进入自然语言处理世界配置NLP环境1实训目标(1) 能覆安装Pylhon环境.(2) 健弊安装NLP相关库.(3) 能够下教数据集.(4) ffe筋测试环境配词是否成功,2实训环境环境Kt*说明WindowsIOM电脑掾作系统Pylhun3.&SPythonift皆版本pandas1.3.0主要用于数箱读取、清洗等操作NmPy1.21.6主宴川十PyIhOn中的
2、数值计算jicha0.42.1主要用干文本分词Gensim4.2.0主要用于检索文本、计算文本相似度、加族词向术、建模主题殍Maiploilib3.3.0主要用于数IK可视化PuddIePaddIc2.4.2足个深度学习板架.搬供了高效的计口板架和优化算法PaAiIeSpcixh1.2.0主要用于语音和音领中的各种关Bt任务的开发Scikit-Icam1.0.2广泛地用于统计分析和机器学习建模等数据科学戳域LibrOKIEa用分析版的许然他号.足一个季常强大的Pyihon语音仙号处理的第三方保NLTK35是一个常用的自然i*处理工具包,可用于文本处理、好义分析.同性标注等SciPy1.73是一
3、个科学计算工具包,可用于数学、科学.工程学等领域PynSX32.9.0主要用于将文本转换成语者3实训说明自然语言处理(NLP)是指利用计算也对自然语言的形、书、义等信息进行处理,即对字、闻、句、笈章的输入、1出、识别、分析、理解、生成等进行操作和加工的过程.NLP是计算机科学领域以及人工智能领域的一个无要的研究方向,是一门融语言学、计修机科学、数学、统计学于一体的科学.NLP的具体表现形式包括机满翻译、文本摘要、文本分类、文本校对、信息抽取、语音合成、语音识别等,诳入自然语言处理世界前需要配汽NLP环境。4实训步骤4.1 安装Python环境安装Atiaconda的基本步暇如下。卜或Anaco
4、nda安装包,由于AnaConda官网网站不提供历史版本,所以需要通过官方镜像或国内镜像源进行下教,本顶口将安装2020.07版本的AnaCOnda.此处将通过清华镜像源下软AnaConda安装包,即打开清华大学TUNA网站,并电击“开源镜像站”图标,如在镜像列表中找到“anaconda”选项,并单击进入.如图1-2所示.,O20233282036VSCoSumO20236281501EgI3dobc-fort5202382822:30Wm2O23O2909:29JrUlanCUQ2023052905:59411thcO202332911:2035p-*vcrtN20236291106JPAC
5、he202362911:35rchQ202362910:44MCnuQ3OS2913:23archinu11Q2O23OS29O923rchir三xr202382914:13aW)Un20230S29048图1-2找到-anaconda并单击进入在anaconda列表中,单击warchive/进入Anaconda历史版本页面,如图1-3所示,*用3开EmlM04vwnKOQMMKOCAtf。Indexofnacod1UMU20116K8”raAA0Arcftv/22I-MUSX7:15mm”八e*1rUcM/22J-MMW:W6:11MlM3c.t*n?217l271:?Sl1-3查看AnaC
6、onda历史版本在archive列表中,找到“AnaCOn由32O2O07”开头的文件,选拜与自己计分机对应的操作系统版本,并进行卜佛本项目以Windows操作系统为例,iAnaconda3-2020.07-Windows-x86_64.exe即可进行下敦,如图1-4所示,:g32eZ,lVHnc0c64k.290.4HlB23M9225M*c2432eZ.07lMH%,%h5S.1WB2920-07240:25Ancoftfla32e2.eyH*c(6.64.p2:25An*coG322.e7.MlMo*S6.x397.3KlB2e-07242:25A11corM3-2920.07windo
7、wsM64.tie而5RlB22-7-2492:26图14选择对应版本下我AnaConda安装包下载完成后,双击已下栽好的安装包,单击“Nexi”按钮,如图15所示。OAnACOnda32020.07(645)SetupWdmetoknanda3202007QZO0z(64-bit)SetupSetupMlguideyouthrouhtheCStafotmofAnaconto32020.07(6brt).it6recommendedthatyoudoselotherppk0o11sbeforeStAftrtgSetup.TheWimakeitPoefibietoupdaterelevantsy
8、stemIfcswthouthamgtorebootyourccxxer.SckNexttocontinue.图1-5单击“Next”按钮单击“lAgm”按钮,同意相关协议并进入下一步,如图1-6所示.OAnacoda32020.07(64-bit)SetupOANACONDALiceraeAonsonentPleasereviewNkensetermsbeforertfenAndCOnda32020.07(Mt).PressPaeDowitoseetherestoftheagreement.ErxlUserUcemeAgreenent-AnKOnddIfdrvdalEdtwCopyrK2O1
9、S2O2O,Andcondd4Inc.AlEhtSreservedunderthe3*dauseBSDLicense:ThsEndUserlicenseAgreement(the,AgreementTt$agagreemntbetweenyouardAnacondafInc.CAndcondaTandQOVefnSyouruseofAnacondandvddEdition(*dweformerlykn*n&sAnacondaOstnbutxxi).IfyouaccepttetermsoftheagreementdkkIAgreetocontinue.YoumustaccepttheAgreem
10、enttoratalAnaconda32020.07(64it).AncndalInc.w,Yl-it11.并单击NCXt按钮进入下一步.OAnaConda32020.07(64bit)SetupSelectInftdlIdtiOnTypeJANACONDAFaseselectthetypeofrjtalabonyouBcetoperformforAacond32020.07(64t).Imtalfbr:OJustMe(recommended)OAlUsersSouresadnPrtVleg)CarxdE1-7送择所有用户管理权限单击Bg”按钮,选择合道的安装跖径,如图1-8所示(注:路径名称
11、最好为全英文).选择完成后单击“Next”按钮进入下一步.OAnacondaJ20207(64bit)Setp-XChooeeInstdMLoCdtionJANACONDAChOOeethefoMernWHChtoredAnaConte32020.07(6M).SetuptratalAnaconda32020.07(64t)nthefolowngfoWer.ToInStalmadifferentfolder,dckBrowseandselectanolherfolder.CkcfcNexttoconbcue.DeehnabonFoIdefEAnacondBrovwe-SPKerCqUrp2.7
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 自然语言处理技术 自然语言处理技术实训1 配置NLP环境 自然语言 处理 技术 实训 配置 NLP 环境
