欢迎来到三一文库! | 帮助中心 三一文库31doc.com 一个上传文档投稿赚钱的网站
三一文库
全部分类
  • 研究报告>
  • 工作总结>
  • 合同范本>
  • 心得体会>
  • 工作报告>
  • 党团相关>
  • 幼儿/小学教育>
  • 高等教育>
  • 经济/贸易/财会>
  • 建筑/环境>
  • 金融/证券>
  • 医学/心理学>
  • ImageVerifierCode 换一换
    首页 三一文库 > 资源分类 > PPT文档下载
     

    中文微博情感评测报告.ppt

    • 资源ID:2709265       资源大小:1.50MB        全文页数:24页
    • 资源格式: PPT        下载积分:6
    快捷下载 游客一键下载
    会员登录下载
    微信登录下载
    三方登录下载: 微信开放平台登录 QQ登录   微博登录  
    二维码
    微信扫一扫登录
    下载资源需要6
    邮箱/手机:
    温馨提示:
    用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)
    支付方式: 支付宝    微信支付   
    验证码:   换一换

    加入VIP免费专享
     
    账号:
    密码:
    验证码:   换一换
      忘记密码?
        
    友情提示
    2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
    3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
    4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
    5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。

    中文微博情感评测报告.ppt

    中文微博情感评测报告,浙江工商大学 计算机与信息工程学院 报告人:陈威 指导老师:施寒潇,提纲,研究背景及意义 任务预备 任务分析与实施 总结,背景,在Web2.0大背景下,微博作为用户发言、相互交流的重要途径,具有数量大、更新快的特点,是从中发掘用户观点以及情感倾向的可靠来源。针对微博的自然语言处理研究已成为当前一个新的研究热点和前沿课题,而情感分析就是其中一个热点话题。,微博情感分析,情感分析,包括观点挖掘、观点分析、主客观分析等。情感分析的目的是从文本中挖掘用户表达的观点以及情感倾向。 主要技术:(1)情感词典与规则相结合的方法(2)机器学习,意义,过滤不合法网络舆论信息,营造良好的网络环境 监督舆论的走势,辅助社会管理 实现商品个性化推荐 对社会计算的研究有重要的意义,提纲,研究背景及意义 任务预备 任务分析与实施 总结,任务清单,任务一:观点句判定 任务二:分析情感倾向 任务三:提取情感要素,技术准备,分类器:SVM 、 CRF 情感词典扩充:加入网络用语和表情符号 中文分词技术:海量云分词,提纲,研究背景及意义 任务预备 任务分析与实施 总结,任务处理流程,构建特征集,人工标注 训练语料,训练集及训 练模型生成,预测集生 成及预测,人工标注,利用本团队自主开发的标注工具标注 严格按照主办方提供的标注规则,从样列文件中选取1219条具有代表性的微博进行标注 标注内容包括:是否为观点句、情感倾向性、情感要素,训练语料,任务一:人工标注的1219条微博 任务二:任务一训练语料中451条为观点句的微博,任务一特征集,任务二特征集,训练模型生成,网络用语、表情特征提取,提取特征,训练模型,格式转换,分词,SVM训练,人工标注语料,海量分词格式,分词结果,训练集,格式转换,预测集生成,网络用语、表情特征提取,提取特征,格式转换,分词,待预测微博,海量分词格式,分词结果,预测集,格式转换,预处理,预测集生成及预测细节,任务一分词前预处理 : 过滤类似 “我感到很高兴”这样的主观抒发情感句,并定为非观点句。 任务二预测集生成:根据任务一的预测结果,从中提取预测为观点句的微博 使用SVM对预测集进行预测,评测结果,任务三流程,分词,特征提取,CRF训练及预测,结构化标注,情感要素提取,任务三特征集,训练集生成,使用与任务二相同的人工标注集作为训练语料 结构化标注:TP-B 表示情感要素开始词,TP-E 表示情感要素结束词 SO为情感词,BG为背景,情感要素确定,标注为SO,即情感词,作为微博情感倾向 标注为TP-B或TP-E,则可能是情感要素 没有标注TP-的角色,那么就认为该句没有情感要素,总结,本团队在本次比赛中,运用自然语言处理与机器学习的相关知识,结合自身的思路与创新,对任务一(观点句识别)和任务二(情感倾向分析)的评测取得了较为理想的结果,而在任务三的实施方面由于时间和精力方面的原因,尚存一定偏差。在以后的时间里,我们一定会继续深入研究和努力,进一步改进预测方式,扩充情感词典,完善训练模型,提高在中文微博评测领域的水平。,感谢各位专家、学者聆听本次报告!,

    注意事项

    本文(中文微博情感评测报告.ppt)为本站会员(本田雅阁)主动上传,三一文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知三一文库(点击联系客服),我们立即给予删除!

    温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。




    经营许可证编号:宁ICP备18001539号-1

    三一文库
    收起
    展开