大神教你怎么用Python抓取婚恋网用户数据,用决策树生成自己择偶观.doc
《大神教你怎么用Python抓取婚恋网用户数据,用决策树生成自己择偶观.doc》由会员分享,可在线阅读,更多相关《大神教你怎么用Python抓取婚恋网用户数据,用决策树生成自己择偶观.doc(3页珍藏版)》请在三一文库上搜索。
1、大神教你怎么用Python抓取婚恋网用户数据,用决策树生成自己择偶观最近在看机器学习实战的时候萌生了一个想法,自己去网上爬一些数据按照书上的方法处理一下,不仅可以加深自己对书本的理解,顺便还可以在github拉拉人气。刚好在看决策树这一章,书里面的理论和例子让我觉得这个理论和选择对象简直不能再贴切,看完长相看学历,看完学历看收入。如果可以从婚恋网站上爬取女性的数据信息,手动给她们打标签,并根据这些数据构建决策树,不就可以找出自己的择偶模式了吗!github项目:huatian-funny,下面就详细的阐释一下。数据爬取之前在世纪佳缘上爬取过类似的数据,总体的感觉是上面的用户数据要么基本不填要么
2、一看就很假,周围的一些老司机建议可以在花田网上看下,数据质量确实高很多,唯一的缺点就是上面的数据不给爬,搜索用户的API需要登录,而且只显示三十多个用户的信息。刚好我需要的数据也很少,就把搜索条件划分的很细,每次取到的数据很小,但最终汇集的数量还是相当可观的,最终获取了位置在上海年龄22-27共计2000个左右的用户数据。填写好spider.py中的用户名和密码,直接运行这个文件就可以爬取数据,因为数据量不大,很快就可以运行完毕,存储在mongodb中的数据如下:爬虫用到的工具是requests,流程上也很简单,先发送登陆请求获取cookie,然后调用搜索API获取数据,拿到的数据是json格
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 大神 怎么 Python 抓取 婚恋 用户 数据 决策树 生成 自己 择偶
链接地址:https://www.31doc.com/p-3420697.html