分析和预测时序数据的主要方法,如何使用Python处理时序数据.doc
-
资源ID:3393073
资源大小:15KB
全文页数:2页
- 资源格式: DOC
下载积分:2元
快捷下载
会员登录下载
微信登录下载
微信扫一扫登录
友情提示
2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。
|
分析和预测时序数据的主要方法,如何使用Python处理时序数据.doc
分析和预测时序数据的主要方法,如何使用Python处理时序数据Zeptolab数据科学家Dmitriy Sergeev介绍了分析和预测时序数据的主要方法。大家好!这次的开放机器学习课程的内容是时序数据。我们将查看如何使用Python处理时序数据,哪些方法和模型可以用来预测;什么是双指数平滑和三指数平滑;如果平稳(stationarity)不是你的菜,该怎么办;如何创建SARIMA并且活下来;如何使用XGBoost做出预测。所有这些都将应用于(严酷的)真实世界例子。导言在我的工作中,我几乎每天都会碰到和时序有关的任务。最频繁的问题是明天/下一周/下个月/等等,我们的指标将是什么样有多少玩家会安装应用,他们的在线时长会是多少,他们会进行多少次操作,取决于预测所需的质量,预测周期的长度,以及时刻,我们需要选择特征,调整参数,以取得所需结果。基本定义时序的简单定义:时序一系列以时间顺序为索引(或列出、绘出)的数据点。因此,数据以相对确定的时刻组织。所以,和随机样本相比,可能包含我们将尝试提取的额外信息。让我们导入一些库。首先我们需要statsmodels库,它包含了一大堆统计学建模函数,包括时序。对不得不迁移到Python的R粉来说,绝对会感到statsmodels很熟悉,因为它支持类似Wage Age + Education这样的模型定义。import numpy as np # 向量和矩阵import pandas as pd # 表格和数据处理import matplotlib.pyplot as plt # 绘图import seaborn as sns # 更多绘图功能from dateutil.relativedelta import relativedelta # 处理不同格式的时间日期from scipy.optimize import minimize # 最小化函数import statsmodels.formula.api as smf # 统计学和计量经济学import statsmodels.tsa.api as smtimport statsmodels.api as smimport scipy.stats as scsfrom itertools import product # 一些有用的函数from tqdm import tqdm_notebookimport warnings # 勿扰模式warnings.filterwarnings(ignore)%matplotlib inline作为例子,让我们使用一些真实的手游数据,玩家每小时观看的