Kaggle知识点：时序预测基础知识

语言: CN / TW / HK

时间 2022-08-09 08:20:38

时间序列

时间序列是按照时间排序的一组随机变量，通常是在相等间隔的时间段内，依照给定的采样率对某种潜在过程进行观测的结果。时间序列数据通常是一系列实值型数据，时间序列数据的研究方法主要包括分类、聚类和回归预测等方面。

时间序列数据本质上反映的是某个或者某些随机变量随时间不断变化的趋势，而时间序列预测方法的核心就是从数据中挖掘出这种规律，并利用其对将来的数据做出估计。

现实生活中的时间序列数据预测问题有很多，包括语音分析、噪声消除以及股票市场的分析等，本质主要是根据前个时刻的观测数据推算出时刻的时间序列的值。

时间序列数据与其他类型的数据的最大区别在于当前时刻的数据值与之前时刻的数据值存在着联系，该特点表明过去的数据已经暗示了现在或者将来数据发展变化的规律，这种规律主要包括了趋势性、周期性和不规则性。

时间序列的平稳性表明了时间序列的均值和方差在不同时间上没有系统的变化，而非平稳性意味着均值和方差随着时间推移会发生变化。时间序列的平稳性保证了时间序列的本质特征不仅仅存在于当前时刻，还会延伸到未来。

传统的时间序列模型包括：

传统的时间预测是在确定序列参数模型的基础上求解出模型参数，并利用求解出的模型完成预测工作。

”Box-Jenkins方法“策略包含３步：

d值可以通过对原始时间序列进行差分,然后检验差分后的时间序列的平稳性来确定d值的大小，p值和q值可通过偏自相关函数PACF和自相关函数ACF来确定。

传统的时间序列预测方法非常依赖参数模型的选择，能否正确选择参数模型在很大程度上决定了预测结果的准确率。

经典的支持向量机SVM、贝叶斯网络BN、矩阵分解MF和高斯过程GP在时间序列预测方面均取得了不错的效果。

早期的人工神经网络ANN也被用来获取时间序列中长期的趋势。随着深度学习的崛起，其也可以被看作实现时间序列预测的有效工具。

比较典型的模型WaveNet可以对大范围历史数据和序列之间关系的进行建模，利用数据来训练新的深度学习网络结构以完成预测。

# 竞赛交流群邀请函 #

△长按添加竞赛小助手

添加Coggle小助手微信（ID : coggle666）

每天Kaggle算法竞赛、干货资讯汇总

与 22000+ 来自竞赛爱好者一起交流~