登录 注册 | 服务热线:400 886 1266 | ENGLISH | 
 
|
技术方法

时间序列预测技术相关理论综述

发布时间:2014-11-4 16:37:30  点击数:4181

一、时间序列概念简介

  1. 时间序列预测原则

  (1) “惯性”原则:事物变化发展的延续性;

  (2) “类推”原则:事物发展的类似性;

  (3) “相关”原则:事物的变化发展是相互联系的;

  (4) “概率”原则: 事物发展的推断预测结果能以较大概率出现,则结果成立、可用;

  2. 时间序列预测性质

  (1)趋势性:某个变量随着时间进展或自变量变化,呈现一种比较缓慢而长期的持续上升、下降、停留的同性质变动趋向,但变动幅度可能不等。

  (2)周期性:某因素由于外部影响随着自然季节的交替出现高峰与低谷的规律。

  (3)随机性:个别为随机变动,整体呈统计规律。

  (4)综合性:实际变化情况一般是几种变动的叠加或组合。预测时一般设法过滤除去不规则变动,突出反映趋势性和周期性变动。

  3. 时间序列预测类型

  (1)点预测:确定唯一的最好预测数值,其给出了时间序列未来发展趋势的一个简单、直接的结果。但常产生一个非零的预测误差,其不确定程度为点预测值的置信区间。

  (2)区间预测:未来预测值的一个区间,即期望序列的实际值以某一概率落入该区间范围内。区间的长度传递了预测不确定性的程度,区间的中点为点预测值。

  (3)密度预测:序列未来预测值的一个完整的概率分布。根据密度预测,可建立任意置信水平的区间预测,但需要额外的假设和涉及复杂的计算方法。


二、时间序列建模解模过程

  1. 时间序列分析一般步骤

  (1)数据的准备阶段。

  (2)数据的观察及检验阶段:总体把握时间序列发展变化的特征,以便选择恰当的模型进行分析,包括图形方法和统计检验方法。  

  (3)数据的预处理阶段:一方面能够使序列的特征体现得更加明显,利于分析模型的选择;另一方面使数据满足于模型的要求。

  (4)数据分析和建模阶段:根据时间序列的特征和分析的要求,选择恰当的模型进行数据建模和分析。

  (5)模型的评价阶段:与模型分析的目标相结合评价是否达到了分析的目的以及效果如何。

  (6)模型的实施阶段。


  2. 建模解模过程。

  (1)数据检验:检验时间序列样本的平稳性、正态性、周期性、零均值,进行必要的数据处理变换。

  1)作直方图:检验正态性、零均值。

  2)作相关图:检验平稳性、周期性。

  3)数据变换:若时间序列的正态性或平稳性不够好,则需进行数据变换。常用有差分变换(利用transform—Create Time Series)和对数变换(利用Transform—Compute)进行。一般需反复变换、比较,直到数据序列的正态性、平稳性等达到相对最佳。

  (2)模型识别:

  分析时间序列样本,判别模型的形式类型,确定p、d、q 的阶数。

  1)判别模型形式和阶数

  2)建立时间序列新变量

  (3)参数估计:采用最大似然估计或最小二乘估计等方法估计φ、θ参数值,并进行显著性检验。  

  (4)模型检验:检验新建模型的合理性。若检验不通过,则调整(p,q)值,重新

  估计参数和检验,反复进行直到接受为止。但模型识别、参数估计、检验修正三个过程之间相互作用、相互影响,有时需要交叉进行、反复实验,才能最终确定模型形式。

  (5)模型预测:预测系统研究对象的未来某时刻状态。列出预测模型,计算预测值。


三、总结及注意事项

  1.理论上讲,历史数据越多预测越稳定,但根据实际情况可灵活选择。数据中可以没有时间变量,但必须知道时间的起点和时间间隔。

  2.对于自变量也需要预测的时间序列分析中,可以考虑以下几种常用方法:1)选择最末期数据;2)选择近三期数据的平均;3)选择近三期的移动平均。

  3.各个输出统计量的意义:

  系数:反映自变量对因变量影响的权重。

  均值:度量变量的集中度,传递随机变量的位置信息。

  标准差:度量变量的离散度,传递随机变量的规模信息。

  平方和:残差平方和是许多统计量的组成部分,孤立考察无太大价值。

  常数项:认为是取值恒为1的常数变量,其系数就是自变量为0时因变量的最优预测值,也称为预测基准值。

  标准误:表明样本数据的可靠性。在(残差)参数近似服从正态分布条件下,系数加减两倍的标准误差近似等于总体参数95%的置信区间。其值越小,置信区间越窄;并且其对于系数的相对值越小,估计结果越精确。

  t统计量:估计系数与标准误差的比值,检验变量的不相关性。一般给定5%显著水平,则拒绝原假设的0值位于95%的置信区间外,其绝对值必大于2。

  t概率值:其值越小,则拒绝原假设不相关性的证据越充分。其值接近0.05与t统计量接近2相对应。

  准则:信息准则AIC和SBC用于模型的选择,越小越好,但受自由度约束较为严重。

  R2校正:是模型中自变量对因变量变动的解释比例,度量方程预测因变量的成功程度,其是回归标准误差与因变量标准差比较的结果。另一个比较方法是回归标准误差不超过因变量均值的10%则为好的模型。

  DW统计:用于检验随机误差项是否存在序列相关。

  LN似然:用于模型比较和假设检验,越大越好。


 
分享到:
查看更多行业成功案例及解决方案