《数据挖掘:实用案例分析》——2.4 时序模式

时间:2024-05-23 11:19:55

2.4 时序模式

  我们经常会碰到这样的问题:

  1)下个月的商品销量、销售额或库存量是多少?
  2)明天广州市的最高用电负荷是多少?

2.4.1 什么是时序模式

  时序模式:描述基于时间或其他序列的经常发生的规律或趋势,并对其建模。

  与回归一样,它也用已知的数据预测未来的值,但这些数据的区别是变量所处时间的不同。序列模式将关联模式和时间序列模式结合起来,重点考虑数据之间在时间维度上的关联性。时序模式包含时间序列分析和序列发现。

《数据挖掘:实用案例分析》——2.4 时序模式

2.4.2 时间序列的组合成分

  时间序列的变化主要受到长期趋势、季节变动、周期变动和不规则变动这四个因素的影响。其中:

《数据挖掘:实用案例分析》——2.4 时序模式

2.4.3 时间序列的组合模型

  时间序列y可以表示为四个因素的函数,即:

《数据挖掘:实用案例分析》——2.4 时序模式

  时间序列分解的方法有很多,较常用的模型有加法模型和乘法模型。

  1.加法模型

  假定时间序列是基于4种成分相加而成的。长期趋势并不影响季节变动。若以y表示时间序列,则加法模型为:

《数据挖掘:实用案例分析》——2.4 时序模式

  2.乘法模型

  假定时间序列是基于4种成分相乘而成的。假定季节变动与循环变动为长期趋势的函数。该模型的方程式为:

《数据挖掘:实用案例分析》——2.4 时序模式

  乘法模型分解的基本步骤是:

  1)运用移动平均法剔除长期趋势和周期变化,得到序列TC。然后再用按月(季)平均法求出季节指数S。
  2)作散点图,选择适合的曲线模型拟合序列的长期趋势,得到长期趋势T。
  3)计算周期因素C。用序列TC除以T即可得到周期变动因素C。
  4)将时间序列的T、S、C分解出来后,剩余的即为不规则变动,即:

《数据挖掘:实用案例分析》——2.4 时序模式

2.4.4 时序算法

  常用时序算法及适应范围见表2-4。

《数据挖掘:实用案例分析》——2.4 时序模式