指数平滑 | Holt-Winters
type
Post
status
Published
summary
指数平滑法实际上是一种特殊的加权移动平均法,指数平滑法分为:单指数平滑法、二指数平滑法(趋势法)、三指数平滑法;三指数平滑法又称Holt-Winters。
slug
holt-winters
date
Jan 15, 2022
tags
Holt-Winters
预测模型
指数平滑
category
机器学习
password
icon
URL
Property
Feb 28, 2024 01:08 PM
指数平滑法分为:单指数平滑法、二指数平滑法(趋势法)、三指数平滑法;三指数平滑法又称Holt-Winters。三种方法的适用范围不同,并且在原理上逐渐深入递进,想要深入了解三指数平滑法的原理,我们需要从最简单的预测方法开始讲起
简单预测
现给定一组数据如下,我们想要预测下一个数据该如何操作呢
时间t | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 |
观测值y | 3 | 10 | 12 | 13 | 12 | 10 | 12 | ? |
1、朴素预测法:未来的所有预测都等于该序列的最后一个观测值
朴素预测法假设最近的观测值是唯一重要的观测值,并且之前所有的观测值都不提供未来的信息。这可以看作是一个加权平均值,其中所有的权重都被赋给了最后一次观测值。
2、平均预测法:所有未来预测值都等于观测数据的简单平均值
平均预测法假设所有观测值具有同等重要性,并在预测时给予相同的权重。
3、移动平均法:所有未来预测值都等于观测数据n个最后点的平均值
移动平均法的思想是只有最近的n个观测值才重要,但最近的n个观测值也是被赋予相同的权重
当n=3时
4、加权平均法:所有未来预测值都等于所有数据的加权平均值
加权平均法是为所有观测值赋予不同的权重,且权重和为1
指数平滑的核心思想就是加权平均法,只是指数平滑时赋予的权重是随着时间前移,权重呈指数不断下降的,只用给予最近数值一个初始权重。
越近的观测值权重越大,对下一时刻的预测值影响越大;所有数据的权重之和等于1,且权重随观测时间的久远程度呈指数型下降;
当n>2时:(y由进及远)
当n=2时:
单指数平滑
由于加权平均法计算的结果有延后性(我自己在计算的时候总是会比单指数平滑公式计算的延后一位,延后性也是我的猜测),所以这里直接给出加权平均法改进之后的计算公式。
当时间序列无明显的趋势变化,可用一次指数平滑预测。
平滑公式:
预测公式:
以前面给出的数据为例:
此处平滑值的初始值是使用观测值的初始值 ,
时间t | 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 |
观测值y | ㅤ | 3 | 10 | 12 | 13 | 12 | 10 | 12 | ㅤ |
平滑值S | 8.33 | 3.53 | 9.35 | 11.74 | 12.87 | 12.09 | 10.21 | 11.82 | ㅤ |
预测值 | ㅤ | ㅤ | ㅤ | ㅤ | ㅤ | ㅤ | ㅤ | ㅤ | 11.98 |
⚠️注:一次指数平滑只能预测下一时间的值,之后的时间预测值都和该值相同。
这里可以看到第7项的平滑值与加权平均法算出来的第八项预测值相同,所以我说加权平均法有滞后性;这一点还没弄的很明白,之后可以深入研究。而在日常的使用中我们可以直接使用平滑公式和预测公式进行计算就OK
在某些情况下,平滑参数可以进行主观选择——预测者根据以前的经验设定平滑参数的值。然而,一种更可靠和客观的获得未知参数值的方法是从观测数据中估计它们。任何指数平滑方法的未知参数和初始值也可以通过最小化SSE来进行估计。
通过数据带入公式,最小化SSE即可求出初始值和平滑参数
二指数平滑
当时间序列的变动呈现直线趋势时,用一次指数平滑法来进行预测将存在明显的滞后偏差,此时需要使用二次指数平滑。二次指数平滑是在一次指数平滑的基础上再进行一次平滑。它不能单独地进行预测,必须与一次指数平滑法配合。
平滑公式:
预测公式:
说明:h为想要预测的步数,要预测接下来第二步,那h=2,以此类推。
例:某地1983年至1993年财政入的资料如下,试用指数平滑法求解趋势直线方程并预测1996年的财政收入
参数 | ㅤ | alpha | 0.9 | ㅤ | a | 103 | ㅤ | b | 8.99 | ㅤ | ㅤ | ㅤ | ㅤ | ㅤ | ㅤ |
年份 | ㅤ | 1983 | 1984 | 1985 | 1986 | 1987 | 1988 | 1989 | 1990 | 1991 | 1992 | 1993 | 1994 | 1995 | 1996 |
序号 | 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12 | 13 | 14 |
观测值 | ㅤ | 29 | 36 | 40 | 48 | 54 | 62 | 70 | 76 | 85 | 94 | 103 | ㅤ | ㅤ | ㅤ |
一次平滑值 | 35 | 29.60 | 35.36 | 39.54 | 47.15 | 53.32 | 61.13 | 69.11 | 75.31 | 84.03 | 93 | 102 | ㅤ | ㅤ | ㅤ |
二次平滑值 | 35 | 30.14 | 34.84 | 39.07 | 46.34 | 52.62 | 60.28 | 68.23 | 74.6 | 83.09 | 92.01 | 101 | ㅤ | ㅤ | ㅤ |
预测值 | ㅤ | ㅤ | ㅤ | ㅤ | ㅤ | ㅤ | ㅤ | ㅤ | ㅤ | ㅤ | ㅤ | ㅤ | 111.99 | 120.98 | 129.97 |
此处,一次平滑值和二次平滑值的初始值均赋值为前三个观测值的均值35,
三指数平滑
若时间序列的变动呈现出二次曲线趋势,则需要采用三次指数平滑法进行预测。三次指数平滑是在二次指数平滑的基础上再进行一次平滑
平滑公式:
预测公式:
例题:我国某种耐用消费品1996年至2006年的销售量如表所示,试预测2007、2008年的销售量。
参数 | alpha | 0.3 | a | 706.11 | b | 98.40 | c | 4.53 | ||||||
年份 | ㅤ | 1996 | 1997 | 1998 | 1999 | 2000 | 2001 | 2002 | 2003 | 2004 | 2005 | 2006 | 2007 | 2008 |
序号 | 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12 | 13 |
观测值 | ㅤ | 225.2 | 249.9 | 263.2 | 293.6 | 318.9 | 356.7 | 363.3 | 424.2 | 466.5 | 582 | 750 | ㅤ | ㅤ |
一次平滑值 | 246.1 | 239.8 | 242.9 | 249 | 262.3 | 279.3 | 302.5 | 320.8 | 351.8 | 386.2 | 444.9 | 536.5 | ㅤ | ㅤ |
二次平滑值 | 246.1 | 244.2 | 243.8 | 245.4 | 250.5 | 259.1 | 272.1 | 286.7 | 306.2 | 330.2 | 364.6 | 416.2 | ㅤ | ㅤ |
三次平滑值 | 244.7 | 244.6 | 244.3 | 244.6 | 246.4 | 250.2 | 256.8 | 265.8 | 277.9 | 293.6 | 314.9 | 345.3 | ㅤ | ㅤ |
预测值 | ㅤ | ㅤ | ㅤ | ㅤ | ㅤ | ㅤ | ㅤ | ㅤ | ㅤ | ㅤ | ㅤ | ㅤ | 809 | 921.1 |
以下为Excel公式实现指数平滑演练
指数平滑法的缺点:
- 对数据的转折点缺乏鉴别能力,但这一点可通过调查预测法或专家预测法加以弥补。
- 长期预测的效果较差,故多用于短期预测。
指数平滑法的优点:
- 对不同时间的数据的非等权处理较符合实际情况。
- 实用中仅需选择一个模型参数a 即可进行预测,简便易行。
- 具有适应性,也就是说预测模型能自动识别数据模式的变化而加以调整。