本港台开奖现场直播 j2开奖直播报码现场
当前位置: 新闻频道 > IT新闻 >

【j2开奖】小白学数据 算姨妈周期外时间序列分析还有什么用(2)

时间:2017-02-21 17:58来源:118论坛 作者:j2开奖直播 点击:
小白问:一定一定。对了,时间序列分析不会出现很多异常的影响因素么?比如女票为了不影响游泳比赛,吃药推迟了大姨妈时间,再按照曲线推测她后续

  小白问:一定一定。对了,时间序列分析不会出现很多异常的影响因素么?比如女票为了不影响游泳比赛,吃药推迟了大姨妈时间,再按照曲线推测她后续的经期,就会不准了吧?

  答:好问题,看来小白你已经会举一反三了。是的,通常收集到的时间序列数据中都会包含有一些随机扰动因素的影响,我们把这些具有不确定性的因素导致的数量变化统称为随机变量,业内常见的是通过“平滑数据”的方法来降低或消除随机变量带来的影响,“平滑”通常也被称为过滤,目前主要有两大类:平均法和指数平滑法

  小白问:指数平滑听起来就是更快一点的平滑呗?

  答:差不多是这个意思。

  平均法就是取相邻几个数的平均数,然后分析平均数而不是原始数据。举一个简单的例子,平均法中最常见的其中一种叫做“移动平均”(Moving Average),这个例子中,我们把前三个时间点的数值取平均数,当作第3个时间点的移动平均数8.667=(9+8+9)/3,第2,3,4个点数值的平均数作为第4个点的移动平均数…以此类推。

【j2开奖】小白学数据 算姨妈周期外时间序列分析还有什么用

  指数平滑法稍微复杂一点,但是也更受欢迎,很多时候也更准确。平均法中,过去的历史观测点的权重是一样的,而在指数平滑法里,越遥远的观测点的权重呈指数倍减少,就是说越靠近的点给的权重越高。

  移动平均里也有加权移动平均噢,加权是为了体现距离平均值对应时点位置的远近,对平均值的不同影响程度,但是,移动平均只能考虑短期影响,对长期影响怎么办呢?虽然离得越远,影响越小,但是不能杜绝啊,科学的办法来解决,就是指数平滑了,它是通过往期平滑值与当期实际值的加总来体现平滑预测的理念,通过调整两部分的权重来体现过去对现在的影响,乃至对未来的影响。

  小白问:嗯嗯,那平滑之后,时间序列分析里面都用到哪些方法和技术建模啊?

  答:其实时间序列的应用可以说非常广泛但又备受限制。记得上面我们提到时间序列数据被分解为三个部分吗?其中大趋势和季节效应是相对容易建模的,而随机变化是比较难预测的。常见的针对“普通数据”的统计模型(如响应模型,提升模型等)中,趋势和季节效应可能都不存在时间序列分析就需要做更多的数据准备工作。例如,与用于标准线性回归的数据不同,时间序列的数据不一定是独立的或呈现出相同分布。它的一个决定性特征就是数据的排序是有意义的。数据的排序与内在含义有强依赖关系,更改顺序可能会更改数据的意义。

  用来建立时间序列数据的模型主要包括以下几种:

  ——Box-Jenkins ARIMA(Autoregressive Integrated Moving Average)模型

  ——Box-Jenkins多变量模型

  ——Holt-Winters指数平滑法(单,双,三倍)

  ——不可观察成分模型(Unobserved Components Model)

  通常使用者的偏好和需要应用的场景会决定最终使用哪类技术。时间有限,这里肯定没法给你介绍清楚所有的方法和技术,日后真需要用的时候,就要你自己多做做功课,再多加探索了。

  小白问:我简单查了一下有关时间序列分析的资料,好多数学公式啊,这些模型有没有现成的程序包?

  答:哈哈,小白你真是个求知欲旺盛的好喵。R和Python都有的,推荐你一个链接,有Python的样本程序,可以从基础学习哦。https://bicorner.com/2015/11/16/time-series-analysis-using-ipython/

  刚刚女票召唤我了,你自己去研究研究吧!

(责任编辑:本港台直播)
顶一下
(0)
0%
踩一下
(0)
0%
------分隔线----------------------------
栏目列表
推荐内容