股票预测 – ARIMA

工夫序列剖析 ARIMA

转自:工夫序列剖析ARIMA以前的

1. 倡导者平坦法

  • 首数
    倡导者平坦法更远的提高了OBSER的引起。,在两样工夫分神智清楚的遵守值的重要是不相等的。,如此加法运算了近期遵守的重要,如此使预测值可以快反作用的MA的现实转变。

  • 提及 倡导者平坦预测算法

  • ARIMA 一种经用的工夫序列预测以前的,但它通经用于短期预测。,在现实编码时((''2001'',''2200'')) 工夫排列如同稍许地。,待解

2. 工夫序列的对停止预处置

在使成为以前的屯积,必要获益 dataset,普通说起,笔者都必要适当的 dataset 停止对停止预处置,譬如,裁剪相当通知,正常化,通知废话等。工夫序列剖析通知,率先,必要停止测量法。 平稳性纯随意以下绍介

. 平稳性

平稳的根本思惟是:工夫序列的行动不能的随工夫而转变。

波动性分为强平稳历程和弱平稳历程。

强平稳历程:工夫序列的若干亚纲的混合散布是划一的。
弱平稳历程:平均数有或起作用为常数有或起作用,互相牵连有或起作用为ONL。
关于强、弱平稳的分别:
* 强平稳是确实静力的的(同散布的);
* 弱平稳性是遵守中数数的平稳性(平均数)。、方差)。

工夫序列剖析,通知的处置是人家弱平稳历程。,强平稳必需品太强,无论是实际还要实习,很难检定序列是强平稳的。
在附近现实库存通知,鉴于各式各样的表面等式的情感,譬如,状况策略,规则等,因而,普通难以积累到波动条款。
在附近不平稳的股票通知,你必要运用相当办法使它出场平坦。,那时的做预测,譬如,应用不一致轮流的法 diff

2.2. 纯随意(白噪声测量法)

纯随机序列,也称白噪声序列,序列的数值私下缺勤互相牵连性。,序列完整失调的随机涨落,对序列的剖析可以终止处。

barlett 定理
倘若工夫序列是纯随机的,人家遵守使轮转n的遵守序列,那时的,范本的非零使轮转的自互相牵连系数,S遵守使轮转倒数的正态散布
p^\~N(0,1n)” role=”presentation” style=”position: 对立;>

p^\~N(0,1n)

提及
– 〔工夫序列剖析〕〔1〕-波动性,白噪声测量法
– 方法断定工夫序列倘若为白噪声?

3. 平稳工夫序列建模

笔者必要的是润滑的,非白噪声工夫序列,那时的建模它。

. ARIMA以前的

ARIMA:自回归结合在一起滑动以前的(自回归) Integrated Moving Average Model, 有马拾零)
依工夫序列倘若波动和PA的不一致,可分为:

改变主意平均数历程(MA)q))
自回归历程(AR)p))
自回归改变主意平均数历程( ARMA(P),q) )
自回归结合在一起滑动平均数历程 ( 氩马(P),d,q) )

. 工夫序列建模手续

  1. 率先获取工夫序列通知,通知对停止预处置
  2. 绘制获益的通知,测量法倘若波动,因此倘若为白噪声。提及白噪声序列

    • 在附近非平稳工夫序列,D阶差分运算是最初的替换。,此处的d即为氩马(P),d,q)以前的中间的D;
    • 倘若它是平稳序列,则用ARMA(P),Q)以前的。因而氩马(P),d,q) 以前的分别于ARMA(P),Q)是F的自回归地区的特点聚合。。
  3. 得ARIMA以前的
    在附近平稳工夫序列,自互相牵连系数ACF是OBTAI。 地区自互相牵连系数,自互相牵连图与地区自互相牵连图的剖析,通用最好的移居 p 和令 q。D不只是、q、p ,获益ARIMA以前的。
  4. 以前的诊断法
    停止诊断法剖析,该以前的与实物测量通知适合较好。。若不相符,送还到(3)步。

.细目剖析

.1. 波动性实验

倘若序列中在专家的走向或使轮转性,因而它缺点钉牢序列,由于平稳必需品具有常数平均数和常数方差。:

  • 时序图:看守走向的转变。
  • 自互相牵连图与自互相牵连图:跟随延误次数的加法运算,平稳序列的自互相牵连系数很快就会使沮丧。,这触及时滞互相牵连系数的计算
  • 单位根视察: 测量法序列中倘若有单位根,倘若在人家非平稳工夫序列
  • DF检测(Dickey Fuller) 这是人家视察通知波动性的数数视察。。有病的补助金:工夫序列不波动。实验算是由实验数数量和S的临界值结合。。倘若测量法数数决不临界值,笔者可以回绝零补助金。,并以为该序列是波动的。。

3.. 以前的选择

鉴于通用的自互相牵连和地区志愿地选择以前的,在本条文中,笔者打算ARIMA以前的包孕四种:


改变主意平均数历程(MA)q))
自回归历程(AR)p))
自回归改变主意平均数历程( ARMA(P),q) )
自回归结合在一起滑动平均数历程 ( 氩马(P),d,q) )

因:
ARIMA以前的选择

  • AIC和SBC原则用于决定P和Q限度局限因素的值。,二者都速度系数,在Python中,有相当有或起作用可以立即的计算为AIC。,BIC,HQIC值。

  • 在意:
    ((''2001'',''2200''))中,dates_from_range 如同有尾随者的限度局限(262)

.3. 以前的实验

看守ARIMA以前的的残差倘若是平均数值为0且方差为常数的正态散布(等候零平均数、方差常数的正态散布,同时,也强迫看守陆续物倘若在。。

1. 对所选以前的营造的残差停止自互相牵连。

fig = ((), lags=40, ax=ax1)

2. D- W视察

Durbin Watson(Durbin Watson)实验。De bin Watson实验,D- W短路实验,它是眼前最经用的自互相牵连视察办法。,但它仅用于一阶自互相牵连视察。。由于自互相牵连系数p的值在1到1私下。,因而 0≤DW≤4。当DW值濒临0或4时,自互相牵连的在性,濒临2,缺勤(一阶)自互相牵连。供给笔者觉悟DW数数量的概率散布,在必然的意思上,原始补助金可以鉴于临界值的得第二名。0” role=”presentation” style=”position: 对立;>

0

停止视察。()

3. 遵守值倘若与正态散布划一

运用QQ图,它用于直观的地校对一组通知倘若来自某处CelTAI。,或许校对两组通知倘若来自某处同人家(普通的)散布区。fig = qqplot(resid, line=''q'', ax=ax, fit=True)

4. Ljung-Box视察

Ljung-Box 测量法是随意的测量法,或对工夫序列中滞后互相牵连的在性停止数数视察。。滞后互相牵连视察,笔者经常采取的办法还包孕计算ACF和PCAF并看守其图像。LB测量法是鉴于尾随者滞后的命令。,决定序列全体居民的互相牵连性或随意倘若在。
工夫序列中最根本的以前的经过是高斯白噪声序列。。在附近ARIMA以前的,残差被认为为高斯白噪声序列。,因而,当笔者运用ARIMA以前的使适合通知时,使适合后,必要对LR序列停止LB视察。,断定倘若为高斯白噪声,倘若缺点,因而ARIMA以前的能够缺点人家发生的范本以前的。。

r,q,p = ((), qstat=True)
data = [排列(1),41), r[1:], q, p]
table = (通知), columns=[''lag'', "AC", "Q", PRB(Q)
油印((滞后))

测量法的算是是在前十二行O中测量法的概率。,倘若测量法概率决不事先安排的明显程度,比方、回绝最初的的补助金,最初的的补助金是互相牵连系数为零。。就算是说起。,倘若明显性程度,互相牵连系数与t无明显性不一致。,即为白噪声序列。

提及



证实矢量机

证实矢量机(SVM)是一种归类算法,因而,笔者不期待ARIMA算法鉴于工夫序列来预测股票。,该办法首要用于历史通知的剖析和预测。。

通知处置

运用的通知来自某处* 通用的,首要通知是:最大,最小,等

处置:当紧的是在价钱上容易搬运。,拉包括第整天和最后整天私下的差值,整天中高地的和最低限度的不一致。
github-python code

提及


鉴于证实矢量机的股票预测 Python实施 附Github

LSTM

发表评论

电子邮件地址不会被公开。 必填项已用*标注