本篇博文主要介绍如何用ARIMA模型来对股票数据做时序预测的。

获取数据

这里用的是tushare库,得到万科股票半年的数据。

import tushare as t1
t1.set_token('你自己的token')
ts=t1.pro_api()
df = ts.get_k_data('000002',start='2021-09-01',end='2021-12-31')#查万科两个月的历史行情
print(df)

在这里插入图片描述
观察原始数据的时序图和acf图:

df = df.dropna()
df = df["close"]
df.reset_index()

plt.plot(np.arange(81),df)
plt.title("时序图")  #添加图标题 
plt.xticks(rotation=45)    #横坐标旋转45度
plt.xlabel('date')   #添加图的标签(x轴,y轴)
plt.ylabel("close")

在这里插入图片描述

from statsmodels.graphics.tsaplots import plot_acf 
plot_acf(df,lags=30) 
plt.show()  

在这里插入图片描述
观察可得,数据不是平稳序列,接下来对数据进行简单的处理,使其变为平稳序列。

数据预处理

这块对数据做的处理是对数据进行一阶差分:

# 进行一阶差分 
D_ts1 = df.diff().dropna()  
D_ts1.columns = [u'close差分']

做完差分后,观察其时序图和acf、pacf图:
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
看起来感觉还可以,接下来用ADF检验来判断差分后的序列是否为平稳序列:

from arch.unitroot import ADF
adf = ADF(D_ts1)
# print(adf.pvalue)
print(adf.summary().as_text())

在这里插入图片描述
根据结果,可得到一阶差分后的序列为平稳序列。

模型识别

确定阶数的这一块是利用AIC和BIC,代码我就不放了
在这里插入图片描述
画出来的热力图是这样的,可得p=3,q=3

假设检验

拟合模型:

from statsmodels.tsa.arima_model import ARIMA

model = ARIMA(df, order=(3,1,3))
model_fit = model.fit()
model_fit.summary()

在这里插入图片描述
这里利用QQ图(利用QQ图检验残差是否满足正态分布)和DW(利用D-W检验,检验残差的自相关性)进行检验:

from statsmodels.graphics.api import qqplot 
from statsmodels.stats.stattools import durbin_watson #DW检验

resid = model_fit.resid 
plt.figure(figsize=(12,8))

qqplot(resid,line='q',fit=True)

print('D-W检验值为{}'.format(durbin_watson(resid.values)))

Out:

D-W检验值为2.000610162178381

在这里插入图片描述
说明模型还可以。

模型预测

预测模型使用predict函数就可以了。

Logo

华为开发者空间,是为全球开发者打造的专属开发空间,汇聚了华为优质开发资源及工具,致力于让每一位开发者拥有一台云主机,基于华为根生态开发、创新。

更多推荐