当前位置:首页 » 行情解析 » 基于时间序列分析的股票价格趋势预测研究
扩展阅读
中国铝业股票讨论 2024-11-25 02:12:35

基于时间序列分析的股票价格趋势预测研究

发布时间: 2023-02-15 11:24:16

① 一支简单的股票价格预测的数学模型!!!!

对于股票价格只能是在理论上,换句话说是在你自己的期望预期。
而对于股票价格预测一般是从他的基本面上来考虑。
你可以试试下面的方法:
杜邦财务分析法及案例分析
摘要:杜邦分析法是一种财务比率分解的方法,能有效反映影响企业获利能力的各指标间的相互联系,对企业的财务状况和经营成果做出合理的分析。
关键词:杜邦分析法;获利能力;财务状况
获利能力是企业的一项重要的财务指标,对所有者、债权人、投资者及政府来说,分析评价企业的获利能力对其决策都是至关重要的,获利能力分析也是财务管理人员所进行的企业财务分析的重要组成部分。
传统的评价企业获利能力的比率主要有:资产报酬率,边际利润率(或净利润率),所有者权益报酬率等;对股份制企业还有每股利润,市盈率,股利发放率,股利报酬率等。这些单个指标分别用来衡量影响和决定企业获利能力的不同因素,包括销售业绩,资产管理水平,成本控制水平等。
这些指标从某一特定的角度对企业的财务状况以及经营成果进行分析,它们都不足以全面地评价企业的总体财务状况以及经营成果。为了弥补这一不足,就必须有一种方法,它能够进行相互关联的分析,将有关的指标和报表结合起来,采用适当的标准进行综合性的分析评价,既全面体现企业整体财务状况,又指出指标与指标之间和指标与报表之间的内在联系,杜邦分析法就是其中的一种。
杜邦财务分析体系(TheDuPontSystem)是一种比较实用的财务比率分析体系。这种分析方法首先由美国杜邦公司的经理创造出来,故称之为杜邦财务分析体系。这种财务分析方法从评价企业绩效最具综合性和代表性的指标-权益净利率出发,层层分解至企业最基本生产要素的使用,成本与费用的构成和企业风险,从而满足通过财务分析进行绩效评价的需要,在经营目标发生异动时经营者能及时查明原因并加以修正,同时为投资者、债权人及政府评价企业提供依据。
一、杜邦分析法和杜邦分析图
杜邦模型最显著的特点是将若干个用以评价企业经营效率和财务状况的比率按其内在联系有机地结合起来,形成一个完整的指标体系,并最终通过权益收益率来综合反映。采用这一方法,可使财务比率分析的层次更清晰、条理更突出,为报表分析者全面仔细地了解企业的经营和盈利状况提供方便。
杜邦分析法有助于企业管理层更加清晰地看到权益资本收益率的决定因素,以及销售净利润率与总资产周转率、债务比率之间的相互关联关系,给管理层提供了一张明晰的考察公司资产管理效率和是否最大化股东投资回报的路线图。
杜邦分析法利用各个主要财务比率之间的内在联系,建立财务比率分析的综合模型,来综合地分析和评价企业财务状况和经营业绩的方法。采用杜邦分析图将有关分析指标按内在联系加以排列,从而直观地反映出企业的财务状况和经营成果的总体面貌。
杜邦财务分析体系如图所示:

二、对杜邦图的分析
1.图中各财务指标之间的关系:
可以看出杜邦分析法实际上从两个角度来分析财务,一是进行了内部管理因素分析,二是进行了资本结构和风险分析。
权益净利率=资产净利率×权益乘数
权益乘数=1÷(1-资产负债率)
资产净利率=销售净利率×总资产周转率
销售净利率=净利润÷销售收入
总资产周转率=销售收入÷总资产
资产负债率=负债总额÷总资产
2.杜邦分析图提供了下列主要的财务指标关系的信息:
(1)权益净利率是一个综合性最强的财务比率,是杜邦分析系统的核心。它反映所有者投入资本的获利能力,同时反映企业筹资、投资、资产运营等活动的效率,它的高低取决于总资产利润率和权益总资产率的水平。决定权益净利率高低的因素有三个方面--权益乘数、销售净利率和总资产周转率。权益乘数、销售净利率和总资产周转率三个比率分别反映了企业的负债比率、盈利能力比率和资产管理比率。
(2)权益乘数主要受资产负债率影响。负债比率越大,权益乘数越高,说明企业有较高的负债程度,给企业带来较多地杠杆利益,同时也给企业带来了较多地风险。资产净利率是一个综合性的指标,同时受到销售净利率和资产周转率的影响。
(3)资产净利率也是一个重要的财务比率,综合性也较强。它是销售净利率和总资产周转率的乘积,因此,要进一步从销售成果和资产营运两方面来分析。
销售净利率反映了企业利润总额与销售收入的关系,从这个意义上看提高销售净利率是提高企业盈利能力的关键所在。要想提高销售净利率:一是要扩大销售收入;二是降低成本费用。而降低各项成本费用开支是企业财务管理的一项重要内容。通过各项成本费用开支的列示,有利于企业进行成本费用的结构分析,加强成本控制,以便为寻求降低成本费用的途径提供依据。
企业资产的营运能力,既关系到企业的获利能力,又关系到企业的偿债能力。一般而言,流动资产直接体现企业的偿债能力和变现能力;非流动资产体现企业的经营规模和发展潜力。两者之间应有一个合理的结构比率,如果企业持有的现金超过业务需要,就可能影响企业的获利能力;如果企业占用过多的存货和应收账款,则既要影响获利能力,又要影响偿债能力。为此,就要进一步分析各项资产的占用数额和周转速度。对流动资产应重点分析存货是否有积压现象、货币资金是否闲置、应收账款中分析客户的付款能力和有无坏账的可能;对非流动资产应重点分析企业固定资产是否得到充分的利用。
三、利用杜邦分析法作实例分析
杜邦财务分析法可以解释指标变动的原因和变动趋势,以及为采取措施指明方向。下面以一家上市公司北汽福田汽车(600166)为例,说明杜邦分析法的运用。
福田汽车的基本财务数据如下表:

(一)对权益净利率的分析
权益净利率指标是衡量企业利用资产获取利润能力的指标。权益净利率充分考虑了筹资方式对企业获利能力的影响,因此它所反映的获利能力是企业经营能力、财务决策和筹资方式等多种因素综合作用的结果。
该公司的权益净利率在2001年至2002年间出现了一定程度的好转,分别从2001年的0.097增加至2002年的0.112.企业的投资者在很大程度上依据这个指标来判断是否投资或是否转让股份,考察经营者业绩和决定股利分配政策。这些指标对公司的管理者也至关重要。
公司经理们为改善财务决策而进行财务分析,他们可以将权益净利率分解为权益乘数和资产净利率,以找到问题产生的原因。
表三:权益净利率分析表

福田汽车权益净利率=权益乘数×资产净利率
2001年0.097=3.049×0.032
2002年0.112=2.874×0.039
通过分解可以明显地看出,该公司权益净利率的变动在于资本结构(权益乘数)变动和资产利用效果(资产净利率)变动两方面共同作用的结果。而该公司的资产净利率太低,显示出很差的资产利用效果。
(二)分解分析过程:
权益净利率=资产净利率×权益乘数
2001年0.097=0.032×3.049
2002年0.112=0.039×2.874
经过分解表明,权益净利率的改变是由于资本结构的改变(权益乘数下降),同时资产利用和成本控制出现变动(资产净利率也有改变)。那么,我们继续对资产净利率进行分解:
资产净利率=销售净利率×总资产周转率
2001年0.032=0.025×1.34
2002年0.039=0.017×2.29
通过分解可以看出2002年的总资产周转率有所提高,说明资产的利用得到了比较好的控制,显示出比前一年较好的效果,表明该公司利用其总资产产生销售收入的效率在增加。总资产周转率提高的同时销售净利率的减少阻碍了资产净利率的增加,我们接着对销售净利率进行分解:
销售净利率=净利润÷销售收入
2001年0.025=10284.04÷411224.01
2002年0.017=12653.92÷757613.81
该公司2002年大幅度提高了销售收入,但是净利润的提高幅度却很小,分析其原因是成本费用增多,从表一可知:全部成本从2001年403967.43万元增加到2002年736747.24万元,与销售收入的增加幅度大致相当。下面是对全部成本进行的分解:
全部成本=制造成本+销售费用+管理费用+财务费用
2001年403967.43=373534.53+10203.05+18667.77+1562.08
2002年736747.24=684559.91+21740.962+25718.20+5026.17通过分解可以看出杜邦分析法有效的解释了指标变动的原因和趋势,为采取应对措施指明了方向。
在本例中,导致权益利润率小的主原因是全部成本过大。也正是因为全部成本的大幅度提高导致了净利润提高幅度不大,而销售收入大幅度增加,就引起了销售净利率的减少,显示出该公司销售盈利能力的降低。资产净利率的提高当归功于总资产周转率的提高,销售净利率的减少却起到了阻碍的作用。
由表4可知,福田汽车下降的权益乘数,说明他们的资本结构在2001至2002年发生了变动2002年的权益乘数较2001年有所减小。权益乘数越小,企业负债程度越低,偿还债务能力越强,财务风险程度越低。这个指标同时也反映了财务杠杆对利润水平的影响。财务杠杆具有正反两方面的作用。在收益较好的年度,它可以使股东获得的潜在报酬增加,但股东要承担因负债增加而引起的风险;在收益不好的年度,则可能使股东潜在的报酬下降。该公司的权益乘数一直处于2~5之间,也即负债率在50%~80%之间,属于激进战略型企业。管理者应该准确把握公司所处的环境,准确预测利润,合理控制负债带来的风险。
因此,对于福田汽车,当前最为重要的就是要努力减少各项成本,在控制成本上下力气。同时要保持自己高的总资产周转率。这样,可以使销售利润率得到提高,进而使资产净利率有大的提高。
四、结论
综上所述,杜邦分析法以权益净利率为主线,将企业在某一时期的销售成果以及资产营运状况全面联系在一起,层层分解,逐步深入,构成一个完整的分析体系。它能较好的帮助管理者发现企业财务和经营管理中存在的问题,能够为改善企业经营管理提供十分有价值的信息,因而得到普遍的认同并在实际工作中得到广泛的应用。
但是杜邦分析法毕竟是财务分析方法的一种,作为一种综合分析方法,并不排斥其他财务分析方法。相反与其他分析方法结合,不仅可以弥补自身的缺陷和不足,而且也弥补了其他方法的缺点,使得分析结果更完整、更科学。比如以杜邦分析为基础,结合专项分析,进行一些后续分析对有关问题作更深更细致分析了解;也可结合比较分析法和趋势分析法,将不同时期的杜邦分析结果进行对比趋势化,从而形成动态分析,找出财务变化的规律,为预测、决策提供依据;或者与一些企业财务风险分析方法结合,进行必要的风险分析,也为管理者提供依据,所以这种结合,实质也是杜邦分析自身发展的需要。分析者在应用时,应注意这一点。

② 如何用Arma模型做股票估计

时间序列分析是经济领域应用研究最广泛的工具之一,它用恰当的模型描述历史数据随时间变化的规律,并分析预测变量值。ARMA模型是一种最常见的重要时间序列模型,被广泛应用到经济领域预测中。给出ARMA模型的模式和实现方法,然后结合具体股票数据揭示股票变换的规律性,并运用ARMA模型对股票价格进行预测。
选取长江证券股票具体数据进行实证分析
1.数据选取。
由于时间序列模型往往需要大样本,所以这里我选取长江证券从09/03/20到09/06/19日开盘价,前后约三个月,共计60个样本,基本满足ARMA建模要求。
数据来源:大智慧股票分析软件导出的数据(股价趋势图如下)
从上图可看出有一定的趋势走向,应为非平稳过程,对其取对数lnS,再观察其平稳性。
2.数据平稳性分析。
先用EVIEWS生成新序列lnS并用ADF检验其平稳性。
(1)ADF平稳性检验,首先直接对数据平稳检验,没通过检验,即不平稳。
可以看出lnS没有通过检验,也是一个非平稳过程,那么我们想到要对其进行差分。
(2)一阶差分后平稳性检验,ADF检验结果如下,通过1%的显著检验,即数据一阶差分后平稳。
可以看出差分后,明显看出ADF Test Statistic 为-5.978381绝对值是大于1%的显著水平下的临界值的,所以可以通过平稳性检验。
3.确定适用模型,并定阶。可以先生成原始数据的一阶差分数据dls,并观测其相关系数AC和偏自相关系数PAC,以确定其是为AR,MA或者是ARMA模型。
(1)先观测一阶差分数据dls的AC和PAC图。经检验可以看出AC和PAC皆没有明显的截尾性,尝试用ARMA模型,具体的滞后项p,q值还需用AIC和SC具体确定。
(2)尝试不同模型,根据AIC和SC最小化的原理确定模型ARMA(p,q)。经多轮比较不同ARMA(p,q)模型,可以得出相对应AIC 和 SC的值。
经过多次比较最终发现ARMA(1,1)过程的AIC和SC都是最小的。最终选取ARIMA(1,1,1)模型作为预测模型。并得出此模型的具体表达式为:
DLS t = 0.9968020031 DLS (t-1)- 1.164830718 U (t-1) + U t
4.ARMA模型的检验。选取ARIMA(1,1,1)模型,定阶和做参数估计后,还应对其残差序列进行检验,对其残差的AC和Q统计检验发现其残差自相关基本在0附近,且Q值基本通过检验,残差不明显存在相关,即可认为残差中没有包含太多信息,模型拟合基本符合。
5.股价预测。利用以上得出的模型,然后对长江证券6月22日、23日、24日股价预测得出预测值并与实际值比较如下。
有一定的误差,但相比前期的涨跌趋势基本吻合,这里出现第一个误差超出预想的是因为6月22日正好是礼拜一,波动较大,这里正验证了有研究文章用GARCH方法得出的礼拜一波动大的结果。除了礼拜一的误差大点,其他日期的误差皆在接受范围内。
综上所述,ARMA模型较好的解决了非平稳时间序列的建模问题,可以在时间序列的预测方面有很好的表现。借助EViews软件,可以很方便地将ARMA模型应用于金融等时间序列问题的研究和预测方面,为决策者提供决策指导和帮助。当然,由于金融时间序列的复杂性,很好的模拟还需要更进一步的研究和探讨。在后期,将继续在这方面做出自己的摸索。

③ 时间序列分析预测法优缺点

时间序列分析预测法有两个特点:

①时间序列分析预测法是根据市场过去的变化趋势预测未来的发展,它的前提是假定事物的过去会同样延续到未来。事物的现实是历史发展的结果,而事物的未来又是现实的延伸,事物的过去和未来是有联系的。市场预测的时间序列分析法,正是根据客观事物发展的这种连续规律性,运用过去的历史数据,通过统计分析,进一步推测市场未来的发展趋势。市场预测中,事物的过去会同样延续到未来,其意思是说,市场未来不会发生突然跳跃式变化,而是渐进变化的。

时间序列分析预测法的哲学依据,是唯物辩证法中的基本观点,即认为一切事物都是发展变化的,事物的发展变化在时间上具有连续性,市场现象也是这样。市场现象过去和现在的发展变化规律和发展水平,会影响到市场现象未来的发展变化规律和规模水平;市场现象未来的变化规律和水平,是市场现象过去和现在变化规律和发展水平的结果。

需要指出,由于事物的发展不仅有连续性的特点,而且又是复杂多样的。因此,在应用时间序列分析法进行市场预测时应注意市场现象未来发展变化规律和发展水平,不一定与其历史和现在的发展变化规律完全一致。随着市场现象的发展,它还会出现一些新的特点。因此,在时间序列分析预测中,决不能机械地按市场现象过去和现在的规律向外延伸。必须要研究分析市场现象变化的新特点,新表现,并且将这些新特点和新表现充分考虑在预测值内。这样才能对市场现象做出既延续其历史变化规律,又符合其现实表现的可靠的预测结果。

②时间序列分析预测法突出了时间因素在预测中的作用,暂不考虑外界具体因素的影响。时间序列在时间序列分析预测法处于核心位置,没有时间序列,就没有这一方法的存在。虽然,预测对象的发展变化是受很多因素影响的。但是,运用时间序列分析进行量的预测,实际上将所有的影响因素归结到时间这一因素上,只承认所有影响因素的综合作用,并在未来对预测对象仍然起作用,并未去分析探讨预测对象和影响因素之间的因果关系。因此,为了求得能反映市场未来发展变化的精确预测值,在运用时间序列分析法进行预测时,必须将量的分析方法和质的分析方法结合起来,从质的方面充分研究各种因素与市场的关系,在充分分析研究影响市场变化的各种因素的基础上确定预测值。

需要指出的是,时间序列预测法因突出时间序列暂不考虑外界因素影响,因而存在着预测误差的缺陷,当遇到外界发生较大变化,往往会有较大偏差,时间序列预测法对于中短期预测的效果要比长期预测的效果好。因为客观事物,尤其是经济现象,在一个较长时间内发生外界因素变化的可能性加大,它们对市场经济现象必定要产生重大影响。如果出现这种情况,进行预测时,只考虑时间因素不考虑外界因素对预测对象的影响,其预测结果就会与实际状况严重不符。

④ 时间序列在股市有哪些应用

时间序列分析在股票市场中的应用
摘要
在现代金融浪潮的推动下,越来越多的人加入到股市,进行投资行为,以期得到丰厚的回报,这极大促进了股票市场的繁荣。而在这种投资行为的背后,越来越多的投资者逐渐意识到股市预测的重要性。
所谓股票预测是指:根据股票现在行情的发展情况地对未来股市发展方向以及涨跌程度的预测行为。这种预测行为只是基于假定的因素为既定的前提条件为基础的。但是在股票市场中,行情的变化与国家的宏观经济发展、法律法规的制定、公司的运营、股民的信心等等都有关联,因此所谓的预测难于准确预计。
时间序列分析是经济预测领域研究的重要工具之一,它描述历史数据随时间变化的规律,并用于预测经济数据。在股票市场上,时间序列预测法常用于对股票价格趋势进行预测,为投资者和股票市场管理管理方提供决策依据。

⑤ 对股票收盘价进行时间序列分析,预测其下一个交易日的收盘价,并与实际收盘价格进行对比

股票投资的分析这么复杂啊,先问问老师有依据这个买股票没,再回答。

⑥ 应用计量经济学时间序列分析在股票预测上有多大的作用

作用没有想象中的大,你可以用股票的滞后变量来进行回归分析,滞后2~3期就够了,不过数据必须具体点,最好细分到每季度、每月的上证指数,还有时间上怎么也要十年左右吧!

我以前在论文附录中做过分析,数据都是自己按季度整理的,挺麻烦的呢,如果需要的话就发给你~

还有就是,我觉得写关于股票的预测方面的实际用处并不是很大,毕竟股票的影响因素太多,单单的凭借以前的走势而预期太不好了。。我自己也炒股票,就像那些macd、kdj之类的指标根本就起不到太大的作用,如果那个能预期的话,股市岂不就成了提款机了?现在你做的这个就像是那些指标一样,要知道,股市是活的,人是活的,而指标确实死的!说这么多的意思就是股市不是能简单预测的,你做的那个用处不大。。

如果你想做的话,建议换个题目,我当时的写的是对弗里德曼的货币需求理论在中国市场的分析。你可以写写货币供应量对通货膨胀的时滞性,分析下在我国市场的滞后期大概是多少~数据在国家统计局和中国人民银行都可以找到的,样本空间一定要足够大,在对滞后变量分析时候主要考虑各自的T检验是否通过,一般从通过之后大概就是那个的滞后期!这个比较直接反而有些许用处~
要是能分析出国家的一般性政策对实体市场的影响就更好了,更有用了~

呵呵,以上只是自己的建议~有什么其他的问题就给我留言吧~

⑦ 时间序列分析方法

时间序列是指一组在连续时间上测得的数据,其在数学上的定义是一组向量x(t), t=0,1,2,3,...,其中t表示数据所在的时间点,x(t)是一组按时间顺序(测得)排列的随机变量。包含单个变量的时间序列称为单变量时间序列,而包含多个变量的时间序列则称为多变量。

时间序列在很多方面多有涉及到,如天气预报,每天每个小时的气温,股票走势等等,在商业方面有诸多应用,如:

下面我们将通过一个航班数据来说明如何使用已有的工具来进行时间序列数据预测。常用来处理时间序列的包有三个:

对于基于AR、MA的方法一般需要数据预处理,因此本文分为三部分:

通过简单的初步处理以及可视化可以帮助我们有效快速的了解数据的分布(以及时间序列的趋势)。

观察数据的频率直方图以及密度分布图以洞察数据结构,从下图可以看出:

使用 statsmodels 对该时间序列进行分解,以了解该时间序列数据的各个部分,每个部分都代表着一种模式类别。借用 statsmodels 序列分解我们可以看到数据的主要趋势成分、季节成分和残差成分,这与我们上面的推测相符合。

如果一个时间序列的均值和方差随着时间变化保持稳定,则可以说这个时间序列是稳定的。

大多数时间序列模型都是在平稳序列的前提下进行建模的。造成这种情况的主要原因是序列可以有许多种(复杂的)非平稳的方式,而平稳性只有一种,更加的易于分析,易于建模。

在直觉上,如果一段时间序列在某一段时间序列内具有特定的行为,那么将来很可能具有相同的行为。譬如已连续观察一个星期都是六点出太阳,那么可以推测明天也是六点出太阳,误差非常小。

而且,与非平稳序列相比,平稳序列相关的理论更加成熟且易于实现。

一般可以通过以下几种方式来检验序列的平稳性:

如果时间序列是平稳性的,那么在ACF/PACF中观测点数据与之前数据点的相关性会急剧下降。

下图中的圆锥形阴影是置信区间,区间外的数据点说明其与观测数据本身具有强烈的相关性,这种相关性并非来自于统计波动。

PACF在计算X(t)和X(t-h)的相关性的时候,挖空在(t-h,t)上所有数据点对X(t)的影响,反应的是X(t)和X(t-h)之间真实的相关性(直接相关性)。

从下图可以看出,数据点的相关性并没有急剧下降,因此该序列是非平稳的。

如果序列是平稳的,那么其滑动均值/方差会随着时间的变化保持稳定。

但是从下图我们可以看到,随着时间的推移,均值呈现明显的上升趋势,而方差也呈现出波动式上升的趋势,因此该序列是非平稳的。

一般来讲p值小于0.05我们便认为其是显著性的,可以拒绝零假设。但是这里的p值为0.99明显是非显著性的,因此接受零假设,该序列是非平稳的。

从上面的平稳性检验我们可以知道该时间序列为非平稳序列。此外,通过上面1.3部分的序列分解我们也可以看到,该序列可分解为3部分:

我们可以使用数据转换来对那些较大的数据施加更大的惩罚,如取对数、开平方根、立方根、差分等,以达到序列平稳的目的。

滑动平均后数据失去了其原来的特点(波动式上升),这样损失的信息过多,肯定是无法作为后续模型的输入的。

差分是常用的将非平稳序列转换平稳序列的方法。ARIMA中的 'I' 便是指的差分,因此ARIMA是可以对非平稳序列进行处理的,其相当于先将非平稳序列通过差分转换为平稳序列再来使用ARMA进行建模。

一般差分是用某时刻数值减去上一时刻数值来得到新序列。但这里有一点区别,我们是使用当前时刻数值来减去其对应时刻的滑动均值。

我们来看看刚刚差分的结果怎么样。

让我们稍微总结下我们刚刚的步骤:

通过上面的3步我们成功的将一个非平稳序列转换成了一个平稳序列。上面使用的是最简单的滑动均值,下面我们试试指数滑动平均怎么样。

上面是最常用的指数滑动平均的定义,但是pandas实现的指数滑动平均好像与这个有一点区别,详细区别还得去查pandas文档。

指数滑动均值的效果看起来也很差。我们使用差分+指数滑动平均再来试试吧。

在上面我们通过 取log+(指数)滑动平均+差分 已经成功将非平稳序列转换为了平稳序列。

下面我们看看,转换后的平稳序列的各个成分是什么样的。不过这里我们使用的是最简单的差分,当前时刻的值等于原始序列当前时刻的值减去原始序列中上一时刻的值,即: x'(t) = x(t) - x(t-1)。

看起来挺不错,是个平稳序列的样子。不过,还是检验一下吧。

可以看到,趋势(Trend)部分已基本被去除,但是季节性(seasonal)部分还是很明显,而ARIMA是无法对含有seasonal的序列进行建模分析的。

在一开始我们提到了3个包均可以对时间序列进行建模。

为了简便,这里 pmdarima 和 statsmodels.tsa 直接使用最好的建模方法即SARIMA,该方法在ARIMA的基础上添加了额外功能,可以拟合seasonal部分以及额外添加的数据。

在使用ARIMA(Autoregressive Integrated Moving Average)模型前,我们先简单了解下这个模型。这个模型其实可以包括三部分,分别对应着三个参数(p, d, q):

因此ARIMA模型就是将AR和MA模型结合起来然后加上差分,克服了不能处理非平稳序列的问题。但是,需要注意的是,其仍然无法对seasonal进行拟合。

下面开始使用ARIMA来拟合数据。

(1) 先分训练集和验证集。需要注意的是这里使用的原始数据来进行建模而非转换后的数据。

(2)ARIMA一阶差分建模并预测

(3)对差分结果进行还原

先手动选择几组参数,然后参数搜索找到最佳值。需要注意的是,为了避免过拟合,这里的阶数一般不太建议取太大。

可视化看看结果怎么样吧。

(6)最后,我们还能对拟合好的模型进行诊断看看结果怎么样。

我们主要关心的是确保模型的残差(resial)部分互不相关,并且呈零均值正态分布。若季节性ARIMA(SARIMA)不满足这些属性,则表明它可以进一步改善。模型诊断根据下面的几个方面来判断残差是否符合正态分布:

同样的,为了方便,我们这里使用 pmdarima 中一个可以自动搜索最佳参数的方法 auto_arima 来进行建模。

一般来说,在实际生活和生产环节中,除了季节项,趋势项,剩余项之外,通常还有节假日的效应。所以,在prophet算法里面,作者同时考虑了以上四项,即:

上式中,

更多详细Prophet算法内容可以参考 Facebook 时间序列预测算法 Prophet 的研究 。

Prophet算法就是通过拟合这几项,然后把它们累加起来得到时间序列的预测值。

Prophet提供了直观且易于调整的参数:

Prophet对输入数据有要求:

关于 Prophet 的使用例子可以参考 Prophet example notebooks

下面使用 Prophet 来进行处理数据。

参考:
Facebook 时间序列预测算法 Prophet 的研究
Prophet example notebooks
auto_arima documentation for selecting best model
数据分析技术:时间序列分析的AR/MA/ARMA/ARIMA模型体系
https://github.com/advaitsave/Introction-to-Time-Series-forecasting-Python
时间序列分析
My First Time Series Comp (Added Prophet)
Prophet官方文档: https://facebookincubator.github.io