当前位置:首页 » 价格知识 » 贝叶斯预测股票价格
扩展阅读
擅自炒作别人股票账户 2025-02-02 09:33:58
银河表计股票代码 2025-02-02 09:29:16
中国股市一直涨的股票 2025-02-02 08:39:22

贝叶斯预测股票价格

发布时间: 2023-03-12 19:47:09

① 如何理解贝叶斯估计

贝叶斯理论
1.贝叶斯法则
机器学习的任务:在给定训练数据D时,确定假设空间H中的最佳假设。
最佳假设:一种方法是把它定义为在给定数据D以及H中不同假设的先验概率的有关知识下的最可能假设。贝叶斯理论提供了一种计算假设概率的方法,基于假设的先验概率、给定假设下观察到不同数据的概率以及观察到的数据本身。

2.先验概率和后验概率
用P(h)表示在没有训练数据前假设h拥有的初始概率。P(h)被称为h的先验概率。先验概率反映了关于h是一正确假设的机会的背景知识如果没有这一先验知识,可以简单地将每一候选假设赋予相同的先验概率。类似地,P(D)表示训练数据D的先验概率,P(D|h)表示假设h成立时D的概率。机器学习中,我们关心的是P(h|D),即给定D时h的成立的概率,称为h的后验概率。

3.贝叶斯公式
贝叶斯公式提供了从先验概率P(h)、P(D)和P(D|h)计算后验概率P(h|D)的方法
p(h|D)=P(D|H)*P(H)/P(D)
P(h|D)随着P(h)和P(D|h)的增长而增长,随着P(D)的增长而减少,即如果D独立于h时被观察到的可能性越大,那么D对h的支持度越小。

4.极大后验假设
学习器在候选假设集合H中寻找给定数据D时可能性最大的假设h,h被称为极大后验假设(MAP)
确定MAP的方法是用贝叶斯公式计算每个候选假设的后验概率,计算式如下:
h_map=argmax P(h|D)=argmax (P(D|h)*P(h))/P(D)=argmax P(D|h)*p(h) (h属于集合H)
最后一步,去掉了P(D),因为它是不依赖于h的常量。

5.极大似然假设
在某些情况下,可假定H中每个假设有相同的先验概率,这样式子可以进一步简化,只需考虑P(D|h)来寻找极大可能假设。
h_ml = argmax p(D|h) h属于集合H
P(D|h)常被称为给定h时数据D的似然度,而使P(D|h)最大的假设被称为极大似然假设。

6.举例
一个医疗诊断问题
有两个可选的假设:病人有癌症、病人无癌症
可用数据来自化验结果:正+和负-
有先验知识:在所有人口中,患病率是0.008
对确实有病的患者的化验准确率为98%,对确实无病的患者的化验准确率为97%
总结如下
P(cancer)=0.008, P(cancer)=0.992
P(+|cancer)=0.98, P(-|cancer)=0.02
P(+|cancer)=0.03, P(-|cancer)=0.97
问题:假定有一个新病人,化验结果为正,是否应将病人断定为有癌症?求后验概率P(cancer|+)和P(cancer|+)
因此极大后验假设计算如下:
P(+|cancer)P(cancer)=0.0078
P(+|cancer)P(cancer)=0.0298
hMAP=cancer
确切的后验概率可将上面的结果归一化以使它们的和为1
P(canner|+)=0.0078/(0.0078+0.0298)=0.21
P(cancer|-)=0.79
贝叶斯推理的结果很大程度上依赖于先验概率,另外不是完全接受或拒绝假设,只是在观察到较多的数据后增大或减小了假设的可能性。

② 贝叶斯公式的应用

写作话题:

贝叶斯预测模型在矿物含量预测中的应用
贝叶斯预测模型在气温变化预测中的应用
贝叶斯学习原理及其在预测未来地震危险中的应用
基于稀疏贝叶斯分类器的汽车车型识别
信号估计中的贝叶斯方法及应用
贝叶斯神经网络在生物序列分析中的应用
基于贝叶斯网络的海上目标识别
贝叶斯原理在发动机标定中的应用
贝叶斯法在继电器可靠性评估中的应用

相关书籍:

Arnold Zellner 《Bayesian Econometrics: Past, Present and Future》
Springer 《贝叶斯决策》
黄晓榕 《经济信息价格评估以及贝叶斯方法的应用》
张丽 , 闫善文 , 刘亚东 《全概率公式与贝叶斯公式的应用及推广》
周丽琴 《贝叶斯均衡的应用》
王辉 , 张剑飞 , 王双成 《基于预测能力的贝叶斯网络结构学习》
张旭东 , 陈锋 , 高隽 , 方廷健 《稀疏贝叶斯及其在时间序列预测中的应用》
邹林全 《贝叶斯方法在会计决策中的应用》
周丽华 《市场预测中的贝叶斯公式应用》
夏敏轶 , 张焱 《贝叶斯公式在风险决策中的应用》
臧玉卫 , 王萍 , 吴育华 《贝叶斯网络在股指期货风险预警中的应用》
党佳瑞 , 胡杉杉 , 蓝伯雄 《基于贝叶斯决策方法的证券历史数据有效性分析》
肖玉山 , 王海东 《无偏预测理论在经验贝叶斯分析中的应用》
严惠云 , 师义民 《Linex损失下股票投资的贝叶斯预测》
卜祥志 , 王绍绵 , 陈文斌 , 余贻鑫 , 岳顺民 《贝叶斯拍卖定价方法在配电市场定价中的应用》
刘嘉焜 , 范贻昌 , 刘波 《分整模型在商品价格预测中的应用》
《Bayes方法在经营决策中的应用》
《决策有用性的信息观》
《统计预测和决策课件》
《贝叶斯经济时间序列预测模型及其应用研究》
《贝叶斯统计推断》
《决策分析理论与实务》

③ 动量效应的研究发展

自从Jegadeesh和Titman(1993)发现股市存在动量效应以来,对动量效应的研究逐渐成为金融学中最“核心”的领域。行为金融学和传统金融理论对此类问题的解释始终存在分歧。
一、行为金融与中国大陆股市的动量效应
(一)传统金融理论与行为金融模型
Fama和French(1993,1996)等从传统理论的角度对动量效应进行了解释:动量效应不是市场无效的证据,动量策略的超额收益可能与人们采用的理论工具有关——在资本资产定价模型中,β值不是好的风险指标,只要在因子模型中加入新风险因子,超额收益或许就会消失。但对因子模型中应当加入哪些风险因子,学者们未能达成共识。
行为金融则认为传统金融理论的前提出了问题,因而试图从投资者的决策行为入手来找出动量效应的产生机制,但这些解释也存在缺陷。Shefrin(2000)认为,行为金融模型对投资人行为模式的假设,并没有以心理学试验为基础,缺乏合理的依据。正如Peter(1999)所认为的:“为了发展一个理论模型而寻找不合理的逻辑假设就好比把车放到了马前头”。与此同时,这也使经济学失去了自己的特点,经济学毕竟不是心理学,它不应该研究具体的认知模式,其假设应具有一定的概括性与抽象性。
(二)中国股市的动量效应与行为金融
对于中国股市的动量效应,中国学者进行了大量研究。王永宏、赵学军(2001),朱战宇、吴冲锋和王承炜(2003),吴世农、吴超鹏(2003),肖军、徐信忠(2004),马超群、张浩(2005),赵振全、丁志国和苏治(2005),林松立、唐旭(2005)等都认为,如果采用月度数据检验,中国大陆股市并不存在明显的动量效应,而中长期反转现象则比较突出;周琳杰(2002)发现动量策略的利润对形成期和持有期的期限敏感,形成期和持有期为一个月的动量策略赢利性最为显著;刘煜辉、贺菊煌和沈可挺(2003)则认为形成期和持有期在2周和24周之间的动量策略有显著收益;余书炜(2004)则发现形成期和持有期在10到15天的动量策略有显著收益。曹敏、吴冲锋(2004)认为,中国大陆证券市场作为新兴市场,和西方证券市场的反向策略存在差异,主要表现在中国股市的反向周期短于西方发达国家。
虽然以上实证研究的样本期间不尽相同,但一致结论是中国股市的动量策略利润只存在于形成期和持有期在4周以内的周期策略中;而西方国家股市的动量策略利润一般存在于形成期、持有期为中期(3-12个月)的策略中。朱战宇、吴冲锋和王承炜(2003)等都认为,BSV模型、DHS模型、HS模型等模型没有揭示出中国股市动量效应产生的机制。他们认为,BSV模型、DHS模型等模型中的投资者是根据对上市公司业绩的预期来对公司的股票进行估价的,这符合发达资本市场上投资者的投资行为模式,而国内投资者基本上不关心公司的基本面,爱好短线操作,容易出现跟风等现象,从投资者认识偏差角度来解释中国股市的动量效应并不合适。
二、奈特不确定性视角下的股市动量效应
1.不确定性的两种分类
奈特(Knight,1921)把未来的不确定性分成两种情况:一种是具有确定概率分布的不确定性,就是常说的“风险”(risk);另一种是没有确定概率分布的不确定性,其主观概率是不确定的,称为奈特不确定性或模糊(ambiguity)。如果抛硬币的话,你会知道风险有多大,如果赌正面,赢的概率是50%。奈特认为,当你完全不知道各种可能性状态以及各种状态的概率时,就存在奈特不确定性。Savage(1954)等认为,虽然有时不能计算出某种事件的概率分布,但我们可以对这个事件指定一个先验信念,这对建立数理模型的技术选择没有什么区别,因此,奈特对不确定性的分类没有意义了。Ellsberg(1961)等通过一系列试验否定了Savage假设。他们的试验表明,奈特对不确定性的划分是有意义的。这些试验还表明,人们常对奈特不确定性表现出厌恶的倾向,即便告诉试验者Ellsberg试验存在逻辑上的矛盾,试验者仍然坚持自己的选择,并愿意为避免奈特不确定性而支付溢价。他们发现有人喜欢赌博(风险),却不喜欢奈特不确定性,厌恶奈特不确定性的人不一定厌恶风险。这进一步证实奈特的观点:风险厌恶和奈特不确定性是两种不同的现象。他们还发现,在面临奈特不确定性时,人们更在乎别人的想法,更容易形成“羊群效应”。
2.系统的复杂性造成了奈特不确定性
奈特不确定性是如何产生的呢?现代自然科学证明,由于系统内部的非线性机制(或正反馈机制或复杂性机制)造成了系统的进化,从而形成了奈特不确定性。如果系统是一个简单的系统,那么这个随机过程就是遍历的(ergodic),可以通过频数试验等方式得到这个过程的概率分布。自然界大多数随机事件都属于这种过程,这种过程就是一般不确定性——风险。但如果系统是进化的,过程就是非遍历的(nonergodic),即使具备了历史的和当前的所有信息(完全信息),也无法获得某种未来不确定事件的概率分布,因为它不是过去过程的简单重复,永远有新的状态被创造出来,我们不能预知这个状态,更不可能获得这种状态的概率分布。经济社会中的大多数系统都属于这种过程,这种不确定性就是奈特不确定性。
(二)奈特不确定性视角下的动量效应微观机制
Lewellen和Shanken(2002)认为,股票价格序列的可预测性与股票定价过程中的“参数的不确定性”有关,当决策者对未来现金流量的先验信念不确定时(即存在概率分布的不确定性时),代表性投资者通过贝叶斯过程逐渐更新信念,这个学习过程渗透到股票定价过程中,导致股票价格正相关。
徐元栋、黄登仕(2003),徐元栋(2004)从奈特不确定性的角度探讨了股市动量效应产生的微观机制。与LS模型类似,投资者也不可能准确地确定未来现金流量的的概率分布,原因就是投资者面临奈特不确定性。与LS模型不同,他们认为,市场上的投资者不能用一个“代表性投资者”来代替,这些投资者是不同质的,他们对未来现金流量具有不同的先验信念。当这些异质投资者出现市场传染现象时,就造成了动量效应。
Ford、Kelsey和Pang(2006)则从微观金融角度研究了动量(反向)效应产生的机制。当市场上出现模糊(ambiguity)信号、不能确定股票的基本价值(面临奈特不确定性)时,如果做市商与投资者都表现出乐观情绪(悲观情绪),股市就会出现动量现象。
Gerdjikova(2006)试图在CBD理论(Casebased Decision Theory,案例决策理论)下解释股市上的所有异常现象。由于投资者面临奈特不确定性,他无法确定股票的基本价值。如果股票价值在合理区间内,投资者为了追求更多财富而在股市上频繁交易从而造成了动量效应。
奈特不确定性视角下的动量效应机制理论认为,投资者不能确定股票未来现金流量的概率分布,异质投资者的市场传染或者情绪的悲观(乐观)造成了动量效应。这些模型可以较好地解释中国股市的动量现象。行为金融认为,决策者对股票现金流量的概率分布是确定的,不存在所谓“奈特不确定性”,是有限理性的投资者犯了认识偏差错误,从而造成了动量效应。这两种解释的最大分歧在于对不确定性的处理。
(三)奈特不确定性视角下的“奈特不确定性厌恶”补偿模型
近年来,西方学者开始从奈特不确定性“厌恶”的角度来研究动量策略的“利润”的来源。Andrew和Hodrick(2006)、Zhang(2006)等发现动量策略的超额利润以及收益率横断面差异与奈特不确定性有正相关关系。Anderson、Ghysels和Juergens(2005,2006)则试图在资产定价模型中加入“奈特不确定性厌恶因子”来解释股市中的动量效应现象。从奈特不确定性角度看,投资者除面临一般风险外,还面临“更高级风险”,即奈特不确定性。只要在定价因子模型中考虑这种“更高级风险”,异常超额收益就会消失。
(四)奈特不确定性视角下两种解释方案的逻辑联系
从奈特不确定性视角来研究动量效应也有两条思路:一是从奈特不确定性角度研究动量效应产生的机制;二是在传统的资产定价模型中加入“奈特不确定性厌恶因子”,将其作为动量策略“超额”利润产生的来源。从逻辑上看,这两条思路并不矛盾,奈特不确定性视角下的动量效应的微观机制涉及的是“里”,“奈特不确定性厌恶补偿”模型涉及的是“结果”,是“表”。以奈特不确定性为逻辑起点,可以将这两条研究思路紧密地联系在一起。
行为金融模型主要从认识性偏差(或噪声)或信息不完全的角度对动量效应等异常现象进行了解释。但问题是既然这些直觉性决策容易导致认知偏差,投资者为什么仍然采取直觉性决策模式呢?行为金融没有给出“理性”决策者产生上述决策行为模式的原因。实际上,投资者面临的是奈特不确定性的环境,表现为事实上的“有限理性”。从决策行为可以看出人类在进化过程中的学习与记忆自适应性:倾向于本能的自我安全感(自我控制、认知失调)以及通过直觉性决策方式进行决策,即原则理性(rule rationality)(Aumann,1997)。在原则理性的视角下,如果决策者处于一个复杂的、奈特不确定性的世界,采用直觉性决策是合乎他们的理性的。
行为金融没有对“噪声”给出一个确切的定义。如果噪声是与投资价值无关的信息,作为理性投资者为什么不能过滤噪声?行为金融学也重点研究在信息不对称的情况下,有信息优势或劣势的投资者的行为对证券价格的影响。有人认为,对于公开市场上的大量、普遍交易的股票来说,投资者之间信息不对称的可能性很小,也就是说不存在使股票价格产生大波动的信息不对称问题。也有人认为,“噪声”是与股票价值相关的信息,但由于投资者在面临奈特不确定性时的“原则理性”,决策者只能凭直觉利用这些信息。

④ 用libsvm做时间序列预测,为什么训练数据越少越准确

楼主的说法似乎不太对


首先,训练数据的主要区别是什么是测试数据:


如果我有一堆计时数据,首先随机分为两堆,一堆训练只用于看模型是好的,然后前者称为训练数据。下面是几个训练数据序列。(注意不要把训练数据的结果作为模型质量的度量,这是最基本的)。

最后,如果像预测股票价格一切都那样简单,那么就不需要这么多机器学习和金融专家才能进行高频交易。