當前位置:首頁 » 價格知識 » 貝葉斯預測股票價格
擴展閱讀
擅自炒作別人股票賬戶 2025-02-02 09:33:58
銀河表計股票代碼 2025-02-02 09:29:16
中國股市一直漲的股票 2025-02-02 08:39:22

貝葉斯預測股票價格

發布時間: 2023-03-12 19:47:09

① 如何理解貝葉斯估計

貝葉斯理論
1.貝葉斯法則
機器學習的任務:在給定訓練數據D時,確定假設空間H中的最佳假設。
最佳假設:一種方法是把它定義為在給定數據D以及H中不同假設的先驗概率的有關知識下的最可能假設。貝葉斯理論提供了一種計算假設概率的方法,基於假設的先驗概率、給定假設下觀察到不同數據的概率以及觀察到的數據本身。

2.先驗概率和後驗概率
用P(h)表示在沒有訓練數據前假設h擁有的初始概率。P(h)被稱為h的先驗概率。先驗概率反映了關於h是一正確假設的機會的背景知識如果沒有這一先驗知識,可以簡單地將每一候選假設賦予相同的先驗概率。類似地,P(D)表示訓練數據D的先驗概率,P(D|h)表示假設h成立時D的概率。機器學習中,我們關心的是P(h|D),即給定D時h的成立的概率,稱為h的後驗概率。

3.貝葉斯公式
貝葉斯公式提供了從先驗概率P(h)、P(D)和P(D|h)計算後驗概率P(h|D)的方法
p(h|D)=P(D|H)*P(H)/P(D)
P(h|D)隨著P(h)和P(D|h)的增長而增長,隨著P(D)的增長而減少,即如果D獨立於h時被觀察到的可能性越大,那麼D對h的支持度越小。

4.極大後驗假設
學習器在候選假設集合H中尋找給定數據D時可能性最大的假設h,h被稱為極大後驗假設(MAP)
確定MAP的方法是用貝葉斯公式計算每個候選假設的後驗概率,計算式如下:
h_map=argmax P(h|D)=argmax (P(D|h)*P(h))/P(D)=argmax P(D|h)*p(h) (h屬於集合H)
最後一步,去掉了P(D),因為它是不依賴於h的常量。

5.極大似然假設
在某些情況下,可假定H中每個假設有相同的先驗概率,這樣式子可以進一步簡化,只需考慮P(D|h)來尋找極大可能假設。
h_ml = argmax p(D|h) h屬於集合H
P(D|h)常被稱為給定h時數據D的似然度,而使P(D|h)最大的假設被稱為極大似然假設。

6.舉例
一個醫療診斷問題
有兩個可選的假設:病人有癌症、病人無癌症
可用數據來自化驗結果:正+和負-
有先驗知識:在所有人口中,患病率是0.008
對確實有病的患者的化驗准確率為98%,對確實無病的患者的化驗准確率為97%
總結如下
P(cancer)=0.008, P(cancer)=0.992
P(+|cancer)=0.98, P(-|cancer)=0.02
P(+|cancer)=0.03, P(-|cancer)=0.97
問題:假定有一個新病人,化驗結果為正,是否應將病人斷定為有癌症?求後驗概率P(cancer|+)和P(cancer|+)
因此極大後驗假設計算如下:
P(+|cancer)P(cancer)=0.0078
P(+|cancer)P(cancer)=0.0298
hMAP=cancer
確切的後驗概率可將上面的結果歸一化以使它們的和為1
P(canner|+)=0.0078/(0.0078+0.0298)=0.21
P(cancer|-)=0.79
貝葉斯推理的結果很大程度上依賴於先驗概率,另外不是完全接受或拒絕假設,只是在觀察到較多的數據後增大或減小了假設的可能性。

② 貝葉斯公式的應用

寫作話題:

貝葉斯預測模型在礦物含量預測中的應用
貝葉斯預測模型在氣溫變化預測中的應用
貝葉斯學習原理及其在預測未來地震危險中的應用
基於稀疏貝葉斯分類器的汽車車型識別
信號估計中的貝葉斯方法及應用
貝葉斯神經網路在生物序列分析中的應用
基於貝葉斯網路的海上目標識別
貝葉斯原理在發動機標定中的應用
貝葉斯法在繼電器可靠性評估中的應用

相關書籍:

Arnold Zellner 《Bayesian Econometrics: Past, Present and Future》
Springer 《貝葉斯決策》
黃曉榕 《經濟信息價格評估以及貝葉斯方法的應用》
張麗 , 閆善文 , 劉亞東 《全概率公式與貝葉斯公式的應用及推廣》
周麗琴 《貝葉斯均衡的應用》
王輝 , 張劍飛 , 王雙成 《基於預測能力的貝葉斯網路結構學習》
張旭東 , 陳鋒 , 高雋 , 方廷健 《稀疏貝葉斯及其在時間序列預測中的應用》
鄒林全 《貝葉斯方法在會計決策中的應用》
周麗華 《市場預測中的貝葉斯公式應用》
夏敏軼 , 張焱 《貝葉斯公式在風險決策中的應用》
臧玉衛 , 王萍 , 吳育華 《貝葉斯網路在股指期貨風險預警中的應用》
黨佳瑞 , 胡杉杉 , 藍伯雄 《基於貝葉斯決策方法的證券歷史數據有效性分析》
肖玉山 , 王海東 《無偏預測理論在經驗貝葉斯分析中的應用》
嚴惠雲 , 師義民 《Linex損失下股票投資的貝葉斯預測》
卜祥志 , 王紹綿 , 陳文斌 , 余貽鑫 , 岳順民 《貝葉斯拍賣定價方法在配電市場定價中的應用》
劉嘉焜 , 范貽昌 , 劉波 《分整模型在商品價格預測中的應用》
《Bayes方法在經營決策中的應用》
《決策有用性的信息觀》
《統計預測和決策課件》
《貝葉斯經濟時間序列預測模型及其應用研究》
《貝葉斯統計推斷》
《決策分析理論與實務》

③ 動量效應的研究發展

自從Jegadeesh和Titman(1993)發現股市存在動量效應以來,對動量效應的研究逐漸成為金融學中最「核心」的領域。行為金融學和傳統金融理論對此類問題的解釋始終存在分歧。
一、行為金融與中國大陸股市的動量效應
(一)傳統金融理論與行為金融模型
Fama和French(1993,1996)等從傳統理論的角度對動量效應進行了解釋:動量效應不是市場無效的證據,動量策略的超額收益可能與人們採用的理論工具有關——在資本資產定價模型中,β值不是好的風險指標,只要在因子模型中加入新風險因子,超額收益或許就會消失。但對因子模型中應當加入哪些風險因子,學者們未能達成共識。
行為金融則認為傳統金融理論的前提出了問題,因而試圖從投資者的決策行為入手來找出動量效應的產生機制,但這些解釋也存在缺陷。Shefrin(2000)認為,行為金融模型對投資人行為模式的假設,並沒有以心理學試驗為基礎,缺乏合理的依據。正如Peter(1999)所認為的:「為了發展一個理論模型而尋找不合理的邏輯假設就好比把車放到了馬前頭」。與此同時,這也使經濟學失去了自己的特點,經濟學畢竟不是心理學,它不應該研究具體的認知模式,其假設應具有一定的概括性與抽象性。
(二)中國股市的動量效應與行為金融
對於中國股市的動量效應,中國學者進行了大量研究。王永宏、趙學軍(2001),朱戰宇、吳沖鋒和王承煒(2003),吳世農、吳超鵬(2003),肖軍、徐信忠(2004),馬超群、張浩(2005),趙振全、丁志國和蘇治(2005),林松立、唐旭(2005)等都認為,如果採用月度數據檢驗,中國大陸股市並不存在明顯的動量效應,而中長期反轉現象則比較突出;周琳傑(2002)發現動量策略的利潤對形成期和持有期的期限敏感,形成期和持有期為一個月的動量策略贏利性最為顯著;劉煜輝、賀菊煌和沈可挺(2003)則認為形成期和持有期在2周和24周之間的動量策略有顯著收益;余書煒(2004)則發現形成期和持有期在10到15天的動量策略有顯著收益。曹敏、吳沖鋒(2004)認為,中國大陸證券市場作為新興市場,和西方證券市場的反向策略存在差異,主要表現在中國股市的反向周期短於西方發達國家。
雖然以上實證研究的樣本期間不盡相同,但一致結論是中國股市的動量策略利潤只存在於形成期和持有期在4周以內的周期策略中;而西方國家股市的動量策略利潤一般存在於形成期、持有期為中期(3-12個月)的策略中。朱戰宇、吳沖鋒和王承煒(2003)等都認為,BSV模型、DHS模型、HS模型等模型沒有揭示出中國股市動量效應產生的機制。他們認為,BSV模型、DHS模型等模型中的投資者是根據對上市公司業績的預期來對公司的股票進行估價的,這符合發達資本市場上投資者的投資行為模式,而國內投資者基本上不關心公司的基本面,愛好短線操作,容易出現跟風等現象,從投資者認識偏差角度來解釋中國股市的動量效應並不合適。
二、奈特不確定性視角下的股市動量效應
1.不確定性的兩種分類
奈特(Knight,1921)把未來的不確定性分成兩種情況:一種是具有確定概率分布的不確定性,就是常說的「風險」(risk);另一種是沒有確定概率分布的不確定性,其主觀概率是不確定的,稱為奈特不確定性或模糊(ambiguity)。如果拋硬幣的話,你會知道風險有多大,如果賭正面,贏的概率是50%。奈特認為,當你完全不知道各種可能性狀態以及各種狀態的概率時,就存在奈特不確定性。Savage(1954)等認為,雖然有時不能計算出某種事件的概率分布,但我們可以對這個事件指定一個先驗信念,這對建立數理模型的技術選擇沒有什麼區別,因此,奈特對不確定性的分類沒有意義了。Ellsberg(1961)等通過一系列試驗否定了Savage假設。他們的試驗表明,奈特對不確定性的劃分是有意義的。這些試驗還表明,人們常對奈特不確定性表現出厭惡的傾向,即便告訴試驗者Ellsberg試驗存在邏輯上的矛盾,試驗者仍然堅持自己的選擇,並願意為避免奈特不確定性而支付溢價。他們發現有人喜歡賭博(風險),卻不喜歡奈特不確定性,厭惡奈特不確定性的人不一定厭惡風險。這進一步證實奈特的觀點:風險厭惡和奈特不確定性是兩種不同的現象。他們還發現,在面臨奈特不確定性時,人們更在乎別人的想法,更容易形成「羊群效應」。
2.系統的復雜性造成了奈特不確定性
奈特不確定性是如何產生的呢?現代自然科學證明,由於系統內部的非線性機制(或正反饋機制或復雜性機制)造成了系統的進化,從而形成了奈特不確定性。如果系統是一個簡單的系統,那麼這個隨機過程就是遍歷的(ergodic),可以通過頻數試驗等方式得到這個過程的概率分布。自然界大多數隨機事件都屬於這種過程,這種過程就是一般不確定性——風險。但如果系統是進化的,過程就是非遍歷的(nonergodic),即使具備了歷史的和當前的所有信息(完全信息),也無法獲得某種未來不確定事件的概率分布,因為它不是過去過程的簡單重復,永遠有新的狀態被創造出來,我們不能預知這個狀態,更不可能獲得這種狀態的概率分布。經濟社會中的大多數系統都屬於這種過程,這種不確定性就是奈特不確定性。
(二)奈特不確定性視角下的動量效應微觀機制
Lewellen和Shanken(2002)認為,股票價格序列的可預測性與股票定價過程中的「參數的不確定性」有關,當決策者對未來現金流量的先驗信念不確定時(即存在概率分布的不確定性時),代表性投資者通過貝葉斯過程逐漸更新信念,這個學習過程滲透到股票定價過程中,導致股票價格正相關。
徐元棟、黃登仕(2003),徐元棟(2004)從奈特不確定性的角度探討了股市動量效應產生的微觀機制。與LS模型類似,投資者也不可能准確地確定未來現金流量的的概率分布,原因就是投資者面臨奈特不確定性。與LS模型不同,他們認為,市場上的投資者不能用一個「代表性投資者」來代替,這些投資者是不同質的,他們對未來現金流量具有不同的先驗信念。當這些異質投資者出現市場傳染現象時,就造成了動量效應。
Ford、Kelsey和Pang(2006)則從微觀金融角度研究了動量(反向)效應產生的機制。當市場上出現模糊(ambiguity)信號、不能確定股票的基本價值(面臨奈特不確定性)時,如果做市商與投資者都表現出樂觀情緒(悲觀情緒),股市就會出現動量現象。
Gerdjikova(2006)試圖在CBD理論(Casebased Decision Theory,案例決策理論)下解釋股市上的所有異常現象。由於投資者面臨奈特不確定性,他無法確定股票的基本價值。如果股票價值在合理區間內,投資者為了追求更多財富而在股市上頻繁交易從而造成了動量效應。
奈特不確定性視角下的動量效應機制理論認為,投資者不能確定股票未來現金流量的概率分布,異質投資者的市場傳染或者情緒的悲觀(樂觀)造成了動量效應。這些模型可以較好地解釋中國股市的動量現象。行為金融認為,決策者對股票現金流量的概率分布是確定的,不存在所謂「奈特不確定性」,是有限理性的投資者犯了認識偏差錯誤,從而造成了動量效應。這兩種解釋的最大分歧在於對不確定性的處理。
(三)奈特不確定性視角下的「奈特不確定性厭惡」補償模型
近年來,西方學者開始從奈特不確定性「厭惡」的角度來研究動量策略的「利潤」的來源。Andrew和Hodrick(2006)、Zhang(2006)等發現動量策略的超額利潤以及收益率橫斷面差異與奈特不確定性有正相關關系。Anderson、Ghysels和Juergens(2005,2006)則試圖在資產定價模型中加入「奈特不確定性厭惡因子」來解釋股市中的動量效應現象。從奈特不確定性角度看,投資者除面臨一般風險外,還面臨「更高級風險」,即奈特不確定性。只要在定價因子模型中考慮這種「更高級風險」,異常超額收益就會消失。
(四)奈特不確定性視角下兩種解釋方案的邏輯聯系
從奈特不確定性視角來研究動量效應也有兩條思路:一是從奈特不確定性角度研究動量效應產生的機制;二是在傳統的資產定價模型中加入「奈特不確定性厭惡因子」,將其作為動量策略「超額」利潤產生的來源。從邏輯上看,這兩條思路並不矛盾,奈特不確定性視角下的動量效應的微觀機制涉及的是「里」,「奈特不確定性厭惡補償」模型涉及的是「結果」,是「表」。以奈特不確定性為邏輯起點,可以將這兩條研究思路緊密地聯系在一起。
行為金融模型主要從認識性偏差(或雜訊)或信息不完全的角度對動量效應等異常現象進行了解釋。但問題是既然這些直覺性決策容易導致認知偏差,投資者為什麼仍然採取直覺性決策模式呢?行為金融沒有給出「理性」決策者產生上述決策行為模式的原因。實際上,投資者面臨的是奈特不確定性的環境,表現為事實上的「有限理性」。從決策行為可以看出人類在進化過程中的學習與記憶自適應性:傾向於本能的自我安全感(自我控制、認知失調)以及通過直覺性決策方式進行決策,即原則理性(rule rationality)(Aumann,1997)。在原則理性的視角下,如果決策者處於一個復雜的、奈特不確定性的世界,採用直覺性決策是合乎他們的理性的。
行為金融沒有對「雜訊」給出一個確切的定義。如果雜訊是與投資價值無關的信息,作為理性投資者為什麼不能過濾雜訊?行為金融學也重點研究在信息不對稱的情況下,有信息優勢或劣勢的投資者的行為對證券價格的影響。有人認為,對於公開市場上的大量、普遍交易的股票來說,投資者之間信息不對稱的可能性很小,也就是說不存在使股票價格產生大波動的信息不對稱問題。也有人認為,「雜訊」是與股票價值相關的信息,但由於投資者在面臨奈特不確定性時的「原則理性」,決策者只能憑直覺利用這些信息。

④ 用libsvm做時間序列預測,為什麼訓練數據越少越准確

樓主的說法似乎不太對


首先,訓練數據的主要區別是什麼是測試數據:


如果我有一堆計時數據,首先隨機分為兩堆,一堆訓練只用於看模型是好的,然後前者稱為訓練數據。下面是幾個訓練數據序列。(注意不要把訓練數據的結果作為模型質量的度量,這是最基本的)。

最後,如果像預測股票價格一切都那樣簡單,那麼就不需要這么多機器學習和金融專家才能進行高頻交易。