1. 如何用r軟體對給定數據進行回歸分析(不能用lm函數)
可以試著探索一下summary(lm(y~x))到底是什麼。 首先看一下summary(lm(y~x))是什麼數據類型: > m class(summary(m)) [1] "summary.lm" #可以看到,lm的結果是一個"summary.lm" 對象。這有些顯而易見。好吧,繼續探索。 R語言中所有的對象都建立在一些native data structures之上,那麼summary(lm(y~x)的native data structure是什麼呢?可以用mode()命令查看。
2. R語言怎麼把股票日收盤價轉換成對數收益率
知道一系列收盤價向量X,length=1000,求對數收益率的R語言代碼
acf(int[,2], lag.max = 15,type = "correlation", plot = TRUE,main='int monthly
acf(int.l[,2], lag.max = 15,type = "correlation", plot = TRUE,main='int monthly
log return')
Box.test(int[,2], lag = 5, type = "Ljung-Box")
Box.test(int[,2], lag = 10, type = "Ljung-Box")
Box.test(int.l[,2], lag = 5, type = "Ljung-Box")
Box.test(int.l[,2], lag = 10, type = "Ljung-Box")
運行結錯誤辦
> int <- read.table("d-intc7208.txt", head=T)
錯誤於file(file, "rt") : 打鏈結
外: 警告信息:
In file(file, "rt") :
打文件'd-intc7208.txt': No such file or directory
+ acf(int.l[,2], lag.max = 15,type = "correlation", plot = TRUE,main='int monthly
錯誤: 意外符號 in:
"
acf(int.l[,2], lag.max = 15,type = "correlation", plot = TRUE,main='int"
> log return')
錯誤: 意外符號 in "log return"
3. r語言如何數據分析
r語言數據分析是查看數據的結構、類型,數據處理。根據查詢相關資料信息顯示:R語言是一個開源、跨平台的科學計算和統計分析軟體包,具有豐富多樣、強大的的統計功能和數據分析功能,數據可視化可以繪制直方圖、箱型圖、小提琴圖等展示分數的分布情況可以通過散點圖和線性擬合來展示分數和年齡之間的關系。
4. 如何用R語言的quantmod包獲取一系列股票的歷史日線數據
我舉個例子供你參考:
> install.packages('quantmod') # 安裝安裝quantmod包
> require(quantmod)#引用quantmod包
> getSymbols("GOOG",src="yahoo",from="2013-01-01", to='2013-04-24') #從雅虎財經獲取google的股票數據
> chartSeries(GOOG,up.col='red',dn.col='green') #顯示K線圖
5. 如何用R語言提取股票行情數據
你好,關於股票價格有關的開盤價格,當日最高價格,當日最低價格,收盤價格,股票交易量;和調整後的價格;
DIA.Open 當日開盤價格
DIA.High 當日最高價格
DIA.Low 當日最低價格
DIA.Close 當日收盤價格
DIA.Volume 當日股票交易量
DIA.Adjusted 當日調整後的價格
6. 【R語言 第3篇】用R進行主成分分析
主成分分析和探索性因子分析是兩種用來探索和簡化多變數復雜關系的常用方法。
主成分分析(PCA)是一種將數據降維技巧,它將大量相關變數轉化成一組很少的不相關變數,這些無相關變數稱為主成分。
探索性因子分析(EFA)是一系列用來發現一組變數的潛在結構的方法。
R基礎安裝包提供了PCA和EFA的函數,分別是princomp()和factanal()。本章重點介紹psych包中提供的函數,該包提供了比基礎函數更豐富和有用的選項。
最常見步驟
1、數據預處理,在計算前請確保數據沒有缺失值;
2、選擇因子模型,是選擇PCA還是EFA,如果選擇EFA,需要選擇一種估計因子模型,如最大似然法估計;
3、判斷要選擇的主成分/因子數目;
4、選擇主成分/因子;
5、旋轉主成分/因子;
6、解釋結果;
7、計算主成分或因子得分。
載入psych包
library(ggplot2)
library(psych)
展示基於觀測特徵值的碎石檢驗、根據100個隨機數據矩陣推導出來的特徵值均值、以及大於1的特徵值准則(Y=1的水平線)
fa.parallel(USJudgeRatings[, -1], fa = "pc", n.iter = 100, show.legend = FALSE, main = 'Scree plot with parallel analysis')
對數據USJudgeRatings進行主成分分析
pc<-principal(USJudgeRatings[, -1],nfactors=1)
pc
7. 如何用R語言提取股票行情數據
最上邊一行菜單欄倒數第二個「高級」-「關聯任務定義」-選取最右邊從上到下第二個按鈕,找到2009年決算任務安裝路徑-確定。 然後 最上邊一行菜單欄正數第二個「錄入」-「上年數據提取」即可 提取完了,注意修改與去年不同的科目代碼!
8. 如何用R 語言 建立 股票價格的時間序列
在下想用R語言對股票價格進行時間序列分析。
問題出在第一步,如何將股票價格轉換為時間序列。
我想用的語句是 pri <- ts (data, start=(), frequency= )
但是我不知道frequency 項該如何填?
因為股票的交易日是一周五天的。 那麼這個frequency 該如何設置呢?
我知道通常frequency= 12 為月度數據,frequency= 4 為季度數據,frequency= 1 為年度數據 但日數據怎麼寫我就不知道了
初學R語言,還望各位大俠多多幫助。
9. 【R語言入門與數據分析-5】 數據分析實戰
老師的吐槽大會,樂死我了。hhh
regression,通常指用一個或者多個預測變數,也稱自變數或者解釋變數,來預測響應變數,也稱為因變數、效標變數或者結果變數的方法
存在多個變數
AIC 考慮模型統計擬合度、用來擬合的參數數目
AIC值越小,越好
更多的變數:
圖一:是否呈線性關系, 是
圖二:是否呈正態分布,一條直線,正態分布
圖三:位置與尺寸圖,描述同方差性,如果方差不變,水平線周圍的點應該是隨機分布
圖四:殘差與杠桿圖,對單個數據值的觀測,鑒別離群點、高杠桿點、強影響點
模型建好,用predict函數對剩餘500個樣本進行預測,比較殘差值,若預測准確,說明模型可以。
analysis of variance,簡稱ANOVA,也稱為變異數分析。用於兩個及兩個以上樣本均數差別的顯著性檢驗。廣義上,方差分析也是回歸分析的一種,只不過線性回歸的因變數一般是連續型變數。自變數是因子時,研究關注的重點通常會從預測轉向不同組之間的差異比較。也就是方差分析。
power analysis,可以幫助在給定置信度的情況下,判斷檢測到給定效應值所需的樣本量。也可以在給定置信度水平情況下,計算在某樣本量內能檢測到給定效應值的概率
拓展了線性模型的框架,包含了非正態因變數的分析。線性回歸、方差分析都是基於正態分布的假設
-泊松回歸 ,用來為計數資料和列聯表建模的一種回歸分析。泊松回歸假設因變數是泊松分布,並假設它平均值的對數可被未知參數的線性組合建模
-logistic 回歸
通過一系列連續型或者類別型預測變數來預測二值型結果變數是,logistic 回歸是一個非常有用的工具。流行病學研究中用的多。
Principal Component Analysis,PCA,探索和簡化多變數復雜關系的常用方法。 是一種數據降維技巧。可以將大量相關變數轉化為一組很少的不相關變數。這些無關變數成為主成分。主成分是對原始變數重新進行線性組合,將原先眾多具有一定相關性的指標,重新組合為一組的心得相互獨立的綜合指標。
探索性因子分析法 exploratory factor analysis,簡稱為EFA,是一系列用來發現一組變數的潛在結構的方法。通過找尋一組更小的、潛在的活隱藏的結構來解釋已觀測到的、顯式的變數間的關系
因子分析步驟與PCA一致
啤酒與尿布
10. 如何在r語言中抓取股票數據並分析論文
用quantomd包
然後getsymbols函數
分析論文 要看你研究方向
如果是看影響因素 一般回歸就行
如果看股票波動和預測 可能需要時間序列