Re: [問題] 想用R寫一個統計回歸分析的程式

作者: allen1985 (我要低調 拯救形象)   2015-11-22 10:04:28
首先 這標題可能有誤 我的理解這問題跟迴歸沒有關係
如果我的理解沒有錯
題目是: 現在有一組資料是10條繩子的長度
那麼想了解繩子的長度應該是什麼統計分配呢
是不是常態分配 or 指數分配 or Poisson分配
我猜 原po想做的事情是 隨機產生10組數據從上述的分配
然後看看是否跟繩子長度的分配一樣
如果到這邊 我的理解還是對的 原po可以往下看
1. 請先了解生成隨機變數的指令 請google一下
例如 rnorm(10,10,90) 跟你的敘述差距很大很大
只有第一個10是對的 產生10筆資料
還有 dunif 跟 runif 的差別等等 總之 三個指令都誤用了
2. 回到問題 如果沒有學過很多檢定方式 例如 Kolmogorov–Smirnov test
建議的做法是 畫直方圖 如果某一組隨機生成的數據 長相跟繩子長度類似
那麼我想你就接近答案了
3. 跟第一點相關 產生隨機變數的指令 有些參數需要輸入
一個簡單的做法 利用資料去算出這些參數
例如 sample mean and sample variance
其實 在算出這些值之後 也可以利用這些值刪除某些不太可能的分配
舉例來說 Poisson distribution 的特性是什麼 mean = variance?
4. 最後 想要做任何分析之前 請把統計課本再拿出來翻一下
瞭解一下其意義 再來實際做分析
就我看來 T-test 迴歸 在這裡毫無用處 不知道為什麼你會提到
===========================分隔線========================
Sorry 這篇回文跟R沒什麼關係
小弟我實在不敢在這版上回R相關指令問題
版上神人太多了
如果版主覺得不適合 可以刪文
謝謝
※ 引述《eegame (yu)》之銘言:
: 初學者(兩個月) R是第一個程式語言
: 不知道各位前輩有沒做過類似的程式
: !!!假設!!!
: 想用R統計10條繩子的長度
: 再根據統計特性的率隨機產生10組數據
: 程式如下
: G <- 10 #10組數據
: rowname <- c(1:G) #Y軸名稱
: colname <- c("c1","c2","c3","c4") #X軸名稱
: F <- matrix(,nrow=G,ncol=4,dimnames=list(rowname,colname))?
: #開一個10*4的矩陣並以rowname和colname
: F[1,"c1"] <- 19
: F[2,"c1"] <- 59
: F[3,"c1"] <- 48
: F[4,"c1"] <- 23
: F[5,"c1"] <- 31
: F[6,"c1"] <- 48
: F[7,"c1"] <- 56
: F[8,"c1"] <- 60
: F[9,"c1"] <- 74
: F[10,"c1"] <- 83
: #在矩陣c1的位置放入這10條繩子的調查數據
: #假設1符合常態分布
: F[,"c2"] <- rnorm(10,10,90)?
: #在矩陣c2的位置放入根據常態分佈的機率隨機產生一組新的數據介於10~90之間的10筆數
: 據
: #假設2符合均勻分布
: F[,"c3"] <- dunif(10,10,90)
: #在矩陣c3的位置放入根據均勻分佈的機率隨機產生一組新的數據介於10~90之間的10筆數
: 據
: #假設3符合Poisson distribution分布
: F[,"c4"] <- dpois(10, lambda=1)
: #在矩陣c4的位置放入根據Poisson distribution分布的機率隨機產生一組新的數據介於1
: 0~90之間的10筆數據
: #結果如下
: F
: c1 c2 c3 c4
: 1? 19 -70.255568 0.0125 1.013777e-07
: 2? 59 9.346476 0.0125 1.013777e-07
: 3? 48? -2.139539 0.0125 1.013777e-07
: 4? 23 -33.231206 0.0125 1.013777e-07
: 5? 31? 72.630937 0.0125 1.013777e-07
: 6? 48? -6.032507 0.0125 1.013777e-07
: 7? 56? -8.420308 0.0125 1.013777e-07
: 8? 60 -69.542557 0.0125 1.013777e-07
: 9? 74? 12.044775 0.0125 1.013777e-07
: 10 83 -13.474063 0.0125 1.013777e-07
: 問題1.我函數的指令是不是給的不對導致c2 c3 c4的結果錯誤?
: 問題2.關於隨機分布的應用 如何做到根據統計特性產生結果?
: 問題3.關於數據統計特性如何檢定比較符合 常態分布 均勻分布 負指數分布等等的分布
: 特性? 是用卡方檢定 T-test檢定? 還是用數值回歸???
: 這兩個月沒有看到類似的文章
: 麻煩各位前輩指點迷津
: 拜託 拜託
作者: celestialgod (天)   2015-11-22 13:44:00
好人,推
作者: eegame (yu)   2015-11-22 14:06:00
所以不用做卡方檢定!!! 而是要先算出數據的平均數 中位數等等 然後怎麼做判別???
作者: celestialgod (天)   2015-11-22 14:10:00
我比較想建議原po把統計學學清楚比較重要...連我問題都不一一回覆,我實在不知道怎麼幫這實在不太是求學問的方式,像是在要答案
作者: eegame (yu)   2015-11-22 15:28:00
對不起我以為我回答了
作者: allen1985 (我要低調 拯救形象)   2015-11-22 15:36:00
請問你做卡方檢定做什麼?在做每個統計分析前 請先思考一下為什麼這麼做麻煩你回答一下 卡方檢定是用來檢定什麼的
作者: celestialgod (天)   2015-11-22 15:38:00
所以常態的兩個參數意義?卜瓦松的參數意義?你都沒有回答到阿....我說原po
作者: allen1985 (我要低調 拯救形象)   2015-11-22 15:42:00
我懂 呵呵 C大辛苦了
作者: celestialgod (天)   2015-11-22 15:45:00
a大辛苦了,還回那麼一大篇...
作者: allen1985 (我要低調 拯救形象)   2015-11-22 15:51:00
難得在R版上 看到我看得懂的東西...就回一下
作者: celestialgod (天)   2015-11-22 16:14:00
而且卡方檢定只是統稱 最後檢定統計量是卡方的檢定應該要適度標明使用的是哪一種檢定
作者: eegame (yu)   2015-11-22 17:20:00
我整理一下訊息 1.先將資料整理出圖看分布情況 2.比對資料分布與哪一種分布特性相近 3.至於檢定是用在事件成不成立 不知道目前這樣的方式對不對 之前以為檢定是用來找分布特性的 非常抱歉我目前還是不懂函數中各參數的意思

Links booklink

Contact Us: admin [ a t ] ucptt.com