[問題] 用 R 做卡方檢測

作者: peter0726 (江 謝)   2017-04-19 11:04:15
[問題類型]: 程式諮詢
[軟體熟悉度]: 入門
主要用 perl 處理資料,偶爾用R作分析
[問題敘述]:
我現在有兩筆資料要比較其組成比例有沒有差異
問過其他人後知道要用卡方
資料大致上長這樣
要比較 A、T、C、G 的組成在 A 跟 B 之間是否有差異
A T C G
SampleA 1937 373 14788 238
sampleB 2590 395 17686 274
想請問一下要怎麼在R上面做到卡方檢定?
目前 google 查到的方法是這樣
a <- c(1937,373,14788,238)
b <- c(2590,395,17686,274)
chisq.test(rbind(a,b))
在上面列出來case時結果跟我在網路上找到的計算器結果相同
(http://www.socscistatistics.com/tests/chisquare2/Default2.aspx)
可是到了另一個 case
A T C G
SampleA 1595826 308 450 76
sampleB 1576617 362 428 59
上面的寫法跑出來的p-value是 0.06327
可是計算器上給的結果是 The p-value is < 0.00001
想請問一下正確的做法是怎麼樣
[環境敘述]:
R version 3.3.2 (2016-10-31)
Platform: x86_64-redhat-linux-gnu (64-bit)
Running under: CentOS release 6.7 (Final)
locale:
[1] C
attached base packages:
[1] stats graphics grDevices utils datasets methods base
作者: clansoda (小笨)   2017-04-19 11:19:00
把所有資料弄成一個table 然後chisq.test()
作者: dumb0101 (無)   2017-04-19 11:58:00
參數Correction不用預設看看?
作者: fred1541 ((沒意義))   2017-04-21 09:39:00
那是生物DNA?
作者: Steven87 (Bogi)   2017-04-21 12:14:00
對table直接summary會自動幫你做卡方檢定

Links booklink

Contact Us: admin [ a t ] ucptt.com