[問題]有關基因分析之 .tepd檔與PLINK問題

作者: sinclairJ (KEEP MOVING FORWARD)   2014-07-13 02:18:26
[問題類型]:
程式諮詢
PART1.
最近手上拿到一組有關基因的data
分別是.tped檔及.tfam檔
在網路上有查到如何將data load進R中的相關資訊如下
http://www.inside-r.org/node/102009
語法:
convert.snp.tped(tpedfile, tfamfile, outfile,strand = "u", bcast = 10000)
但對於上述的用法還是不夠清楚
所以想上來詢問有人是否也處理過類似的分析
可以指引小弟一條明路
小弟的兩個檔案名稱分別為NC_BP.tped與NC_BP.tfam
有用上述的語法試著load看看 但都還是失敗
所以想請問高人 對於這兩個檔案的話
其完整的語法應該為何?outfile是指我要輸出的所在路徑嗎?(需要先建空白檔?)
然後strand和bcast所代表的又是什麼意思
PART2.
小弟另外也有查到有關基因這方面分析的軟體 PLINK 資訊如下
http://pngu.mgh.harvard.edu/~purcell/plink/
在這邊想請教有從事過這方面分析的高人
對於基因染色體序列分析
是否可單純用PLINK處理就好?
還是必須搭配著R作分析?
因為小弟對於R和PLINK的功力皆屬於初心者階段
所以想說是否可以專心研究其中一個軟體來完成分析即可(R或PLINK)
[軟體熟悉度]:
入門(寫過其他程式,只是對語法不熟悉)
之前大學做專題時有使用過Eclipse開發過APP
[問題敘述]:
請簡略描述你所要做的事情,或是這個程式的目的
如上~主要是想利用基因序列的資料
並用資料探勘的手法 找出其有用潛在資訊
但在一開始load資料的時候就卡關了...
[程式範例]:
張貼能夠重現錯誤的程式碼,可以幫助版友更快的幫你解決問題
因為手邊目前沒資料(放在學校)
但又礙於焦急的心態
所以待日後補上
想說先上來詢問各位高手~
[關鍵字]:
選擇性,也許未來有用
GenABEL套件、PLINK、基因分
作者: king31815 (口八押係)   2014-07-13 23:07:00
建議利用plink轉檔,將ACTG轉成AB_call的genotype,輸出csv之後,在使用R做資料處理與分析會建議使用plink轉檔是因為...R在這方面真的有點慢
作者: sinclairJ (KEEP MOVING FORWARD)   2014-07-14 00:35:00
感謝樓上!我會試著用看看 因為資料也有數萬筆...

Links booklink

Contact Us: admin [ a t ] ucptt.com