我有兩個DNA database:
database A 有約18 萬條序列,每條約500nt
database B 有約5 萬條序列,每條約5000nt
我希望讓這A、B兩個database 互相比對,
以找出A、B兩個database中,共有相同20nt 的兩筆序列。
我先用 "foreach" 將database A 每條序列分開,
再用 "substr" 每20個nt 搜索 (DNA 的正反股都要搜索)
再用 "foreach" 將database B 的序列逐一檢查跟 "substr" 相同者
結果... 我用小一點的database 測試並且估算,
這樣用筆電算完,總共要四千天左右 XD
想請教先進們
是否有節省時間的運算方式?
或是換好一點的電腦會算比較快嗎?
先謝不吝賜教!!