[整理] 病毒演化系統發生樹

作者: naieeliao (♪~~)   2020-04-19 18:37:27
這裡只是來宣傳一下這兩週做的小project
https://github.com/PinguPinga/hCoV-2019-phylogenetic-analysis
從 GISAID 的資料庫抓病毒定序資料
Project1 => 篩出高品質的序列
Project2 => 分析並畫出樹狀圖
Git裡面有pdf檔可以參考
https://i.imgur.com/rELDNzQ.png
當初看 nextstrain.org 的資料
自己簡單玩了一下發現有出入 (C241T是假的,定序誤差)
所以就把 GISAID 原始的序列抓來分析了
https://i.imgur.com/WhUWCF9.png
概念圖
樹根的原點是使用大家統一定義的參考序列,採集地點在武漢,這並不重要
真要追溯到蝙蝠,說真的,沒完沒了
接下來要講故事了
https://imgur.com/kHlMZD5
一、鑽石公主號
node #450 (G11083T) EPI_ISL_408481 chongqing 2020-01-18
雖然在重慶第一次檢驗到,但實際上很多助攻來自第一艘爆炸的鑽石公主號
如果回過頭仔細分析不完整的序列,G11083T 貢獻全球 1/6 的上傳序列 (持續降低中)
還記得鑽石公主號乘客返回以色列之後被驗出來的事嗎? 他有 G11083T
但這是不是日本該背的鍋呢?
1. 目前最盛行這個突變的地域是歐洲 (合併 G26144T)
G26144T 偏偏也有獨立的點突變
2. 日本目前很少報告有這個突變 (可是日本最近爆炸,卻很少上傳序列)
3. 早在鑽石公主號爆炸之前,重慶、香港、新加坡就有這個突變的個案了
結論是...很難講啊 我也不清楚
https://i.imgur.com/VPX47cI.png
二、惡名昭彰的Italy
node #136 EPI_ISL_412973 italy 2020-02-20 (C3037T C14408T A23403G)
其實在他前面有出現過一個
EPI_ISL_406862 germany 2020-01-28 (C3037T A23403G)
但是德國早期很快就遏止一間公司的群聚感染了
序列重複上傳筆數只有1,所以被程式篩掉了
但是義大利真的害人不淺阿,太多觀光客了,一下就傳到世界各處
這個分支占了 60% 以上的筆數,歐美遍地都是他的子孫
node #375 India 就是他的子孫之一
印度上傳的序列過半 (9/12) 都是他,在人口世界第二的國家,應該會爆炸吧 (?)
node #1159 Russia 也是 (11/22)
看來俄羅斯要起飛了
https://i.imgur.com/no8EZUk.png
三、Make America Great Again
事實上跟義大利同時發生的,是二月下旬到三月上旬的美國分支
美國現在最大的流派還是三月初暴漲的義大利系 (美國鎖國前的飛機超毒)
node #1 EPI_ISL_413456 usa 2020-02-20
C8782T C17747T A17858G C18060T T28144C
這個分支主要在北美跟澳洲出現,普遍度還是遠遠不及義大利的株系
https://i.imgur.com/ZMI0Qc5.png
四、日漸壯大的西班牙無敵艦隊
聽說最近西班牙死比較多人? 其實西班牙的資料只侷限在兩個支系
很抱歉,這株系比較難從大量數據中找到源頭
node #409 EPI_ISL_418248 spain 2020-03-01
C8782T T9477A C14805T G25979T T28144C C28657T C28863T
智利就中獎了... 南美洲會不會都是他呢?
澳洲有一個小分支,接下來討論
五、世界的大贏家,澳洲
當你以為紐澳離亞洲、歐洲、美洲都隔著汪洋大海時
澳洲真的各個病毒株系都有!一二月亞洲的株系、三四月的歐美株系
雖然說澳洲表面上好像趨緩,但現在他可是集大成者!
實際上我們還不清楚究竟對不同株系會不會有共同的免疫力
聽說最近紐澳要形成共同的 travel bubble (往來的班機復航)
拭 目 以 待
六、蓋牌專家,中國
自從三月後上傳的有效資料數.... 手指數得出來
聽說最近有班機,我們可以來驗驗看有沒有新的演化支出現
結論:地理位置對於病毒的演化有很大的關係
冰島就有很多專屬的病毒株系,大英帝國也有少部分
以上是我個人的意見,解說到這邊,謝謝大家 (我不是專門研究病毒的,很抱歉)
※禁止轉載※
最近沒投2330,失望啊....

Links booklink

Contact Us: admin [ a t ] ucptt.com