[觀點] 續談現代中國-東南亞-日韓人的來源 (一)

作者: a46911a149 (a149)   2023-04-03 00:43:20
在我先前在本版寫過的文章
[觀點] 現代中國-東南亞人群(基因)來源
https://www.ptt.cc/bbs/historia/M.1676192356.A.CC2.html
系列文中
我已引述數篇學術論文的內容
對中國與東南亞人的來源進行初步探討
但由於前幾篇論文的分析,主要通過常染色體來進行分析
常染色體分析一方面也可能產生各種bug與誤差
一方面也可能產生誤導性的分析
一方面也不容易確認細節
所以本文的內容
主要放在進一步統整東南亞人的Y染色體類型與比例
以Y染色體分析東南亞人/東亞人的來源
以對前文進行補充
以及補充中國新石器文化的Y染色體類型,與現代人進行比較
當然,Y染色體的比例,不能代表常染色體的比例
因為Y染色體只來自父方,只能代表人群父系祖先來源,
粒線體來自母方,代表人群的母系祖先來源
而常染色體均勻的來自父方與母方,代表所有父系母系祖先來源
但一個使用Y染色體來分析的原因是
是因為Y染色體遺傳漂變的速度更快
這指的是,Y染色體多樣性減低的速度更快
舉例來說,在中國,距今一萬~兩萬年的Y染色體支系,
大概只要十幾支,就能覆蓋99%的人口
(表示99%的中國人,都是十幾個 一萬多年前的男性的父系後代)
但同年代的粒線體,可能要成百上千支,才能覆蓋99%的人口 (我不太清楚確切的數字)
這導致使用Y染色體,分析晚近人群來源更直觀
用粒線體分析更複雜,相關來源也比較難找
不過本文還是會簡單的敘述一下,東亞人粒線體的來源情形
一. 東亞人粒線體來源簡論
https://i.imgur.com/DZeGpBU.png
來源:
https://en.wikipedia.org/wiki/Human_mitochondrial_DNA_haplogroup
此外,如此圖也能看出
這種幾萬年級別的粒線體,黃種人(東亞人)內部的類似性是比較高的
上圖主要是3萬~7萬年共祖的粒線體,在不同人群中的分布情形
在北方漢人 南方漢人 越南人 傣族 內部有程度不低的重疊狀況
但已與歐洲人 印度人 非洲人展現出明顯的差異
另一張圖:
https://i.imgur.com/XJgIbSK.jpg
來源:
https://www.ncbi.nlm.nih.gov/pmc/articles/PMC3913319/
可以看出,中南半島的緬甸 泰國 寮國 越南 香港人,
在三萬~七萬年共祖的粒線體上,都是具有一定重疊性的
M 與 N 是唯二兩個走出非洲的粒線體 (大約六萬~七萬年前共祖)
所有非洲以外的智人,都是M與N的母系後代
而非洲黑人主要是粒線體L的後代 (雖然 M 與 N 也是L的後代)
示意圖:
https://i.imgur.com/CeLJxxu.jpg
如圖,
標淺綠色的支系是東歐亞人/黃種人的粒線體類型
藍色是西歐亞人(歐洲/中東人)的粒線體
紫色是印度人獨有的粒線體
紅色是非洲黑人的粒線體
黃色是大洋洲人群的粒線體
南島人的粒線體的大類型其實主要與其他東亞人重疊
只有E這個分支有比較強的南島特色
(但這些都是三萬~七萬年的分支,細分到一兩萬年內的小支系,
東亞人內部仍能展現出甚大的族群差異)
這也是為什麼23魔方官方文章的粒線體分析,
挑出來比較的粒線體,只能覆蓋到50%的人口
(因為同年代粒線體支系的數量甚大,
只能挑出人口占比較高/地域特色明顯的支系方便分析)
https://i.imgur.com/25DO5za.jpg
中國人的粒線體來源,亦可參考
https://academic.oup.com/mbe/article/36/8/1643/5423190
這篇中國的學術論文的樣本資料
此篇論文中,中國各省的粒線體比例,與23魔方那篇文章列出的粒線體比例一致度甚高
東亞人/黃種人常見的粒線體類型
有 A B C D F M7 M9a 等等
其中粒線體D4 ,有比較強的北方色彩,在日本人中,可以佔到30%~40%,韓國人25%~30%
https://i.imgur.com/jWVOz0i.png
但在東南亞人中,比較缺乏,少於1%~5%
在中國由北向南遞減,在河南一帶大概 20%,湖北16%~17%,福建12%~13%,廣東廣府8%~9%
二. 資料來源
本段落主要羅列部分本文的參考來源
並羅列出一些,有助於用來分析人群的Y染色體的工具
(1). 中國基因公司23魔方的官方網站
https://www.23mofang.com/ancestry/ytree/D-Z27269
優點:
中國的基因公司,具有幾十萬中國人的y染色體樣本
分支細,可以精細到查詢不同y染色體支系,在各中國地籍市的占比
還能查詢中國少數民族的Y染色體占比
缺點:
該公司的中國少數民族樣本,包含不少一兩代內跟外族通婚過的
導致該公司的樣本,少數民族的純度更低(學術論文至少能過濾掉近兩三代內通婚的樣本)
而且該公司只有中國人的樣本,缺乏中國以外人群的樣本
也沒有公開粒線體的樣本
(2). theytree網站
https://www.theytree.com/tree/O-M119
https://i.imgur.com/0ZJM9QZ.png
該網站為另一家中國的基因公司,微基因公司架的網站
微基因這家公司,除了提供商業性的基因測試以外,也有從事一點基因相關的研究
該網站,為該公司蒐集世界各地學術機構,公開的Y染色體樣本
所整理出的Y染色體分支樹,可以查詢世界各國人群的Y染色體分支狀況
優點:
包含世界各國/各民族的樣本,分支細,而且包含考古遺址的Y染色體樣本
有粒線體的版本
缺點:
樣本數不均衡 (例如有的國家的樣本數很少)
無法用來分析Y染色體分支在人群中的比例
樣本沒有第一手來源的連結
(3). ISOGG的官方網站
ISOGG (International Society of Genetic Genealogy)
為一個國際非營利組織,專門促進世界各國對基因溯源的研究
https://isogg.org/tree/
此網站為該組織架的網站,用來規範化世界各地對Y染色體的命名標準
因為有些機構,在發現新的Y染色體支系以後,會自己幫Y染色體取名字
然後他們就會到ISOGG這個組織進行登記,登記Y染色體的突變點與名稱
(例如中國的23魔方與微基因這兩家公司,就會去ISOGG登記他們幫Y染色體取的名字)
ISOGG會整理 重名的Y染色體支系,幫他們統一命名
所以遇到不同機構/學術單位,使用的Y染色體名稱不一致時,
就可以去ISOGG的官網查詢
(4). familytree網站
https://www.familytreedna.com/public/y-dna-haplotree/O
美國的某家基因公司,架的Y染色體基因庫 (類似中國23魔方的Y染色體基因庫網站)
缺點:
可能因為歐美國家重視隱私權的關係,歐美的基因公司,比較不會公開顧客的樣本
該網站主要來自志願者提供樣本,所以樣本數很少
(尤其亞洲人的樣本非常非常少)
所以其實用處很小,只能勉強用來當一個參照比較的對象
(5). 英語維基百科
https://en.wikipedia.org/wiki/Y-DNA_haplogroups_in_populations_of_East_and_Southeast_Asia
英語維基百科,會整理各種學術論文的內容,
列出各國/民族人群,Y染色體類型的比例
優點:
資料來源多,內容豐富
有粒線體的版本
而且可以透過英語維基百科引用的參考資料來找論文
缺點:
學術論文的品質良莠不齊,有的樣本數非常少,準確度差
有的論文是十幾二十年前的過時論文
三. 中國新石器遺址概述
https://i.imgur.com/FrYzBgR.jpg
https://i.imgur.com/C2oAWwA.png
Y染色體分支圖:
https://i.imgur.com/o8vsHUU.png
https://i.imgur.com/NjuGTld.png
https://i.imgur.com/P3nHZ9n.png
中國距今4000~5000年的新石器文化示意圖:
https://i.imgur.com/BhPmi7x.jpg
可以看出,如此圖,仰韶文化能作為黃河中上游,一系列考古遺址的合稱
上圖(Y染色體分支圖),標註為"黃河土著"的Y染色體類型,
多數都有在仰韶相關遺址中測出(主要根據微基因架的網站),
(包含 O-F8 O-F46 C-F978 N-M1819 等)
且依照其上游的多樣性與分布頻率,
推測早期分布地在黃河流域,源自仰韶文化相關人群的擴張
根據微基因的網站,仰韶相關遺址,測出的y染色體類型其實不少
(也不只有上面標出的)
但我不清楚是否都有對應的第一手論文
大汶口文化的人群來源,推測亦為黃河中上游人群東進,
與更早的山東土著混合後產生的
(但我不清楚大汶口文化有沒有測過Y染色體)
山東新石器早期的文化為後李文化
後李文化測出的y染色體類型以在上圖(Y染色體分支圖)標出,
以N1b為主,好像還有 C-F978
湖北的屈家嶺文化與之後的石家河文化 (距今4000~5000年前),
取代了年代更早的大溪文化
但目前沒聽說屈家嶺與石家河有測過基因
所以尚不清楚,屈家嶺/石家河文化,主導人群是否仍是大溪文化人群,
或者受到多大程度仰韶人群的影響
大溪文化(距今5300~6400年前)
(分布地在湖北湖南一帶)
考古遺址出土六例Y染色體,有4例屬於 O-M7 ,一例 O-PK4 ,一例其他 O2a
(其中根據23魔方的備註,大溪文化測出的O-PK4,有可能屬於O-M1284這支下游)
根據大溪文化出土的Y染色體(但沒測常染色體)
大溪文化可能參與了 原始南亞語人群的成形
O-M7 與 O-M1284/O-PK4 皆在東南亞(含中南半島與海島東南亞)分布廣泛
可能是南亞語人群的特色Y染色體
相關論文:
https://link.springer.com/article/10.1007/s00439-007-0407-2
良渚文化(距今5300年至4000年前),是長江下游,浙江北部一帶的史前文化
同一篇論文提供的資料,良渚文化測了兩個地點,測出來九例樣本全數為O1a
但良渚文化在距今四千年前消失了,之後江浙一帶的新石器文化,
雖然含有少量良渚元素,然於風格比起良渚,仍具有明顯差異性
之後江浙一帶的新石器文化,由於暫時沒聽說有測過基因
尚不清楚主導者是良渚遺留的人群,還是其他外來人群
不過在春秋時期,吳越地區強勁爆發的Y染色體 O-F619
(在現代浙江占比14%,華南各省8%)
是 O1a 的下游,且它的上游也一直在長江下游一帶,很有可能是早年良渚人群的遺留
現代浙江也是中國 O1a 占比最高的地區
https://i.imgur.com/nQrWNIt.png
由於春秋戰國/秦漢以後,江南人的擴散
現代中國南方人的O1a,應該有不少源自晚近的長江下游人群
但O1a也有江西湖南/嶺南土著支
而同一篇論文,也有提到吳城文化的Y染色體類型
吳城文化,是江西的史前文化遺址,年代大致與商代重疊 (已進入青銅器時代)
據說從考古遺址,能看出吳城文化有受商文化影響
檢測的三例Y染色體樣本中,有兩例為 O-PK4(O1b),一例為 O2a
此外,
南島語人群可能來自同年代的曇石山文化
曇石山文化測過常染色體,常染色體為高純度的南島成分
而曇石山文化測出的y染色體類型,也與現代南島人群的特色類型十分吻合
根據微基因的網站
O1a2(O-F3288) (5690年共祖) 有在曇石山文化測出
此外,O1a2 在台灣南部的原住民,菲律賓人都有10%~20%的分布,
其他南島人群也有一定分布,但少見於台灣北部的原住民
O1a2(O-F3288)在中國的分布狀況:
https://i.imgur.com/9omscIN.png
https://i.imgur.com/6Fy2LB0.png
O1a2在現代福建只有 0.21%,最高頻地點在廣西
可能是因為早期福建的南島人群也有對兩廣土著產生影響
且現代廣西的土著濃度較高所致
曇石山文化測出的應該不只有 O1a2,也有其它類型,
但我目前沒有找到相關的第一手論文
下篇待續...
作者: IAMCSH (BorninMCMXCVIII)   2023-04-03 14:38:00
作者: hedgehogs (刺蝟)   2023-04-03 14:40:00
作者: shihpoyen (伯勞)   2023-04-03 15:18:00
喜歡這系列
作者: moslaa (萬變蛾)   2023-04-03 17:43:00
謝謝整理。

Links booklink

Contact Us: admin [ a t ] ucptt.com