[觀點] 續談現代中國-東南亞-日韓人的來源 (二)

作者: a46911a149 (a149)   2023-04-04 03:11:15
四. 東南亞人的來源與基因組成
1. 東南亞矮黑人
東南亞矮黑人
泛指在南亞語人群/南島語人群進入東南亞前,東南亞與大洋洲的土著人群
包含 和平文化人群 大洋洲人群 等等
在英文中,通常用 Negrito 指稱東南亞矮黑人
(雖然我不確定這個詞彙是否包含所有矮黑人,還是僅僅指菲律賓印尼一帶的矮黑人)
矮黑人其實不是一群有共同血統的人群
不同的矮黑人族群基因差異甚大,基因多樣性高
共通點是膚色都偏黑,類似非洲人的膚色
此外其實沒太多的共同點 (不同的矮黑人族群,語系 長相 可能都不同)
可以把矮黑人看成,沒有演化成黃種人的早期東歐亞人的後代
(因為矮黑人一直住在熱帶地區,無法演化出淺膚色)
他們也是東南亞與大洋洲歷史悠久(數萬年)的土著人群
如下圖,可以看出
不同的矮黑人族群 Mlabri 美拉尼亞人 Aeta (菲律賓矮黑人) 等,
都各分析出一種完全不同的常染色體成分 (不過有些人群語言上已被南亞語系同化)
https://i.imgur.com/BNVALlK.png
現存的矮黑人族群,包含
菲律賓矮黑人 Aeta
馬來西亞矮黑人 Semang
安達曼人 (位於印度統轄的安達曼群島)
澳洲土著
新幾內亞土著
等等
東南亞矮黑人族群的Y染色體,包含
C D底下的某些支系
K* S M 等等
(K的後代中, O與N演化成黃種人,而S M (可能還包含K*) 待在東南亞,
所以為矮黑人族群攜帶的Y染色體)
N, O1 與 O2 應該是專屬於東亞人的Y染色體
(此外 C底下的 C2 也與東南亞矮黑人沒有關係,只有 C1 與東南亞和平文化人群有關)
https://i.imgur.com/o8vsHUU.png
但現存的矮黑人中,有些也或多或少混到東南亞人的血統
2. 南亞語系
南亞語系 (Austroasiatic),其實跟南亞(印度)毫無關係
是東亞/東南亞人的語系
舊稱 孟高棉語系
(孟高棉語族,其實算是南亞語系底下的主流語族)
目前主流的假說,可以參考這支影片
https://www.youtube.com/watch?v=RExAsmaXxIw
認為南亞語系大約在 4000~5000年前,從雲南一帶進入中南半島
之後曾一度占據整個中南半島,又一定程度擴散到海島東南亞(印尼-馬來西亞)
直到藏緬語與侗台語人群之後的南下,大幅削減南亞語系在中南半島的領地
如圖,根據主流假說,南亞語系的巔峰期(西元前1000~0年):
https://i.imgur.com/zC7bTKe.png
現代南亞語系分布:
https://i.imgur.com/j55jOEb.png
南亞語系,在中南半島,呈現高度的語言多樣性,
確實能展現出它在中南半島比較悠久的歷史
而南亞語系,在中國,只有在雲南(靠近中南半島的邊境)有零星分布
反觀侗台語系,在中南半島的語言多樣性極低 (反而在廣西海南,呈現較高多樣性)
東南亞的侗台語,幾乎都聚集在泰語支,這支共祖時間不到1500年的語支底下
南亞語系的名人:
孟人(泰國土著,在緬甸也有分布)
高棉人(柬埔寨主體民族)
佤族(雲南少數民族)
蒙達人(Munda) (印度少數民族)
越南人(京族)
芒族 (越南人的兄弟民族,語言屬於越語支,但漢語借詞更少
疑似躲藏在深山叢林裡,沒有受漢文化影響的越南北部土著的留存)
其他大量知名度低,人口數少 的中南半島/馬來半島 少數民族
南亞語系的特色Y染色體:
O-PK4 (O1b-> O1b1a1)
O-M7 (O2a-> O2a2a -> O-M7)

3. 侗台語系
侗台語系(Kra-dai),又名仡台語系,壯侗語系,侗泰語系、台-卡岱語系等等
英文稱為 kra-dai語系 或 Tai–Kadai語系
侗台語系分支圖:
https://i.imgur.com/cTQVy3m.png
現代侗台語系分布圖:
https://i.imgur.com/vDmLWCh.png
可以看出,壯傣語族/語支(Tai),是侗台語系底下的一個分支
而泰語支(Southwestern Tai),是壯傣語族/語支底下的一個分支
用 Tai 來稱呼壯傣語支,主要是西方學者提出的名稱
中國的壯族,不使用 Tai 一詞作為族群的稱呼
僅有泰語支(Southwestern Tai)底下的人群使用 Tai作為族群的稱呼 (也包含中國的傣族)
壯傣語支,從語言學上來判斷,同源的時間其實很晚近,大約成型於兩千年前
壯傣語在全盛時期,應該曾一度大致覆蓋廣西全境
且壯傣語在廣西的擴散,也是很晚近的事,幾乎是在歷史時期(南越國/秦漢以後)
才在廣西境內擴張,同化了廣西更早的其他土著(例如同屬侗台語系的仡央語人群)
現在的廣西壯族,指的就是使用壯傣語的人群(排除泰語支)
廣西雖然在西漢時,便已併入中國,
但一直到南宋,都是土著語言習俗佔主體的地方
(類似越南,但廣西在宋代,漢化程度可能不如越南)
(可以參考嶺外代答 方輿勝覽 等 宋朝人的著作)
一直到南宋,才漸漸開始有較多漢人遷入廣西,減低壯傣語在廣西的覆蓋範圍
在現代,
廣西的東部,是純粵語區,
北部,是漢語西南官話與北部壯語的混合區
西南部,是比較純的南部壯語區 (雖然也有一些粵語分布)
中部,是壯語與粵語 西南官話的混合過度帶
此外在越南北部,貴州,也有壯語分布
而廣東的情形,其實與廣西也有點類似
廣東雖然在西漢時,就併入中國境內,
但也有一段時間,是土著語言風俗都很濃厚的地區
(可以參考冼夫人的事蹟,洗夫人是 南北朝/隋代,廣東土著中的名人 )
廣東的土著,早年被稱為 俚僚,俚與黎(海南黎族)是同義詞
僚是壯傣語民族的自稱,也是對廣西壯族的舊稱
可見廣東的土著,跟廣西壯族與海南黎族可能是性質類似的一群人
現代東南亞的寮國,寮 與 僚 可能是同源詞,都源於壯傣語人群的自稱
此外,近現代粵西(廣東西部),有幾個村子,
被發現村內講的方言屬於侗台語系的語言 (雖然當地人未必知道,可能以為是漢語方言)
(參考 標話 吉兆話)
這也反應在Y染色體上,根據微基因的網站/23魔方的基因庫,
廣府人與廣西壯族 泰人,共享一部分共祖年代晚至兩三千年前的支系
可見廣東的土著,與廣西壯族分家的時間確實非常晚
例如 O-SK1730 就是一支典型的壯傣或侗台特色支,
在泰人/廣西壯族/廣東廣府人中都大量分布
https://i.imgur.com/2wAIylE.png
https://i.imgur.com/70GLdDp.png
https://i.imgur.com/P2ZOYQm.png
可見 O-SK1730的分布,由西向東遞減,粵西最高頻,可達7%~9%
珠三角 4%~7%,粵東客語區 2%~3%
https://i.imgur.com/y6HDOEd.png
這支分布比例最高的地方,落在廣西東部的粵語區,可達12%~15%
其次才是廣西西部的壯語區,大約落在9%~10%
可見O-SK1730早年的起源地,應該在廣東,或者至少是粵西桂東一帶,向西擴散
以至於在粵西桂東粵語區的佔比,不低於西部的壯語區
O-SK1730雖然是共祖時間三千多年的支系,
但有約一半的後代,聚集在2500年共祖的下游 O-Z26029底下
而這支2500年共祖的下游,同樣在廣東廣西人與泰人中都廣泛分布
https://i.imgur.com/6CfkNDo.png
https://www.theytree.com/?snp=O-Z26029
https://www.23mofang.com/ancestry/ytree/O-SK1730
不過當然,廣東的土著成分,與廣西壯族的成分也沒有完全重疊
因為土著人群也會存在基因上的地域差異
廣西壯族的y染色體支系中,包含了一些近兩三千年才(疑似)從廣東流入的成分
也包含一些更早就流入廣西的土著成分 (或許與侗台語系的仡央語人群有關?)
也包含一些疑似與南亞語人群有關的成分(而在廣東較缺乏,例如O-m1284這支Y染色體)
此外,粵西(廣東西部) 桂東(廣西東部) 的粵語區,土著濃度也高過珠三角
可能因為珠三角是廣東經濟政治中心,又與客語區接壤等原因,有較多移民所致
(但粵西桂東的客家/閩人移民也不少)
不過珠三角的土著類型,也大致與粵西桂東屬於同一個類型
而現代的廣府人群,雖然有顯著的土著成分,但土著成分應該也不是主體
從Y染色體來看,嶺南土著來源的比例可能落在 20%~40%之間
(不含湖北江浙江西移民攜帶的南方成分)
(但這不是來自嚴謹學術來源的推測)
當然,廣西的侗台語人群,也不見得是歷史悠久的土著
侗台語人群應該是在距今四千~五千年內,才(疑似從江西湖南)流入兩廣
廣西五六千年前的古人群(隆林人等),也測過基因,與現代的廣西壯族差異很大
甚至不是東亞人種
至於東南亞的泰人,從基因上來看,確實與廣西壯族存在不少聯繫
像是參考23魔方與微基因所列出,秦漢時期的廣西大族
通常都在泰國有不少的後代
例如秦漢時期,廣西第一大族 (廣西韋氏)
在現代廣西人口佔比接近7% (其中60%是壯族,30%是漢族),
同樣在泰國有不少的後代
https://i.imgur.com/O60IROH.png
其他一些戰國~秦漢時期的廣西(壯族)大族,也是類似
https://i.imgur.com/H0Rsv4M.png
(壯族起漢姓的時間其實沒那麼早,只是同一氏族/部落的人會起同一個漢姓,所以
同一支Y染色體下有主流姓氏)
這也符合從語言學與一些歷史背景做出的推斷
認為泰人大約在距今1000~2000年前,才從廣西一帶擴散至中南半島
可以參考,侗台語系擴散史,這個影片
https://www.youtube.com/watch?v=PT9v_LoJb4g
但這個影片還是描繪的太保守了,
侗台語唐宋以前,覆蓋範圍應該要包含廣東(至少粵西珠三角)
現代侗台語系的名人:
泰人(含 泰國/寮國主體民族,緬甸的撣邦)
壯族(含 越南的儂族)
傣族(中國境內的泰語人群)
海南黎族
侗族/水族/仡佬族/臨高人 等等
侗台語的特色Y染色體
O-PK4 (O1b-> O-PK4)
O-SK1730 (O2a -> O-M117 -> 0-F8 -> O-SK1730)
此外 O1a 或者其他Y染色體底下也有一些疑似可以當成侗台特色支
4. 越南人
越南北部,在距今約2100~2300年前,被南越國併吞
之後到了西漢初年,又被併入漢朝的版圖
之後越南在中國境內,一直持續到宋代,越南才獨立成一個國家
越南獨立後,在中南半島大肆擴張,滅了在其南方的占城
(占城為南島語系的占族人建的國家,受印度文明影響)
之後越南併吞了占城的領土,又併吞了部分柬埔寨原本的領土,逐漸成為當代越南
越南剛獨立時 (宋朝時) 的版圖:
https://i.imgur.com/NXzlQQ3.png
越南在大肆擴張,消滅占城,蠶食柬埔寨後的版圖 (即現代越南版圖):
https://i.imgur.com/5uHHsHQ.png
越南的主體民族 京族,佔越南人口86%
主要發源於越南北部的紅河平原
也是漢代~宋代時的交趾/交州人的後代
交州在宋以前,發展程度還在廣西之上,曾經在唐朝時出過本土進士
至於越南人(京族)在基因上,
應該主要是 南亞語土著/侗台語人群/歷史時期流入的漢人
以某種比例混合
越南人的y染色體構成,找不太到優質的樣本來源,
只有一些樣本數很小的來源,能勉強做為參考
例如英語維基百科引用的,某篇樣本數為70的來源
顯示出越南人 O2 40% , O1b 32.9% , O1a 5.7% ,N 2.9%,C 4.3%,D 2.9%
另一篇較新的論文:
https://i.imgur.com/j8jRAJW.jpg
來源:
https://www.nature.com/articles/s41431-019-0557-4#Tab2
但這篇的樣本數更少,只有50
另外某張來源不明的圖:
https://i.imgur.com/UnfmJWc.jpg
(這張圖應該來自多年前的數據,所以使用過時的名稱,
O3指的是現在的O2a,O2a是現代的O1b)
另一個來源:
https://i.imgur.com/aycqElA.png
https://www.researchgate.net/figure/Classification-tree-of-26-NRY-haplogroups-along-with-their-frequencies-in-four_fig2_224959093
這篇的樣本也是非常小
另一個英語維基百科提供的資料:
https://i.imgur.com/V3NZbHt.png
https://i.imgur.com/P3nHZ9n.png
總之越南人的O2a 與 O1b,應該分別介於 30%~40%之間
且越南人的 O1b 絕大多數屬於 O-PK4
然後也混有一些 O1a C N 等等 (但因為樣本太小,無法確定具體的比例)
越南人的 O1b/O-PK4,可能源於侗台語或南亞語人群
至於越南人的O2a,裡面應該有3%~10% 屬於 O-M7
O-M7應該源自南亞語人群
此外越南人的O2a ,可能來自歷史時期的漢人移民,與侗台語/其他土著人群自帶的成分
而除了 O-M7 以外,越南人的O2a底下的類型似乎很雜
而且不同來源顯示的比例不太一致(因為樣本數太小)
根據微基因建的網站,越南人的y染色體支系中,有不少像是源自晚近的漢人移民
但仍然難以估計具體的比例,而且微基因的網站,越南人的樣本數量也沒有到很多
根據一些常染色體分析工具,越南人的常染色體,是與北部泰人/壯族比較接近的
https://i.imgur.com/QFiNaqw.png
但這是因為晚近的同源關係,還是剛好混出來的比例接近
仍然難以斷定
5. 泰人
https://i.imgur.com/vDmLWCh.png
(只有 Southwestern Tai 這支是泰人)
泰人進入中南半島的時間十分晚近,
大約在距今1000~1500年前,才陸續從廣西,擴散進入雲南南部,中南半島北部
之後泰人繼續深入中南半島腹地,移入孟人的地盤居住
當時泰國的土著居民為孟族,
孟族已在今天泰國的領土上,建立數個國家
孟人國家在柬埔寨帝國的勢力範圍內,與柬埔寨的關係,
可能有點類似 西周與諸侯國的關係 (柬埔寨是西周,孟人國家是諸侯國)
柬埔寨/孟人的文化主要受印度文明影響,信仰印度教/印度傳來的佛教
使用印度字母,來創建文字
後來泰人源源不絕的進入孟人的領地後,就起兵反抗孟高棉人的統治,
在當地建立泰人王國
素可泰王國,是現代泰國的前身,由泰人所建立,成立於西元1238年,
泰國中南部,再之前的國家都是孟人國家
不過泰人在中南半島,建立的王國也不只有素可泰王國
在雲南邊境,中南半島北端,在同年代,也有數個泰人建立的王國
(蘭納,瀾滄王國等等,後者演化成了現在的寮國)
不過泰人在進入中南半島時,本身應該是沒有很高的文化水平的 (例如沒有文字)
所以文化上,很大程度,採用了孟高棉人的文化
包含信仰印度式佛教,用印度字母來創建文字 等等
泰人參考了孟高棉人用的印度字母,替泰語創建了文字
後來泰人國家,陸續把原先孟人的領地都併吞了,
又在中南半島大肆擴張,併吞一部分馬來人的領地
逐漸形成現代的泰國
泰國還差一點與越南一起瓜分了柬埔寨
(幸好柬埔寨遇上歐洲人的殖民時代,成為法國殖民地,法國人還幫柬埔寨要回失土
不然再晚幾百年就要被越南與泰國瓜分了)
泰人雖然發源於中國南方,
且因為歷史時期的接觸,壯傣語支吸收了不少古漢語的詞彙
(例如泰語的數詞,就有不少源自古漢語,可以明顯的辨認出來)
但泰人遷入中南半島時,受漢文化的影響仍然很小,
而且泰人沒有他們進入中南半島以前的歷史記憶
泰人的民族敘事,最遠只能追溯到在雲南南方/中南半島建國
再往前就都是神話傳說
但傳統泰人的民族主義敘事,仍然認為他們是外來者
而不是孟高棉人的後裔
所以在近代語言學興起之前,泰人與廣西壯族,都不知道他們之間有關連
(中國的傣族除外,傣族與東南亞的泰人確實文化上有更密切的關係)
儘管語言上同源,文化上,泰人與廣西壯族的差異仍很大
廣西壯族在近現代,漢化程度已很高(例如有部分已自我認同為漢人),
也沒有受印度文化影響
而泰人主要受 印度文化/孟高棉人的文化影響
泰國人的Y染色體:
https://i.imgur.com/4UCQ7Vn.jpg
來源:
https://academic.oup.com/mbe/article/36/7/1490/5449617
左邊是泰族(泰語人群),右邊是南亞語系(孟高棉人群)
可以看出,泰人主流的Y染色體,跟越南人一樣,也是
O1b 與 O2a
因為樣本數很小(每一條都只有幾十個樣本),加上泰國的地域差異等緣故
不同的泰人樣本,在y染色體的比例上,也出現不小的差異
除了 O1b 與 O2a 以外
泰人還有其他成分
C D 可以來自侗台語人群自帶的成分,
C 也可以來自晚近的華人移民,D也可以來自藏緬語人群
此外 C D 也可以來自東南亞和平文化/矮黑人人群
N 可以來自侗台語人群自帶的成分,藏緬語人群,或晚近的華人移民
R J H 來自印度人 (早年的印度移民,將印度文化傳播給孟高棉人)
另一篇泰人的Y染色體來源:
https://i.imgur.com/eOJRuFd.jpg
(O-M111 是 O-PK4底下的分支,O-M324=其他O2a) / (除了LW 與 MO 其他都是泰人)
來源
https://www.ncbi.nlm.nih.gov/pmc/articles/PMC5524406/
可以看出,泰國北部的泰人,主要是 O-PK4(O1b) O-M117
混有少量的 O-M7 其他O2a 與 其他成分(主要是 C D O1a 等等)
https://i.imgur.com/b4B48XW.png
C2 也是侗台語人群自帶的成分,另外也可以來自漢人/華人移民
至於其他C,上圖沒有詳列底下的類型,不確定是否與和平文化人群(矮黑人)有關
K應該來自和平文化人群(矮黑人)
J H來自印度人
D1a1 是西藏土著/部分藏緬人群的成分,嶺南的侗台語人群也攜帶這種成分
泰人的 O1b 絕大多數聚集在 O-PK4底下,
O-PK4可能來自侗台語,也可能來自南亞語人群
而泰人的O2a ,較多聚集在 O-M7 與 O-M117底下
O-M7來自南亞語人群,而 O-M117可以來自侗台語自帶的那支 O-SK1730,
也可以來自藏緬語人群
但泰人的O2a也有其他類型,但這裡面也不易判斷有多少來自華人移民
有多少是侗台語人群自帶的成分,或者另有來源
此外,泰國北部人與泰國南部人,也存在明顯的基因差異
在常染色體上,泰國北部人與中國境內的傣族、廣西壯族等較接近
而泰國南部人,常染色體與現代孟高棉人更接近
這表示泰國中南部人,應該是具有大量孟高棉血統的
儘管如此,歷史上孟高棉人與泰人交流密切,也可能受到泰人的滲透
仍不好輕易的判斷,這種常染色體的接近,
有多少是因為 南部泰人主體基因是孟高棉血統,
或者因為孟高棉人也受到泰人滲透
儘管如此,中南部的泰人有大量南亞語/孟高棉基因,仍然是沒什麼爭議的
縱使是泰國北部的泰人,南亞語基因含量也高過廣西境內的壯族
關於常染色體,可以參考美國基因公司23andme的常染色體分析
https://i.imgur.com/4dnjdXe.jpg
與泰國人有關的類別:
Chinese Dai (中國傣族)
Vietnamese (越南人)
Indonesian, Thai, Khmer, Myanma (印尼 泰國 高棉 緬甸)
這幾個類別中,第三個類別,可以看成泛東南亞成分
第三個類別的共同點,就在於都含有濃度不低的南亞語成分
而第一個類別,可以看成原始泰族成分(以侗台成分為主流,但本身就自帶一點南亞語成分
這個常染色體分析,泰國/寮國北部人,會測出較高比例的 Chinese Dai 與 Vietnamese
而泰國南部人,會測出較高的 Indonesian, Thai, Khmer, Myanma
甚至很多泰國南部人,會測出高純度的Indonesian, Thai, Khmer, Myanma
測出來的結果,與柬埔寨人的結果是比較接近的
某個寮國北部人的測試結果:
https://i.imgur.com/kHB9oZg.jpg
https://www.reddit.com/r/23andme/comments/x0q3br/lao_american_update/
然後這個廣西人去測,會是south chinese 與 Chinese Dai以某種比例混合
https://i.imgur.com/hgZlDDf.jpg
https://www.reddit.com/r/23andme/comments/11nd58b/after_21_years_i_know_my_dna_wasnt_expecting/
某個廣西人的測試結果,很有可能是壯族
(但測試者是被領養的美國人,所以只知道是廣西裔,不知道具體的來源)
下篇待續...
作者: hedgehogs (刺蝟)   2023-04-05 19:47:00
推,精彩

Links booklink

Contact Us: admin [ a t ] ucptt.com