[心得] 整理翻譯 mp3 vs AAC 與 有損 vs 無損

作者: iaminanl (好MAN)   2017-12-19 12:15:55
《前言》
想寫這篇文章很久了,
主要前陣子在探究Apple music與Spotify的音質差異,
就我所知,
- Apple music是256Kbps的AAC
- Spotify是320Kbps的MP3
(編按:這裡完全誤會,原來Spotify是OGG Vorbis,因此我拿掉後面不正確的結論)
以這主題來說,CODEC不同、位元率不同,要比較有點奇怪,
且還不考慮不同的mp3 codec也有差異、串流在不同環境下的比較,
要討論音質其實並不容易。
然而網路上,至少中文的資源,針對這個主題,
往往只用描述的方式,
整理針對CODEC的說明、大概解釋位元率,
深一點會解釋不同編碼的邏輯與特色
但很少透過具體圖像,去比較聲音如何被影響,
不論是透過示意圖、演算法模擬或是真實的轉換,
我個人會很想知道「頻譜或是波形,壓縮前後的差異」
(當然對許多情況,不用講到這麼具體,就足以支持其論點)
尋尋覓覓,這篇來自Stereophile.com的老外文章,
看完拍案叫絕,
非常詳盡的介紹有損壓縮與無損壓縮,
並拿幾種常用的出來比較,使用頻譜解釋。
(有損的部分選擇Mp3與AAC、無損選擇FLAC)
https://www.stereophile.com/features/308mp3cd/index.html
其中使用頻譜的部分,
選的題材非常具有啟發性,
當然,頻譜是非常根本、非常物理層的,
編曲、錄音、混音、編碼等等的技術往往影響音樂更多,
然而從最根本的角度去看不同的CODEC,
可以直接佐證一些特色與理念。
太精彩了,常常會打開來看,也很想整理起來,
最近工作很操,決定靜下來寫這篇文章轉換心情。
《內文概述》
本篇文章將擷取文章,翻譯給各位版友參考,
將包含:
- 翻譯一段文字,解釋錄音檔,以及有損壓縮與無損壓縮
- 利用這篇文章的圖,簡單比較不同codec的差異
(因為我比較熟悉英文的術語,翻譯的部分看不懂可以討論一下)
文章會有點長,盡可能的解釋清楚是我的目標;
另外如果有興趣可以點進去原文,
看底下的討論,很多也很精彩。
《內文之一:有損與無損的差異(翻譯)》
一片CD上,三分鐘的錄音檔,大小為30到40MB。一台4G的iPod大概可以裝入
一百三十首歌曲,大約只是九張唱片的大小,為了放進更多的歌,某種壓縮
的技術讓檔案變很小就很必要,一方面也可以減少下載的時間。
無損壓縮對於聲音是無害的。就很像我們使用WinZip壓縮電腦的檔案,你讀
取出來的內容跟壓進去的內容一定是一樣的。而一般檔案的壓縮與聲音檔案
的壓縮最大的差異,在於後者需要能夠隨機存取。(想像為了聽一張唱片,
還要等電腦把400M的檔案全部解壓縮完,大概會馬上就不想聽歌啦)如果有
辦法把檔案壓到40~60%,一台4G的iPod就能放進三百首歌,大概是二十張唱
片,當然不同的壓縮技術有點差異,但我們需要把檔案壓的更小。
1980末期,MP3這種CODEC被提出來,並在1991年變成一種標準。一般來說,
MP3的壓縮比可以到10倍,也就是一首CD上要30MB的歌曲只需要3MB的儲存空
間。現在iPod可以裝進超過一千首歌了,而且通常家裡一般的高速網路,只
要十秒,歌曲就被抓下來啦。
但天下沒有白吃的午餐。MP3以及其他種類似壓縮比的演算法,都是「有損」
的:在這樣的需求下,許多音樂資訊就被捨棄掉。而捨棄多少,就看他的位
元率,越低的位元率就越多音樂消失。
以CD來說,不考慮overhead,從唱片上拉下來的檔案傳輸速率,兩聲道是超
過1400 Kbps,一般的MP3是使用十分之一,128Kbps。為了要這樣搞,MP3把
連續的聲音切成分離的時間區塊,並透過各種轉換去檢視每個區塊。Codec
的設計者,根據一些聲音的心裡學,做一些假設,討論看看有哪些可以捨棄,
例如同一個時間裡,播出比較小聲的就被捨棄,畢竟大聲的會蓋過小聲的。
另一方面為了要使用各種轉換來處理,這些被切開的時間之間,可能具有的
連續性特質就也被捨棄了。(編按:這段英文好懂很多XD)
一般聽眾會不會感受到有東西被捨棄了?那些在不同區塊間的連續性特質,
到底聽不聽的出來?如我1994年所寫的,「如果這些演算法,使用聲音心理
學的假設時,所寫出的演算法是正確的,那大部分的人都聽不出來的。」
欸欸,「如果」這個餅畫的有點大。
況且,當各種演算法間所做的假設都不太一樣的同時,那些他們捨棄的,永
遠捨棄的真實資訊,可能在一些使用者的系統上,有一些音樂是聽的出來差
異的。用玩家術語來說,這些codec不夠透明!有些測試可以輕易demo出來。
所以對我們這些發燒用戶來說,討論哪個有損壓縮的音質最好,是有點阿雜
的事情。最好就使用WAV或AIF等完全沒壓縮的檔案,不然就選擇無損壓縮,
像FLAC或ALAC,這些檔案在不同種的系統、音樂間,對用戶都是完全透明的。
(編按:透明,意思應該是指沒有隱瞞)
《內文之二:不同code之間的差異:AAC與MP3》
進入討論前,先簡單介紹一下什麼是頻譜。
(信號與系統入門教學,START!)
人類的混沌持續數千年,直到富立葉轉換出現,世界才有了光明,
所謂富立葉轉換(Fourier Transform),
他證明出,世界上所有的波形(函數)都一定能透過一連串的單頻波組成,
可能1% 10Hz+2% 11Hz+0.368% 12Hz+...+=原PO的聲音,
把那些幾趴幾趴,對頻率作圖,就是大家所說的頻譜。
男生、女生聲音的頻譜比較:
http://imgur.com/Kz2xsDk
y軸是剛剛說的幾趴幾趴,x軸就是越來越大的頻率。
大概解釋一下就好
作者: yenchieh1102 (香蕉史塔克)   2017-12-19 13:43:00
推整理
作者: stardust7011   2017-12-19 14:36:00
推推 受益良多 目前仍處於不是mp3就是CD轉的狀態
作者: alstorsummer (alstorsummer)   2017-12-19 19:18:00
推分享
作者: justlovekiss (就是愛親親)   2017-12-20 09:41:00
推專業

Links booklink

Contact Us: admin [ a t ] ucptt.com