聲音位元深度 (Audio Bit Depth)
先前提到取樣率(Sample Rate),關於聲音的取樣次數對於音質的影響,而另一個在聲音錄製過程中和取樣率一樣重要的,則是聲音位元深度。取樣率負責的是橫向紀錄,而聲音位元深度則是縱向的紀錄,代表每一次取樣的聲音訊號可以用多少位元記錄下來。最常見的聲音位元深度有 16bit 和 24bit,影響聲音資訊的部分是錄音時的動態範圍(Dynamic Range)。動態範圍指的是,錄音時所能收錄到有效的最小聲音到最大聲音之間的音量範圍。越大的動態範圍,則可以收錄到越細微的聲音。
▲ 較高的 Bit Depth 可記錄的資訊量更多,對於聲音動態的重現能更準確自然。
在數位二進制中,以 16bit 所錄製的聲音資訊最大可以有2的16次方,也就是65,535可量化的值。 而24bit 所錄製的聲音,有2的24次方也就是16,777,216可量化的值。因此較高的 Bit Depth 所能記錄到的可能的震幅值(Amplitude)也越多。而因為以較高的 Bit Depth 錄製的聲音有著更多的資訊量,所以可以更精準的紀錄下聲音的震幅,並更忠實的重建聲音。而類比訊號在被轉換成數位訊號的量化過程和重建時與原始波形的誤差會產生的雜訊。不同的 Bit Depth 有著不同程度的量化雜訊比(Signal-to-quantization-noise ratio),直接影響到錄音時的震幅動態範圍。簡單來說,越大的 Bit Depth 所得到的量化雜訊就會越小。而雜訊越小則會帶來更大的錄音動態範圍。依照量化雜訊比的方程轉換去計算後,可粗略得到動態範圍的值。以 16bit 錄製的動態範圍音量大約是 96dB,而以 24bit 錄製的動態範圍則可以達到 144dB。
▲ 量化雜訊比計算方程,Q 值以 Bit Depth 代入。
舉例來說,以 16bit 錄製時,錄音的動態範圍有 96dB,在錄音軟體中有效的音量就介於0dBfs ~-96dBfs 之間。任何小於 -96dBfs 的聲音都會因為量化雜訊的原因給遮蓋掉而無法收錄到。因此較高的 Bit Depth 所錄製的聲音、相較於較低的 Bit Depth 來說,除了更小的雜訊之外,還可以有更大的錄音動態範圍,所以可以錄製到更細小的聲音,也能有更準確的聲音動態。
▲ 以不同聲音位元深度錄製的的音質差異,最明顯的差異量化過程產生的雜訊以及聲音動態的失真度。
▲ 以 16bit 錄製的聲音(左)相較以 24bit 錄製的聲音(右),在高頻區段可見有明顯的雜訊。
對於取樣率是否越高就越好這一點,至今仍然有許多分歧的意見。反對方認為更高的取樣率完全超過人耳的分辨率,對於聆聽者來說沒有實質且直觀的益處,反而會增加電腦運算甚至是檔案傳輸的成本。不過以客觀的事實來看,較高的取樣率確實對於類比聲音數位化後再重建時有更多的優勢,更乾淨的音質更少的失真率都能更準確且忠實的還原原音。隨著硬體技術的進步以及網路的高速傳輸,原本被視為缺點運算及檔案過大的問題,也會漸漸式微了吧。如同影視產業一直進步一樣,不斷的提高畫質以及畫面偵數來呈現更細緻的細節體驗感受。漸漸地做到真正的身歷其境、讓感覺不著人工的痕跡。
▲ 提高取樣率及聲音位元深度可以得到更少的失真,可以更準確的重建原音。
撰文:煉丹小童