【錄音事】何謂取樣率 l :了解取樣率對聲音的影響

16bit,24bit,44.1 kHZ,48kHz,96kHz。這些數字和英文想必對於剛踏入錄音領域的人是最熟悉卻又最陌生的吧。從整個錄音專案的一開始到最後檔案的提交,甚至是選購錄音器材時都會看到這一連串的數字英文。往往都只是憑藉著經驗做出選擇,卻不了解其背後的原理跟依據,今天就讓我們來看看這熟悉的陌生人:取樣率。

由於現今絕大多數的錄音都是透過電腦的數位錄音,而要將類比的聲音記錄下來則需要將類比訊號數位化。將類比訊號數位化記錄下來的過程包含兩個步驟,取樣和量化。其關乎到的就是聲音資訊記錄的細節程度以及將錄製好的聲音再重現時的準確度。其中包含了兩個主要的元素:聲音位元深度(Audio Bit Depth)以及取樣率(Sample Rate)。雖然大多的時候都直接簡化稱之為取樣率,但是這兩個元素影響聲音的範疇是不太一樣的。

  • 取樣率

取樣率指的是每秒鐘聲音取樣的次數,單位是千赫(Kilohertz)。一般常見的取樣率有44.1kHz、 48kHz、96kHz 以及 192kHZ。 以 44.1kHz 為例,在此數值下意味者錄音設備將以每秒44100次的次數紀錄聲音,或說取樣自聲音。越高的取樣率代表在同樣的時間內有著越多的聲音資訊量可以被記錄下來,用以重建聲音時還原聲音的準確度。

另外根據奈奎斯特取樣定理(Nyquist Theorem),一個頻率的聲音被要被紀錄下來,其取樣率至少達到該聲音頻率的兩倍以上,也就是說在44.1kHz取樣率之下,最高可以被完整有效記錄下來的音高頻率為22050赫茲,高於22050赫茲的聲音則無法在此取樣率之下正確的完整資訊化紀錄。超過有效的取樣頻率範圍的資訊在重建時會產生訊號的混疊(Aliasing)或稱為贗音,因此在轉換訊號時為了避免超過有效取樣的範圍的失真訊號也連同一起被記錄起來,一般在訊號被數位裝置ADC(Analog-To-Digital Converter)轉換成數位訊號前就先過濾掉超過有效取樣頻率的高頻訊號(Low-Pass Filter)避免過於失真的訊號被記錄下來。

根據取樣定理,在 44.1kHz 取樣率之下最高可以被完整有效記錄下來的最高音高頻率可以達到 22050Hz,而人耳能聽見的的頻率範圍理論值是 20Hz~20kHz,因此在 44.1kHz 取樣率之下所能取樣到的頻率就已經能將人耳所能聽到的音高頻率範圍都涵蓋了,甚至一般來說,絕大多數人能確實聽到聲音的頻率多在 40Hz~18kHz 之間,甚至隨著聽力的使用習慣或年紀增長而逐漸縮小可聽到的頻率範圍。因此除人聲傳輸的應用之外,在記錄音樂、聲音的應用中大多都是採用高於 40kHz 的取樣頻率,以確保能夠完整還原。而更高的取樣率早已超過人耳的分辨率,無法明顯的聽出差異。這也是為什麼對於音樂CD的標準取樣率規格會選擇 44.1kHz。

▲不同 Sample Rate 對於所能取樣到的聲音頻率差異。

人耳能聽見的有效頻率範圍理論值是20Hz~20kHz,但大多數人的頻率聽覺範圍比這個還小。

那麼既然以 44.1kHz 的取樣率所錄製的有效頻率範圍已經能包含人耳所能聽到的頻率範圍記錄下來,並能完整還原。那為何需要演衍伸出更高的取樣率呢?原因很間單,就是想要更完整清晰的錄製到更高的細節及更佳的聲音解析度。較高的取樣率能得到更多的資訊量,重建時也能更好的還原原音。

於音效設計來說,更高取樣率除了音質之外還能保留更高的頻率的音高,就連超過人耳聽覺極限的超聲波都能被完整記錄下來。這樣的聲音對於音效設計來說更能彈性的去應用。如果使用較低的取樣率製作的聲音檔案來調低音高或拉伸的話,就會發生高頻區域出現空缺或是聲音失真,這是因為這些較低的取樣率聲音資訊較少且更高頻率的音高範圍最一開始就沒有辦法被記錄下來。


如果使用較低的取樣率製作的聲音檔案調低音高造成的高頻區域訊號空缺。

接下來會再講到錄音取樣過程中的另一個影響要素:聲音位元深度(Audio Bit Depth)。

撰文:煉丹小童

本文最後更新於 2021年11月10日 12:08。

【錄音事】田野錄音 ll:手持型錄音機 Zoom H4n Pro