器材室

如何製作聲音的克隆人：關於 AI 與音樂（五）

06/02/2023

17323

在我們被 AI 孫燕姿轟炸了好一陣子之後，蘋果近日推出了一項挺重要、但似乎還沒有那麼多人關注的新功能：輔助使用中的「Personal Voice」，宣稱僅需錄製使用者15分鐘音訊，即可讓他們創造與自己聲音相似的語音。雖然功能是針對說話能力可能被逐漸侵蝕的疾病之人，目前也僅支援英語，但另一方面也代表了 AI 語音的進入門檻來到新低，只需要一台手機，便可在短時間訓練模型並輸出。

迷因創作者、詐騙集團、音樂製作人⋯⋯大家準備好了嗎？

探討更深層的問題，諸如 AI 準備如何摧毀或重建產業，或是法律層面之前，先來看看這是怎麼做的。主流是一款名為 SO-VITS-SVC 的開源軟體，利用深度學習將「餵」給它的聲音檔案建立模型，再以此轉化那些你想模仿的音檔，音樂製作上，如果有用過例如 Drumagog 這類換鼓軟體，其實是頗為相似的概念。

先利用 iZotope RX、免費的 Ultimate Vocal Remover，又或是之前提過可線上處理的 LALAL.AI，先將想建立模型的人聲從音樂中分離出，轉成 44.1kHz 的採樣頻率，再分別剪成5~15秒的小片段，由於 SO-VITS-SVC 是在本地電腦上運行，加上一個不能太糟的 GPU 工作一陣子之後，你就能得到一個能讓它唱出任何旋律的「角色」。

這類 AI 模型「像不像」的關鍵除了演算法之外，最重要關鍵來源是否乾淨清晰，能合法地獲得原始單軌大概是最佳解，取樣的多樣性例如較為寬廣的音域也會很有幫助。

▲ UVR5 很好用，且免費。

Discord 也行？

覺得上述方式太麻煩的話，更簡單的是像 Uberduck 或 Voicemod 這類服務，大抵上都是透過月費訂閱的方式，可以享有文字轉成語音、製作聲音模型這類的功能，有的甚至有已經建好的名人模型，例如可以用 Snoop Dogg 的聲音說個「我很嗨」之類。

另一個有趣的是名為 AI World 的 Discord 伺服器，你可以把它想成聲音版本的 Midjourney，透過與伺服器中的機器人運作完成你希望製作的 AI 語音。

一旦得到需要的語音軌道之後，接下來就跟日常的音樂製作一樣，丟進你的 DAW，將整個音樂做良好的平衡，利用一些混音技巧讓表情更為生動等等。老實說近日海量的 AI 歌曲，製作精良的還是相對少數，如果少了文字以及畫面引導，你是否還是認為這真是某個歌手，唱著不屬於他的作品？

▲ 你可以在 AI World 裡頭交流 model，並且看到現在已有許多非英語系的內容。

會出事嗎？ 還是接下來會出什麼事

製作了（AI）Drake 與 The Weekend 合唱歌曲〈Heart on My Sleeve〉的 @ghostwriter977，算是這波 AI 歌曲的高潮先鋒，但他的 TikTok 幾乎已清空，各串流平台也下架了（下架前播放量超百萬次）。握有大量版權的唱片公司對媒體平台的影響力仍相當巨大，但也有像 Grimes 這樣在早先宣布：以分潤50%的方式歡迎大家使用她的聲音。

藝人將自己當成 API，大部分時候，大家都可以自由接上只要別忘了版稅，似乎是個不錯的想法，只是實際層面如何執行，又或是 Google 可不管你上架的小程式有多醜，但作為藝術創作者能忍受的範圍通常不太大。一如所有新科技帶來的混沌，接下來我們終究會找到出口。

▲ 陳珊妮製作陳珊妮的 AI 模型，可能是某種長生不老的概念（？）

撰文：Jungle

重返青春熱血的社團時光，5月23日樂手巢雜誌 Vol.17 正式出刊：
https://ysolife.com/yso-mag-vol-17/

幾個值得嘗試的 AI 音樂工具：關於 AI 與音樂（四）

「客家流行音樂座談交流會」袁永興 x 丁曉雯 x 柯智豪 x 彭柏邑對談：不刻意強化客家身分、與不同場景連結翻轉形象

「你絕對不會忘記的樂團！」血肉果汁機頭版登 SXSW 社群，拍謝少年、凹與山等登2026美國南方音樂節

文策院力促對接國際，攜大港開唱領航臺流！創辦人 Doris：期許讓國際業者看見臺灣藝人強大的現場能量

撞鬼的歌會紅？Radiohead 16世紀莊園錄專輯，Thom Yorke：睡覺時鬼會跟我聊天

「不比太陽熱也不如月亮冷」Billyrrom 新作《Jupiter=》巡演用木星哲學擴張音樂星系

全明星陣容創造新廠牌「忘憂水」，Emo-Punk 重塑暗黑版〈愛情釀的酒〉

獨家專訪｜ONEWE 不只唱「宇宙系抒情搖滾」：更想和粉絲一起跳起來玩！

專訪｜走進那扇名為「Redoor」的門：希望成為一支在現場留下餘韻的樂團

4~6月演出總整理》別再懶在家！來聽齊豫、趙傳風采依舊，SIRUP、shame 新世代強勢來襲

Midwest Emo 傳奇回歸！American Football 攜新作《LP4》二度來臺

熱血唱紅《坂本日常》片尾曲，go!go!vanillas 首次亞洲巡迴7月來臺！

華語嘻哈最強旋律製造機 x 華語嘻哈 OG 合體！KnowKnow 巡演臺北場邀熱狗 MC HotDog 擔任嘉賓

政治審查這麼嚴，為何還要去中國演出？《報導者事件簿005：唱進／噤中國》臺灣獨立樂團西進中國的靈魂拷問

主角原本應該是瑪麗蓮夢露？改變奧黛麗赫本清純公主形象的《第凡內早餐》

從《日租家庭》出發：看四部外來者視角電影，如何以音樂呈現東京的孤獨

電影《Street Kingdom》日本3月上映！銀杏BOYZ 主唱峯田和伸主演，重返東京獨立樂團黃金年代

廟東食肆五感並行小客廳：以「傳奇喇叭」作為聽覺核心、限定禮盒用醬香貫穿冬季！

現在還逛唱片行嗎？朝聖英國「世界唱片行日」，擁抱實體的魔力

在香港的夜晚，穿梭荷李活道的酒吧

到英國上哪聽音樂？走進歷史現場，探訪曼徹斯特傳奇音樂場地！加碼巴黎篇（下）

【樂手評鑑】Modulation 效果大集合！Eventide TriceraChorus 開箱

傳奇重金屬樂手都使用哪些效果器？Zakk Wylde、Kerry King、Alexi Laiho 篇

想跟《Led Zeppelin II》音色一樣讚，Slash 情歸 Gibson Les Paul

沒錢買琴就自己做：貝斯傳奇品牌 Dingwall Guitars 如何從地下室走上 Taylor Swift 演唱會？

如何製作聲音的克隆人：關於 AI 與音樂（五）

ABOUT

LINKS

CATEGORIES