
(來源:麻省理工科技評論)
當帕特里克・達林(Patrick Darling)的歌聲響起,臺下觀衆潸然淚下。這是一首飽含深情的歌,寫給他從未謀面的曾祖父。而這場演出之所以格外動人,還有另一個原因:這是達林在兩年前失去歌唱能力後,首次與樂隊成員重返舞臺。
這位 32 歲的音樂人在 29 歲時被確診爲肌萎縮側索硬化症(ALS)。這種疾病與其他運動神經元病一樣,會損傷控制人體肌肉的神經。肌萎縮側索硬化症患者最終會失去對肌肉的控制能力,其中包括支配肢體活動、說話和呼吸的相關肌肉。
達林上一次登臺演出已經是兩年多以前。那時他已經無法站立,也不能演奏樂器,唱歌和說話都變得十分困難。但在近期,他藉助一款基於舊音頻片段訓練的 AI 工具,重新復原了自己失去的聲音。另一款 AI 工具讓他可以用聲音克隆的方式創作新歌曲,達林得以重新進行音樂創作。
這場活動於週三在倫敦舉辦。達林藉助克隆聲音在臺上表示,很遺憾自己已經失去唱歌和演奏樂器的能力。儘管如此,他現在大部分時間仍在堅持創作和製作音樂,對他而言,這件事比以往任何時候都更重要。
達林表示,自己從 14 歲左右就開始從事音樂創作。他在活動中提到,自己學習過彈奏貝斯吉他、原聲吉他、鋼琴、口風琴、曼陀林以及次中音班卓琴,但他最熱愛的事情依然是歌唱。
樂隊成員尼克・科金(Nick Cocking)回憶,兩人在十多年前相識,當時達林還是一名大學生。不久後,達林加入了科金所在的愛爾蘭民謠樂隊 Ceili House Band,兩人首次同臺演出是在 2014 年 4 月。科金表示,達林以歌手和吉他手的身份加入樂隊,提升了整個樂隊的演奏水準。
但在幾年前,科金和其他樂隊成員開始察覺到達林的身體變化。科金提到,達林的動作開始變得笨拙。他回憶起一個夜晚,樂隊一行人冒雨穿過加的夫市區,達林不停滑倒摔跤,常常被鋪路石板之類的東西絆倒。
科金當時並沒有多想,但達林的症狀在持續加重。疾病最先影響到他的雙腿,2023 年 8 月,達林演出時必須坐着完成。隨後他的雙手也逐漸失去活動能力,科金說,達林最終再也無法彈奏吉他和班卓琴。
科金表示,到 2024 年 4 月,達林已經難以一邊說話一邊正常呼吸。在那一場演出中,樂隊成員將達林抬上舞臺。科金聲音哽咽地回憶,達林在演出第二天打來電話,說自己再也無法繼續演出。到 2024 年 6 月,一切都結束了,那是樂隊最後一次合體演出。
達林隨後聯繫了一位言語治療師,這位治療師提出,可以爲他進行聲音儲備。喪失發聲能力的人羣可以選擇錄製自己的語音,再用這些錄音生成可被文字觸發的發聲,觸發方式既可以是手動輸入,也可以是眼球運動控制設備。
部分用戶覺得這類工具發出的聲音過於機械,但達林還面臨另一個問題。他在活動中表示,到準備儲備聲音時,自己的嗓音已經發生改變,他覺得這樣保存下來的並不是自己原本的聲音。
之後,另一位言語治療師向他介紹了一項不同的技術。理查德・凱夫(Richard Cave)是一名言語治療師,同時也是倫敦大學學院的研究員。他還是 ElevenLabs 的顧問,這家 AI 公司專注開發智能體以及音頻、語音、視頻和音樂工具。該公司的一款工具可以生成聲音克隆,只需幾分鐘甚至幾秒的個人錄音,就能高度還原真實人聲。
ElevenLabs 在去年推出一項公益項目,承諾爲因肌萎縮側索硬化症、頭頸部癌症或中風等疾病失去聲音的人羣免費提供該工具使用權限。
這款工具已經爲部分用戶提供了幫助。該項目負責人、言語治療師加比・萊博維茨(Gabi Leibowitz)表示,他們並不能提升患者的溝通速度,也無法解決運動神經元病患者在進食、呼吸等方面的全部身體困難。但他們可以爲這些人羣提供重新創作、繼續實現自我價值的途徑。她表示,用戶可以更長久地保留自己的工作,繼續做那些讓他們感受到自身存在的事情。
凱夫與達林合作,利用這款工具和達林的舊錄音,復原了他失去的說話聲音。
達林藉助克隆聲音在活動中說,第一次聽到復原聲音時,他覺得效果十分驚人。這個聲音和他以前的嗓音一模一樣,旁人幾乎聽不出差別。他不願透露用新聲音說出的第一個詞,但可以表示這個詞以 f 開頭、以 k 結尾。
復原歌唱聲音的過程則沒有這麼簡單。這款工具通常需要約 10 分鐘清晰音頻才能生成克隆聲音。達林說,自己沒有高質量的歌唱錄音,他們只能使用人們手機拍攝的、在嘈雜酒吧裏的視頻音頻,以及幾段他在廚房唱歌的錄音。但凱夫表示,這些片段已經足夠生成達林歌唱聲音的合成版本。
凱夫提到,這些錄音裏的達林嗓音有些沙啞,部分音準也存在偏差。克隆聲音也保留了這些特點。凱夫表示,這個聲音並不完美,但足夠真實。
達林在活動中說,他們用 ElevenLabs 製作的聲音效果非常好。這個聲音毫無疑問就是他本人,只是感覺像是另一個版本的自己。
ElevenLabs 還開發了一款名爲 Eleven Music 的 AI 音樂生成工具。用戶可以通過文字提示選擇音樂風格,並用這款工具創作樂曲。多位知名藝人與該公司合作,授權其製作自己的 AI 聲音克隆,其中包括演員邁克爾・凱恩(Michael Caine),他的克隆聲音將用於 ElevenLabs 一部即將推出的紀錄片配音。該公司在上個月發佈了一張專輯,其中 11 首曲目均由這款工具生成。凱夫說,麗莎・明奈利(Liza Minnelli)相關曲目效果非常出色。
Eleven Music 可以在一分鐘內生成一首歌曲,但達林和凱夫花了大約六週時間打磨達林的歌曲。凱夫表示,任何用戶都可以通過文字提示,以自己喜歡的風格創作音樂並添加歌詞。達林偏愛愛爾蘭民謠,而凱夫還與一位哥倫比亞創作者合作,製作當地民謠。ElevenLabs 工具目前支持 74 種語言。
上個月,科金接到凱夫的電話,對方發送了達林完成的曲目。科金說,他只聽到達林唱出前幾句,就不得不暫停播放。他當時情緒崩潰,淚流不止,反覆聽了六七次,才完整聽完整首曲目。
達林和凱夫計劃在 2 月 11 日週三於倫敦舉辦的 ElevenLabs 峯會上現場表演這首曲目。科金和樂隊成員哈里・馬(Hari Ma)分別編排了曼陀林和小提琴的伴奏部分。距離上一次同臺演出過去兩年,他們用幾周時間排練,之後與達林一同登臺。
凱夫說,他推着達林走上舞臺,兩人都不敢相信這一幕是真實的。達林當時非常激動:達林留在臺上,歌曲正式播放,科金和馬進行現場樂器伴奏。
科金和凱夫均表示,達林計劃繼續使用這些工具進行音樂創作。科金希望能再次與達林同臺演出,但他也清楚,考慮到肌萎縮側索硬化症的病程特點,很難做出長期規劃。
科金說,這段經歷苦樂交織。但走上舞臺看到達林的那一刻,他心中充滿喜悅——他知道達林也非常享受這次演出。
原文鏈接:
https://www.technologyreview.com/2026/02/13/1132913/als-stole-this-musicians-voice-ai-sing/




