FINDIT
EN
2024.06.21

【新興領域/2024.06焦點】跨越詞曲創作的技術門檻,AI音樂成了行動創意萌芽的沃土

今年五月,臺灣街頭公民行動透過社群串聯加上實體集結,迸發出不可思議的創作能量,讓大眾看見「藝術與運動」的完美結合,像是琳瑯滿目的手板標語、布條徽章、珍奶手燈等,不僅是集體價值信念的投射,更是精神得以延續的載體。不過,與過去明顯不同的是,今年社運有強大的神隊友—「人工智慧」(AI)的加入,藉由生成式AI作圖,快速在網路平臺傳播、擴散,再加上AI音樂助陣,成了各大媒體上現象級的熱門話題,許多參與者運用「Suno AI音樂生成器」,產出一首首曲風及語言不同的作品應援。當許多音樂人正為AI版權問題發難的此刻,臺灣社會已運用AI發展出獨特的公民行動風貌。本文將以Suno為主介紹AI音樂生成器,並引用調研結果說明AI音樂的市場發展,最後提及AI發展的版權爭議,反思藝術產業所面臨的挑戰與威脅。

 

AI音樂生成器

自從ChatGPT在2022年11月橫空出世以來,關於人工智慧(AI)的話題便未曾停歇,從文本撰寫、圖像創作到聲紋模仿,AI擬人的藝術創作實力,屢屢讓人感到驚艷。而如今,這股AI風潮也吹進了音樂製作圈,開拓者如Adobe的Project Music GenAI、YouTube的Dream Track和Voicify AI(現在為Jammable)等,但因早先這類AI音樂生成器需原始音檔才能進一步生成,再加上作品的音質不佳且內容不符合指令,大眾討論度不高。然而,拜科技迭代速度之賜,不到一年後Suno的出現,已能將作詞、作曲、編曲、合奏及演唱,甚至單曲封面「一鍵生成」,這對過去技術密集的音樂產業來說,無疑將迎來一場行業震盪與顛覆,以下介紹並報導近期消息。

 

Suno紅什麼?

打開Suno的網頁,簡潔的使用者介面(UI)一目瞭然,只要在文字欄鍵入簡單的指令(prompt),如:「熱血的年輕人」、「春天花開的時節」等,它即會在1分鐘內生成兩種不同風格的歌曲,時長2分鐘包含人聲演唱(生成結果如下圖);同時,自動匯出封面及歌詞影片(目前歌詞除了英文之外,也支援中文、日文、粵語等)。當然,若想要歌曲更專業、更符合需求,也能直接指定男、女聲,或直接輸入歌詞並制定Intro(前奏)、Verse(主歌)、Chorus(副歌)、Bridge(銜接)等細節。就目前Suno所生成的作品而言,以鼓、鋼琴、小提琴、大提琴四種樂器為主,並包含民謠、Pop、RnB、重金屬等71種音樂形式,與慵懶、迷幻等29種音樂風格,讓任何人都可以從音樂小白搖身變為音樂單曲製作人,甚至還不需要花費一毛錢!

 

 

探討Suno的訂價策略,根據目前官網公告,用戶在註冊登入後,有三種價格方案可供選擇。其一,免費用戶每天都可獲得50點,每一次生成歌曲扣10點,但該歌曲禁止商用;其二,購買Pro方案者,須支付8美元/月,每月可生成最多500首歌曲,且可將歌曲於YouTube頻道、Spotify或Apple Music上架營利;其三,購買Premier方案者,須支付24美元/月,每月可生成高達2,000首歌曲,商用規定則與Pro方案者雷同。如此低成本的音樂製作費用,跨越過去傳統音樂的進入門檻與專業藩籬,不僅為臺灣公民運動增色,也為音樂創作增加新的意義。比如臺中市瑞穗國小張老師就在「翻轉教育」的專欄分享,其課堂上也運用Suno,帶著學生把童詩變歌曲,讓小學生透過音樂的渲染力,清楚表達詩作的情感與意象。想像在不久的未來,任何人都可以輕易打造自己的主題曲,就連求/結婚譜曲也不再是難事,透過音樂創作可以協助記憶每個人生命中的精心時刻。根據報導,截至2024年5月底,Suno月活躍用戶全球已突破1,000萬,成為AI音樂生成領域不可忽視的領頭羊。

 

 

發展歷程與策略

Suno起初建構在Discord平臺上,是2022年由哈佛大學和麻省理工學院的團隊所創立,四位共同創辦人Mikey Shulman、Keenan Freyberg、Georg Kucsko和Martin Camacho皆曾擔任Kensho公司的主管,這是一家以大數據及機器學習模型為機構投資者提供情報的金融科技公司,也因而厚實了Suno的技術背景與運算基礎。

實際而言,與大多數生成式人工智慧一樣,Suno的運算模型與ChatGPT等大型語言模型(LLM)相似,需要大量文本、音樂伴奏及語音錄音進行資料鍛鍊(training),以能根據提示詞來創作合適的曲風。回顧Suno技術演進的歷程,2023年4月,推出文本轉音訊的模型Bark;該年7月,在音訊基礎上增加人聲音樂、時長30秒;12月,推出網頁Suno 3.0版本,可生成2分鐘帶人聲的歌曲;直至近期2024年5月,隨著Suno 3.5版本推出,生成歌曲時長從2分鐘加倍至4分鐘,同時還發布了一項突破性的新功能:將音訊轉歌曲。未來我們可以期待將熙攘的城市街道音轉換成充滿活力的電子曲目,或將蟲鳴鳥叫聲幻化為寧靜的環境樂曲,這種創新方法將為音樂家和聲音設計師開闢了一個充滿可能性的世界,也以前所未有的方式探索聲音景觀,模糊了音樂與我們周圍世界的界限,讓AI不僅讀得懂文意、更聽得懂聲音。

而除了技術更迭迅速之外,Suno為了避免用戶僅止於「嚐鮮」、玩完即丟,也有策略性地強化平臺上的社群經營,加深用戶的黏著度。平臺會依據各個作品的生成時間、播放次數、按讚數等方面進行評比,將獲得最多共鳴的歌曲放在首頁的「Trending」區塊,讓所有用戶可以瀏覽最即時的熱門曲目。2024年5月,Suno更宣布了一項名為「Summer of Suno」的計畫(如下圖),針對最熱門的歌曲排名並提供獎金支持。第一熱門曲目將獲得10,000美元、第二名獲得7,500美元、第三名獲得5,000美元,依此類推至101-500名者提供100美元獎金,其中參賽資格規定創作者必須年滿18歲,作品歌詞中不能隱含攻擊性的詞彙,且須接受以PayPal管道支付獎金;另一方面,Suno也藉此鼓勵用戶將自己生成的作品放上X(前身為Twitter)、IG或Tiktok,透過與既有社群連結的方式加深Suno的能見度,與參賽用戶成為一種互惠關係。

而在合作與資金支持方面,2023年12月,微軟看好Suno未來發展,率先將Suno 3.0功能整合到Copilot AI應用程式中;2024年5月21日,Suno官網宣布其籌集了1.25億美元B輪資金,主要投資者為近年來關注區塊鏈金融技術及生成式AI的Lightspeed Venture Partners,並由創投基金Founder Collective,與曾擔任GitHub執行長及Midjourney的顧問Nat Friedman等跟投,市場估值來到5億美元。Suno創辦人表示,該筆資金將致力於擴大公司的員工規模與投入Suno 4.0的開發。

 

 

生成式AI音樂市場

強敵環伺

Suno看似穩步向前,但站在機器學習日新月異的立場,誰也說不準任一對手有彎道超車的可能。故介紹近期最常拿來與Suno相比的Udio,並羅列其他市場上可能的競爭對手,以能縱觀生成式AI音樂領域的發展。

 

 

1. Udio AI

由Google DeepMind 研究人員於2023年所推出的Udio,使用方式與Suno相似,但其特點在於,Udio可針對生成的音樂進行精細的調整,如加上前奏、結尾,或在特定片段之前或之後增加段落,不必再重新下指令。另外,關於版權侵犯的疑慮,Udio表示該軟體有設定自動化的版權過濾器,確保平臺上創作的音樂皆為原創,並將持續精進以利保障措施能夠更完善。該公司於2024年4月,完成種子輪1,000萬美元籌資,Udio表示,未來將增加從單獨的曲目中拆分音軌的功能,甚至可以指定歌手或藝術家的風格來創造音樂,並持續擴充歌詞語系,以能擴張用戶版圖。

2. SongR

介面簡單,不需要註冊帳戶即可生成音樂,任何人都可以選擇音樂類別並輸入文字指令來生成歌曲,且提供不同的AI歌手(聲線)供選擇,但若需對生成作品進行更專業的音軌調整,目前SongR則相對缺乏。

3. Beatoven AI

同樣可透過指令生成特定內容的歌曲,長度上限為60秒,但生成的音樂沒有人聲、操作也較複雜,可加以控制音樂淡入淡出、節奏,並自行添加音樂或影像片段等。若需下載音樂生成作品,每分鐘的下載費用為3美元。

4. Riffusion

操作步驟與其他平臺略有不同,Riffusion係先輸入歌詞後,AI提供適合的人聲和樂器,再加以調整和自訂音樂風格,而生成的音樂片段長度僅為12秒,較適合用於短影音等內容上,該生成的音檔下載僅需登入即可。

5. LimeWire AI Music Studio

生成的音樂不包含人聲,歌曲長度最多30秒,其特點在於除音樂外,平臺還能支援文字、圖片生成等多元內容。目前LimeWire提供免費方案,每天可生成四段音樂,訂閱方案則是每月9.99美元。

 

後勢看漲

建立在競爭的思維之上,瞭解生成式AI音樂潛在的需求與市場價值是重要的。因此,本文根據2024年2月歐洲版權管理協會所發布的報告,看人工智慧發展對創作及音樂產業的影響。

首先,該報告係由法國音樂作家版權協會(Sacem)和德國著作權仲介團體GEMA委託編寫,並由專注於媒體和娛樂產業的諮詢和研究機構Goldmedia進行的「人工智慧和音樂」研究預測。其中針對15,000多名音樂家,調查迄今為止對人工智慧的看法與體驗。研究發現,35%的人已經在工作中使用了AI工具,若再將35歲以下藝術家分群,使用AI工具的占比從35%直接攀升至51%,顯示年輕作曲家接受度更高。

此外,使用AI的程度也與音樂流派有關,占比由高到低分別是電子音樂(54%)、嘻哈音樂(53%)、廣告音樂(52%)及背景音樂(47%)等;而在搖滾金屬樂、交響、爵士及傳統古典樂中,占比皆不超過40%。

儘管人工智慧已存在創作者的日常中,許多人也已看到其發展潛力,但有高達71%的受訪者表示擔憂,指出目前有許多針對人工智慧開發者的訴訟,指控其在訓練人工智慧模型時未經授權使用受版權保護的音樂,但尚無法律框架來指導法院如何解決這些案件。多數人擔心AI持續發展可能會削弱音樂家透過歌曲賺錢的能力。

另外,在針對AI音樂市場價值的研究中預測,如果全球不建立針對人類創作投入的報酬制度,到2028年,音樂創作者的收入可能會減少27%;且光是在法國和德國,2028年音樂收入將出現9.5億歐元(10.3億美元)的缺口,而該缺口也會成為AI市場發展的養分。研究預測,由於對人工智慧的大規模投資,全球生成式人工智慧音樂市場將從2023年的3億美元(占人工智慧市場總額的8%)增長到2028年的31億美元(如下圖),相當於2022年11月ChatGPT甫推出的光景,在歐洲當時產生了近500億美元的收入。

對此,Goldmedia強調人工智慧快速發展確實創造了巨大的經濟潛力,但相對地,可能剝奪了其他市場上的創作者,從音樂的角度而言,多數創作者迄今為止認為風險大於機會,未來只有聚集多方塑造整體產業條件,才能使行業中的每個參與者都能適當地發展,並得到公平的收益。日前(2024年5月21日)歐洲理事會才批准全球首部監管人工智慧的法規,或許有助於減輕音樂創作者的擔憂。

 

 

版權爭議難題

承上報告所述,AI音樂產業發展將受惠於投資與技術開發,但與此同時,版權爭議若無法得到妥適的解決,將不利於未來公平分配與薪資正義。以下說明關於Suno的版權爭議及相關立法舉措。

 

版權聲明

關於AI生成歌曲的所有權問題,Suno有在其官網問答集中說明,告知用戶若為付費定閱者,同時也擁有該作品的所有權;若為免費使用者,則Suno擁有其所有權。然而,關於Suno生成的音樂是否受到智慧財產權保障的問題,官方則表示目前全球對人工智慧生成內容的智財規範是複雜且沒有固定標準的,建議使用者向相關法律單位尋求解答,意旨Suno並不願意向外界交代鍛鍊AI模型的素材來源。就連音樂媒體RollingStone與Suno團隊一次的訪談報導中,該公司創辦人也拒絕透露其背後的大數據,僅願意表示歌曲人聲的部分,是來自於語音錄音中學習的事實。

 

各界爭議

2024年4月,Fairly Training的創始人、Stability AI前音訊部門副總裁、專家Ed Newton-Rex在《Music Business Worldwide》發表的一篇文章警告,Suno至今尚未透露其使用哪些資料作為訓練資料,但根據生成結果,有許多跡象表明,Suno與許多其他生成式人工智慧公司一樣,可能會在未經許可的情況下使用受版權保護的作品來訓練其模型。

隨後,2024年5月全球大型的唱片工業之一的索尼音樂集團也對約700家數位公司和串流媒體服務發出警告信,信中內容表示,索尼音樂承認人工智慧的無限潛力,但當公司及其藝術家的內容未經許可用於人工智慧開發、培訓或行銷時,他們將採取行動,並敦促所有收件人提供有關AI如何在訓練中使用索尼音樂的歌曲、製作了多少副本以及是否仍在使用等詳細資訊。

 

立法保障

事實上,包含OpenAI在內的許多AI公司認為,模型要能夠更加精確運算,未經版權許可的資料訓練應被納入「合理使用」範疇,但該範疇又該如何界定一直是法律爭辯當中令人頭痛的問題。

對此,美國田納西州在3月份積極通過了《確保肖像、聲音和影像安全法案》(Ensuring Likeness,Voice,and Image Security Act of 2024;簡稱ELVIS法案),成為保護藝術家免受人工智慧侵害的先驅州。該法律規定了一項新的民事訴訟,針對未經他人同意而發布或表演他人的聲音,或未經授權而使用藝術家的姓名、圖像、聲音或肖像的人將被追究責任,預計將於7月1日頒布。另外,面對人工智慧應用層面日益擴增,加州民主黨代表Adam Schiff也在4月提交立法,要求人工智慧公司披露其受版權保護的音樂。可預期未來關於AI版權爭議的立法會與AI發展並進前行,以能保護更多創作者的權益。

 

結語

不久前,我們還在AI歌手以假亂真的唱腔裡挑瑕疵,討論AI聲紋模仿對音樂產業的影響,許多人總以為那些調動情緒與訴諸情感的音符創作,是AI永遠無法取代的。不料,音樂產業的ChatGPT即刻到來,AI已跨越了過去音樂既有的技藝與樂理門檻,讓人人都能成為音樂製作人,擁有屬於自己的音樂作品,甚至用即時生成的音樂參與公民行動,AI的獨特性恰恰能嶄露出多元社會的創意。

然而,「水能載舟,亦能覆舟」,如今所發展的生成式AI並沒有為人類承擔枯燥無聊的工作,反而是AI在寫詩、作畫、吟唱,而人類仍受困在機械式的工作裡無法自拔。當所有的技藝輕易地被AI作為養分,整體音樂工業的失業,彷彿近在咫尺。當我們總在反思「人」自身的價值同時,透過法律保障的智財權制度,應與AI的發展一併受到相關政府單位的關注,才能維持健康的產業生態。

 

 

參考資料

1. Music Business Worldwide, “AFTER RAISING $125M, AI MUSIC GENERATOR SUNO IS NOW PAYING ITS MOST POPULAR CREATORS”, June 17, 2024, https://www.musicbusinessworldwide.com/after-raising-125m-ai-music-generator-suno-is-now-paying-its-most-popular-creators/

2. Music Business Worldwide, “GENERATIVE AI MUSIC MARKET TO BE WORTH $3BN BY 2028, SAYS REPORT COMMISSIONED BY SACEM AND GEMA”, January 30, 2024, https://www.musicbusinessworldwide.com/generative-ai-music-market-to-be-worth-3bn-by-2028-says-report-commissioned-by-sacem-and-gema/

3. Data Conomy, “Suno 3.5 unleashes new wave of AI music creation”, May 29, 2024, https://dataconomy.com/2024/05/29/suno-3-5-features/

4. 吹音樂,青鳥行動之後,我們訪問了用AI作出City Pop〈蔥師表〉的詠唱師:「我不覺得我得了幾千個讚就是個音樂人。」,2024年5月31日,https://blow.streetvoice.com/74383/

5. Inside,歌曲生成 AI「Udio」討論度超高,為何能被稱為音樂界的 Sora 時刻?,2024年4月15日,https://www.inside.com.tw/article/34739-udio-music-generation

6. 數位時代,只需一鍵」,SUNO讓人人都是音樂家!背後版權爭議卻是一大難題,2024年6月6日,https://www.bnext.com.tw/article/79334/suno-ai-music-copyright-problem?