天工SkyMusic是什么?
「天工SkyMusic」是昆侖萬維推出的AI音樂生成大模型,基于昆侖萬維「天工3.0」超級大模型打造,是目前國內唯一公開可用的AI音樂生成大模型。具備高質量音樂制作、逼真人聲合成、精準歌詞控制、多元風格適應及復雜歌唱技巧學習等五大特點。該模型基于先進的Transformer技術,能夠根據用戶輸入生成具有豐富情感表達的音樂作品,旨在推動音樂創作的創新和個性化發展。

天工SkyMusic的主要特點
「天工SkyMusic」的五大特點如下:
- 高質量AI音樂生成:「天工SkyMusic」能夠生成長達80秒、44100Hz采樣率的雙聲道立體聲AI歌曲。它可以根據用戶輸入的歌詞風格生成相應風格的歌曲,保證音樂的質量和技術的先進性。
- 人聲“以假亂真”:在AI音樂生成中,人聲合成是非常關鍵的部分,「天工SkyMusic」的AI人聲合成技術達到了業內頂尖的SOTA(State of the Art)水平。特別是在中文人聲合成方面,它的發音清晰、無異響,并且顯著優于國外同類產品,處于世界領先水平。
- 歌詞段落控制:「天工SkyMusic」具備通過歌詞控制歌曲情緒變化的能力,能夠明確區分不同歌詞段落的情緒差異,如主歌和副歌、前奏和主歌之間的不同,使得生成的歌曲情感表達更為豐富和精準。
- 多種音樂風格支持:該模型支持多種音樂風格,包括說唱、民謠、放克、古風、電子等,為用戶提供廣泛的創作選擇。用戶可以根據自己的創作意圖選擇和參考不同的音樂風格,以實現個性化的音樂創作。
- 音樂智能表達-歌唱技巧學習:「天工SkyMusic」不僅能生成基礎的音樂作品,還能學習和模仿多種歌唱技巧,如顫音、歌劇、吟唱、男女對唱、自動和聲等,使得用戶創作的歌曲在情感表達上更加細膩和恰當。
這些特點共同構成了「天工SkyMusic」的核心優勢,使其在AI音樂生成領域具有強大的競爭力和廣泛的應用前景。
天工SkyMusic的技術架構
「天工SkyMusic」采用音樂音頻領域類Sora模型架構,Large-scale Transformer 負責譜曲,來學習 Music Patches 的上下文依賴關系,同時完成音樂可控性;Diffusion Transformer 負責演唱,通過LDM讓Music Patches被還原成高質量音頻,使得「天工SkyMusic」能夠支持生成80秒44100Hz 采樣率雙聲道立體聲歌曲。這套模型架構在處理視頻、音頻和音樂領域效果極佳。昆侖萬維團隊也將在后續逐步迭代和添加新的能力,讓模型具備多模態的情感理解與表達能力。

如何使用天工SkyMusic?
SkyMusic體驗地址:https://music.tiangong.cn/
