Riffusion 是一個免費開源的具有穩(wěn)定擴散的實時音樂和音頻生成庫,用戶只需輸入音樂描述,AI便可以生成對應(yīng)風(fēng)格的音樂。該開源項目由Seth Forsgren 和 Hayk Martiros推出,Riffusion的背后原理是基于Stable Diffusion(文本生成圖像模型)微調(diào)頻譜圖,頻譜圖是音頻的視覺表示,顯示不同頻率隨時間的振幅,而后再將高保真度的頻譜圖圖像轉(zhuǎn)換為音頻。
Riffusion 是一個免費開源的具有穩(wěn)定擴散的實時音樂和音頻生成庫,用戶只需輸入音樂描述,AI便可以生成對應(yīng)風(fēng)格的音樂。該開源項目由Seth Forsgren 和 Hayk Martiros推出,Riffusion的背后原理是基于Stable Diffusion(文本生成圖像模型)微調(diào)頻譜圖,頻譜圖是音頻的視覺表示,顯示不同頻率隨時間的振幅,而后再將高保真度的頻譜圖圖像轉(zhuǎn)換為音頻。