最强聲音克隆擬聲【AI 翻唱】必備神器!So-VITS-SVC 能模仿你訓練的聲音,輕鬆生成AI歌曲
So-vits-svc(也稱Sovits)是由是中國民間歌聲合成愛好者Rcell基於VITS、soft-vc、VISinger2等一系列項目開發的一款開源免費AI語音轉換軟體,現由svc-develop-team接手進行後續維護。
So-vits-svc基於端到端架構的VITS和soft-vc,用戶只需準備幾十分鐘到幾個小時不等的語音或歌聲數據,就能製作(訓練)屬於自己的AI聲庫(前提是你的顯卡足夠給力),將一段語音或歌聲轉換為你想要的音色。
目前最新版本分為4.0v1和4.0v2兩個分支,區別在於v2使用了visinger2架構進行了重構。
因為一些問題,目前Rcell已經停止維護並刪除了原倉庫,現由svc-develop-team接手後續的代碼維護和社區管理工作。
瞭解 So-VITS-SVC 背景:
so-vits-svc是基於VITS的開源項目,VITS(Variational Inference with adversarial learning for end-to-end Text-to-Speech)是一種結合變分推理(variational inference)、標準化流(normalizing flows)和對抗訓練的高表現力語音合成模型。
目前該文件使用兩個版本號系統,分別是 So-VITS 官方的版本號,以及本整合包的版本號。請注意不要混淆。
So-VITS 官方版本號目前為 4.1,其下另有兩個分支:4.1-Stable 以及 4.1-Latest.
4.1-Stable是官方的穩定版本
4.1-Latest中包括一些尚在開發的新特性。
由於後者可能存在一些 BUG,因此本整合包將僅同步更新 4.1-Stable的內容。
So-vits-svc 的硬體需求:
顯示卡建議:nVidia 顯示卡,建議GPU達到GTX 3080顯存8G以上。AMD 顯示卡應該是跑不了,只能通過CPU去跑了(AMD,no!)
當AI入侵音樂行業後,生成式音樂的氾濫讓很多人感到憂心。
根據國外一位音樂經紀人的觀察,過去幾個月,音樂服務平台 Spotify 上的歌曲數量一直在以平均每天10萬首的速度激增。
眼下,環球影業已致信各大流媒體平台,要求打擊使用生成式AI的行為,停止使用其版權所有的歌曲進行訓練。
Spotify 平台也已下架人工智慧音樂初創公司Boomy的數萬首歌曲,下架的主要原因是懷疑“水軍機器人冒充人類聽眾來誇大某些歌曲的聽眾數量”,形成機器寫歌、機器聽歌、創造收益,一條龍服務。
對此,中國大陸 也出台了關聯政策法規,近日發佈的《生成式人工智慧服務管理辦法》提出,“利用生成式人工智慧產品提供聊天和文字、圖像、音效生成等服務的組織和個人,要承擔該產品生成內容生產者的責任”。
這些都是可以且需要進一步關注討論的話題。
“2003年大火的歌手:孫燕姿。2023年爆火的歌手:AI孫燕姿。”
最近,在B站一個熱門AI孫燕姿翻唱視訊下,有網友這樣評論道。
近幾天來,AI歌手翻唱歌曲及視訊在多個平台火爆,生成式人工智慧(AIGC)再度出圈。
該翻唱視訊採用了開源項目So-vits-svc,簡稱Sovits,是一款由國內音樂合成愛好者Rcell開源的免費AI語音轉換項目。
但對於“AI孫燕姿”,孫燕姿本人極具標識的咬字和獨特尾聲,很好彌補了普通“翻唱”AI的缺陷。
尚不論風格相似的《花海》,難辨是真人還是AI翻唱。即便是反差極大的《好漢歌》,也被唱出了“孫燕姿”式味道。
這大概也是“AI孫燕姿”能從一眾AI歌手中脫穎而出、爆火的原因之一。
AI歌手的“模擬”程度能夠以假亂真,騙過許多專業人士和真愛粉,欣喜於技術革新的同時,人們不禁擔憂,在人工智慧技術愈發成熟的未來,真正的歌手是否還有舞台?
但在人工智慧產業高速發展、創新業態極速擴張的今天,人機深度互動或將成為社會生產生活的常態,與其在“是否被取代”的惶恐中將新技術視作洪水猛獸,倒不如好好思考 『AI時代,我們到底可以做些什麼』?