最强聲音克隆擬聲【AI 翻唱】必備神器！So-VITS-SVC 能模仿你訓練的聲音，輕鬆生成AI歌曲

2023 年 6 月 21 日 topadminAI 人工智慧不加評論

So-vits-svc（也稱Sovits）是由是中國民間歌聲合成愛好者Rcell基於VITS、soft-vc、VISinger2等一系列項目開發的一款開源免費AI語音轉換軟體，現由svc-develop-team接手進行後續維護。

So-vits-svc基於端到端架構的VITS和soft-vc，用戶只需準備幾十分鐘到幾個小時不等的語音或歌聲數據，就能製作（訓練）屬於自己的AI聲庫（前提是你的顯卡足夠給力），將一段語音或歌聲轉換為你想要的音色。

目前最新版本分為4.0v1和4.0v2兩個分支，區別在於v2使用了visinger2架構進行了重構。

因為一些問題，目前Rcell已經停止維護並刪除了原倉庫，現由svc-develop-team接手後續的代碼維護和社區管理工作。

瞭解 So-VITS-SVC 背景：
so-vits-svc是基於VITS的開源項目，VITS（Variational Inference with adversarial learning for end-to-end Text-to-Speech）是一種結合變分推理（variational inference）、標準化流（normalizing flows）和對抗訓練的高表現力語音合成模型。

目前該文件使用兩個版本號系統，分別是 So-VITS 官方的版本號，以及本整合包的版本號。請注意不要混淆。

So-VITS 官方版本號目前為 4.1，其下另有兩個分支：4.1-Stable 以及 4.1-Latest.

4.1-Stable是官方的穩定版本
4.1-Latest中包括一些尚在開發的新特性。
由於後者可能存在一些 BUG，因此本整合包將僅同步更新 4.1-Stable的內容。

So-vits-svc 的硬體需求：
顯示卡建議：nVidia 顯示卡，建議GPU達到GTX 3080顯存8G以上。AMD 顯示卡應該是跑不了，只能通過CPU去跑了（AMD,no!）

當AI入侵音樂行業後，生成式音樂的氾濫讓很多人感到憂心。
根據國外一位音樂經紀人的觀察，過去幾個月，音樂服務平台 Spotify 上的歌曲數量一直在以平均每天10萬首的速度激增。

眼下，環球影業已致信各大流媒體平台，要求打擊使用生成式AI的行為，停止使用其版權所有的歌曲進行訓練。
Spotify 平台也已下架人工智慧音樂初創公司Boomy的數萬首歌曲，下架的主要原因是懷疑“水軍機器人冒充人類聽眾來誇大某些歌曲的聽眾數量”，形成機器寫歌、機器聽歌、創造收益，一條龍服務。

對此，中國大陸也出台了關聯政策法規，近日發佈的《生成式人工智慧服務管理辦法》提出，“利用生成式人工智慧產品提供聊天和文字、圖像、音效生成等服務的組織和個人，要承擔該產品生成內容生產者的責任”。

這些都是可以且需要進一步關注討論的話題。