AI 圈又有大新闻啦！Stability AI 又悄悄放出一个大招，这次不再是画图，而是音乐生成！而且还是开源的！

这个新工具叫 Stable Audio Open，简单来说，用文字就能生成各种音频——无论是鼓点、旋律，还是环境音效，全都不在话下！最最最重要的是，它还能为 Sora 和可灵这些视频生成配音！接下来我介绍3种使用方法

1.最简单在线使用

Stable Audio 2.0

【点击前往】

2.本地一键安装包：【点击下载】，适合新手，低配的电脑也能运行，但是效果没有第3种好！

3.手动安装

首先，将存储库克隆到本地机器：

git clone https://github.com/RoyalCities/RC-stable-audio-tools.git

cd RC-stable-audio-tools

创建虚拟环境

Windows ：

python -m venv venv

venv\Scripts\activate

macOS 和 Linux：

python3 -m venv venv

source venv/bin/activate

安装所需的软件包

安装稳定的音频工具和必要的软件包setup.py：

pip install stable-audio-tools

pip install .

Windows 用户的额外步骤

为了确保 Gradio 使用 GPU/CUDA 而不是默认使用 CPU，请卸载并重新安装torch、，torchvision并torchaudio使用正确的 CUDA 版本：

pip uninstall -y torch torchvision torchaudio

pip install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu121

配置

config.json根目录中包含一个示例。对其进行自定义以指定自定义模型和输出的目录（.wav 和 .mid 文件将存储在此处）：

{

"model_directory": "models",

"output_directory": "generations"

}

使用方法

🎚️ 运行 Gradio 界面

使用批处理文件或直接从命令行启动 Gradio 界面：

批处理文件示例：

@echo off

cd /d path-to-your-venv/Scripts

call activate

cd /d path-to-your-stable-audio-tools

python run_gradio.py --model-config models/path-to-config/example_config.json --ckpt-path models/path-to-config/example.ckpt

pause

或命令行：

python run_gradio.py --model-config models/path-to-config/example_config.json --ckpt-path models/path-to-config/example.ckpt

🎶 生成音频和 MIDI

Gradio 界面中的输入提示会生成音频和 MIDI 文件，这些文件将按照中指定的方式保存config.json。

该界面已经扩展了 Bar/BPM 设置（可修改用户提示 + 样本长度条件）、MIDI 显示 + 转换，还具有动态模型加载功能。

模型必须与附带的配置文件一起存储在其自己的子文件夹中。即，一次微调可以有多个检查点。所有相关检查点都可以放在同一个“model1”子文件夹中，但重要的是，它们的相关配置文件包含在与检查点本身相同的文件夹中。

要切换模型，只需使用下拉菜单选择要加载的模型，然后选择“加载模型”。

声明：本站所有文章，如无特殊说明或标注，均为本站原创发布。任何个人或组织，在未征得本站同意时，禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益，可联系我们进行处理。

Stability AI 最近发布了一项“黑科技”新技术，该技术在音乐生成领域显著超越了Suno AI。

Stable Audio 2.0

创建虚拟环境

安装所需的软件包

Windows 用户的额外步骤

配置

使用方法

🎚️ 运行 Gradio 界面

🎶 生成音频和 MIDI

评论(0)

提示：请文明发言取消回复

作者信息

文章展示

opencode部署

如何将 Chatbox 连接到远程 Ollama 服务：逐步指南

如何将 Chatbox 连接到 LM Studio：分步指南

Stability AI 最近发布了一项“黑科技”新技术，该技术在音乐生成领域显著超越了Suno AI。

想做Ai配音？这款工具错过将多浪费80%时间，再附5款可选配音软件，并持续更新中…

快速使用手里的U盘制作系统启动器，可安装win7/win8/win10/win11通用高效方法。

Stability AI 最近发布了一项“黑科技”新技术，该技术在音乐生成领域显著超越了Suno AI。

Stable Audio 2.0

创建虚拟环境

安装所需的软件包

Windows 用户的额外步骤

配置

使用方法

🎚️ 运行 Gradio 界面

🎶 生成音频和 MIDI

评论(0)

提示：请文明发言 取消回复

相关文章

作者信息

文章展示

提示：请文明发言取消回复