2.23 音频处理与生成 (Audio Processing & Generation)

本类别的节点主要用于音频的生成、处理和编辑，通过各种算法和模型将文本转换为语音，生成音乐，或处理现有音频，是实现AI辅助音频创作的关键工具。

1. StableAudioLoader（稳定音频加载器）

中文名称：稳定音频加载器

节点功能：加载Stable Audio模型，用于高质量音频生成。

参数说明： - model_name：Stable Audio模型名称 - device：运行设备（CPU、CUDA等） - precision：计算精度（fp16、fp32等）

输出端口： - AUDIO_MODEL：加载的Stable Audio模型

使用案例： - 准备音乐生成工作流 - 加载不同类型的音频模型 - 为音效生成准备模型

优点： - 支持多种Stable Audio模型变体 - 可以控制计算精度和设备 - 是音频生成工作流的基础 - 适合各种音频创作需求

所属插件项目：ComfyUI-StableAudioSampler（需额外安装）

最后更新日期：2025-04-15

2. TextToAudio（文本到音频）

中文名称：文本到音频

节点功能：根据文本描述生成音频内容。

参数说明： - audio_model：音频模型 - prompt：文本描述 - negative_prompt：负面提示词 - duration：音频时长（秒） - seed：随机种子 - guidance_scale：引导比例 - sample_rate：采样率 - audio_type：音频类型（音乐、音效等）

输出端口： - AUDIO：生成的音频 - WAVEFORM：音频波形可视化

使用案例： - 根据描述生成背景音乐 - 创建特定氛围的音效 - 为视频生成配乐

优点： - 从文本描述直接生成音频 - 可以控制音频时长和类型 - 提供多种参数调整 - 适合创意音频内容创作

所属插件项目：ComfyUI-StableAudioSampler（需额外安装）

最后更新日期：2025-04-15

3. AudioSaver（音频保存器）

中文名称：音频保存器

节点功能：将生成的音频保存为文件。

参数说明： - audio：音频数据 - filename_prefix：文件名前缀 - format：音频格式（wav、mp3、ogg等） - sample_rate：采样率 - bit_depth：位深度 - normalize：是否标准化音量

输出端口： - AUDIO_PATH：保存的音频文件路径

使用案例： - 保存生成的音乐 - 导出处理后的音频 - 准备音频文件用于其他应用

优点： - 支持多种音频格式 - 可以控制音频质量参数 - 提供音量标准化选项 - 适合完成音频生成工作流

所属插件项目：ComfyUI-AudioHelperSuite（需额外安装）

最后更新日期：2025-03-20

4. IndexTTSLoader（IndexTTS加载器）

中文名称：IndexTTS加载器

节点功能：加载IndexTTS模型，用于高质量的文本到语音转换。

参数说明： - model_name：IndexTTS模型名称 - language：语言设置 - device：运行设备

输出端口： - TTS_MODEL：加载的IndexTTS模型

使用案例： - 准备语音合成工作流 - 加载不同语言的TTS模型 - 为视频配音准备模型

优点： - 支持多种语言和声音 - 高质量的语音合成能力 - 是TTS工作流的基础 - 适合专业配音需求

所属插件项目：ComfyUI-Index-TTS（需额外安装）

最后更新日期：2025-03-15

5. TextToSpeech（文本到语音）

中文名称：文本到语音

节点功能：将文本转换为自然语音。

参数说明： - tts_model：TTS模型 - text：要转换的文本 - voice：声音选择 - speed：语速调整 - pitch：音调调整 - emotion：情感风格 - emphasis：强调级别

输出端口： - AUDIO：生成的语音音频 - DURATION：音频时长

使用案例： - 生成视频旁白 - 创建有声读物内容 - 为角色添加对话语音

优点： - 生成自然流畅的语音 - 可以调整多种语音参数 - 支持情感表达 - 适合各种需要语音的应用

所属插件项目：ComfyUI-Index-TTS（需额外安装）

最后更新日期：2025-03-15

6. VoiceCloning（声音克隆）

中文名称：声音克隆

节点功能：基于参考音频样本克隆特定声音。

参数说明： - reference_audio：参考音频 - text：要转换的文本 - similarity_strength：相似度强度 - stability：稳定性 - style_transfer：风格迁移程度 - denoise：去噪级别

输出端口： - AUDIO：克隆声音生成的音频

使用案例： - 使用特定声音生成内容 - 为角色创建一致的声音 - 个性化语音助手

优点： - 可以模仿特定声音特征 - 提供多种声音调整参数 - 保持声音特征的同时生成新内容 - 适合个性化语音需求

所属插件项目：ComfyUI-F5-TTS（需额外安装）

最后更新日期：2025-04-10

7. AudioEnhancer（音频增强器）

中文名称：音频增强器

节点功能：增强音频质量，去除噪音和瑕疵。

参数说明： - audio：输入音频 - denoise_strength：去噪强度 - dereverberation：去混响程度 - equalization：均衡调整 - clarity_boost：清晰度提升 - bass_boost：低音增强

输出端口： - AUDIO：增强后的音频

使用案例： - 提高生成音频的质量 - 清理录音中的噪音 - 优化语音清晰度

优点： - 提供多种音频增强选项 - 可以去除常见音频问题 - 提高整体音频质量 - 适合后期处理生成音频

所属插件项目：ComfyUI-AudioFX（需额外安装）

最后更新日期：2025-03-10

8. MusicGenerator（音乐生成器）

中文名称：音乐生成器

节点功能：生成特定风格和情绪的音乐。

参数说明： - audio_model：音乐模型 - prompt：音乐描述 - genre：音乐风格 - mood：情绪氛围 - tempo：节奏速度 - duration：时长（秒） - instruments：主要乐器 - seed：随机种子

输出端口： - AUDIO：生成的音乐 - MIDI（可选）：MIDI数据

使用案例： - 为视频创建背景音乐 - 生成特定风格的音乐片段 - 创建情绪氛围音乐

优点： - 可以指定详细的音乐特征 - 生成高质量的音乐内容 - 提供多种风格和情绪选择 - 适合创意音乐创作

所属插件项目：ComfyUI-InspireMusic（需额外安装）

最后更新日期：2025-04-05

9. AudioMixer（音频混合器）

中文名称：音频混合器

节点功能：混合多个音频轨道，调整音量和效果。

参数说明： - audio_tracks：音频轨道列表 - volumes：各轨道音量 - panning：声道平衡 - fade_in：淡入时间 - fade_out：淡出时间 - crossfade：交叉淡入淡出

输出端口： - AUDIO：混合后的音频

使用案例： - 合并音乐和语音 - 创建多层次的音频效果 - 为视频准备完整音轨

优点： - 可以混合多个音频源 - 提供精细的音频调整 - 支持淡入淡出和交叉混合 - 适合创建复杂音频内容

所属插件项目：ComfyUI-AudioHelperSuite（需额外安装）

最后更新日期：2025-03-20

10. TangoFluxLoader（TangoFlux加载器）

中文名称：TangoFlux加载器

节点功能：加载TangoFlux模型，用于高效的文本到音频生成。

参数说明： - model_name：TangoFlux模型名称 - device：运行设备 - precision：计算精度

输出端口： - TANGOFLUX_MODEL：加载的TangoFlux模型

使用案例： - 准备高效音频生成工作流 - 加载专业音频模型 - 为长音频内容生成准备

优点： - 高效的音频生成能力 - 支持长音频内容 - 提供高质量的音频输出 - 适合需要快速生成的场景

所属插件项目：ComfyUI-TangoFlux（需额外安装）

最后更新日期：2025-04-01

< 2.22 视频处理与生成 (Video Processing & Generation)

2.24 批处理与迭代 (Batch Processing & Iteration) >

1 关于MyShell

2 新手指南

3 炉边对话

4 Shell Agent

5 常用问答

6 AI 开源社区周报