1 关于MyShell

2 新手指南

3 炉边对话

4 Shell Agent

5 常用问答

6 AI 开源社区周报

2.23 音频处理与生成 (Audio Processing & Generation)

本类别的节点主要用于音频的生成、处理和编辑,通过各种算法和模型将文本转换为语音,生成音乐,或处理现有音频,是实现AI辅助音频创作的关键工具。

1. StableAudioLoader(稳定音频加载器)

中文名称:稳定音频加载器

节点功能:加载Stable Audio模型,用于高质量音频生成。

参数说明: - model_name:Stable Audio模型名称 - device:运行设备(CPU、CUDA等) - precision:计算精度(fp16、fp32等)

输出端口: - AUDIO_MODEL:加载的Stable Audio模型

使用案例: - 准备音乐生成工作流 - 加载不同类型的音频模型 - 为音效生成准备模型

优点: - 支持多种Stable Audio模型变体 - 可以控制计算精度和设备 - 是音频生成工作流的基础 - 适合各种音频创作需求

所属插件项目:ComfyUI-StableAudioSampler(需额外安装)

最后更新日期:2025-04-15

2. TextToAudio(文本到音频)

中文名称:文本到音频

节点功能:根据文本描述生成音频内容。

参数说明: - audio_model:音频模型 - prompt:文本描述 - negative_prompt:负面提示词 - duration:音频时长(秒) - seed:随机种子 - guidance_scale:引导比例 - sample_rate:采样率 - audio_type:音频类型(音乐、音效等)

输出端口: - AUDIO:生成的音频 - WAVEFORM:音频波形可视化

使用案例: - 根据描述生成背景音乐 - 创建特定氛围的音效 - 为视频生成配乐

优点: - 从文本描述直接生成音频 - 可以控制音频时长和类型 - 提供多种参数调整 - 适合创意音频内容创作

所属插件项目:ComfyUI-StableAudioSampler(需额外安装)

最后更新日期:2025-04-15

3. AudioSaver(音频保存器)

中文名称:音频保存器

节点功能:将生成的音频保存为文件。

参数说明: - audio:音频数据 - filename_prefix:文件名前缀 - format:音频格式(wav、mp3、ogg等) - sample_rate:采样率 - bit_depth:位深度 - normalize:是否标准化音量

输出端口: - AUDIO_PATH:保存的音频文件路径

使用案例: - 保存生成的音乐 - 导出处理后的音频 - 准备音频文件用于其他应用

优点: - 支持多种音频格式 - 可以控制音频质量参数 - 提供音量标准化选项 - 适合完成音频生成工作流

所属插件项目:ComfyUI-AudioHelperSuite(需额外安装)

最后更新日期:2025-03-20

4. IndexTTSLoader(IndexTTS加载器)

中文名称:IndexTTS加载器

节点功能:加载IndexTTS模型,用于高质量的文本到语音转换。

参数说明: - model_name:IndexTTS模型名称 - language:语言设置 - device:运行设备

输出端口: - TTS_MODEL:加载的IndexTTS模型

使用案例: - 准备语音合成工作流 - 加载不同语言的TTS模型 - 为视频配音准备模型

优点: - 支持多种语言和声音 - 高质量的语音合成能力 - 是TTS工作流的基础 - 适合专业配音需求

所属插件项目:ComfyUI-Index-TTS(需额外安装)

最后更新日期:2025-03-15

5. TextToSpeech(文本到语音)

中文名称:文本到语音

节点功能:将文本转换为自然语音。

参数说明: - tts_model:TTS模型 - text:要转换的文本 - voice:声音选择 - speed:语速调整 - pitch:音调调整 - emotion:情感风格 - emphasis:强调级别

输出端口: - AUDIO:生成的语音音频 - DURATION:音频时长

使用案例: - 生成视频旁白 - 创建有声读物内容 - 为角色添加对话语音

优点: - 生成自然流畅的语音 - 可以调整多种语音参数 - 支持情感表达 - 适合各种需要语音的应用

所属插件项目:ComfyUI-Index-TTS(需额外安装)

最后更新日期:2025-03-15

6. VoiceCloning(声音克隆)

中文名称:声音克隆

节点功能:基于参考音频样本克隆特定声音。

参数说明: - reference_audio:参考音频 - text:要转换的文本 - similarity_strength:相似度强度 - stability:稳定性 - style_transfer:风格迁移程度 - denoise:去噪级别

输出端口: - AUDIO:克隆声音生成的音频

使用案例: - 使用特定声音生成内容 - 为角色创建一致的声音 - 个性化语音助手

优点: - 可以模仿特定声音特征 - 提供多种声音调整参数 - 保持声音特征的同时生成新内容 - 适合个性化语音需求

所属插件项目:ComfyUI-F5-TTS(需额外安装)

最后更新日期:2025-04-10

7. AudioEnhancer(音频增强器)

中文名称:音频增强器

节点功能:增强音频质量,去除噪音和瑕疵。

参数说明: - audio:输入音频 - denoise_strength:去噪强度 - dereverberation:去混响程度 - equalization:均衡调整 - clarity_boost:清晰度提升 - bass_boost:低音增强

输出端口: - AUDIO:增强后的音频

使用案例: - 提高生成音频的质量 - 清理录音中的噪音 - 优化语音清晰度

优点: - 提供多种音频增强选项 - 可以去除常见音频问题 - 提高整体音频质量 - 适合后期处理生成音频

所属插件项目:ComfyUI-AudioFX(需额外安装)

最后更新日期:2025-03-10

8. MusicGenerator(音乐生成器)

中文名称:音乐生成器

节点功能:生成特定风格和情绪的音乐。

参数说明: - audio_model:音乐模型 - prompt:音乐描述 - genre:音乐风格 - mood:情绪氛围 - tempo:节奏速度 - duration:时长(秒) - instruments:主要乐器 - seed:随机种子

输出端口: - AUDIO:生成的音乐 - MIDI(可选):MIDI数据

使用案例: - 为视频创建背景音乐 - 生成特定风格的音乐片段 - 创建情绪氛围音乐

优点: - 可以指定详细的音乐特征 - 生成高质量的音乐内容 - 提供多种风格和情绪选择 - 适合创意音乐创作

所属插件项目:ComfyUI-InspireMusic(需额外安装)

最后更新日期:2025-04-05

9. AudioMixer(音频混合器)

中文名称:音频混合器

节点功能:混合多个音频轨道,调整音量和效果。

参数说明: - audio_tracks:音频轨道列表 - volumes:各轨道音量 - panning:声道平衡 - fade_in:淡入时间 - fade_out:淡出时间 - crossfade:交叉淡入淡出

输出端口: - AUDIO:混合后的音频

使用案例: - 合并音乐和语音 - 创建多层次的音频效果 - 为视频准备完整音轨

优点: - 可以混合多个音频源 - 提供精细的音频调整 - 支持淡入淡出和交叉混合 - 适合创建复杂音频内容

所属插件项目:ComfyUI-AudioHelperSuite(需额外安装)

最后更新日期:2025-03-20

10. TangoFluxLoader(TangoFlux加载器)

中文名称:TangoFlux加载器

节点功能:加载TangoFlux模型,用于高效的文本到音频生成。

参数说明: - model_name:TangoFlux模型名称 - device:运行设备 - precision:计算精度

输出端口: - TANGOFLUX_MODEL:加载的TangoFlux模型

使用案例: - 准备高效音频生成工作流 - 加载专业音频模型 - 为长音频内容生成准备

优点: - 高效的音频生成能力 - 支持长音频内容 - 提供高质量的音频输出 - 适合需要快速生成的场景

所属插件项目:ComfyUI-TangoFlux(需额外安装)

最后更新日期:2025-04-01