6.1 AI开源社区周报【五月Week1】

AI开源社区周报【五月Week1】

统计时间: 2025年5月9日 - 2025年5月16日

1. AI 图像与 ComfyUI 技术更新

ComfyUI Relight 技术新进展: Comfyui-LG_Relight

来源: GitHub | 日期: 2025年5月15日 (22小时前)

摘要: LAOGOU-666 在 GitHub 上更新了 Comfyui-LG_Relight 项目，这是一个在 ComfyUI 中实现3D实时打光的节点。最新更新增加了 ULTRA 版本，支持添加多个独立可调光源，以实现更全面的3D打光效果，并改进了模态弹窗问题。

GitHub 仓库

ComfyUI LBM Wrapper (LBM Relighting 相关)

来源: GitHub / YouTube | 日期: 2025年5月15日 (22小时前)

摘要: Kijai 在 GitHub 上提供了 ComfyUI-LBMWrapper，用于集成 LBM Relighting 模型。相关 YouTube 视频展示了其与 IC-Light 等工具的对比，显示了其在图像重打光方面的能力。LBM 可能指代一种新的分层基础的重打光方法或模型。

GitHub 仓库 (Wrapper)

ComfyUI 支持通义万相 VACE 2.1 模型讨论

来源: GitHub Issue | 日期: 2025年5月15日 (24小时前)

摘要: ComfyUI 官方 GitHub 仓库中出现关于增加对阿里巴巴最新开源的视频模型通义万相 Wan 2.1 VACE 支持的讨论 (Issue #8124)。这预示着 ComfyUI 社区可能很快会集成这一强大的视频生成与编辑功能。

GitHub Issue

ComfyUI 与 Flux 模型生态更新 (图像编辑与补全)

来源: 社区视频内容提炼 | 日期: 2025年5月14日

摘要: 社区内容显示对开源模型 Flux 的功能补全和改进仍在继续，例如结合 Chroma 技术进行色彩或特定风格处理，以及利用解剖学知识增强人体生成等。IC-Light V2 作为基于 Flux 的图像编辑模型也已发布，支持多种风格化处理。

IC-Light V2 (ComfyUI Wiki)

ComfyUI 图像一致性与万物迁移工具更新

来源: 社区视频内容提炼 | 日期: 2025年5月12日

摘要: 社区介绍了图像一致性参考工具 Omni-Reference，以及 Insert Anything 与 Nunchaku 等工具的联动与功能升级，这些工具旨在提升 AI 图像生成中的元素一致性和可编辑性，并发布了新的模型权重和算法。

2. AI Agent 工具与框架

LightLab: 基于扩散模型控制图像光源

来源: nadmag.github.io | 日期: 2025年5月15日 (约10小时前)

摘要: Google 研究团队展示了 LightLab 项目，一个利用扩散模型在图像中控制光源的技术。用户可以交互式地添加、移除或修改图像中的光源，并实时观察渲染效果。该技术为图像编辑提供了新的维度。

项目页面

Agent-MCP: 多智能体协作框架

来源: GitHub | 日期: 2025年5月14日

摘要: rinadelph 在 GitHub 上开源了 Agent-MCP 框架，用于创建多智能体系统。它通过模型上下文协议 (MCP) 实现 AI 智能体之间协调高效的协作。多个项目如 Files-com/files-mcp, makeplane/plane-mcp-server 也展示了 MCP 在不同场景的应用。

GitHub 仓库

ModelScope AgentScope: 构建LLM驱动的多智能体应用

来源: GitHub | 日期: 2025年5月13日

摘要: ModelScope 开源了 AgentScope，一个旨在帮助开发者轻松构建基于大语言模型的多智能体应用的库。近期更新包括 AgentScope Copilot，一个多源 RAG 应用。

GitHub 仓库

LovArt AI 设计工具 (内测中)

来源: AIbase | 日期: 2025年5月13日

摘要: LovArt 是一款集成了图像、视频和音乐模型的 AI 设计工具，旨在通过任务分解实现全链条自动化输出。目前该产品处于内测阶段，具体开源情况和技术细节待进一步公开。

相关资讯 (AIbase)

ListenHub AI Agent 工具

来源: 综合搜索 | 日期: 过去7天

摘要: 关于 ListenHub 作为 AI Agent 工具的近期特定开源更新信息较少。该领域工具仍在快速发展中。

Silly Tavern 与大模型联动 (AI Agent 应用)

来源: 社区视频内容提炼 | 日期: 2025年5月13日

摘要: 开源聊天界面 Silly Tavern 持续被用于与各类大语言模型（如 QWEN3）和 AI 工具流（如 ComfyUI）联动，以实现更具交互性和一致性的 AI Agent 应用，例如角色扮演和故事生成中的图像一致性。

3. 开源模型进展

阿里巴巴开源新一代通义千问模型Qwen3

来源: 腾讯新闻 | 日期: 2025年5月13日

摘要: 阿里巴巴正式开源新一代通义千问模型Qwen3，旨在改写AI生产力格局，其采用混合推理架构，降低应用成本。

阅读原文

阿里开源新版通义万相Wan2.1-VACE，单一模型全面支持视频生成和编辑

来源: 新京报 | 日期: 2025年5月15日

摘要: 阿里巴巴正式开源通义万相Wan2.1-VACE，是业界功能最全的视频生成与编辑模型，单一模型可同时支持文生视频、图像参考视频生成、视频重绘、视频局部编辑等。

阅读原文

腾讯混元图像（Hunyuan Image）2.0 正式发布

来源: 开源中国 (OSCHINA) | 日期: 2025年5月16日

摘要: 腾讯混元图像2.0模型正式发布，主打实时生图和超写实画质，已在腾讯混元官网开放体验。模型支持实时绘画板多图融合，AI自动协调透视与光影，丰富AI生图交互体验。

阅读原文

腾讯混元宣布开源首个多模态统一CoT奖励模型

来源: 新浪财经 | 日期: 2025年5月13日

摘要: 腾讯混元联合上海AI Lab等机构提出UnifiedReward-Think，构建出首个具备长链式推理能力的统一多模态奖励模型。

阅读原文

腾讯混元视频生成工具HunyuanCustom全新开源

来源: 东方财富 | 日期: 2025年5月10日

摘要: 腾讯混元宣布正式推出并开源全新的多模态定制化视频生成工具HunyuanCustom，基于混元视频生成大模型打造，主体一致性效果优越。

阅读原文

WizardLM 团队加入腾讯混元

来源: OSCHINA | 日期: 2025年5月14日

摘要: 前微软北京AI研究团队WizardLM的核心成员Can Xu宣布，他与WizardLM团队已离开微软，并加入了腾讯混元团队，将继续致力于推动大型语言模型的发展。

阅读原文

Meta 推迟发布旗舰级AI 模型Behemoth

来源: OSCHINA | 日期: 2025年5月16日

摘要: 据报道，Meta推迟了其旗舰级AI模型Behemoth的发布计划，因担心其可能不足以超越之前的模型。

阅读原文

4. LLM (大语言模型) 相关

开源AI 客户端Cherry Studio v1.3.3 正式发布

来源: OSCHINA | 日期: 2025年5月16日

摘要: Cherry Studio是一款支持多个大语言模型（LLM）服务商的开源桌面客户端，兼容Windows、Mac和Linux系统。

阅读原文

完全开源的7B模型DeepSeek LLM，性能比肩主流LLM

来源: CSDN博客 | 日期: 2025年5月14日

摘要: DeepSeek LLM基于2万亿token数据集训练，涵盖7B参数，文中探讨了预训练、微调等技术细节。

阅读原文

5. 通往AGI之路

国产大模型「五强争霸」，决战AGI！

来源: 知乎专栏 | 日期: 2025年5月13日

摘要: 自2023年以来，通义团队累积开源200+模型，涵盖了千问（Qwen）大语言模型和万相（Wan）视觉生成模型两大基座系列。这些模型覆盖了文本生成、视觉/语音理解生成、文生图，以及视频。

阅读原文

GPT-5研发内幕首曝，OpenAI首席研究官：AGI指日可待

来源: 36氪 | 日期: 2025年5月12日

摘要: 近来，GPT-4.1关键人物揭秘了GPT-5进展，挑战在于平衡推理与聊天能力。与此同时，OpenAI首席研究官在新采访中，畅谈了通往AGI之路的关键要素。

阅读原文

< 5.4 RunningHub云端ComfyUI

6.2 AI开源社区周报【五月Week2】 >

1 关于MyShell

2 新手指南

3 炉边对话

4 Shell Agent

5 常用问答

6 AI 开源社区周报

6.1 AI开源社区周报【五月Week1】

AI开源社区周报【五月Week1】

目录

1. AI 图像与 ComfyUI 技术更新

2. AI Agent 工具与框架

3. 开源模型进展

4. LLM (大语言模型) 相关

5. 通往AGI之路