1 关于MyShell

2 新手指南

3 炉边对话

4 Shell Agent

5 常用问答

6 AI 开源社区周报

6.1 AI开源社区周报【五月Week1】

AI开源社区周报【五月Week1】

统计时间: 2025年5月9日 - 2025年5月16日

目录

  • 1. AI 图像与 ComfyUI 技术更新

  • 2. AI Agent 工具与框架

  • 3. 开源模型进展

  • 4. LLM (大语言模型) 相关

  • 5. 通往AGI之路

1. AI 图像与 ComfyUI 技术更新

ComfyUI Relight 技术新进展: Comfyui-LG_Relight

来源: GitHub | 日期: 2025515日 (22小时前)

摘要: LAOGOU-666 GitHub 上更新了 Comfyui-LG_Relight 项目,这是一个在 ComfyUI 中实现3D实时打光的节点。最新更新增加了 ULTRA 版本,支持添加多个独立可调光源,以实现更全面的3D打光效果,并改进了模态弹窗问题。

GitHub 仓库

ComfyUI LBM Wrapper (LBM Relighting 相关)

来源: GitHub / YouTube | 日期: 2025515(22小时前)

摘要: Kijai GitHub 上提供了 ComfyUI-LBMWrapper,用于集成 LBM Relighting 模型。相关 YouTube 视频展示了其与 IC-Light 等工具的对比,显示了其在图像重打光方面的能力。LBM 可能指代一种新的分层基础的重打光方法或模型。

GitHub 仓库 (Wrapper)

ComfyUI 支持通义万相 VACE 2.1 模型讨论

来源: GitHub Issue | 日期: 2025515(24小时前)

摘要: ComfyUI 官方 GitHub 仓库中出现关于增加对阿里巴巴最新开源的视频模型通义万相 Wan 2.1 VACE 支持的讨论 (Issue #8124)。这预示着 ComfyUI 社区可能很快会集成这一强大的视频生成与编辑功能。

GitHub Issue

ComfyUI 与 Flux 模型生态更新 (图像编辑与补全)

来源: 社区视频内容提炼 | 日期: 2025514

摘要: 社区内容显示对开源模型 Flux 的功能补全和改进仍在继续,例如结合 Chroma 技术进行色彩或特定风格处理,以及利用解剖学知识增强人体生成等。IC-Light V2 作为基于 Flux 的图像编辑模型也已发布,支持多种风格化处理。

IC-Light V2 (ComfyUI Wiki)

ComfyUI 图像一致性与万物迁移工具更新

来源: 社区视频内容提炼 | 日期: 2025512

摘要: 社区介绍了图像一致性参考工具 Omni-Reference,以及 Insert Anything Nunchaku 等工具的联动与功能升级,这些工具旨在提升 AI 图像生成中的元素一致性和可编辑性,并发布了新的模型权重和算法。


2. AI Agent 工具与框架

LightLab: 基于扩散模型控制图像光源

来源: nadmag.github.io | 日期: 2025年5月15日 (约10小时前)

摘要: Google 研究团队展示了 LightLab 项目,一个利用扩散模型在图像中控制光源的技术。用户可以交互式地添加、移除或修改图像中的光源,并实时观察渲染效果。该技术为图像编辑提供了新的维度。

项目页面

Agent-MCP: 多智能体协作框架

来源: GitHub | 日期: 2025514

摘要: rinadelph GitHub 上开源了 Agent-MCP 框架,用于创建多智能体系统。它通过模型上下文协议 (MCP) 实现 AI 智能体之间协调高效的协作。多个项目如 Files-com/files-mcp, makeplane/plane-mcp-server 也展示了 MCP 在不同场景的应用。

GitHub 仓库

ModelScope AgentScope: 构建LLM驱动的多智能体应用

来源: GitHub | 日期: 2025年5月13日

摘要: ModelScope 开源了 AgentScope,一个旨在帮助开发者轻松构建基于大语言模型的多智能体应用的库。近期更新包括 AgentScope Copilot,一个多源 RAG 应用。

GitHub 仓库

LovArt AI 设计工具 (内测中)

来源: AIbase | 日期: 2025513

摘要: LovArt 是一款集成了图像、视频和音乐模型的 AI 设计工具,旨在通过任务分解实现全链条自动化输出。目前该产品处于内测阶段,具体开源情况和技术细节待进一步公开。

相关资讯 (AIbase)

ListenHub AI Agent 工具

来源: 综合搜索 | 日期: 过去7

摘要: 关于 ListenHub 作为 AI Agent 工具的近期特定开源更新信息较少。该领域工具仍在快速发展中。

Silly Tavern 与大模型联动 (AI Agent 应用)

来源: 社区视频内容提炼 | 日期: 2025513

摘要: 开源聊天界面 Silly Tavern 持续被用于与各类大语言模型(如 QWEN3)和 AI 工具流(如 ComfyUI)联动,以实现更具交互性和一致性的 AI Agent 应用,例如角色扮演和故事生成中的图像一致性。


3. 开源模型进展

阿里巴巴开源新一代通义千问模型Qwen3

来源: 腾讯新闻 | 日期: 2025513

摘要: 阿里巴巴正式开源新一代通义千问模型Qwen3,旨在改写AI生产力格局,其采用混合推理架构,降低应用成本。

阅读原文

阿里开源新版通义万相Wan2.1-VACE,单一模型全面支持视频生成和编辑

来源: 新京报 | 日期: 2025515

摘要: 阿里巴巴正式开源通义万相Wan2.1-VACE,是业界功能最全的视频生成与编辑模型,单一模型可同时支持文生视频、图像参考视频生成、视频重绘、视频局部编辑等。

阅读原文

腾讯混元图像(Hunyuan Image2.0 正式发布

来源: 开源中国 (OSCHINA) | 日期: 2025516

摘要: 腾讯混元图像2.0模型正式发布,主打实时生图和超写实画质,已在腾讯混元官网开放体验。模型支持实时绘画板多图融合,AI自动协调透视与光影,丰富AI生图交互体验。

阅读原文

腾讯混元宣布开源首个多模态统一CoT奖励模型

来源: 新浪财经 | 日期: 2025513

摘要: 腾讯混元联合上海AI Lab等机构提出UnifiedReward-Think,构建出首个具备长链式推理能力的统一多模态奖励模型。

阅读原文

腾讯混元视频生成工具HunyuanCustom全新开源

来源: 东方财富 | 日期: 2025510

摘要: 腾讯混元宣布正式推出并开源全新的多模态定制化视频生成工具HunyuanCustom,基于混元视频生成大模型打造,主体一致性效果优越。

阅读原文

WizardLM 团队加入腾讯混元

来源: OSCHINA | 日期: 2025514

摘要: 前微软北京AI研究团队WizardLM的核心成员Can Xu宣布,他与WizardLM团队已离开微软,并加入了腾讯混元团队,将继续致力于推动大型语言模型的发展。

阅读原文

Meta 推迟发布旗舰级AI 模型Behemoth

来源: OSCHINA | 日期: 2025516

摘要: 据报道,Meta推迟了其旗舰级AI模型Behemoth的发布计划,因担心其可能不足以超越之前的模型。

阅读原文

4. LLM (大语言模型) 相关

开源AI 客户端Cherry Studio v1.3.3 正式发布

来源: OSCHINA | 日期: 2025516

摘要: Cherry Studio是一款支持多个大语言模型(LLM)服务商的开源桌面客户端,兼容WindowsMacLinux系统。

阅读原文

完全开源的7B模型DeepSeek LLM,性能比肩主流LLM

来源: CSDN博客 | 日期: 2025514

摘要: DeepSeek LLM基于2万亿token数据集训练,涵盖7B参数,文中探讨了预训练、微调等技术细节。

阅读原文

5. 通往AGI之路

国产大模型「五强争霸」,决战AGI

来源: 知乎专栏 | 日期: 2025513

摘要: 2023年以来,通义团队累积开源200+模型,涵盖了千问(Qwen)大语言模型和万相(Wan)视觉生成模型两大基座系列。这些模型覆盖了文本生成、视觉/语音理解生成、文生图,以及视频。

阅读原文

GPT-5研发内幕首曝,OpenAI首席研究官:AGI指日可待

来源: 36| 日期: 2025512

摘要: 近来,GPT-4.1关键人物揭秘了GPT-5进展,挑战在于平衡推理与聊天能力。与此同时,OpenAI首席研究官在新采访中,畅谈了通往AGI之路的关键要素。

阅读原文