1 关于MyShell

2 新手指南

3 炉边对话

4 Shell Agent

5 常用问答

6 AI 开源社区周报

6.4 AI开源社区周报【六月Week2】

AI开源社区周报【六月Week2】


目录

1. 字节跳动Seedance 1.0视频模型

Seedance 1.0 Pro - 字节跳动最新视频生成模型

发布日期: 2025年6月11日

开发方: 字节跳动Seed团队

发布场合: 2025火山引擎原动力大会

官方网站https://seed.bytedance.com/zh/seedance

GitHub组织https://github.com/ByteDance-Seed/.github

字节跳动Seed团队发布的新一代视频生成基础模型Seedance 1.0,支持文字与图片输入,可生成多镜头无缝切换的1080P高品质视频。该模型在多镜头叙事、运动生成等多维度表现卓越,主体运动稳定性与画面自然度较高,并首次登顶全球视频生成竞技榜。

豆包App已上线"豆包Seedance 1.0 pro",作为字节跳动最新视频模型的应用展示。此次发布标志着字节跳动在AI视频生成领域的重要突破,与快手等公司形成新一轮AI视频生成技术竞争。

值得注意的是,火山引擎平台日均token调用量同比增长137倍,显示字节跳动AI业务快速发展。同期发布的还有豆包大模型1.6和Agent开发平台升级等AI云原生服务。

相关资源:

2. WaytoAGI东京大会

WaytoAGI 全球AI大会-东京站成功举办

活动日期: 2025年6月7日至8日

举办地点: 日本东京樱美林大学新宿校区

主办方: WaytoAGI(国内领先的AI开源知识社区)

主题: "AI全球化发展"

活动官网https://www.panewslab.com/zh/articles/3rqxea5w

备受瞩目的"WaytoAGI 全球AI大会-东京站"于6月7-8日在日本东京樱美林大学新宿校区成功举办。本次大会聚焦"AI全球化发展"主题,吸引了来自世界各地的开发者、创业家和AI专业人士,旨在推动国际间的技术交流、创新合作与产业融合。

企业级AI智能体构建平台GPTBots.ai作为赞助方参与并展示了最新技术成果。AI视频生成平台Vidu也参与展示了其最新技术进展。此次东京站是WaytoAGI全球AI大会系列活动之一,展示了中国AI开源社区在全球AI领域的影响力,并促进了AI技术在不同文化背景下的应用与融合。

相关资源:

3. ComfyUI生态更新

ComfyUI-Copilot: 阿里巴巴推出AI艺术创作助手

发布日期: 2025年6月5日

开发方: 阿里巴巴国际数字商务部门与哈尔滨工业大学(深圳)

发布平台: arXiv预印本平台

GitHub仓库https://github.com/AIDC-AI/ComfyUI-Copilot

论文链接https://arxiv.org/html/2506.05010v1

阿里巴巴国际数字商务部门与哈尔滨工业大学(深圳)的研究团队联合推出了名为"ComfyUI-Copilot"的创新工具,这是一款基于大型语言模型的插件,旨在提升ComfyUI这一开源AI艺术创作平台的易用性和效率。该工具通过简化操作流程,帮助用户更轻松地创作AI艺术作品。

相关资源:

Vidu API节点即将上线ComfyUI

发布时间: 2025年6月初

合作方: Vidu AI与ComfyUI

ComfyUI官网https://www.comfy.org/zh-cn/

Vidu AI与ComfyUI携手开启全新联动,为创作者们带来从图像到视频的创作新体验。Vidu API节点即将正式上线ComfyUI,实现轻松图生视频,让创作流程再次升级,进一步扩展了ComfyUI的功能范围。

4. AI开源社区其他动态

OmniConsistency: 低成本图像风格实现方案

发布日期: 2025年6月2日

开发方: 新加坡国立大学

相关报道https://comfyui-wiki.com/zh/news

机构官网https://www.nus.edu.sg/

新加坡国立大学发布OmniConsistency,这是一种低成本实现图像风格的新方案。该技术通过创新算法,使得图像风格转换更加高效且资源消耗更低,为AI创作者提供了更多可能性。

Pixel-Reasoner: 开源像素级视觉推理模型

发布日期: 2025年5月27日

相关报道https://comfyui-wiki.com/zh/news

Pixel-Reasoner开源像素级视觉推理模型正式发布,该模型在像素级别进行视觉推理,提供了更精细的图像理解和处理能力,为计算机视觉领域带来新的技术突破。

2025开源之夏活动启动

发起方: 中国科学院软件研究所

活动内容: "开源软件供应链点亮计划"系列暑期活动

活动官网https://www.cnblogs.com/alisystemsoftware/p/18891573

机构官网https://isrc.iscas.ac.cn/

中国科学院软件研究所于2020年发起的"开源软件供应链点亮计划"系列暑期活动"开源之夏"正式开启报名,包含AI+云原生的10个开源项目,旨在鼓励高校学生积极参与开源软件的开发维护,培养和发掘更多优秀的开源人才。

5. Bilibili AI开源社区最新视频 (过去7天)

Ai动画102-视频超级加速-Self Forcing图生视频VACE模型

多人小语音配置-超强TTS

  • 发布日期: 2025年6月10日

  • 视频链接https://space.bilibili.com/385085361/upload/video

  • 主要内容: 详细介绍了多人小语音配置方法,展示了IndexTTS Pro版的功能和双人语音配置技术。视频包含完整的配置教程和实际应用案例。

不正经玩法-FramePack图像编辑技术

  • 发布日期: 2025年6月11日

  • 视频链接https://space.bilibili.com/385085361/upload/video

  • 主要内容: 介绍FramePack图像编辑技术,包括F1转过渡、兼容港元等功能。视频展示了该技术的实际应用效果和操作方法。

错过后悔系列(二)

AI数字人Avatar-本地部署及RHI在线玩

  • 发布日期: 2025年6月9日

  • 视频时长: 09:07

  • 视频链接https://space.bilibili.com/385085361/upload/video

  • 主要内容: 详细介绍了AI数字人Avatar的本地部署方法和RHI在线使用技术。视频包含完整的部署教程和实际应用案例。

5大图像编辑模型1.0对比

  • 发布日期: 2025年6月7日

  • 视频时长: 12:59

  • 视频链接https://space.bilibili.com/385085361/upload/video

  • 主要内容: 对比分析了5种主要图像编辑模型1.0的性能和效果,包括Flux Kontext Max、Gpido等模型。视频提供了各模型的优缺点和适用场景分析。

AI数字人27-双创合集

绘画进阶187-表情王

绘画进阶186-奇门神数

王炸-比Flux Kontext Max更强的图像编辑技术