
AI日报:字节开源统一多模态大模型Lance 3B;智谱发布GLM-5.1高速版;CapCut与Gemini合作推出深度集成
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。 1、字节跳动开源Lance 3B:用一个“脑子”同时搞定图视理解与生成 字节跳动开源了其原生统一多模态大模型Lance,以3B参数实现全功能覆盖,打破了理解模型与生成模型之间的技术壁垒。Lance通过共享上下
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
1、字节跳动开源Lance 3B:用一个“脑子”同时搞定图视理解与生成
字节跳动开源了其原生统一多模态大模型Lance,以3B参数实现全功能覆盖,打破了理解模型与生成模型之间的技术壁垒。Lance通过共享上下文和能力解耦并行设计,实现了图像、视频的理解、生成与跨模态编辑的统一。
2、智谱发布GLM-5.1高速版:400 tokens/s飙出全球API新极限
智谱发布GLM-5.1高速版API,以400tokens/s的速度刷新全球大模型API速度上限,实现旗舰级全尺寸能力与 极致 低延迟并存,通过系统级工程优化提升模型性能,推动AI应用的高效发展。
3、CapCut 与 Gemini 合作推出深度集成:AI 创作工具实现智能互联
CapCut 与 Google Gemini App 合作,用户可在 Gemini 应用内直接调用 CapCut 的 高级 创意和编辑功能,进一步推动 AI 工具在内容创作领域的普及与创新。

4、OpenAI 发布 ChatGPT for PowerPoint:一句话生成 PPT,还能主动揪 Bug
OpenAI 推出 ChatGPT for PowerPoint 插件,使用户能够通过简单的指令快速生成和优化 PPT 内容,同时具备智能分析和修改功能,极大提升了办公效率。

5、WordPress 7.0 正式发布:原生集成 AI 迈入智能建站新时代
WordPress 7.0 正式发布,原生集成AI能力,标志着网页搭建迈入智能化阶段。新版在内容创作、后台界面和移动端体验方面进行了全面升级,为用户带来更高效、流畅的建站与编辑体验。

6、Spotify 联手环球音乐推出 AI 翻唱与混音:正版版权的“降维打击”来了
Spotify与环球音乐合作推出AI翻唱和混音功能,标志着音乐版权领域的一次重大变革。该功能基于合法授权,为用户提供了全新的创作方式,并通过合理的分成机制保障了艺术家的利益。这一举措不仅提升了Spotify的市场竞争力,也对其他AI音乐平台形成了有力的挑战。
7、拒绝“人机单聊”!UniClaw2026 公测:AI 正在迈入“多人社交模式”
北京本源万象人工智能科技有限公司推出的全新AI原生即时通讯产品UniClaw,其突破了传统单聊对话框模式,将AI从单人效率工具升级为群体协作的社交Agent,开启了AI的多人协作模式。文章还详细描述了UniClaw的三大核心角色以及开放的Agent应用社区。
8、拒绝彩排,真刀真枪上舞台!美团LongCat-Video-Avatar1.5开源:全面击败主流闭源模型
美团龙猫大模型团队正式开源商用级数字人视频生成模型 LongCat-Video-Avatar1.5,该版本在唇形同步、物理合理性、长视频稳定性等方面实现全面跃升,并通过多项技术升级显著提升了模型的商业应用价值和用户体验。

声明:本文仅代表作者观点,不代表本平台立场
评论 (0)
登录后即可发表评论
去登录


