07-14-简报

AI每日简报 (The AI Daily Briefing)「2025-07-14」

月之暗面Kimi K2开源模型震撼发布:Kimi K2采用1T总参数/32B活跃参数的MoE架构,在SWE Bench Verified、Tau2和AceBench等基准测试中领先所有开源模型。训练成本约500万美元,与DeepSeek V3相当但性能更优,证明计算并非决定性因素。
消息来源

Kimi通过Anthropic API接入Claude Code:开发者现可通过修改环境变量,在Claude Code中直接调用Kimi模型。100万tokens成本仅2美元,大幅降低AI编程门槛。社区已推出快速启动项目,简化配置流程。
消息来源 | 快速启动项目

Google Gemini 2.5论文作者达3295人:创下AI论文作者数量新纪录,比Gemini 1.0的约1000名作者增长三倍多。这一数字反映了大型AI项目的规模化趋势和跨团队协作的复杂性。
消息来源 | 论文地址

神经符号AI获大型科技公司认可:Gary Marcus指出,神经符号方法正逐步融入主流LLM系统。Ben Goertzel等专家认为,真正的AGI需要更深层的符号与神经网络融合架构,而非仅将符号方法作为辅助工具。
消息来源

Midjourney庆祝开放测试三周年:这家AI图像生成平台回顾三年发展历程,感谢社区支持。Midjourney已成为创意产业不可或缺的工具,持续推动AI艺术创作的边界。
消息来源 | 加入Discord | 使用指南

Amazon在ICML2025展示AI研究成果:Amazon研究团队在国际机器学习大会上发表多篇论文,涵盖生成式AI、自主代理、时间序列预测和异常检测等领域,展现其在AI基础研究的广泛布局。
消息来源 | 论文集合

UK AISI指出AI欺骗性对齐研究缺陷:英国AI安全研究所发现Anthropic、MTER、Apollo Research等机构的"AI scheming"研究存在四个方法论问题,呼吁减少依赖轶事证据,加强对照实验设计。
消息来源

GPT-5虚假基准测试在网络传播:有用户利用ChatGPT生成GPT-5的虚假性能基准并广泛传播,Gary Marcus批评这反映了部分AI社区对AGI即将到来的过度乐观情绪。
消息来源

AI扩展定义引发学术争议:Gary Marcus质疑"扩展"作为通向AGI路径的定义变化,指出从预测指数级进步到承认收益递减,以及将工具使用等创新算作扩展,是对原始假设的篡改。
消息来源

Anthropic开源策略遭质疑:研究者批评Anthropic未开源任何模型与其推进AI安全的宗旨相悖,因为大部分AI安全研究在顶级AGI实验室外进行,模型内部研究需要开源权重。
消息来源

xAI和Moonshot引领新一代AI实验室:两家年轻公司分别在闭源和开源LLM领域取得领先地位。xAI成立仅两年,Moonshot成立不到三年,证明AI领域的真正护城河并非传统认知。
消息来源

CoT工具使用先驱之争:Jeremy Howard指出,Anthropic早在一年前就已实现思维链中的工具使用,反驳了OpenAI是该技术先驱的说法,展现AI技术发展的激烈竞争。
消息来源 | 相关讨论