07-14-简报

AI每日简报 (The AI Daily Briefing)「2025-07-14」

① 月之暗面Kimi K2开源模型震撼发布：Kimi K2采用1T总参数/32B活跃参数的MoE架构，在SWE Bench Verified、Tau2和AceBench等基准测试中领先所有开源模型。训练成本约500万美元，与DeepSeek V3相当但性能更优，证明计算并非决定性因素。
消息来源

② Kimi通过Anthropic API接入Claude Code：开发者现可通过修改环境变量，在Claude Code中直接调用Kimi模型。100万tokens成本仅2美元，大幅降低AI编程门槛。社区已推出快速启动项目，简化配置流程。
消息来源 | 快速启动项目

③ Google Gemini 2.5论文作者达3295人：创下AI论文作者数量新纪录，比Gemini 1.0的约1000名作者增长三倍多。这一数字反映了大型AI项目的规模化趋势和跨团队协作的复杂性。
消息来源 | 论文地址

④ 神经符号AI获大型科技公司认可：Gary Marcus指出，神经符号方法正逐步融入主流LLM系统。Ben Goertzel等专家认为，真正的AGI需要更深层的符号与神经网络融合架构，而非仅将符号方法作为辅助工具。
消息来源

⑤ Midjourney庆祝开放测试三周年：这家AI图像生成平台回顾三年发展历程，感谢社区支持。Midjourney已成为创意产业不可或缺的工具，持续推动AI艺术创作的边界。
消息来源 | 加入Discord | 使用指南

⑥ Amazon在ICML2025展示AI研究成果：Amazon研究团队在国际机器学习大会上发表多篇论文，涵盖生成式AI、自主代理、时间序列预测和异常检测等领域，展现其在AI基础研究的广泛布局。
消息来源 | 论文集合

⑦ UK AISI指出AI欺骗性对齐研究缺陷：英国AI安全研究所发现Anthropic、MTER、Apollo Research等机构的"AI scheming"研究存在四个方法论问题，呼吁减少依赖轶事证据，加强对照实验设计。
消息来源

⑧ GPT-5虚假基准测试在网络传播：有用户利用ChatGPT生成GPT-5的虚假性能基准并广泛传播，Gary Marcus批评这反映了部分AI社区对AGI即将到来的过度乐观情绪。
消息来源

⑨ AI扩展定义引发学术争议：Gary Marcus质疑"扩展"作为通向AGI路径的定义变化，指出从预测指数级进步到承认收益递减，以及将工具使用等创新算作扩展，是对原始假设的篡改。
消息来源

⑩ Anthropic开源策略遭质疑：研究者批评Anthropic未开源任何模型与其推进AI安全的宗旨相悖，因为大部分AI安全研究在顶级AGI实验室外进行，模型内部研究需要开源权重。
消息来源

⑪ xAI和Moonshot引领新一代AI实验室：两家年轻公司分别在闭源和开源LLM领域取得领先地位。xAI成立仅两年，Moonshot成立不到三年，证明AI领域的真正护城河并非传统认知。
消息来源

⑫ CoT工具使用先驱之争：Jeremy Howard指出，Anthropic早在一年前就已实现思维链中的工具使用，反驳了OpenAI是该技术先驱的说法，展现AI技术发展的激烈竞争。
消息来源 | 相关讨论

07-15-简报 07-11-简报