AI HOT 日报 2026-06-25:xAI争议、Figma AI 画布、AI Coding 实践
条评论数据来自 AI HOT 过去 24 小时精选动态,本文在原始资讯基础上补充趋势点评、落地建议,并同步更新到本站「AI 资讯播客」。
今日总览
本期基于 AI HOT 过去 24 小时精选动态,重点关注 模型发布/更新、产品发布/更新、行业动态、论文研究、技巧与观点。核心信号是:xAI 与 SpaceX 的 AI 叙事受到投资人质疑;Figma 在 Config 2026 把设计画布扩展到代码、动画与 3D;字节跳动复盘 AI Coding,提醒不要只看代码生成占比。
我把 12 条重点动态压缩成以下核心信号:
- 里德·霍夫曼称SpaceX”不是一家人工智能公司”,xAI则是”彻底的灾难”:Hacker News 热门(buzzing.cc 中文翻译)。LinkedIn联合创始人、Anthropic和OpenAI投资者Reid Hoffman在播客中公开批评SpaceX和xAI。他指出SpaceX”不是一…
- Figma在Config 2026押注人类判断,画布AI能力却来自第三方:The Decoder:AI News(RSS)。Figma在Config 2026将设计画布扩展至代码、动画、3D深度和着色器效果,并集成去年收购的Weave工作流系统。新功能包括Code Layers…
- 字节跳动技术副总裁洪定坤:AI Coding 的实践与探索:公众号:火山引擎。在火山引擎Force大会,字节跳动技术副总裁洪定坤分享AI Coding实践。过去一年,字节AI代码贡献率增长6倍,tokens消耗增长5倍,但过度关注单…
- DFlash:块扩散草稿模型实现最高15倍吞吐量提升:MarkTechPost(RSS)。DFlash 由 UC San Diego 团队提出,是一种用于投机解码的轻量块扩散草稿模型。它一次前向推理生成整块 token,再由目标模型并行验证,保…
- OpenAI ChatGPT 语音最大规模升级:双向AI语音模型 Bidi 1 已上线测试:IT之家(RSS)。6月23日,部分用户反馈 ChatGPT 网页版和 App 版上线了双向 AI 语音模型 Bidi 1,位于设置模型选择器中,与标准语音和高级语音并列。该…
一、模型发布/更新
1. OpenAI ChatGPT 语音最大规模升级:双向AI语音模型 Bidi 1 已上线测试
- 来源: IT之家(RSS)
- 时间: 6/24 12:34(约 21 小时前)
- AI HOT 热度: 74
摘要: 6月23日,部分用户反馈 ChatGPT 网页版和 App 版上线了双向 AI 语音模型 Bidi 1,位于设置模型选择器中,与标准语音和高级语音并列。该模型支持边说话边监听,用户可在对话中途打断并发出新指令,例如要求从1数到10时中途喊停倒数,模型会立即切换执行。OpenAI 尚未官宣,预计本周…
我的点评: 双向语音的关键不是“声音更像人”,而是模型能边听边说、被打断、实时改任务。这会推动客服、陪练、会议助手和车载交互从播报式体验走向协作式体验。
建议: 语音产品应重点测试打断、纠错、噪声环境、多说话人和任务切换,而不是只比较音色自然度。
2. Qwen-AgentWorld 开源:让 Agent 学会”先预测,再行动”
- 来源: 公众号:通义实验室(千问)
- 时间: 6/24 11:32(约 22 小时前)
- AI HOT 热度: 74
摘要: 通义千问推出首个原生语言世界模型 Qwen-AgentWorld,覆盖 MCP、Search、Terminal、SWE、Web、OS、Android 七大领域。模型基于超 1000 万条真实交互轨迹,经 CPT→SFT→RL 三阶段训练,在 AgentWorldBench 上超越 GPT-5.4(…
我的点评: Agent 竞争正在从“会调用工具”升级为“理解行动后果”。先预测再行动,本质上是在给智能体补上世界模型、可回放轨迹和低风险试错空间。
建议: 做企业 Agent 时,优先建设任务轨迹、仿真环境、评测集和回滚机制,不要急着把高风险动作直接交给模型。
3. Gemini 3.5 Flash 中的计算机使用
- 来源: Hacker News 热门(buzzing.cc 中文翻译)
- 时间: 6/25 05:16(约 4 小时前)
- AI HOT 热度: 71
摘要: Google 将计算机使用(Computer use)作为内置工具集成至 Gemini 3.5 Flash,使开发者能构建跨浏览器、移动端和桌面环境的智能体。此前该功能仅作为独立模型在 Gemini 2.5 中提供,现已原生整合至主 Flash 模型。开发者可通过 Gemini API 及 Gem…
我的点评: Computer Use 进入主模型,说明浏览器、桌面和移动端操作会成为通用 Agent 的基础能力。但能力越通用,权限边界和误操作风险越需要工程化治理。
建议: 试点此类能力时,先限定沙箱、白名单网站、只读数据和人工确认点,再逐步开放写入、支付、发布等高风险操作。
4. GPT-5.5 Instant 新版本,对话更有趣
- 来源: X:OpenAI (@OpenAI)
- 时间: 6/25 02:00(约 8 小时前)
- AI HOT 热度: 67
摘要: 我们为你带来了新版 GPT-5.5 Instant,它现在聊起天来有趣多了。 我们最常用的模型现在能更好地理解问题背后的意图,并相应地调整回应。 它也能更可靠地处理复杂约束,让购物和本地推荐更加实用和连贯。 今天向付费用户推送,明天向免费用户推送。
我的点评: 通用模型继续打磨“意图理解 + 约束遵循 + 推荐质量”,说明日常助手的竞争正在转向更稳定的长尾任务体验。
建议: 团队评测通用模型时,应加入多约束推荐、本地信息检索、连续追问和拒答边界,而不是只看一次性问答。
二、产品发布/更新
1. Figma在Config 2026押注人类判断,画布AI能力却来自第三方
- 来源: The Decoder:AI News(RSS)
- 时间: 6/25 00:49(约 9 小时前)
- AI HOT 热度: 74
摘要: Figma在Config 2026将设计画布扩展至代码、动画、3D深度和着色器效果,并集成去年收购的Weave工作流系统。新功能包括Code Layers(代码与设计并存)、Motion动画、深度层、Shader及Generative Plugins。协作方面,团队可搜索复用AI提示词、保存工作流…
我的点评: Figma 的方向很清楚:设计工具正在从静态画布变成“产品生产画布”。但核心 AI 能力来自外部模型,也说明应用层护城河会更多来自工作流、协作和设计资产,而不是底层模型本身。
建议: 设计和产品团队可以试点“设计稿—代码—动画—评审”的一体化流程,但要保留设计规范、组件库和人工审核,避免生成内容破坏品牌一致性。
三、行业动态
1. 在与Anthropic的纠纷中,NSA失去了对Mythos的访问权限
- 来源: Hacker News 热门(buzzing.cc 中文翻译)
- 时间: 6/25 03:08(约 7 小时前)
- AI HOT 热度: 71
摘要: 美国国家安全局(NSA)因与人工智能公司Anthropic的纠纷,失去了对Mythos系统的访问权限。
我的点评: 这类事件提醒我们,关键 AI 系统不仅是工具,也是供应链和治理资产。一旦访问权、合同或信任关系变化,业务连续性会受到直接影响。
建议: 企业采购关键 AI 能力时,应准备替代模型、数据导出、权限审计和应急降级方案,避免单一供应商锁死核心流程。
四、论文研究
1. DFlash:块扩散草稿模型实现最高15倍吞吐量提升
- 来源: MarkTechPost(RSS)
- 时间: 6/24 15:21(约 18 小时前)
- AI HOT 热度: 74
摘要: DFlash 由 UC San Diego 团队提出,是一种用于投机解码的轻量块扩散草稿模型。它一次前向推理生成整块 token,再由目标模型并行验证,保证输出无损。相比 EAGLE-3,DFlash 实现最高 2.5 倍加速,在 Qwen3-8B 等多种模型上平均无损加速超过 6 倍(MATH-…
我的点评: 投机解码与块扩散草稿模型说明推理侧仍有巨大工程红利。对于企业来说,吞吐提升往往比单点能力提升更快转化为成本下降和体验改善。
建议: 平台团队可关注这类无损加速方案是否能接入现有推理栈,并用真实负载测试延迟、吞吐、显存和答案一致性。
2. 思考即回忆:推理如何解锁LLM中的参数化知识
- 来源: Google Research:Blog(网页)
- 时间: 6/25 01:05(约 9 小时前)
- AI HOT 热度: 69
摘要: Google Research研究发现,推理(chain-of-thought)能帮助大语言模型(LLM)回忆简单事实,即使这些事实无需复杂推导。在Gemini-2.5 Flash和Pro以及Qwen3-32B上,启用推理后模型能够回答原本无法直接回答的简单问题,pass@k显示正确事实存在于输出…
我的点评: 这项研究说明“推理”有时不只是解决复杂题,也能激活模型内部已有知识。它提醒我们,提示词和推理预算会影响事实召回,而不仅影响数学题表现。
建议: 知识问答场景应对比直接回答、短推理、长推理和 RAG 的效果差异,避免在所有问题上无差别开启高成本推理。
五、技巧与观点
1. 里德·霍夫曼称SpaceX”不是一家人工智能公司”,xAI则是”彻底的灾难”
- 来源: Hacker News 热门(buzzing.cc 中文翻译)
- 时间: 6/24 22:20(约 11 小时前)
- AI HOT 热度: 78
摘要: LinkedIn联合创始人、Anthropic和OpenAI投资者Reid Hoffman在播客中公开批评SpaceX和xAI。他指出SpaceX”不是一家人工智能公司”,6月12日上市后收购AI编程工具Cursor属于”花钱买相关性”;xAI则是”彻底的灾难”,所有11位联合创始人已离职,Gro…
我的点评: 投资人对 xAI 与 SpaceX 的批评,本质上是在质疑“把 AI 标签贴到一切业务上”的叙事泡沫。AI 公司最终还是要用模型能力、产品留存、组织稳定性和商业收入证明自己。
建议: 看 AI 公司或相关标的时,不要只看估值和创始人光环,应拆开看团队稳定性、技术路线、客户付费、数据闭环和现金消耗。
2. 字节跳动技术副总裁洪定坤:AI Coding 的实践与探索
- 来源: 公众号:火山引擎
- 时间: 6/24 22:02(约 12 小时前)
- AI HOT 热度: 74
摘要: 在火山引擎Force大会,字节跳动技术副总裁洪定坤分享AI Coding实践。过去一年,字节AI代码贡献率增长6倍,tokens消耗增长5倍,但过度关注单一指标可能失真–TRAE团队代码超90%由AI生成,人均需求吞吐率仅提升60%。900次实验显示,主流Coding模型组合代码正确率超80%,…
我的点评: AI Coding 已经从“代码有多少由 AI 写”进入“需求吞吐、正确率、评审负担、缺陷率是否改善”的阶段。只追求生成占比,很容易制造漂亮但失真的指标。
建议: 研发管理者应把 AI Coding 评估指标改成端到端交付效率:需求周期、一次通过率、线上缺陷、代码审查耗时和开发者满意度。
3. AI被认为会取代工程岗位,但新数据显示工程是2025年最具韧性的岗位
- 来源: TechCrunch:AI(RSS)
- 时间: 6/25 05:56(约 4 小时前)
- AI HOT 热度: 70
摘要: 风投机构SignalFire追踪8000万家公司数百万员工数据发现,工程是2025年最具韧性的岗位。大型科技公司总招聘较2019年下降25%,工程岗仅降11%;工程岗占Alphabet、Meta等12家”Tech Majors”新招员工的55%(2019年为46%)。早期初创公司2025年工程师招…
我的点评: “AI 取代工程师”的叙事过于粗糙。更现实的变化是工程师岗位会重组:会用 AI 分解任务、写规格、评审和验证的人,反而更稀缺。
建议: 个人应把学习重点放在系统设计、需求澄清、测试验证和 Agent 协作;团队则应把 AI 培训纳入工程规范,而不是只买工具。
4. OpenRouter 零数据留存(ZDR)实践:97 款新模型,流量占比近半
- 来源: OpenRouter:Announcements(RSS)
- 时间: 6/25 00:00(约 10 小时前)
- AI HOT 热度: 68
摘要: OpenRouter 的零数据留存(ZDR)保证用户提示词和模型响应不被存储,元数据一般安全。自 1 月以来新增 97 款支持 ZDR 的模型,月度 token 量增长 4.3 倍,约占全部路由流量一半。ZDR 在三个层面执行:账户级(整个供应商开启)、护栏级(按 API Key 或组织成员限定)…
我的点评: ZDR 流量占比上升,说明企业用户越来越在意模型路由中的数据留存和合规边界。隐私能力会成为模型平台的重要产品特性。
建议: 企业接入模型路由平台时,应逐项确认提示词、响应、日志、元数据的留存策略,并把不同业务按敏感级别分配模型与 Key。
今日行动建议
给开发者
- 把热点模型和工具放到真实仓库、真实数据、真实测试链路中评估。
- 建立质量、延迟、吞吐、成本、失败回滚五个指标,不只看榜单或演示。
- 对 Agent 工作流保留日志、分支隔离、权限规则和人工接管点。
给产品经理 / 创业者
- 先定义高频任务和闭环结果,再选择模型、工具和入口。
- 把独有数据、行业流程和评测集沉淀为护城河。
- 对高速模型、免费额度和平台补贴保持成本敏感。
给企业管理者
- AI 转型要同步设计培训、岗位协作和绩效指标,避免只变成降本口号。
- 采购 AI 工具时,把权限、审计、数据合规、供应商持续性写进标准。
- 每周复盘 AI 项目的实际节省时间、错误率和员工接受度。
结语
今天的主线不是“又有几个新模型”,而是 AI 正在进入可执行工作流:语音可被实时打断,设计画布能生成代码与动画,开发团队开始用吞吐率和正确率衡量 AI Coding。建议把每条新闻落到三张表:任务评测表、权限与数据边界表、成本与 ROI 复盘表。
播客入口:AI 资讯播客;本期文字稿链接:/posts/62525/
本文标题:AI HOT 日报 2026-06-25:xAI争议、Figma AI 画布、AI Coding 实践
文章作者:fantasykai
发布时间:2026-06-25
最后更新:2026-06-25
原始链接:https://aimak.cn/posts/62525/
版权声明:本博客所有文章除特别声明外,均采用 CC BY-NC-SA 4.0 许可协议。转载请注明出处!