AI HOT 日报 2026-06-25：xAI争议、Figma AI 画布、AI Coding 实践

数据来自 AI HOT 过去 24 小时精选动态，本文在原始资讯基础上补充趋势点评、落地建议，并同步更新到本站「AI 资讯播客」。

今日总览

本期基于 AI HOT 过去 24 小时精选动态，重点关注模型发布/更新、产品发布/更新、行业动态、论文研究、技巧与观点。核心信号是：xAI 与 SpaceX 的 AI 叙事受到投资人质疑；Figma 在 Config 2026 把设计画布扩展到代码、动画与 3D；字节跳动复盘 AI Coding，提醒不要只看代码生成占比。

我把 12 条重点动态压缩成以下核心信号：

里德·霍夫曼称SpaceX”不是一家人工智能公司”，xAI则是”彻底的灾难”：Hacker News 热门（buzzing.cc 中文翻译）。LinkedIn联合创始人、Anthropic和OpenAI投资者Reid Hoffman在播客中公开批评SpaceX和xAI。他指出SpaceX”不是一…
Figma在Config 2026押注人类判断，画布AI能力却来自第三方：The Decoder：AI News（RSS）。Figma在Config 2026将设计画布扩展至代码、动画、3D深度和着色器效果，并集成去年收购的Weave工作流系统。新功能包括Code Layers…
字节跳动技术副总裁洪定坤：AI Coding 的实践与探索：公众号：火山引擎。在火山引擎Force大会，字节跳动技术副总裁洪定坤分享AI Coding实践。过去一年，字节AI代码贡献率增长6倍，tokens消耗增长5倍，但过度关注单…
DFlash：块扩散草稿模型实现最高15倍吞吐量提升：MarkTechPost（RSS）。DFlash 由 UC San Diego 团队提出，是一种用于投机解码的轻量块扩散草稿模型。它一次前向推理生成整块 token，再由目标模型并行验证，保…
OpenAI ChatGPT 语音最大规模升级：双向AI语音模型 Bidi 1 已上线测试：IT之家（RSS）。6月23日，部分用户反馈 ChatGPT 网页版和 App 版上线了双向 AI 语音模型 Bidi 1，位于设置模型选择器中，与标准语音和高级语音并列。该…

一、模型发布/更新

1. OpenAI ChatGPT 语音最大规模升级：双向AI语音模型 Bidi 1 已上线测试

来源： IT之家（RSS）
时间： 6/24 12:34（约 21 小时前）
AI HOT 热度： 74

摘要： 6月23日，部分用户反馈 ChatGPT 网页版和 App 版上线了双向 AI 语音模型 Bidi 1，位于设置模型选择器中，与标准语音和高级语音并列。该模型支持边说话边监听，用户可在对话中途打断并发出新指令，例如要求从1数到10时中途喊停倒数，模型会立即切换执行。OpenAI 尚未官宣，预计本周…

我的点评： 双向语音的关键不是“声音更像人”，而是模型能边听边说、被打断、实时改任务。这会推动客服、陪练、会议助手和车载交互从播报式体验走向协作式体验。

建议： 语音产品应重点测试打断、纠错、噪声环境、多说话人和任务切换，而不是只比较音色自然度。

2. Qwen-AgentWorld 开源：让 Agent 学会”先预测，再行动”

来源： 公众号：通义实验室（千问）
时间： 6/24 11:32（约 22 小时前）
AI HOT 热度： 74

摘要： 通义千问推出首个原生语言世界模型 Qwen-AgentWorld，覆盖 MCP、Search、Terminal、SWE、Web、OS、Android 七大领域。模型基于超 1000 万条真实交互轨迹，经 CPT→SFT→RL 三阶段训练，在 AgentWorldBench 上超越 GPT-5.4（…

我的点评： Agent 竞争正在从“会调用工具”升级为“理解行动后果”。先预测再行动，本质上是在给智能体补上世界模型、可回放轨迹和低风险试错空间。

建议： 做企业 Agent 时，优先建设任务轨迹、仿真环境、评测集和回滚机制，不要急着把高风险动作直接交给模型。

3. Gemini 3.5 Flash 中的计算机使用

来源： Hacker News 热门（buzzing.cc 中文翻译）
时间： 6/25 05:16（约 4 小时前）
AI HOT 热度： 71

摘要： Google 将计算机使用（Computer use）作为内置工具集成至 Gemini 3.5 Flash，使开发者能构建跨浏览器、移动端和桌面环境的智能体。此前该功能仅作为独立模型在 Gemini 2.5 中提供，现已原生整合至主 Flash 模型。开发者可通过 Gemini API 及 Gem…

我的点评： Computer Use 进入主模型，说明浏览器、桌面和移动端操作会成为通用 Agent 的基础能力。但能力越通用，权限边界和误操作风险越需要工程化治理。

建议： 试点此类能力时，先限定沙箱、白名单网站、只读数据和人工确认点，再逐步开放写入、支付、发布等高风险操作。

4. GPT-5.5 Instant 新版本，对话更有趣

来源： X：OpenAI (@OpenAI)
时间： 6/25 02:00（约 8 小时前）
AI HOT 热度： 67

摘要： 我们为你带来了新版 GPT-5.5 Instant，它现在聊起天来有趣多了。我们最常用的模型现在能更好地理解问题背后的意图，并相应地调整回应。它也能更可靠地处理复杂约束，让购物和本地推荐更加实用和连贯。今天向付费用户推送，明天向免费用户推送。

我的点评： 通用模型继续打磨“意图理解 + 约束遵循 + 推荐质量”，说明日常助手的竞争正在转向更稳定的长尾任务体验。

建议： 团队评测通用模型时，应加入多约束推荐、本地信息检索、连续追问和拒答边界，而不是只看一次性问答。

二、产品发布/更新

1. Figma在Config 2026押注人类判断，画布AI能力却来自第三方

来源： The Decoder：AI News（RSS）
时间： 6/25 00:49（约 9 小时前）
AI HOT 热度： 74

摘要： Figma在Config 2026将设计画布扩展至代码、动画、3D深度和着色器效果，并集成去年收购的Weave工作流系统。新功能包括Code Layers（代码与设计并存）、Motion动画、深度层、Shader及Generative Plugins。协作方面，团队可搜索复用AI提示词、保存工作流…

我的点评： Figma 的方向很清楚：设计工具正在从静态画布变成“产品生产画布”。但核心 AI 能力来自外部模型，也说明应用层护城河会更多来自工作流、协作和设计资产，而不是底层模型本身。

建议： 设计和产品团队可以试点“设计稿—代码—动画—评审”的一体化流程，但要保留设计规范、组件库和人工审核，避免生成内容破坏品牌一致性。

三、行业动态

1. 在与Anthropic的纠纷中，NSA失去了对Mythos的访问权限

来源： Hacker News 热门（buzzing.cc 中文翻译）
时间： 6/25 03:08（约 7 小时前）
AI HOT 热度： 71

摘要： 美国国家安全局（NSA）因与人工智能公司Anthropic的纠纷，失去了对Mythos系统的访问权限。

我的点评： 这类事件提醒我们，关键 AI 系统不仅是工具，也是供应链和治理资产。一旦访问权、合同或信任关系变化，业务连续性会受到直接影响。

建议： 企业采购关键 AI 能力时，应准备替代模型、数据导出、权限审计和应急降级方案，避免单一供应商锁死核心流程。

四、论文研究

1. DFlash：块扩散草稿模型实现最高15倍吞吐量提升

来源： MarkTechPost（RSS）
时间： 6/24 15:21（约 18 小时前）
AI HOT 热度： 74

摘要： DFlash 由 UC San Diego 团队提出，是一种用于投机解码的轻量块扩散草稿模型。它一次前向推理生成整块 token，再由目标模型并行验证，保证输出无损。相比 EAGLE-3，DFlash 实现最高 2.5 倍加速，在 Qwen3-8B 等多种模型上平均无损加速超过 6 倍（MATH-…

我的点评： 投机解码与块扩散草稿模型说明推理侧仍有巨大工程红利。对于企业来说，吞吐提升往往比单点能力提升更快转化为成本下降和体验改善。

建议： 平台团队可关注这类无损加速方案是否能接入现有推理栈，并用真实负载测试延迟、吞吐、显存和答案一致性。

2. 思考即回忆：推理如何解锁LLM中的参数化知识

来源： Google Research：Blog（网页）
时间： 6/25 01:05（约 9 小时前）
AI HOT 热度： 69

摘要： Google Research研究发现，推理（chain-of-thought）能帮助大语言模型（LLM）回忆简单事实，即使这些事实无需复杂推导。在Gemini-2.5 Flash和Pro以及Qwen3-32B上，启用推理后模型能够回答原本无法直接回答的简单问题，pass@k显示正确事实存在于输出…

我的点评： 这项研究说明“推理”有时不只是解决复杂题，也能激活模型内部已有知识。它提醒我们，提示词和推理预算会影响事实召回，而不仅影响数学题表现。

建议： 知识问答场景应对比直接回答、短推理、长推理和 RAG 的效果差异，避免在所有问题上无差别开启高成本推理。

五、技巧与观点

1. 里德·霍夫曼称SpaceX”不是一家人工智能公司”，xAI则是”彻底的灾难”

来源： Hacker News 热门（buzzing.cc 中文翻译）
时间： 6/24 22:20（约 11 小时前）
AI HOT 热度： 78

摘要： LinkedIn联合创始人、Anthropic和OpenAI投资者Reid Hoffman在播客中公开批评SpaceX和xAI。他指出SpaceX”不是一家人工智能公司”，6月12日上市后收购AI编程工具Cursor属于”花钱买相关性”；xAI则是”彻底的灾难”，所有11位联合创始人已离职，Gro…

我的点评： 投资人对 xAI 与 SpaceX 的批评，本质上是在质疑“把 AI 标签贴到一切业务上”的叙事泡沫。AI 公司最终还是要用模型能力、产品留存、组织稳定性和商业收入证明自己。

建议： 看 AI 公司或相关标的时，不要只看估值和创始人光环，应拆开看团队稳定性、技术路线、客户付费、数据闭环和现金消耗。

2. 字节跳动技术副总裁洪定坤：AI Coding 的实践与探索

来源： 公众号：火山引擎
时间： 6/24 22:02（约 12 小时前）
AI HOT 热度： 74

摘要： 在火山引擎Force大会，字节跳动技术副总裁洪定坤分享AI Coding实践。过去一年，字节AI代码贡献率增长6倍，tokens消耗增长5倍，但过度关注单一指标可能失真–TRAE团队代码超90%由AI生成，人均需求吞吐率仅提升60%。900次实验显示，主流Coding模型组合代码正确率超80%，…

我的点评： AI Coding 已经从“代码有多少由 AI 写”进入“需求吞吐、正确率、评审负担、缺陷率是否改善”的阶段。只追求生成占比，很容易制造漂亮但失真的指标。

建议： 研发管理者应把 AI Coding 评估指标改成端到端交付效率：需求周期、一次通过率、线上缺陷、代码审查耗时和开发者满意度。

3. AI被认为会取代工程岗位，但新数据显示工程是2025年最具韧性的岗位

来源： TechCrunch：AI（RSS）
时间： 6/25 05:56（约 4 小时前）
AI HOT 热度： 70

摘要： 风投机构SignalFire追踪8000万家公司数百万员工数据发现，工程是2025年最具韧性的岗位。大型科技公司总招聘较2019年下降25%，工程岗仅降11%；工程岗占Alphabet、Meta等12家”Tech Majors”新招员工的55%（2019年为46%）。早期初创公司2025年工程师招…

我的点评： “AI 取代工程师”的叙事过于粗糙。更现实的变化是工程师岗位会重组：会用 AI 分解任务、写规格、评审和验证的人，反而更稀缺。

建议： 个人应把学习重点放在系统设计、需求澄清、测试验证和 Agent 协作；团队则应把 AI 培训纳入工程规范，而不是只买工具。

4. OpenRouter 零数据留存（ZDR）实践：97 款新模型，流量占比近半

来源： OpenRouter：Announcements（RSS）
时间： 6/25 00:00（约 10 小时前）
AI HOT 热度： 68

摘要： OpenRouter 的零数据留存（ZDR）保证用户提示词和模型响应不被存储，元数据一般安全。自 1 月以来新增 97 款支持 ZDR 的模型，月度 token 量增长 4.3 倍，约占全部路由流量一半。ZDR 在三个层面执行：账户级（整个供应商开启）、护栏级（按 API Key 或组织成员限定）…

我的点评： ZDR 流量占比上升，说明企业用户越来越在意模型路由中的数据留存和合规边界。隐私能力会成为模型平台的重要产品特性。

建议： 企业接入模型路由平台时，应逐项确认提示词、响应、日志、元数据的留存策略，并把不同业务按敏感级别分配模型与 Key。

今日行动建议

给开发者

把热点模型和工具放到真实仓库、真实数据、真实测试链路中评估。
建立质量、延迟、吞吐、成本、失败回滚五个指标，不只看榜单或演示。
对 Agent 工作流保留日志、分支隔离、权限规则和人工接管点。

给产品经理 / 创业者

先定义高频任务和闭环结果，再选择模型、工具和入口。
把独有数据、行业流程和评测集沉淀为护城河。
对高速模型、免费额度和平台补贴保持成本敏感。

给企业管理者

AI 转型要同步设计培训、岗位协作和绩效指标，避免只变成降本口号。
采购 AI 工具时，把权限、审计、数据合规、供应商持续性写进标准。
每周复盘 AI 项目的实际节省时间、错误率和员工接受度。

结语

今天的主线不是“又有几个新模型”，而是 AI 正在进入可执行工作流：语音可被实时打断，设计画布能生成代码与动画，开发团队开始用吞吐率和正确率衡量 AI Coding。建议把每条新闻落到三张表：任务评测表、权限与数据边界表、成本与 ROI 复盘表。

播客入口：AI 资讯播客；本期文字稿链接：/posts/62525/

AI HOT 日报 2026-06-25：xAI争议、Figma AI 画布、AI Coding 实践

AI HOT 日报 2026-06-25：xAI争议、Figma AI 画布、AI Coding 实践

今日总览

一、模型发布/更新

1. OpenAI ChatGPT 语音最大规模升级：双向AI语音模型 Bidi 1 已上线测试

2. Qwen-AgentWorld 开源：让 Agent 学会”先预测，再行动”

3. Gemini 3.5 Flash 中的计算机使用

4. GPT-5.5 Instant 新版本，对话更有趣

二、产品发布/更新

1. Figma在Config 2026押注人类判断，画布AI能力却来自第三方

三、行业动态

1. 在与Anthropic的纠纷中，NSA失去了对Mythos的访问权限

四、论文研究

1. DFlash：块扩散草稿模型实现最高15倍吞吐量提升

2. 思考即回忆：推理如何解锁LLM中的参数化知识

五、技巧与观点

1. 里德·霍夫曼称SpaceX”不是一家人工智能公司”，xAI则是”彻底的灾难”

2. 字节跳动技术副总裁洪定坤：AI Coding 的实践与探索

3. AI被认为会取代工程岗位，但新数据显示工程是2025年最具韧性的岗位

4. OpenRouter 零数据留存（ZDR）实践：97 款新模型，流量占比近半

今日行动建议

给开发者

给产品经理 / 创业者

给企业管理者

结语

收藏与订阅