
June 28, 2026 · 5:57 PM
AI脚本包:OpenAI把算力战搬到芯片上
这期把 OpenAI 自研推理芯片、GPT-5.6 Sol、Daybreak 安全工具、NVIDIA 人形机器人参考设计和 Google Pixel AI 更新,转成 5 个可拍选题,并完整写出一支关于 Jalapeño 芯片的 5 分钟科技商业脚本。
如果今天只拍一条,我会选 OpenAI 的 Jalapeño 芯片。表面看,这是 OpenAI 又多了一个硬件合作;拍成视频时,它真正的冲突是:当 AI 公司开始自己定义芯片,NVIDIA 的客户、Broadcom 的订单、微软的数据中心、ChatGPT 的价格,全被拉进同一张桌子。
本期覆盖 2026 年 6 月 16 日至 6 月 26 日公开动态,适合做一支科技商业视频的选题池。
视频标题
OpenAI 下场造芯片:AI 巨头开始抢「每一个 Token 的成本」
封面文案
OpenAI 不只做模型了,它要改写算力账本
5 篇候选大纲
| 候选选题 | 爆款钩子 | 核心观点 | 展开路径 |
|---|---|---|---|
| OpenAI 和 Broadcom 发布 Jalapeño 推理芯片 | ChatGPT 背后的下一场战争,不是模型名字,而是谁能把每个回答的成本压下来。 | OpenAI 把自研芯片、模型、产品和数据中心部署绑在一起,说明推理成本已经成了 AI 商业化的核心变量。OpenAI 称 Jalapeño 面向 LLM 推理设计,工程样片已在实验室运行 GPT-5.3-Codex-Spark 等负载,并计划从 2026 年底开始部署。1 | 先讲「为什么 GPU 不够便宜」,再讲 Jalapeño 的三层算盘:减少数据搬运、贴合自家模型负载、与微软等数据中心伙伴做吉瓦级部署。最后落到视频冲突:OpenAI 既是 NVIDIA 客户,也在尝试成为芯片规则制定者。 |
| GPT-5.6 Sol 预览 | GPT-5.6 最有戏的地方不是名字升级,而是 OpenAI 开始把「模型等级」做成产品货架。 | OpenAI 把 GPT-5.6 分成 Sol、Terra、Luna 三档,并公布 Sol 5 美元/百万输入 token、30 美元/百万输出 token,Terra 与 Luna 价格更低。2 | 从「一代模型打天下」转向「旗舰、均衡、低价」三档货架;解释 max reasoning 与 ultra mode;补拍重点放在价格、延迟、能力边界,而不是只喊更强。 |
| Daybreak 与 GPT-5.5-Cyber | AI 安全的下一步,可能不是发现更多漏洞,而是把补丁真正合进去。 | OpenAI 称 Codex Security 研究预览以来扫描了 3000 多万个 commit、3 万多个代码库,并有 50 多万个 finding 被自动判定为已修复;GPT-5.5-Cyber 在 CyberGym 上达到 85.6%,高于 GPT-5.5 的 81.8%。3 | 开场用「漏洞报告不等于安全」;中段讲安全团队的新瓶颈从 finding 变成 patch;结尾提醒:防御能力增强的同时,双用途风险也被同步放大。 |
| NVIDIA + Unitree 的 Isaac GR00T 参考人形机器人 | 如果机器人有了统一开发套件,真正值钱的是「身体」还是「大脑」? | NVIDIA 发布 Isaac GR00T Reference Humanoid Robot,组合 Unitree H2 Plus、Sharpa 五指手、Jetson AGX Thor T5000 和 Isaac GR00T 软件栈;官方称 Jetson AGX Thor T5000 可提供 2070 FP4 TFLOPS,整机合计 75 个自由度,计划 2026 年底由宇树供应。4 | 先拍「黄仁勋把机器人拆成身体和大脑」;再讲高校和研究机构为什么需要标准化平台;最后问一个商业问题:当大脑标准化,本体厂商的差异化还剩什么。 |
| Google Pixel 把 Gemini 做进创作与手机系统 | 手机 AI 不再只是问答助手,它开始直接接管拍摄、剪辑、音乐和通话场景。 | Google 在 6 月 Pixel Drop 中加入 Screen reactions、Gemini Omni 视频编辑、Gemini 音乐生成和 Bubbles 多任务;同月 Android Drop 还加入冒充联系人来电识别、Circle to Search 找整套穿搭、Google Photos wardrobe 等功能。56 | 开头从「手机里长出一间小型工作室」切入;中段拆创作、通话、安全、跨设备分享四个入口;结尾判断端侧 AI 的竞争会从参数转向使用频率。 |
最佳选题完整 5 分钟脚本
片名
OpenAI 下场造芯片:AI 巨头开始抢「每一个 Token 的成本」
0:00-0:25 开场钩子
【画面】ChatGPT 回答问题的界面,快速切到一排数据中心机柜、GPU 板卡、晶圆特写。
【旁白】
过去两年,AI 公司最爱比较模型有多聪明。现在,问题变得更现实:每回答一次,谁来付电费、芯片费和数据中心账单?
6 月 24 日,OpenAI 和 Broadcom 发布 Jalapeño,OpenAI 的第一款 Intelligence Processor。官方说它不是通用 GPU 的改版,而是从头为大模型推理设计的加速器。1
这条新闻适合拍,因为它把 AI 商业化最硬的一笔账摊开了:模型越多人用,成本越不是后台问题,而是产品能不能继续降价、提速、扩大用户的前台问题。
0:25-1:15 第一段:OpenAI 为什么要碰芯片
【画面】把「模型」「API」「Codex」「数据中心」「芯片」做成一条链路动画。
【旁白】
OpenAI 过去给人的印象是模型公司、产品公司。Jalapeño 出来后,它开始把自己往全栈基础设施公司推。
官方写得很直:这颗芯片围绕 OpenAI 每天运行的 ChatGPT、Codex、API 和未来智能体产品来设计,优化点包括 kernel、内存移动、网络、调度和部署系统。1
翻成视频语言就是:OpenAI 不想只在别人做好的算力货架上选货,它想把货架也按自己的使用方式改掉。
为什么?因为推理和训练不同。训练像一次大工程,推理像每天开门营业。用户每问一句、开发者每调用一次 API、企业每跑一个自动化流程,都在消耗 token。成本如果压不下来,AI 的价格、速度和稳定性都会被卡住。
1:15-2:10 第二段:Jalapeño 的三张牌
【画面】三张卡片依次出现:「更贴合 LLM」「更少数据搬运」「更快产业化」。
【旁白】
Jalapeño 这件事有三张牌。
第一张牌,是负载匹配。OpenAI 称工程样片已经在实验室以目标频率和功耗运行机器学习负载,包括 GPT-5.3-Codex-Spark。官方还说,早期测试显示它的每瓦性能会明显好于当前先进水平,但详细技术报告要之后再公布。1
这里不能拍成「已经吊打 GPU」。更稳的说法是:OpenAI 先给出了方向性结论,还没有给外部可复核的完整 benchmark。
第二张牌,是减少数据搬运。大模型推理不只是算力峰值,内存、网络和调度都会影响真实吞吐。Jalapeño 的架构目标,是让实际利用率更接近理论峰值。1
第三张牌,是产业化速度。OpenAI 称这颗芯片从初始设计到制造 tape-out 只用了 9 个月,并把自家模型用于部分设计和优化流程。1
这部分适合拍成一个很有冲击力的反差:AI 不只消耗芯片,AI 也开始参与设计下一代芯片。
2:10-3:05 第三段:Broadcom、微软和数据中心伙伴为什么重要
【画面】OpenAI、Broadcom、Celestica、Microsoft 名称围成一张网络图,中间是「inference platform」。
【旁白】
Jalapeño 不是 OpenAI 单独造一颗芯片。Broadcom 负责硅实现和网络技术,Celestica 参与板卡、机架和系统能力,OpenAI 负责定义负载和平台方向。官方还提到,这个平台将与微软和其他伙伴从 2026 年开始部署到吉瓦级数据中心。1
这句话很关键。吉瓦级不是实验室词汇,它直接指向电力、机房、冷却、供应链和资本开支。
NVIDIA 同一周也在讲 AI 工厂的冷却问题。NVIDIA 博客称,最新 AI 服务器可以使用 45 摄氏度冷却液运行,从而减少冷却能耗;Gizmodo 在报道中补充,NVIDIA 把这个方案描述为最多可减少 100% 的用水,但也提醒不同气候下效果会有差异。78
把这两条放在一起,视频的商业线就出来了:AI 公司抢的不只是芯片性能,还包括电、水、机架、网络和长期融资能力。
3:05-4:05 第四段:这会不会威胁 NVIDIA
【画面】左边是 NVIDIA GPU 货架,右边是定制 ASIC,底部跑出「训练」「推理」「专用负载」「通用生态」四个标签。
【旁白】
看到 OpenAI 自研芯片,很多人第一反应是:这是不是要绕开 NVIDIA?
更准确的拍法是:短期不是替代,长期是分流。
NVIDIA 的优势在通用生态、软件栈、训练集群和开发者惯性。OpenAI 这类定制芯片的优势在特定负载,尤其是已经知道自己每天要跑什么模型、什么产品、什么延迟要求的大客户。
当一家 AI 公司规模足够大,它会自然产生一个问题:为什么我要为所有通用能力买单?我最常跑的那部分负载,能不能用专门设计的芯片跑得更便宜?
Jalapeño 给出的答案是:OpenAI 认为值得试,而且要多代迭代。官方把它称为多代计算平台的第一步,不是一次性硬件项目。1
所以这条新闻的标题不该是「OpenAI 干掉 NVIDIA」。更好的标题是:「AI 进入推理时代,巨头开始为自己的高频负载定制底座」。
4:05-4:45 第五段:对创作者怎么拍
【画面】给出三段式分镜:成本账本、芯片样片、数据中心。
【旁白】
这条选题可以按三层拍。
第一层,用户层。ChatGPT 为什么可能更快、更便宜、更稳定?因为推理成本被压下来,产品才有继续扩张的空间。
第二层,公司层。OpenAI 不再只拼模型发布节奏,而是在控制从模型到芯片再到数据中心的关键环节。
第三层,产业层。Broadcom、微软、Celestica、NVIDIA 都在同一局里。谁掌握「每个 token 的成本」,谁就更接近 AI 的利润表。
这里不要把话说满。OpenAI 还没有公布完整性能报告,Jalapeño 也还没证明能在真实大规模生产环境里稳定运行。视频里要把这点讲清楚:这是一次重要押注,不是已经完成的胜利。1
4:45-5:10 结尾
【画面】晶圆慢慢叠到 ChatGPT 输入框上,最后停在「Token Cost」四个字。
【旁白】
过去,AI 公司的发布会喜欢告诉你模型更聪明了。接下来,真正影响体验的可能是另一个问题:同样聪明的模型,谁能用更低的成本跑起来?
Jalapeño 这颗芯片还没有给出外部完整成绩单,但它已经把牌桌换了。AI 巨头不只抢模型名次,也开始抢芯片、机房、电力和冷却系统。
如果要拍一句收尾,可以这样说:以后每一次 AI 回答背后,可能都藏着一场基础设施战争。
需要补查的关键信息
- Jalapeño 的第三方 benchmark、真实延迟、吞吐、功耗和单位 token 成本,目前 OpenAI 只给了方向性描述,完整技术报告尚未公布。1
- 2026 年底部署节奏需要继续追踪,尤其是微软与其他数据中心伙伴的实际采购规模、机房位置和上线时间。1
- 如果要把 GPT-5.6 Sol 单独拍成一期,需要补查外部评测,重点看 Terminal-Bench、GeneBench、ExploitGym 等指标能否被第三方复现。2
- Daybreak 适合拍「AI 安全军备升级」,但要补查安全社区对 GPT-5.5-Cyber 限制访问、误报率、补丁质量的反馈。3
- 机器人选题要补查 Unitree H2 Plus 的实际交付价、交付数量和高校使用案例,否则容易拍成参数堆叠。4
References
- 1OpenAI and Broadcom unveil LLM-optimized inference chip
- 2Previewing GPT-5.6 Sol: a next-generation model
- 3Daybreak: Tools for securing every organization in the world
- 4NVIDIA Announces NVIDIA Isaac GR00T Reference Humanoid Robot for Academic Research
- 5Explore the newest features coming to your Pixel devices in the June drop
- 6June Android Drop: Google Photos wardrobe and more
- 7Hotter Than a Hot Tub: The 45°C Breakthrough to Cool AI’s Biggest Machines
- 8Nvidia Touts ‘100% Reduction in Water Use’ With New Data Center Design
More from this channel
Related content
- Sign in to comment.
