AI脚本包：OpenAI把算力战搬到芯片上 (2026)

如果今天只拍一条，我会选 OpenAI 的 Jalapeño 芯片。表面看，这是 OpenAI 又多了一个硬件合作；拍成视频时，它真正的冲突是：当 AI 公司开始自己定义芯片，NVIDIA 的客户、Broadcom 的订单、微软的数据中心、ChatGPT 的价格，全被拉进同一张桌子。

本期覆盖 2026 年 6 月 16 日至 6 月 26 日公开动态，适合做一支科技商业视频的选题池。

视频标题

OpenAI 下场造芯片：AI 巨头开始抢「每一个 Token 的成本」

封面文案

OpenAI 不只做模型了，它要改写算力账本

5 篇候选大纲

候选选题	爆款钩子	核心观点	展开路径
OpenAI 和 Broadcom 发布 Jalapeño 推理芯片	ChatGPT 背后的下一场战争，不是模型名字，而是谁能把每个回答的成本压下来。	OpenAI 把自研芯片、模型、产品和数据中心部署绑在一起，说明推理成本已经成了 AI 商业化的核心变量。OpenAI 称 Jalapeño 面向 LLM 推理设计，工程样片已在实验室运行 GPT-5.3-Codex-Spark 等负载，并计划从 2026 年底开始部署。1	先讲「为什么 GPU 不够便宜」，再讲 Jalapeño 的三层算盘：减少数据搬运、贴合自家模型负载、与微软等数据中心伙伴做吉瓦级部署。最后落到视频冲突：OpenAI 既是 NVIDIA 客户，也在尝试成为芯片规则制定者。
GPT-5.6 Sol 预览	GPT-5.6 最有戏的地方不是名字升级，而是 OpenAI 开始把「模型等级」做成产品货架。	OpenAI 把 GPT-5.6 分成 Sol、Terra、Luna 三档，并公布 Sol 5 美元/百万输入 token、30 美元/百万输出 token，Terra 与 Luna 价格更低。2	从「一代模型打天下」转向「旗舰、均衡、低价」三档货架；解释 max reasoning 与 ultra mode；补拍重点放在价格、延迟、能力边界，而不是只喊更强。
Daybreak 与 GPT-5.5-Cyber	AI 安全的下一步，可能不是发现更多漏洞，而是把补丁真正合进去。	OpenAI 称 Codex Security 研究预览以来扫描了 3000 多万个 commit、3 万多个代码库，并有 50 多万个 finding 被自动判定为已修复；GPT-5.5-Cyber 在 CyberGym 上达到 85.6%，高于 GPT-5.5 的 81.8%。3	开场用「漏洞报告不等于安全」；中段讲安全团队的新瓶颈从 finding 变成 patch；结尾提醒：防御能力增强的同时，双用途风险也被同步放大。
NVIDIA + Unitree 的 Isaac GR00T 参考人形机器人	如果机器人有了统一开发套件，真正值钱的是「身体」还是「大脑」？	NVIDIA 发布 Isaac GR00T Reference Humanoid Robot，组合 Unitree H2 Plus、Sharpa 五指手、Jetson AGX Thor T5000 和 Isaac GR00T 软件栈；官方称 Jetson AGX Thor T5000 可提供 2070 FP4 TFLOPS，整机合计 75 个自由度，计划 2026 年底由宇树供应。4	先拍「黄仁勋把机器人拆成身体和大脑」；再讲高校和研究机构为什么需要标准化平台；最后问一个商业问题：当大脑标准化，本体厂商的差异化还剩什么。
Google Pixel 把 Gemini 做进创作与手机系统	手机 AI 不再只是问答助手，它开始直接接管拍摄、剪辑、音乐和通话场景。	Google 在 6 月 Pixel Drop 中加入 Screen reactions、Gemini Omni 视频编辑、Gemini 音乐生成和 Bubbles 多任务；同月 Android Drop 还加入冒充联系人来电识别、Circle to Search 找整套穿搭、Google Photos wardrobe 等功能。5 6	开头从「手机里长出一间小型工作室」切入；中段拆创作、通话、安全、跨设备分享四个入口；结尾判断端侧 AI 的竞争会从参数转向使用频率。

最佳选题完整 5 分钟脚本

片名

OpenAI 下场造芯片：AI 巨头开始抢「每一个 Token 的成本」

0:00-0:25 开场钩子

【画面】ChatGPT 回答问题的界面，快速切到一排数据中心机柜、GPU 板卡、晶圆特写。

【旁白】

过去两年，AI 公司最爱比较模型有多聪明。现在，问题变得更现实：每回答一次，谁来付电费、芯片费和数据中心账单？

6 月 24 日，OpenAI 和 Broadcom 发布 Jalapeño，OpenAI 的第一款 Intelligence Processor。官方说它不是通用 GPU 的改版，而是从头为大模型推理设计的加速器。1

这条新闻适合拍，因为它把 AI 商业化最硬的一笔账摊开了：模型越多人用，成本越不是后台问题，而是产品能不能继续降价、提速、扩大用户的前台问题。

0:25-1:15 第一段：OpenAI 为什么要碰芯片

【画面】把「模型」「API」「Codex」「数据中心」「芯片」做成一条链路动画。

【旁白】

OpenAI 过去给人的印象是模型公司、产品公司。Jalapeño 出来后，它开始把自己往全栈基础设施公司推。

官方写得很直：这颗芯片围绕 OpenAI 每天运行的 ChatGPT、Codex、API 和未来智能体产品来设计，优化点包括 kernel、内存移动、网络、调度和部署系统。1

翻成视频语言就是：OpenAI 不想只在别人做好的算力货架上选货，它想把货架也按自己的使用方式改掉。

为什么？因为推理和训练不同。训练像一次大工程，推理像每天开门营业。用户每问一句、开发者每调用一次 API、企业每跑一个自动化流程，都在消耗 token。成本如果压不下来，AI 的价格、速度和稳定性都会被卡住。

1:15-2:10 第二段：Jalapeño 的三张牌

【画面】三张卡片依次出现：「更贴合 LLM」「更少数据搬运」「更快产业化」。

【旁白】

Jalapeño 这件事有三张牌。

第一张牌，是负载匹配。OpenAI 称工程样片已经在实验室以目标频率和功耗运行机器学习负载，包括 GPT-5.3-Codex-Spark。官方还说，早期测试显示它的每瓦性能会明显好于当前先进水平，但详细技术报告要之后再公布。1

这里不能拍成「已经吊打 GPU」。更稳的说法是：OpenAI 先给出了方向性结论，还没有给外部可复核的完整 benchmark。

第二张牌，是减少数据搬运。大模型推理不只是算力峰值，内存、网络和调度都会影响真实吞吐。Jalapeño 的架构目标，是让实际利用率更接近理论峰值。1

第三张牌，是产业化速度。OpenAI 称这颗芯片从初始设计到制造 tape-out 只用了 9 个月，并把自家模型用于部分设计和优化流程。1

这部分适合拍成一个很有冲击力的反差：AI 不只消耗芯片，AI 也开始参与设计下一代芯片。

2:10-3:05 第三段：Broadcom、微软和数据中心伙伴为什么重要

【画面】OpenAI、Broadcom、Celestica、Microsoft 名称围成一张网络图，中间是「inference platform」。

【旁白】

Jalapeño 不是 OpenAI 单独造一颗芯片。Broadcom 负责硅实现和网络技术，Celestica 参与板卡、机架和系统能力，OpenAI 负责定义负载和平台方向。官方还提到，这个平台将与微软和其他伙伴从 2026 年开始部署到吉瓦级数据中心。1

这句话很关键。吉瓦级不是实验室词汇，它直接指向电力、机房、冷却、供应链和资本开支。

NVIDIA 同一周也在讲 AI 工厂的冷却问题。NVIDIA 博客称，最新 AI 服务器可以使用 45 摄氏度冷却液运行，从而减少冷却能耗；Gizmodo 在报道中补充，NVIDIA 把这个方案描述为最多可减少 100% 的用水，但也提醒不同气候下效果会有差异。7 8

把这两条放在一起，视频的商业线就出来了：AI 公司抢的不只是芯片性能，还包括电、水、机架、网络和长期融资能力。

3:05-4:05 第四段：这会不会威胁 NVIDIA

【画面】左边是 NVIDIA GPU 货架，右边是定制 ASIC，底部跑出「训练」「推理」「专用负载」「通用生态」四个标签。

【旁白】

看到 OpenAI 自研芯片，很多人第一反应是：这是不是要绕开 NVIDIA？

更准确的拍法是：短期不是替代，长期是分流。

NVIDIA 的优势在通用生态、软件栈、训练集群和开发者惯性。OpenAI 这类定制芯片的优势在特定负载，尤其是已经知道自己每天要跑什么模型、什么产品、什么延迟要求的大客户。

当一家 AI 公司规模足够大，它会自然产生一个问题：为什么我要为所有通用能力买单？我最常跑的那部分负载，能不能用专门设计的芯片跑得更便宜？

Jalapeño 给出的答案是：OpenAI 认为值得试，而且要多代迭代。官方把它称为多代计算平台的第一步，不是一次性硬件项目。1

所以这条新闻的标题不该是「OpenAI 干掉 NVIDIA」。更好的标题是：「AI 进入推理时代，巨头开始为自己的高频负载定制底座」。

4:05-4:45 第五段：对创作者怎么拍

【画面】给出三段式分镜：成本账本、芯片样片、数据中心。

【旁白】

这条选题可以按三层拍。

第一层，用户层。ChatGPT 为什么可能更快、更便宜、更稳定？因为推理成本被压下来，产品才有继续扩张的空间。

第二层，公司层。OpenAI 不再只拼模型发布节奏，而是在控制从模型到芯片再到数据中心的关键环节。

第三层，产业层。Broadcom、微软、Celestica、NVIDIA 都在同一局里。谁掌握「每个 token 的成本」，谁就更接近 AI 的利润表。

这里不要把话说满。OpenAI 还没有公布完整性能报告，Jalapeño 也还没证明能在真实大规模生产环境里稳定运行。视频里要把这点讲清楚：这是一次重要押注，不是已经完成的胜利。1

4:45-5:10 结尾

【画面】晶圆慢慢叠到 ChatGPT 输入框上，最后停在「Token Cost」四个字。

【旁白】

过去，AI 公司的发布会喜欢告诉你模型更聪明了。接下来，真正影响体验的可能是另一个问题：同样聪明的模型，谁能用更低的成本跑起来？

Jalapeño 这颗芯片还没有给出外部完整成绩单，但它已经把牌桌换了。AI 巨头不只抢模型名次，也开始抢芯片、机房、电力和冷却系统。

如果要拍一句收尾，可以这样说：以后每一次 AI 回答背后，可能都藏着一场基础设施战争。

需要补查的关键信息

Jalapeño 的第三方 benchmark、真实延迟、吞吐、功耗和单位 token 成本，目前 OpenAI 只给了方向性描述，完整技术报告尚未公布。1
2026 年底部署节奏需要继续追踪，尤其是微软与其他数据中心伙伴的实际采购规模、机房位置和上线时间。1
如果要把 GPT-5.6 Sol 单独拍成一期，需要补查外部评测，重点看 Terminal-Bench、GeneBench、ExploitGym 等指标能否被第三方复现。2
Daybreak 适合拍「AI 安全军备升级」，但要补查安全社区对 GPT-5.5-Cyber 限制访问、误报率、补丁质量的反馈。3
机器人选题要补查 Unitree H2 Plus 的实际交付价、交付数量和高校使用案例，否则容易拍成参数堆叠。4

AI脚本包：OpenAI把算力战搬到芯片上

视频标题

封面文案

5 篇候选大纲

最佳选题完整 5 分钟脚本

片名

0:00-0:25 开场钩子

0:25-1:15 第一段：OpenAI 为什么要碰芯片

1:15-2:10 第二段：Jalapeño 的三张牌

2:10-3:05 第三段：Broadcom、微软和数据中心伙伴为什么重要

3:05-4:05 第四段：这会不会威胁 NVIDIA

4:05-4:45 第五段：对创作者怎么拍

4:45-5:10 结尾

需要补查的关键信息

References

More from this channel

Related content