今天是 2026-05-31,00:00 Los Angeles time。下面是过去 12-24 小时里值得关注的全球 AI 大事件,按影响力和可行动性整理。
快速结论
今天对 AI 构建者最强的信号,与其说来自某个轰动的前沿模型发布,不如说来自成本曲线和智能体基础设施:DeepSeek 的 V4-Pro 价格重置、GitHub Copilot 即将启用 AI-credit 计费、OpenAI Codex 获得 Windows 电脑使用能力、Liquid 发布本地 MoE 模型,以及 LlamaIndex 推出基于 Rust 的解析栈。实用判断是:团队应审计 token 开销,基准测试更便宜的长上下文路径,并在扩大自主工作流之前加固智能体运行时。
1. 1. DeepSeek 将 V4-Pro 的大幅 API 折扣变成事实上的新价格
这不是单纯的模型发布新闻,而是一个会立即影响构建者经济账的事件。如果你的智能体栈高度依赖 token,DeepSeek 的 V4-Pro 定价现在会改变你与 Claude、GPT、Gemini 以及路由服务商做默认比较时的基准集合。
关键信息
- DeepSeek 官方定价页面显示,
deepseek-v4-pro的价格在 75% 促销于 2026-05-31 15:59 UTC 结束后,调整为原价的四分之一。 - 页面列出的 V4-Pro 实际费率为:缓存命中输入 token 每 100 万 0.435,输出 token 每 100 万 $0.87;上下文长度为 100 万,最大输出为 384K。
0.003625,缓存未命中输入 token 每 100 万 - 这是本轮扫描中最强的中国/亚洲 AI 构建者信号:它让一个长上下文推理模型在智能体循环、批量代码分析、重检索工作流以及高频工具调用系统中显著变便宜。
- 注意:文档也说明价格可能变化,DeepSeek 保留调整价格的权利,因此生产团队应该锁定成本监控,而不是把新价格视为永久不变。
来源
- DeepSeek API Docs - Models & Pricing(Crawled May 31, 2026)
2. 2. GitHub Copilot 的 AI-credit 计费成为周末的成本管控演练
编码助手正在从“订阅制心智”转向“按量计费基础设施”。对于任何规模化使用 IDE 智能体或代码审查智能体的公司,这都会改变采购、团队策略和架构选择。
关键信息
- GitHub 文档现在将 Copilot 使用量定义为 AI credits,其中 1 个 AI credit 等于 0.01 美元。
- GitHub 此前已开放 4 月使用报告,让管理员能在 6 月 1 日变更前查看哪些用户、模型和产品入口在驱动 AI-credit 消耗。
- 新的热度来自开发者反应:TechCrunch 在 5 月 30 日报道称,随着团队意识到基于 token 的智能体使用可能把 Copilot 从可预测的席位成本变成云服务式的可变账单,反弹已经明显出现。
- 对运营团队来说,眼下该做的是检查预览报告、设置预算上限、区分重度智能体用户,并在大规模推出 Copilot agents 前,测算长时间运行的编码智能体会话成本。
来源
- GitHub Docs - GitHub Copilot billing(Crawled May 31, 2026)
- TechCrunch - ‘What a joke’: Github Copilot’s new token-based billing spurs consternation among devs(May 30, 2026)
- GitHub Changelog - April reports are now available to prepare for usage-based billing(May 12, 2026)
3. 3. OpenAI 推动 Codex 从编码助手走向远程 Windows 工作站智能体
这对构建者意味着工作流变化:Codex 不再只是编辑代码或运行仓库任务;它正在进入开发者机器上的 GUI 级调试和应用交互。这很强大,但团队在将其常态化之前,需要先建立权限、审计日志和沙箱策略。
关键信息
- OpenAI 的 ChatGPT 发布说明列出了 5 月 29 日的 Codex 更新,其中包括面向符合条件用户的 Codex app Windows Computer Use。
- 该功能让 Codex 可以查看、点击并输入 Windows 应用,同时 Windows 机器仍然承载文件、shell、应用服务器和本地上下文。
- OpenAI 还表示,用户可以从 iOS 或 Android 上的 ChatGPT,或从 Mac 上的 Codex 来引导或继续相关工作,这指向了对依赖桌面的编码和测试会话进行远程监督的方向。
- 上线初期可用范围有限:发布说明称,Windows Computer Use 在 EEA、英国和瑞士不可用。
来源
- OpenAI Help Center - ChatGPT — Release Notes(Updated May 31, 2026; release note dated May 29, 2026)
4. 4. Liquid AI 的 LFM2.5-8B-A1B 延续本地智能体势头
这次发布提醒我们,并非所有有用的 AI 进展都来自巨型托管模型。对于构建私有助手、嵌入式智能体或端侧工作流的创始人来说,小活跃参数 MoE 模型正变得更实用,也更容易部署。
关键信息
- Liquid AI 发布了 LFM2.5-8B-A1B,这是一款面向边缘场景、为本地工具调用构建的 MoE 模型,拥有 128K 上下文窗口,预训练规模从 12T token 提升到 38T token。
- Hugging Face 模型卡列出其总参数为 8.3B、活跃参数为 1.5B、24 层,支持工具使用、结构化输出,并提供 Transformers、vLLM、SGLang、Docker Model Runner、GGUF、ONNX 和 MLX 等部署路径。
- Liquid 称该模型相较 LFM2-8B-A1B,在指令遵循、数学、函数调用和工具使用基准上有大幅提升,但模型卡也提醒,如果没有检索增强,它并不最适合重度编程或知识密集型问答。
- 现在真正值得关注的不是前沿模型竞赛,而是边缘智能体经济性:一个具备长上下文、工具使用能力和多语言分词改进的本地模型,可以为个人助手、机器人、笔记本电脑以及隐私敏感工作流降低对云端的依赖。
来源
- Liquid AI - LFM2.5-8B-A1B: An Even Better On-Device Mixture of Experts(May 28, 2026)
- Hugging Face - LiquidAI/LFM2.5-8B-A1B(Updated May 2026)
5. 5. LlamaIndex LiteParse v2 将文档解析变成本地 Rust 原语
RAG 质量和智能体可靠性常常在推理之前就失败了:抽取效果差、版面信息丢失、OCR 慢、解析只能上云。LiteParse 重要之处在于,它直接攻击了这个不光鲜但成本很高的层。
关键信息
- LlamaIndex 的 LiteParse 仓库将其描述为一个独立的开源文档解析器,可在本地运行,提取带边界框的空间文本,避免依赖专有 LLM/云服务,并支持 Rust、Node/TypeScript、Python 以及浏览器/WASM 使用。
- GitHub 仓库显示,该项目采用 Apache-2.0 许可,支持 PDF、Office 文件和图像等多格式输入,内置 Tesseract OCR,基于 PDFium 进行文本提取,支持截图生成;最新 Node.js v2.0.4 版本发布日期为 2026 年 5 月 30 日。
- 据称 v2.0 的核心变化是用 Rust 重写,并宣称小文档速度最高提升 100 倍,大文档速度接近提升 3 倍;在你自己的语料上完成基准测试前,应将这些数字视为厂商/报道方说法。
- 它之所以热,是因为解析是每一个 RAG、文档智能体和企业知识工作流之前的瓶颈。更快的本地解析可以在调用 LLM 之前,就降低延迟、隐私风险和单文档流水线成本。
来源
- GitHub - run-llama/liteparse(Latest release May 30, 2026)
- KuCoin News / BlockBeats pickup - LlamaIndex Launches LiteParse v2.0, Rewritten in Rust with Speed Improvements of Up to 100x(May 28, 2026)
接下来值得盯的信号
- 核实路由服务和 IDE 工具如何透传 DeepSeek 更新后的 V4-Pro 定价;一些中间商可能滞后于官方费率。
- 在 6 月 1 日计费生效前,导出 Copilot 使用报告,并为重度智能体用户和代码审查工作流设置预算。
- 在团队具备日志记录、密钥隔离和回滚路径之前,只在沙箱或非敏感项目中测试 Codex Windows Computer Use。
- 在你自己的设备类型上基准测试 LFM2.5-8B-A1B;这次发布对本地智能体很有前景,但它并不被定位为重度编码模型或无需检索的知识模型。
- 在替换现有 RAG 摄取流水线之前,用你的真实 PDF、扫描文档和 Office 文件测试 LiteParse;解析质量比标题里的速度数字更重要。
本文由自动化流程基于联网搜索生成,发布前建议抽查关键来源。