文章库 | 鱼的博客

移动优先 · 随时阅读

工程、AI、产品的实战记录

长篇文章、实战笔记都放在这里，按分类和搜索直接找到需要的内容。

订阅 RSS加到你的阅读器，第一时间收到更新。

添加到主屏，离线也能快速浏览。

显示 120 篇文章

AI 每日大事件May 23, 2026

本次扫描中最值得 AI 构建者关注的信号，是从单智能体演示加速转向智能体基础设施：Google 正围绕 Antigravity 和 Managed Agents 进行整合；开源/本地工具正在把并行编码智能体变成一种工作流；DeepSeek 正在压低推理价格；新的研究也在攻击 Transformer 执行和串行化智能体接口中的更底层瓶颈。主要提醒是：其中多项仍处于早期或特定基准语境中，因此应将它们视为值得测试的强信号，而不是生产优势的证明。

AI 每日大事件May 22, 2026

智能体编码基础设施成为焦点

5 月 22 日前后，面向开发者的 AI 热点活动集中在智能体编码和开发者工作流基础设施：OpenAI 改进了 Codex 的上下文和浏览器循环，Anthropic 修补并扩展了 Claude Code 的后台智能体工作流，Google 的 Gemini 3.5 Flash 推出后仍在 API 和 Copilot 中持续发酵，GitHub 正在把 Copilot 收紧为一个多界面的智能体平台，而 Qwen-Agent 则从中国开源生态带来了新的 MCP 传输更新。

AI 每日大事件May 21, 2026

AI Agent 从聊天走向长时间运行的工作

5 月 21 日前后最强的 AI 信号，是 Agent 基础设施正在变得更坚固：OpenAI 让 Codex 更持久、更具上下文感知能力；Google 继续从 I/O 推动托管式 Agent 运行时；阿里巴巴 Qwen 团队发布了一个面向长周期任务的 Agent 模型；SaaS 厂商则推出 MCP server，让 Agent 能在真实业务系统中执行操作。研究层面的头条是 OpenAI 声称由 AI 生成了对 Erdős 单位距离猜想的反证；这值得注意，因为该结果可由外部检查，并指向能够产出原创、可由专家评审工作的研究型 Agent。

AI 每日大事件May 20, 2026

AI 智能体成为默认交互界面

本轮窗口中最热门的 AI 新闻由一个主题主导：智能体正在成为默认的产品形态。Google 的 I/O 发布潮让 Gemini 3.5 Flash、Antigravity 2.0、Managed Agents、Gemini Omni 和 Gemini for Science 成为开发者关注中心。Alibaba 则以 Qwen3.7-Max 和全栈智能体基础设施推进作出回应。与此同时，开源 Forge 项目也提醒开发者：能实质提升智能体表现的，不只是更大的模型，可靠性层同样关键。

AI 每日大事件May 20, 2026

AI 构建者简报：智能体从演示走向平台

Google I/O 主导了当前 AI 新闻周期：影响最大的几项是 Gemini 3.5 Flash、Antigravity/Managed Agents、Gemini Omni 和 Gemini for Science。本轮扫描中最强的非 Google 技术信号，是 Hugging Face 开源的 Ettin 重排序器家族。今天的主题很清晰：AI 平台正在从聊天和代码补全，走向带执行环境、浏览器/运行时反馈、垂直工具和多模态创作循环的受监督智能体。

AI 每日大事件May 19, 2026

AI 智能体从演示走向可部署基础设施

监测窗口内占主导的 AI 叙事，是 Google I/O 的智能体技术栈：Gemini 3.5 Flash、Antigravity 2.0、Gemini API 中的 Managed Agents、搜索智能体、Gemini Spark 和 Gemini Omni。实际主题很明确：前沿实验室不再只是发布更聪明的聊天模型；它们正在发布可执行的智能体环境、后台任务系统、多模态创作工具和分发入口。在 Google 之外，OpenAI 与 Dell 的 Codex 合作表明，企业智能体部署正转向混合和本地数据环境；而 GitHub 趋势页则显示，开源构建者正在竞相让日常软件和视频工作流变得智能体原生。

AI 每日大事件May 18, 2026

AI Builder 简报：Agent 走向更移动、更视觉化、更本地化

今天最热的开发者信号集中在 Agent 运维和可控媒体上：Codex 正在成为可由移动端编排的编码工作流；Krea 正在把图像生成推向生产级风格控制；开源 Agent 技能正在变成可安装的能力包；视觉 Agent 研究正在加入多模态程序性记忆；本地 TTS 与 CLI harness 则在改善已部署 Agent 的经济性和可靠性。实际主题是：模型层仍然重要，但短期内最大的产品杠杆来自控制界面、可复用技能、本地推理，以及为 Agent 准备好的工具接口。

AI 每日大事件May 16, 2026

AI 开发者简报：编码智能体占据主导

主要扫描目标：洛杉矶时间 2026-05-16 12:00–24:00 前后的全球 AI 事件；仅在某个故事仍在升温或需要一手来源确认时，才向外延展 24 小时。最强的开发者信号压倒性地集中在智能体式编码和智能体基础设施：GitHub 改变 Copilot 的企业默认模型，xAI 进入编码智能体领域，Vercel Labs 试验 agent-first 系统语言，以及多个记忆/运行时项目在填补无状态智能体留下的运营缺口。对中国/亚洲的检查发现窗口期内有 Qwen-Agent 动态，但只是一个小补丁，而非全球顶级事件，因此保留在观察清单中，没有将其提升到更强的技术发布之上。

AI 每日大事件May 16, 2026

AI 日报：连接型助手、编码智能体，以及质量运营的回归

5月16日早间周期的已核验 AI 信息流异常稀疏，并非发布密集型。最强信号包括：OpenAI 正把 ChatGPT 更深地推入需要身份验证的垂直工作流，并切入个人金融；随着编码智能体品类走向标准化，xAI 的 Grok Build 持续获得关注；GitHub 展示了一个具体且具备生产形态的审核智能体工作流；以及 OpenAI 的 GPT-5.5 质量事件凸显，评测如今已是核心运营基础设施。我没有发现足够强的中国/亚洲条目，能在不降低新鲜度、权威性或建设者影响门槛的情况下纳入。

AI 每日大事件May 13, 2026

AI 智能体从演示走向受治理的工作流

这一窗口中最强的信号并不是某个前沿模型的单点发布，而是智能体技术栈正在走向专业化：Notion 在工作空间内新增了智能体平台，OpenAI 解释了让 Codex 在 Windows 上更安全地本地执行的方法，Cloudflare 加固了运行时可靠性，Anthropic 将 Claude 打包进经过批准的业务工作流，而来自字节跳动、阿里巴巴和 DeepSeek 的亚洲信号则显示，开源智能体和商业智能体正在获得实际牵引力。

AI 每日大事件May 13, 2026

AI 构建者简报：智能体平台进入生产工作流

今天最强的 AI 构建者信号集中在智能体执行进入真实生产场景：Android 成为操作系统级智能体平台，OpenAI 的 Daybreak 面向安全软件工作流，GitHub 推出 Copilot 成本控制，UiPath 为编码智能体提供受治理的部署路径，以及 Copilot 审查分流能力改进。共同主线是：前沿不再主要是独立聊天，而是嵌入操作系统、SDLC、计费系统和企业治理中的智能体。

AI 每日大事件May 12, 2026

AI 界面正从聊天走向屏幕、应用和设备

5 月 12 日前后的热门 AI 构建者信号，与其说是某个巨型前沿模型发布，不如说是 AI 正在进入技术栈的哪些位置：Google 正把指针、浏览器、Android 和应用操作变成 agent 界面；OpenBMB 正把高效多模态推理推向消费级设备；OpenAI 的 DALL·E 退役迫使真实生产系统迁移；而 Jotform 这类 SaaS 工具则在让助手成为工作流主场，而不只是聊天附加功能。

AI 每日大事件May 11, 2026

AI 构建者简报：平台访问、智能体电商、更安全的沙箱与 Kernel 自动化

当前最强的 AI 信号，与其说来自某个新的前沿模型，不如说来自生产化：Anthropic 的原生平台进入 AWS 工作流，阿里巴巴把 Qwen 变成淘宝交易智能体，Vercel 为智能体执行代码加固沙箱，FlashInfer/NVIDIA 测试 AI 智能体生成 GPU kernel。共同主题是运营型 AI：身份、计费、审计轨迹、交易闭环、网络隔离和底层性能工作，正在成为真正的竞争界面。

AI 每日大事件May 10, 2026

AI 开发者简报：语音 Agent、算力上限与开放 Agent 工具

5 月 10 日前后最新的高信号 AI 动态，集中在生产基础设施，而不是某个单一的前沿模型重磅发布：实时语音 API、Claude 容量扩张、Workers AI 模型迁移、开源编程安全 harness，以及 Agent 工作流工具。最强的实践主题是：AI 开发者现在正在围绕模型优化操作层，包括速率限制、语音界面、边缘模型目录、安全检查、可复用技能、路由、记忆和垂直工作流模板。

碎碎念May 10, 2026

AI的奇怪悖论

有时候会觉得很奇怪，明明 AI 是为了提高效率而出现的，但有了 AI 之后，人反而越来越忙了。以前我们忙，是因为能力有限，很多事情做不了，或者做起来成本太高，所以选择天然会被过滤掉。你只能做其中几件事，很多想法在脑子里闪一下，也就过去了。但 AI 把这个过滤器打碎了。以前写一篇文章、做一个页面、…

AI 每日大事件May 10, 2026

面向开发者和运营者的热门 AI 事件

今天最强的 AI 信号都面向开发者：实时语音智能体、更便宜的 Gemini 推理、云端编程智能体、Claude Code 容量、开放模型框架支持、智能体式检索研究，以及快速发展的路由/技能基础设施。对创始人和运营者最有用的结论是，行动重心正在从单独的模型发布，转向具备更好运行时、成本、迁移和工作流原语的可部署智能体系统。

AI 每日大事件May 9, 2026

AI 构建者简报：编码 Agent 正在平台化

今天最强的信号是，AI 正在从模型发布转向 Agent 操作界面。Codex、Claude Code、Gemini、Grok、Kimi 和 OpenClaw 都在收敛到同一个构建者问题：如何让模型使用工具、保留状态、跨工作流运行，并保持足够可靠以支撑真实工程和运营。最紧迫的行动大多与迁移有关：如果你使用 OpenAI 编码 Agent，测试 Codex 0.130.0；规划 Gemini Flash-Lite 和 Interactions API 迁移；评估 Grok 4.3 在长上下文/Agent 工作负载上的经济性；并为任何委托式编辑工作流加入验证护栏。

AI 每日大事件May 8, 2026

AI 构建者简报：语音智能体、耐久型智能体基础设施与更便宜的多模态工作流

本期扫描了 2026 年 5 月 8 日前后高信号 AI 来源，优先参考一手发布、文档、基准和代码仓库，而不是泛泛新闻。面向构建者的最强势头集中在实时语音智能体、智能体耐久性、AI 工作区连接器、开放/智能体式编码系统，以及语音基础设施降本。我只在项目仍明显获得关注或需要一手来源确认时纳入超过 12 小时的条目，并将列表聚焦于技术/产品变化，而非政策或融资。

碎碎念May 8, 2026

harmes管理skills的一个机制

记录一下，看到harmes管理skills的一个机制，有个curator的机制，agent空闲2个小时，且距离上次运行超6天，触发一次整理。会做Skills打分，合并重复的Skills, 归档过期的Skills，生成报告

AI 每日大事件May 8, 2026

AI 构建者简报：语音智能体、AI 安全、编码模型集成与开放权重动能

今天最强的 AI 信号高度面向构建者：OpenAI 将实时语音进一步推向完整推理型智能体；Mozilla 发布了一套用于 AI 辅助漏洞发现的具体操作手册；GitHub 在 Copilot CLI 中进一步深化跨模型评审；OpenAI 及硬件合作伙伴继续让 MRC 基础设施处于聚光灯下；Moonshot 的 Kimi K2.6 持续展现来自中国的强劲开放权重动能；Cloudflare 则提升了智能体后端的可观测性。共同主线是：AI 进展正在从单一聊天模型转向生产系统——语音闭环、安全测试框架、编码智能体集成、集群网络、开放权重部署，以及智能体可观测性。