给 AI 对话做限流:Workers / 会话 / AI Gateway 三层防护
一个公开的 AI 对话接口,不限流就是给钱包开了个无底洞。我用三层互补的限流——请求层防刷、会话层防滥用、网关层兜底花费——把「被薅羊毛」的风险摁住。
AI 工程720

一个公开的 AI 对话接口,不限流就是给钱包开了个无底洞。我用三层互补的限流——请求层防刷、会话层防滥用、网关层兜底花费——把「被薅羊毛」的风险摁住。
AI 工程720

同一套提示词,DeepSeek 和 Gemini 表现出截然不同的「性格」——一个推理欲望强、爱多调工具,一个极度克制、走最短路径。聊聊这两种风格在 RAG 场景下各自要怎么调。
AI 工程620

Agent 的本质不是「让模型无所不知」,而是「让模型学会调用工具」。拆解一个工具驱动的 Agent Loop:调用模型 → 解析工具调用 → 执行 → 带结果再调,循环到收敛,并用最大步数防止贪婪死循环。
AI 工程650

不用任何自建中间件,全栈基于 Cloudflare 原生组件(Workers、D1、R2、AI Search、AI Gateway)搭一个能回答「关于我博客」的 AI Agent。这是一次边缘 Serverless AI 的完整实践。
AI 工程400
