给 AI 对话做限流:Workers / 会话 / AI Gateway 三层防护
一个公开的 AI 对话接口,不限流就是给钱包开了个无底洞。我用三层互补的限流——请求层防刷、会话层防滥用、网关层兜底花费——把「被薅羊毛」的风险摁住。
AI 工程720

一个公开的 AI 对话接口,不限流就是给钱包开了个无底洞。我用三层互补的限流——请求层防刷、会话层防滥用、网关层兜底花费——把「被薅羊毛」的风险摁住。
AI 工程720

给 RAG 喂数据有两条路——爬自己的网站,或主动维护干净的 Markdown。我选了后者。因为爬虫抓到的 HTML 混杂着导航、评论、侧边栏,这些噪音会污染向量空间,毁掉召回质量。
AI 工程640

Agent 的本质不是「让模型无所不知」,而是「让模型学会调用工具」。拆解一个工具驱动的 Agent Loop:调用模型 → 解析工具调用 → 执行 → 带结果再调,循环到收敛,并用最大步数防止贪婪死循环。
AI 工程650

个人博客从一个 Koa 单体,长成「API + 前台 SSR + 后台 SPA + 边缘 AI」四个服务。复盘每一步拆分的动因——不是为了微服务而微服务,而是每次都被一个具体痛点推着走。
架构与工程实践450

不用任何自建中间件,全栈基于 Cloudflare 原生组件(Workers、D1、R2、AI Search、AI Gateway)搭一个能回答「关于我博客」的 AI Agent。这是一次边缘 Serverless AI 的完整实践。
AI 工程400

个人项目没有 SRE 团队,但「两眼一抹黑」更危险——尤其当系统里有按量付费的 LLM。聊聊用极低成本给个人项目加上可观测性:托管组件自带的日志、健康检查、用量看板。
架构与工程实践410

后台点一下「AI 管理」就被登出。排查发现是 Worker 回源到国内服务器验 token,触发了 530。解法不是修网络,而是换架构——把 JWT 验签搬到边缘本地做,彻底不回源。
AI 工程410
