# Cloudflare Workers

给 AI 对话做限流：Workers / 会话 / AI Gateway 三层防护

一个公开的 AI 对话接口，不限流就是给钱包开了个无底洞。我用三层互补的限流——请求层防刷、会话层防滥用、网关层兜底花费——把「被薅羊毛」的风险摁住。

2026-05-08AI 工程720

给 RAG 喂数据有两条路——爬自己的网站，或主动维护干净的 Markdown。我选了后者。因为爬虫抓到的 HTML 混杂着导航、评论、侧边栏，这些噪音会污染向量空间，毁掉召回质量。

2026-02-10AI 工程640

Agent 的本质不是「让模型无所不知」，而是「让模型学会调用工具」。拆解一个工具驱动的 Agent Loop：调用模型 → 解析工具调用 → 执行 → 带结果再调，循环到收敛，并用最大步数防止贪婪死循环。

2026-01-13AI 工程650

个人博客从一个 Koa 单体，长成「API + 前台 SSR + 后台 SPA + 边缘 AI」四个服务。复盘每一步拆分的动因——不是为了微服务而微服务，而是每次都被一个具体痛点推着走。

2025-10-21架构与工程实践450

不用任何自建中间件，全栈基于 Cloudflare 原生组件（Workers、D1、R2、AI Search、AI Gateway）搭一个能回答「关于我博客」的 AI Agent。这是一次边缘 Serverless AI 的完整实践。

2025-09-16AI 工程400

个人项目没有 SRE 团队，但「两眼一抹黑」更危险——尤其当系统里有按量付费的 LLM。聊聊用极低成本给个人项目加上可观测性：托管组件自带的日志、健康检查、用量看板。

2025-05-22架构与工程实践410

后台点一下「AI 管理」就被登出。排查发现是 Worker 回源到国内服务器验 token，触发了 530。解法不是修网络，而是换架构——把 JWT 验签搬到边缘本地做，彻底不回源。

2025-05-14AI 工程410