夏季指南
首页归档留言关于

# LLM

给 AI 对话做限流:Workers / 会话 / AI Gateway 三层防护

一个公开的 AI 对话接口,不限流就是给钱包开了个无底洞。我用三层互补的限流——请求层防刷、会话层防滥用、网关层兜底花费——把「被薅羊毛」的风险摁住。

2026-05-08AI 工程720

给 AI 对话做限流:Workers / 会话 / AI Gateway 三层防护

DeepSeek vs Gemini:RAG 场景的工具调用风格调优

同一套提示词,DeepSeek 和 Gemini 表现出截然不同的「性格」——一个推理欲望强、爱多调工具,一个极度克制、走最短路径。聊聊这两种风格在 RAG 场景下各自要怎么调。

2026-04-18AI 工程620

DeepSeek vs Gemini:RAG 场景的工具调用风格调优

Tool-driven Agent Loop:让 LLM 只做调度

Agent 的本质不是「让模型无所不知」,而是「让模型学会调用工具」。拆解一个工具驱动的 Agent Loop:调用模型 → 解析工具调用 → 执行 → 带结果再调,循环到收敛,并用最大步数防止贪婪死循环。

2026-01-13AI 工程650

Tool-driven Agent Loop:让 LLM 只做调度

在 Cloudflare Workers 上从零搭一个 RAG + Agent 服务

不用任何自建中间件,全栈基于 Cloudflare 原生组件(Workers、D1、R2、AI Search、AI Gateway)搭一个能回答「关于我博客」的 AI Agent。这是一次边缘 Serverless AI 的完整实践。

2025-09-16AI 工程400

在 Cloudflare Workers 上从零搭一个 RAG + Agent 服务

分类

后端工程 前端工程 AI 工程 云原生与交付 架构与工程实践 工具与效率

热门标签

AI
Docker
架构
命令行
NestJS
Cloudflare Workers
Node.js
TypeScript
CI-CD
安全
Nuxt
前端
RAG
LLM
性能
Vim
效率
Vue
React
Agent

最新文章

Vibe Coding 工程化进阶(四):用 Hooks 给 Agent 上"自动护栏"

2026-06-13

Vibe Coding 工程化进阶(三):用 MCP 给 AI 接上"外部世界"

2026-06-12

Vibe Coding 工程化进阶(二):用 Rules 把团队规范变成 AI 的"条件反射"

2026-06-11

Vibe Coding 工程化进阶(一):用 CLAUDE.md / AGENTS.md 给 AI 装上"项目记忆"

2026-06-10

为开源准备一个项目:README、LICENSE 与最小可复现

2026-06-05

前端工程师的 Vibe Coding 最佳实践(三):质量保障与工程化

2026-06-04

© 2026 Gavin|GitHub |RSS|Sitemap|豫ICP备2022002177号-1