Anthropic · Claude 4.x · 2026

Anthropic API 完全指南

Claude 是 Anthropic 打造的大语言模型家族——从 Opus 的深度推理到 Haiku 的实时响应。这本手册覆盖从第一个 messages.create 到生产级别的 Tool Use / Vision / Prompt Caching / Extended Thinking / Batch API / Agent SDK——把 Claude 真正用起来、用便宜、用稳定的全部要点。

Messages API Tool Use Vision Prompt Caching Extended Thinking Batch API Agent SDK

10 章 · 深度讲透 200K 上下文 Opus / Sonnet / Haiku

为什么是 Anthropic API

Agent、RAG、代码生成场景的第一梯队选择

Claude 模型以长上下文、指令遵循、工具调用稳定见长——200K 窗口、明显更低的"自信胡说"倾向、可控的 Extended Thinking 推理模式。对 Agent / RAG / 代码生成场景,Claude 是第一梯队选择。

Messages API 一个端点搞定 chat / tool / vision / thinking,独门武器让工程侧事半功倍:Prompt Caching 把 system prompt 命中率拉到 90% 以上、Batch API 直接砍一半价、Computer Use 让 Claude 自己操作屏幕。这门教程不堆 API 文档,而是把"生产级 Claude 应用"需要的每块骨头挨个拆给你看。

课程大纲

10 章 · 从第一次调用到生产部署

Chapter 01 Claude 模型家族与第一次调用 Opus / Sonnet / Haiku 的差异与选型 · API Key 与 SDK 安装 · Messages API 核心结构 · 第一个"Hello Claude" · 计费模型与 token 直觉

Chapter 02 Messages API 深入多轮对话结构 · system prompt · role=user/assistant 的正确姿势 · stop_sequences / max_tokens / temperature / top_p 的实战含义 · 常见错误排查 · token 计数

Chapter 03 流式响应 SSE 事件协议 · message_start / content_block_delta / message_stop · Node.js async iterator 与 Python with 语法 · 中断流的正确姿势 · 流式首 token 延迟优化

Chapter 04 Tool Use 工具调用定义 tool schema · tool_use / tool_result 两次调用模式 · 并行多工具 · tool_choice 强制选择 · JSON 抽取的正解 · Agent loop 的骨架

Chapter 05 Vision 图像理解 base64 / URL 传图 · 多图对比 · 图表与文档 OCR · 图像 + 问答 · 尺寸与 token 消耗估算 · 和 tool_use 组合做结构化抽取

VisionMulti-modal

Chapter 06 Prompt Caching 提示缓存 cache_control 打点机制 · 90% 读折扣 · 5 分钟 / 1 小时 TTL · RAG 长上下文的最佳用法 · 避免"缓存未命中"的 5 个陷阱 · 计费与监控

Chapter 07 Extended Thinking 推理模式 thinking block 结构 · budget_tokens 控制推理长度 · 何时该开、何时不该 · 和 Tool Use / Streaming 的组合规则 · thinking + tool 的经典 agent 模式

ThinkingReasoning

Chapter 08 Batch API 与成本优化半价 Batch 的提交 / 查询 / 取消 · 多模型切换策略 · 限额与重试 · token 审计面板 · 把月账单砍半的组合拳:Batch + Caching + 模型路由

Chapter 09 Agent SDK 与 Computer Use Claude Agent SDK:自动 loop · 内置工具 · Computer Use 让 Claude 操作屏幕 · Skills / MCP 接入 · 本地 vs 托管 agent 的取舍

Chapter 10 生产化:限流、监控、安全 rate limit 分层 · 指数退避与队列 · PII 脱敏 · Prompt Injection 防御 · 评测 / A/B · 和 OpenTelemetry GenAI SemConv 集成 · 真实 SLO 设计

ProductionSafety

学习路径建议

按你的目标挑三到四章,串成闭环

第一次接触 Claude

第 1 章模型家族与第一次调用
第 2 章 Messages API 深入
第 3 章流式响应

读完这三章,就能撑起 80% 的 chatbot 场景。提示词技巧与 prompt/ 教程互为补充。

Agent / RAG 开发者

第 4 章 Tool Use 工具调用
第 6 章 Prompt Caching 提示缓存
第 7 章 Extended Thinking
第 9 章 Agent SDK 与 Computer Use

这四章组合起来就是生产级 AI 应用的骨架——工具调用、长上下文省钱、推理控制、Agent 编排一气呵成。