generateContent 和 streamGenerateContent 两个端点。
与 Chat Completions API 的区别
Gemini Generate Content API 使用 Google 官方原生请求格式(contents 字段),而不是 OpenAI 兼容格式(messages 字段)。如果你已经使用 Google Gemini SDK 或熟悉官方 API 格式,可以直接使用此 API 而无需修改请求格式。
申请流程
使用 Gemini Generate Content API 前,请先访问 Gemini Generate Content API 页面,点击 “获取” 按钮来获得请求所需的凭证。 如果尚未登录或注册,会自动跳转到登录页面。首次申请会有免费额度。基本用法
Non-Streaming(非流式)
发送 POST 请求到/v1beta/models/{model}:generateContent:
Streaming(流式)
发送 POST 请求到/v1beta/models/{model}:streamGenerateContent?alt=sse:
支持的模型
| 模型名称 | 说明 |
|---|---|
gemini-2.5-flash | 性价比优秀,适合高数据量低延迟任务 |
gemini-2.5-pro | 最先进的模型,复杂任务深度推理 |
gemini-2.5-flash-lite | 最快最经济的多模态模型 |
gemini-3-flash-preview | 前沿级性能,成本更低 |
gemini-3.1-pro | 先进智能,强大代理和编码能力 |
gemini-2.0-flash | 第二代主力模型 |
高级功能
系统指令
生成配置
JSON 模式
思考模式(Thinking)
支持思考功能的模型(如 gemini-2.5-flash、gemini-2.5-pro)可以启用思考模式:函数调用
多轮对话
图片理解
安全设置
可通过safetySettings 控制内容过滤:
错误处理
| HTTP 状态码 | 含义 |
|---|---|
| 400 | 请求参数无效 |
| 401 | 认证失败,请检查 Token |
| 403 | 内容被安全过滤器拦截 |
| 429 | 请求过于频繁 |
| 500 | 服务器内部错误 |

