图像及视频
调用频率控制(Rate Limits)
理解调用频率控制
调用频率控制是指用户 API 在指定时间内访问本平台服务频次的规则。其旨在:
- 防止 API 滥用和误用: 通过设定访问频率上限,限制异常或非预期的请求行为。
- 确保公平的资源分配: 避免少数用户占用过多系统资源,保障所有用户在同等条件下访问服务的权利。
- 保持 API 性能和可靠性: 稳定系统响应时间,降低因过载导致的请求失败率,提升整体接口的服务质量。
- 保护服务的稳定性: 通过频率限制减缓突发访问压力,防止瞬时高并发对系统造成冲击。
调用频率控制指标
对于图像及视频模型主要采用两种调用频率的衡量指标:
- 图像模型采用 IPM(Image Per Minute,即每分钟可生成的图像数量)
- 视频模型采用 RPM (Requests Per Minute,即每分钟的 API 请求次数)
调用频率控制规则
针对不同的模型,本平台根据其计算资源消耗程度,对其调用频率实行差异化的限制策略。
IPM
IPM 限制每分钟可生成的图像数量,具体各模型对应的默认 IPM 值见下方表格。
服务名称 | 模型 API | 用户默认值 |
---|---|---|
文生图 | txt2img_v3 | 10 |
图生图 | img2img_v3 | 10 |
背景移除 | remove_background | 10 |
背景替换 | replace_background | 10 |
文字擦除 | remove_text | 10 |
局部重绘 | inpainting | 10 |
对象擦除 | cleanup | 10 |
人脸融合 | merge_face | 10 |
RPM
RPM 限制每分钟的 API 请求次数,具体各模型对应的默认 RPM 值见下方表格。
服务名称 | 模型 API | 用户默认值 |
---|---|---|
文生视频 | txt2video | 1 |
图生视频 | img2video | 1 |
避免触发调用频率控制
如果您的 API 请求数量超过了调用频率控制,API 将返回:
- HTTP 状态码: 429 Too Many Requests(请求过多)。
- 响应体: 调用频率超出的信息。
为避免触发调用频率控制,您可以采取以下措施:
- 在您的应用中实现请求限制: 根据平台提供的调用频率限制,自行控制客户端的请求速率,避免在短时间内发送过多请求。
- 在重试时使用指数退避机制: 当遇到请求被限制(如 429 错误)时,不要立即重试,而是逐步延长重试间隔时间,以减少对服务的冲击。
- 监控您的 API 使用情况: 持续跟踪并记录您的调用次数、频率和异常响应,及时调整使用策略。
若您已经触发了429错误,您可以尝试以下操作:
- 稍后再试: 等待一段时间后再重试您的请求。
- 优化请求: 根据平台提供的调用频率限制减少请求频率。
- 提高调用频率控制: 如果需要更高的调用频率控制,可以通过下方企业微信联系我们。