首页技术总结正文内容

【结合OpenAI官方文档】解决Chatgpt的API接口请求速率限制

技术总结

更新时间：2024-12-22 16:52:28 4

admin 管理员组

文章数量: 887007

OpenAI API接口请求速率限制

速率限制以五种方式衡量：RPM（每分钟请求数）、RPD（每天请求数）、TPM（每分钟令牌数）、TPD（每天令牌数）和IPM（每分钟图像数）。

任何选项都可能会达到速率限制，具体取决于首先发生的情况。例如，向 ChatCompletions 端点发送仅包含 100 个令牌的 20 个请求，这将达到限制（如果RPM 为 20），即使在这 20 个请求中没有发送 150k 令牌（如果TPM 限制为 150k）。

其他值得注意的重要事项：

速率限制是在组织级别而不是用户级别施加的。
速率限制因所使用的模型而异。
组织每月可以在 API 上花费的总金额也受到限制。这些也称为“使用限制”。

解决方法

OpenAI Cookbook 有一个Python 笔记本，解释了如何避免速率限制错误，以及一个用于在批处理 API 请求时保持速率限制的示例Python 脚本。

在提供编程访问、批量处理功能和自动社交媒体发布时，考虑只为部分用户启用这些功能。

为了防止自动和大量滥用，请在指定时间范围内（每日、每周或每月）为单个用户设置使用限制。考虑对超出限制的用户实施硬上限或手动审核流程。

方法一：使用指数退避重试

避免速率限制错误的一种简单方法是使用随机指数退避自动重试请求。使用指数退避重试意味着在遇到速率限制错误时执行短暂睡眠，然后重试不成功的请求。如果请求仍然不成功，则增加睡眠长度并重复该过程。这将持续到请求成功或达到最大重试次数为止。这种方法有很多好处：

自动重试意味着您可以从速率限制错误中恢复，而不会崩溃或丢失数据
指数退避意味着您可以快速尝试第一次重试，同时如果前几次重试失败，仍然可以从更长的延迟中受益
在延迟中添加随机抖动有助于同时重试所有命中。

请注意，不成功的请求会影响您的每分钟限制，因此连续重新发送请求将不起作用。

下面是一些使用指数退避的Python解决方案示例。

示例 1：使用 Tenacity 库

Tenacity 是一个 Apache 2.0 许可的通用重试库，用 Python 编写，用于简化向任何事物添加重试行为的任务。要为您的请求添加指数退避，您可以使用tenacity.retry装饰器。下面的示例使用该tenacity.wait_random_exponential函数向请求添加随机指数退避。

from openai import OpenAI
client = OpenAI()

from tenacity import (
    retry,
    stop_after_attempt,
    wait_random_exponential,
)  # 指数退避
 
@retry(wait=wait_random_exponential(min=1, max=60), stop=stop_after_attempt(6))
def completion_with_backoff(**kwargs):
    return client.completions.create(**kwargs)
 
completion_with_backoff(model="gpt-3.5-turbo-instruct", prompt="Once upon a time,")

请注意，Tenacity 库是第三方工具，OpenAI 不保证其可靠性或安全性。

示例 2：使用backoff库

另一个为退避和重试提供函数装饰器的 python 库是backoff：

import backoff 
import openai
from openai import OpenAI
client = OpenAI()

@backoff.on_exception(backoff.expo, openai.RateLimitError)
def completions_with_backoff(**kwargs):
    return client.completions.create(**kwargs)
 
completions_with_backoff(model="gpt-3.5-turbo-instruct", prompt="Once upon a time,")

与 Tenacity 一样，backoff 库是第三方工具，OpenAI 不保证其可靠性或安全性。

示例 3：手动退避实现

如果您不想使用第三方库，您可以按照以下示例实现自己的退避逻辑：

import random
import time
 
import openai
from openai import OpenAI
client = OpenAI()
 
# 定义一个重试装饰器
def retry_with_exponential_backoff(
    func,
    initial_delay: float = 1,
    exponential_base: float = 2,
    jitter: bool = True,
    max_retries: int = 10,
    errors: tuple = (openai.RateLimitError,),
):
    """Retry a function with exponential backoff."""
 
    def wrapper(*args, **kwargs):
        # 初始化变量
        num_retries = 0
        delay = initial_delay
 
        # 循环直到成功响应或达到 max_retries 或引发异常
        while True:
            try:
                return func(*args, **kwargs)
 
            # 重试特定错误
            except errors as e:
                # 增量重试
                num_retries += 1
 
                # 检查是否已达到最大重试次数
                if num_retries > max_retries:
                    raise Exception(
                        f"Maximum number of retries ({max_retries}) exceeded."
                    )
 
                # 增加延迟
                delay *= exponential_base * (1 + jitter * random.random())
 
                time.sleep(delay)
 
            # 针对任何未指定的错误引发异常
            except Exception as e:
                raise e
 
    return wrapper
    
@retry_with_exponential_backoff
def completions_with_backoff(**kwargs):
    return client.completions.create(**kwargs)

同样，OpenAI 不保证该解决方案的安全性或效率，但它可以成为您自己的解决方案的良好起点。

方法二：充分利用max_tokens以匹配您完成的规模

max_tokens您的速率限制是根据您的请求的字符数计算的令牌的最大值和估计数量。尝试将该max_tokens值设置为尽可能接近您的预期响应大小。

批量请求

OpenAI API 对每分钟请求数和每分钟令牌数有单独的限制。

如果您达到了每分钟的请求限制，但每分钟的令牌有可用容量，则可以通过将多个任务批处理到每个请求中来提高吞吐量。这将使您每分钟处理更多令牌，特别是对于我们较小的模型。

发送一批提示的工作方式与普通 API 调用完全相同，只不过您将字符串列表而不是单个字符串传递给提示参数。

没有批处理的示例

from openai import OpenAI
client = OpenAI()
 
num_stories = 10
prompt = "Once upon a time,"
 
# 示例，每个请求完成一个故事
for _ in range(num_stories):
    response = client.completions.create(
        model="curie",
        prompt=prompt,
        max_tokens=20,
    )
    # 输出故事
    print(prompt + response.choices[0].text)

批处理示例

from openai import OpenAI
client = OpenAI()
 
num_stories = 10
prompts = ["Once upon a time,"] * num_stories
 
# 批量示例，每个请求完成 10 个故事
response = client.completions.create(
    model="curie",
    prompt=prompts,
    max_tokens=20,
)
 
# 按索引将完成与提示进行匹配
stories = [""] * len(prompts)
for choice in response.choices:
    stories[choice.index] = prompts[choice.index] + choice.text
 
# 输出故事
for story in stories:
    print(story)

本文标签：速率接口文档官方 OpenAI

版权声明：本文标题：【结合OpenAI官方文档】解决Chatgpt的API接口请求速率限制内容由网友自发贡献，该文观点仅代表作者本人，转载请联系作者并注明出处：http://www.freenas.com.cn/jishu/1724526559h756388.html，本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容，一经查实，本站将立刻删除。

发表评论

全部评论 0

暂无评论

技术交流 – FreeNAS中文网

【结合OpenAI官方文档】解决Chatgpt的API接口请求速率限制

OpenAI API接口请求速率限制

解决方法

方法一：使用指数退避重试

示例 1：使用 Tenacity 库

示例 2：使用backoff库

示例 3：手动退避实现

方法二：充分利用max_tokens以匹配您完成的规模

批量请求

更多相关文章

计算机系统数据保存期限,官方数据：U盘数据通常可以保存多长时间

爆肝一周，我开源了ChatGPT 中文版接口，官方1:1镜像支持全部 官方接口

OpenAI 宣布 ChatGPT GPTs 免费开放

OpenAI ChatGPT 图片生成API

揭开ChatGPT面纱（1）：准备工作（搭建开发环境运行OpenAI Demo）

人工智能 | openai chatgpt 大语言模型

刚刚，ChatGPT变身AI搜索免费用！OpenAI颠覆谷歌，搜索变天了

纯手工获取的WINDOWS 7 32位 SP1后续补丁集ver201509的官方下载地址

分享一篇关于腾讯会议的PRD文档

Windows系统安装和使用PyTorch 0.4.0 （官方已经支持 Windows ）

ChatGPT OpenAI接口调用示例

Word文档复制粘贴内容跳到下一页问题的解决方法

openai visgpt，chatgpt,DALLE2 使用测试

OpenAI震撼发布：桌面版ChatGPT，Windows &amp; macOS双平台AI编程体验！

如何检查笔记本电脑是否支持USB3.0接口_百度知道

使用VBA在Word文档末尾添加空白页

VMware虚拟机安装Win10系统教程【附官方纯净版镜像】

KMS Client Setup Keys 微软官方KMS密钥

★★★HEU_KMS_Activator_v7.5 （附详细说明文档）

OpenAI 发布 o1 Pro 与 ChatGPT Pro：更强大、更智能的 AI 助手

发表评论

推荐文章

2024年Python最全Python 集合之旅(2)

reference to non

Gromacs 分子动力学 远程安装介绍 全网最详细的Gromacs安装前说明 该怎么选择合适的安装方式 Windows直接可用的Gromacs（预编译版）有什么危害？Gromacs安装需要准备什么？

计算机装系统找不到硬盘分区,解决安装系统找不到硬盘的问题（图文）

windows byound compared 授权秘钥被吊销解决办法

热门文章

计算机基础（Windows 10+Office 2016）教程 —— 第5章 文档编辑软件Word 2016（下）

python将一个英文语句以单词为单位逆序排放

图小样本学习方法调研

Windows11中文版ISO镜像下载合集及安装指南

使用 KVM 在 Xubuntu 上创建 Windows 10 虚拟机

window 无法访问docker_windows下docker无法进行端口映射的问题

6款文件恢复软件推荐，电脑小白也能够一人做到电脑数据恢复！

电脑开机键盘鼠标显示器都不亮的解决方法

linux系统 用优盘启动流程,制作u盘启动linux系统

windows系统安装anaconda（包括老版本）

最新文章

Raid技术

LSI_阵列卡操作手册

破解Centos7_root用户密码

Redhat重置Root用户密码方法

远程批量修改linux服务器密码的脚本

win7计算机管理中看不到新加的硬盘,win7系统看不到第二块硬盘的解决方法.

[转]笔记本电脑处理器(CPU)性能排行榜

project安装包的下载和安装教程

测试模式 windows2008 内部版本7601

如何区分自己的windows系统是正版还是盗版 ？从零基础到精通，收藏这篇就够了！

爆肝一周，我开源了ChatGPT 中文版接口，官方1:1镜像支持全部官方接口

OpenAI震撼发布：桌面版ChatGPT，Windows & macOS双平台AI编程体验！

Gromacs 分子动力学远程安装介绍全网最详细的Gromacs安装前说明该怎么选择合适的安装方式 Windows直接可用的Gromacs（预编译版）有什么危害？Gromacs安装需要准备什么？

计算机基础（Windows 10+Office 2016）教程 —— 第5章文档编辑软件Word 2016（下）

linux系统用优盘启动流程,制作u盘启动linux系统

如何区分自己的windows系统是正版还是盗版？从零基础到精通，收藏这篇就够了！