首页技术总结正文内容

ChatGPT OpenAI | 多线程or多进程批量调用

技术总结

更新时间：2024-12-22 16:37:07 3

admin 管理员组

文章数量: 887006

🔥 本文讲解的使用chatgpt的openai调用，包含单线程、多线程、多进程的批量调用处理数据。至于哪种方法快，说不准，得自己测测，我觉得多线程就ok了，因为只是调用😄

文章目录

1、单线程批量处理
2、多线程批量处理
3、多进程批量处理

1、单线程批量处理

import openai
openai.api_key = 'sk-xxx'
import time

# 定义预测函数
def predict(prompt):

    # 请求返回结果
    # model：调用的模型名称，是一个字符串，用最新模型直接设置成gpt-3.5-turbo
    # messages：请求的文本内容，是一个列表，列表里每个元素类型是字典
    # role:system：设置gpt人设。
    # role:assistant：表示gpt。
    # role:user：表示用户。
    retry_count = 100
    retry_interval = 1
    for _ in range(retry_count):
        try:
            response = openai.ChatCompletion.create(
                model="gpt-3.5-turbo",
                messages=[{"role": "system", "content": "算法工程师"},
                          {"role": "user", "content": prompt}],
                temperature=0
            )

            # 抽出gpt答复的内容
            msg = response.choices[0].message["content"].strip()
            return msg
        except openai.error.RateLimitError as e:
            print("超出openai api 调用频率：", e)
            print('重新请求....')
            retry_count += 1
            retry_interval *= 2  # 指数退避策略，每次重试后加倍重试间隔时间
            time.sleep(retry_interval)
        except Exception as e:
            print("任务执行出错：", e)
            print('重新请求....')
            retry_count += 1
            retry_interval *= 2  # 指数退避策略，每次重试后加倍重试间隔时间
            time.sleep(retry_interval)
def main():
    start_time = time.time()


    prompt = """请用少于5个字回答问题：{}"""
    input_data = ['1+1等于几啊？', '2+2等于几啊？', '3+3等于几啊？', '4+4等于几啊？']
    all_res = []
    for query in input_data[:1]:
        res = predict(prompt.format(query))
        all_res.append(res)
        time.sleep(1)



    end_time = time.time()
    total_run_time = round(end_time-start_time, 3)
    print('Total_run_time: {} s'.format(total_run_time))

    print('chatgpt answer: ', all_res)


if __name__ == "__main__":
    main()

2、多线程批量处理

import openai
openai.api_key = 'sk-xxx'

from concurrent.futures import ThreadPoolExecutor, as_completed
import time
import collections


# 定义预测函数
def predict(params):
    prompt, query = params
    prompt = prompt.format(query)

    # 请求返回结果
    # model：调用的模型名称，是一个字符串，用最新模型直接设置成gpt-3.5-turbo
    # messages：请求的文本内容，是一个列表，列表里每个元素类型是字典
    # role:system：设置gpt人设。
    # role:assistant：表示gpt。
    # role:user：表示用户。
    retry_count = 100
    retry_interval = 1
    for _ in range(retry_count):
        try:
            response = openai.ChatCompletion.create(
                model="gpt-3.5-turbo",
                messages=[{"role": "system", "content": "算法工程师"},
                          {"role": "user", "content": prompt}],
                temperature=0
            )
            # 抽出gpt答复的内容
            msg = response.choices[0].message["content"].strip()
            return query, msg

        except openai.error.RateLimitError as e:
            print("超出openai api 调用频率：", e)
            print('重新请求....')
            retry_count += 1
            retry_interval *= 2 # 指数退避策略，每次重试后加倍重试间隔时间
            time.sleep(retry_interval)


        except TimeoutError:
            print("任务执行超时：", query)
            print('重新请求....')
            retry_count += 1
            retry_interval *= 2  # 指数退避策略，每次重试后加倍重试间隔时间
            time.sleep(retry_interval)

        except Exception as e:
            print("任务执行出错：", e)
            print('重新请求....')
            retry_count += 1
            retry_interval *= 2  # 指数退避策略，每次重试后加倍重试间隔时间
            time.sleep(retry_interval)

    return query,'api请求失败'


def main():
    start_time = time.time()
    # 多线程并行预测
    # 您可能需要根据自己的需求调整间隔时间。另外，您可以根据需要调整线程池的大小，以获得更好的性能。
    prompt = """请用少于5个字回答问题：```{}```"""
    input_data = ['1+1等于几啊？', '2+2等于几啊？', '3+3等于几啊？', '4+4等于几啊？']
    output_data = []
    with ThreadPoolExecutor(max_workers=3) as executor:
        ## 同步调用.submit之后直接.result（一个进程执行完才能下一个进程）
        # output_data = [executor.submit(predict, prompt.format(query)).result() for query in input_data]

        # # 异步调用（多进程并发执行）
        # futures = [executor.submit(predict, prompt.format(query)) for query in input_data]
        # query2res = collections.defaultdict(int)
        # # 同步等待结果（返回顺序和原数据顺序一致）
        # for job in futures:
        #     query, res = job.result(timeout=None)  # 默认timeout=None，不限时间等待结果
        #     query2res[query] = res
        #
        #     time.sleep(1)  # 为了避免超过OpenAI API的速率限制，每次预测之间间隔1秒


        # 异步调用（多进程并发执行）
        futures = [executor.submit(predict, (prompt, query)) for query in input_data]
        query2res = collections.defaultdict(int) # 因为异步等待结果，返回的顺序是不定的，所以记录一下进程和输入数据的对应
        # 异步等待结果（返回顺序和原数据顺序可能不一致） ，直接predict函数里返回结果？
        for job in as_completed(futures):
            query,res = job.result(timeout=None)  # 默认timeout=None，不限时间等待结果
            query2res[query] = res


            time.sleep(1)  # 为了避免超过OpenAI API的速率限制，每次预测之间间隔1秒


    end_time = time.time()
    total_run_time = round(end_time-start_time, 3)
    print('Total_run_time: {} s'.format(total_run_time))
    print(query2res)

    import pandas as pd
    df = pd.DataFrame({'query': list(query2res.keys()), 'infer_result': list(query2res.values())})
    df.to_excel('./chatgpt_infer_result.xlsx', index=False)

if __name__ == "__main__":
    main()

3、多进程批量处理

import openai
openai.api_key = 'sk-xxx'

from concurrent.futures import ProcessPoolExecutor, as_completed
import time
import collections


# 定义预测函数
def predict(params):
    prompt, query = params
    prompt = prompt.format(query)

    # 请求返回结果
    # model：调用的模型名称，是一个字符串，用最新模型直接设置成gpt-3.5-turbo
    # messages：请求的文本内容，是一个列表，列表里每个元素类型是字典
    # role:system：设置gpt人设。
    # role:assistant：表示gpt。
    # role:user：表示用户。
    retry_count = 100
    retry_interval = 1
    for _ in range(retry_count):
        try:
            response = openai.ChatCompletion.create(
                model="gpt-3.5-turbo",
                messages=[{"role": "system", "content": "算法工程师"},
                          {"role": "user", "content": prompt}],
                temperature=0
            )
            # 抽出gpt答复的内容
            msg = response.choices[0].message["content"].strip()
            return query, msg

        except openai.error.RateLimitError as e:
            print("超出openai api 调用频率：", e)
            print('重新请求....')
            retry_count += 1
            retry_interval *= 2 # 指数退避策略，每次重试后加倍重试间隔时间
            time.sleep(retry_interval)


        except TimeoutError:
            print("任务执行超时：", query)
            print('重新请求....')
            retry_count += 1
            retry_interval *= 2  # 指数退避策略，每次重试后加倍重试间隔时间
            time.sleep(retry_interval)

        except Exception as e:
            print("任务执行出错：", e)
            print('重新请求....')
            retry_count += 1
            retry_interval *= 2  # 指数退避策略，每次重试后加倍重试间隔时间
            time.sleep(retry_interval)

    return query,'api请求失败'


def main():
    start_time = time.time()
    # 多进程并行预测
    # 您可能需要根据自己的需求调整间隔时间。另外，您可以根据需要调整进程池的大小，以获得更好的性能。
    prompt = """请用少于5个字回答问题：{}"""
    input_data = ['1+1等于几啊？', '2+2等于几啊？', '3+3等于几啊？', '4+4等于几啊？']
    # output_data = []

    # output_data = collections.defaultdict(int)
    with ProcessPoolExecutor(max_workers=2) as executor:
        ## 同步调用.submit之后直接.result（一个进程执行完才能下一个进程）
        # output_data = [executor.submit(predict, prompt.format(query)).result() for query in input_data]

        # # 异步调用（多进程并发执行）
        # futures = [executor.submit(predict, prompt.format(query)) for query in input_data]
        # query2res = collections.defaultdict(int)
        # # 同步等待结果（返回顺序和原数据顺序一致）
        # for job in futures:
        #     query, res = job.result(timeout=None)  # 默认timeout=None，不限时间等待结果
        #     query2res[query] = res
        #
        #     time.sleep(1)  # 为了避免超过OpenAI API的速率限制，每次预测之间间隔1秒


        # 异步调用（多进程并发执行）
        futures = [executor.submit(predict, (prompt, query)) for query in input_data]
        query2res = collections.defaultdict(int) # 因为异步等待结果，返回的顺序是不定的，所以记录一下进程和输入数据的对应
        # 异步等待结果（返回顺序和原数据顺序可能不一致） ，直接predict函数里返回结果？
        for job in as_completed(futures):
            query,res = job.result(timeout=None)  # 默认timeout=None，不限时间等待结果
            query2res[query] = res


            time.sleep(1)  # 为了避免超过OpenAI API的速率限制，每次预测之间间隔1秒



    end_time = time.time()
    total_run_time = round(end_time-start_time, 3)
    print('Total_run_time: {} s'.format(total_run_time))
    print(query2res)

    import pandas as pd
    df = pd.DataFrame({'query': list(query2res.keys()), 'infer_result': list(query2res.values())})
    df.to_excel('./chatgpt_infer_result.xlsx', index=False)





if __name__ == "__main__":
    main()

本文标签：多线程批量进程 ChatGpt OpenAI

版权声明：本文标题：ChatGPT OpenAI | 多线程or多进程批量调用内容由网友自发贡献，该文观点仅代表作者本人，转载请联系作者并注明出处：http://www.freenas.com.cn/jishu/1733208118h1560946.html，本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容，一经查实，本站将立刻删除。

发表评论

全部评论 0

暂无评论

技术交流 – FreeNAS中文网

ChatGPT OpenAI | 多线程or多进程批量调用

文章目录

1、单线程批量处理

2、多线程批量处理

3、多进程批量处理

更多相关文章

ChatGPT吐槽式自评

人工智能 | openai chatgpt 大语言模型

大模型：Python调用chatgpt的三种方法

ChatGPT新手指南-2024.9.25

（转）[教程] G2 的一些问题解决方案，比如GPRS，联系人添加进程终止。GPRS, 问题解决, 联系人, 进程, 方案 ...

刚刚，ChatGPT变身AI搜索免费用！OpenAI颠覆谷歌，搜索变天了

ChatGPT结合Excel与VBA：迈向AI办公智能化与高效化

查看windows服务进程对应服务名称及常见服务描述

操作系统实验（五） Windows中进程的创建、运行和终止

Claude 与 ChatGPT：哪个更适合学术写作，深入对比分析

OpenAI 推出新网络爬虫GPTBot，为GPT-5做准备

UE5+ChatGPT实现3D AI虚拟人综合实战

Open WebUI | 自托管的 ChatGPT 网站

OpenAI震撼发布：桌面版ChatGPT，Windows &amp; macOS双平台AI编程体验！

【Windows系统】查询特定进程TCP端口

如何使用ChatGPT进行情感分析

ChatGPT高效提问—prompt常见用法（续篇九）

ChatGPT资源合集

1.初识ChatGPT：AI聊天机器人的革命（110）

windows7 找不到w3wp.exe 进程

发表评论

推荐文章

关于win10密钥

win7 系统强制关机后部分软件无法启动

百度网盘东西没了 然后被塞满了动作片

【Node.js】Node 环境下载与安装教程（Windows系统）

windows创建隐藏用户及后门

热门文章

Windows Service Wrapper

电脑仅一个C盘如何重装系统？超简单教程分享！

Linux笔记（7 8 9 10 11 12）

人工智能和python之间有什么联系？为何用python？

CHC5223 Data Structures and Algorithms代码实现

vue点击定位到指定位置

【论文泛读】Joint Visual

化妆品区块链溯源：企业口碑建设的中坚力量

Windows不用虚拟机或双系统，轻松实现linux shell环境：gitforwindows

ChatGPT论文润色：一键提升学术写作质量的智能助手

最新文章

Raid技术

LSI_阵列卡操作手册

破解Centos7_root用户密码

Redhat重置Root用户密码方法

远程批量修改linux服务器密码的脚本

[转]笔记本电脑处理器(CPU)性能排行榜

project安装包的下载和安装教程

测试模式 windows2008 内部版本7601

如何区分自己的windows系统是正版还是盗版 ？从零基础到精通，收藏这篇就够了！

windows下查看系统证书（一）

OpenAI震撼发布：桌面版ChatGPT，Windows & macOS双平台AI编程体验！

百度网盘东西没了然后被塞满了动作片

如何区分自己的windows系统是正版还是盗版？从零基础到精通，收藏这篇就够了！