首页技术总结正文内容

python调用ChatGPT4vision api（openai==1.3.6）

技术总结

更新时间：2024-12-22 22:20:01 7

admin 管理员组

文章数量: 887019

写在开始之前

写这篇文章的本意在于一开始搜到了很多调用openai api的文章，但是版本太老，不支持openai更新后的版本了，甄别教程的版本还是花了我很多时间，后面才发现官方文档。所以总之如果科学上网条件允许，建议直接访问openai的官方文档，有非常详细的介绍和直接可使用的代码，包括text2speech，vision等各种功能。

https://platform.openai/docs/overviewhttps://platform.openai/docs/overview

当然如果懒得看英文文档也可以继续浏览啦~）

调用vision API

准备工作

openai账号
注册一个api，记下api key（只能查看一次）
在python环境里下载好openai库

这里我在anaconda里准备了一个python3.9的环境，激活环境后conda install openai即可。（笔者没有考察过openai<1.0对于GPT4的api支持情况，总之新版的调用方式跟之前差别挺大）

conda activate your_env
conda install openai
conda list openai

图片上传与得到结果

准备一张你准备用来上传给api的图片。ChatGPT4 vision api目前支持一张或多张的image_url或base64图片，这里先以image_url为例。

1. 将图片转为公网可访问的url

你需要类似Postimages — 免费图片托管 / 图片上传之类的工具，将你打算传给GPT的图片上传，再把给出的url放到代码里。类似

2. 修改代码

把api key，图片url粘贴到代码里，就可以发送了，会直接打印返回的内容。

from openai import OpenAI

client = OpenAI()
api_key = "这里放你的api key，类似sk-xxx"
max_tokens = 200

client = OpenAI(
    api_key=api_key,
)

chat_completion = client.chatpletions.create(
  model="gpt-4-vision-preview",
  messages=[
    {
      "role": "user",
      "content": [
        {"type": "text", "text": "What’s in this image?"},

        {
          "type": "image_url",
          "image_url": {
            "url": "这里放你的图片url",
          },
        },

      ],
    }
  ],
  max_tokens=max_tokens,
)

print(chat_completion.choices[0].message.content)

base64图片

一种替代的方式是把本地的图片文件转成base64格式（表现为一种很长的字符串），通过请求的方式传给api。代码为

import base64
import requests


api_key = "你的api"

# Function to encode the image
def encode_image(image_path):
  with open(image_path, "rb") as image_file:
    return base64.b64encode(image_file.read()).decode('utf-8')


image_path = "你的本地图片路径"

# Getting the base64 string
base64_image = encode_image(image_path)

headers = {
  "Content-Type": "application/json",
  "Authorization": f"Bearer {api_key}"
}

payload = {
  "model": "gpt-4-vision-preview",
  "messages": [
    {
      "role": "user",
      "content": [
        {
          "type": "text",
          "text": "What’s in this image?"
        },
        {
          "type": "image_url",
          "image_url": {
            "url": f"data:image/jpeg;base64,{base64_image}"
          }
        }
      ]
    }
  ],
  "max_tokens": 300
}

response = requests.post("https://api.openai/v1/chat/completions", headers=headers, json=payload)

print(response.json()['choices'][0]['message']['content'])

你可能会遇到的一些问题

1. api余额不足

可以在https://platform.openai/usage这个页面查看你的余额。不过值得一提的是页面上显示的数字是已用额度/每月限制额度，余额查看在下面的balance里，能看到每一笔充值和剩余情况。

2. 网络连接问题

这个错误的发生可能因人而异，笔者自己做得还挺顺利的）推荐的处理方式有全局加速，添加os.environ["http_proxy"]等等...

本文标签： ChatGPT4vision python api OpenAI

版权声明：本文标题：python调用ChatGPT4vision api（openai==1.3.6）内容由网友自发贡献，该文观点仅代表作者本人，转载请联系作者并注明出处：http://www.freenas.com.cn/jishu/1724990334h845752.html，本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容，一经查实，本站将立刻删除。

更多相关文章

科普：OpenAI为什么没有发布chatGPT中文版官网?

技术总结

2月前

国内用户都一直期盼openai发布中文版chatgpt官网，这个期盼近期可能不会实现，具体原因官方已经给出了解释。目前为止，OpenAI尚未发布中文版的ChatGPT官网的具体原因可能是以下几点： 1.技术挑战：将ChatGPT适配到中

python爬虫之selenium库，浏览器访问搜索页面并提取信息，及隐藏浏览器运行

技术总结

2月前

一、 selenium简介如果链接简单，爬虫可以通过链接用requests库提取页面信息，如爬取豆瓣top250影片信息，链接简单易懂。参考：爬取豆

html5指纹api,头条：如何获取浏览器指纹信息

技术总结

2月前

本文收录于 GitHub 日问: DailyQuestion，内含大厂内推机会、面经大全及若干面试题，每天学习五分钟，一年进入大厂中。大厂面经大全大厂内推由于不同的系统

OpenAI ChatGPT 图片生成API

技术总结

2月前

图像生成了解如何使用 DALL·E 在 API 中。想要在 ChatGPT 中生成图像？前往 chat.openai。介绍图像 API 提供了三种与图像交互的方法： 基于文本提示从头

OpenAI API Key 获取及测试代码示例 | Python ChatGPT API Key

技术总结

2月前

OpenAI API Key 获取实用教程及测试代码示例 | ChatGPT API Key 获取方法详解在人工智能技术飞速发展的今天，OpenAI 的 API 为开发者提供了强大的自然语言处理和生成能力&

揭开ChatGPT面纱（1）：准备工作（搭建开发环境运行OpenAI Demo）

技术总结

2月前

文章目录序言：探索人工智能的新篇章一、搭建开发环境二、编写并运行demo1.代码2.解析3.执行结果本博客的gitlab仓库：地址，本博客对应01文件夹。序言&

Windows10下安装Python+OpenCV

技术总结

1月前

Windows10下安装PythonOpenCV 操作步骤1、安装Python2、安装numpy库3、安装OpenCV 开始之前1、Python 不同版本之间的差异适用于Python 3.0以上版本以及Python

Windows API GetLastError错误代码解释大全(最完整的一篇)

技术总结

1月前

这个也很好获取，循环FormatMessage即可。 0 操作成功完成。 1 函数不正确。 2 系统找不到指定的文件。 3 系统找不到指定的路径。 4 系统无法打开文件。 5 拒绝访问。 6 句柄无效。

大模型：Python调用chatgpt的三种方法

技术总结

1月前

OpenAI 是一个人工智能研究实验室和公司，而 ChatGPT 是 OpenAI 开发的一种基于语言模型的对话系统。ChatGPT 是 OpenAI 在自然语言处理领域的重要成果之一，它使用了大

windows10 Python打包方法——Pyinstaller

技术总结

1月前

目录一、安装二、使用Pyinstaller生成exe 三、显示效果一、安装 1、安装pywin32 下载安装文件：下载适合python版本的pywin32pip命令安装：pip i

qt界面和python怎么交互_Python GUI界面编程-初识

技术总结

1月前

图形用户界面(Graphical User Interface，简称 GUI，又称图形用户接口)是指采用图形方式显示的计算机操作用户界面。与早期计算机使用的命令行界面相比，图形界面对于用户来说在视觉上更易于接受。然而这界面若要通过在显示屏的

openai visgpt，chatgpt,DALLE2 使用测试

技术总结

18天前

网络问题：openai-chatGPT的API调用异常处理官方手册：https:platform.openaidocsapi-reference visgpt gitlab代码 h

如何免费试用OpenAI o1 preview大模型

技术总结

18天前

OpenAI于 2024 年 9 月 12 日推出 o1（以前称为 Strawberry 项目） 。这一系列新推理模型旨在更有效地解决复杂问题。ChatGPT Plus 和 Team 用户可以访问

Windows API开发

技术总结

18天前

1. 什么是Windows API Windows的API（Application Programming Interface，应用程序编程接口），是W

python登录华为路由器

技术总结

15天前

最近工作需要，利用华为路由器和TP-Link交换机，临时搭建了一个基于4G网络的局域网，为了可以在后台及时将流量断开节省流量，特别研究了一下pyhon中

windows+python环境下安装xxx.tar.gz文件

技术总结

13天前

有的时候在windows中，想直接安装下载好的python包参考：https:blog.csdnweixin_38981172articledetails88689143 1、下载想

Python在Windows系统中安装matplotlib

技术总结

10天前

安装matplotlib 1.安装Visual Studio 在Windows中安装matplotlib，首先要安装Visual Studio。点击下载。下载后运行该应用程序。 2.下载matplotlib安装程序

python控制手机模拟器_AppiumDesktop控制手机和安卓模拟器（附视频）

技术总结

10天前

2018.11.14:增加了开启夜神模拟器电脑蓝屏的解决方案。前言： 本期内容如何用AppiumDesktop连接安卓手机和安卓模拟器 AppiumDesktop基本参数的获取方法,及如何驱动安卓设备 AppiumD

哈工大LTP：Windows系统Python本地调用

技术总结

1天前

本文实验环境为64位win10系统，python3.6.2，LTP项目文件和模型文件使用的3.3.1版本 1.LTP下载（1）LTP项目文件ltp-3.3.1-win-x86.zip（下载链接）（2）LTP模型文件3.3.1（下载链接

windows安装python的包管理器poetry

技术总结

20小时前

参考stackoverflow的老哥：https:stackoverflowquestions67813396modulenotfounderror-no-module-named-poetry-cons

发表评论

全部评论 0

暂无评论

技术交流 – FreeNAS中文网

python调用ChatGPT4vision api（openai==1.3.6）

写在开始之前

调用vision API

准备工作

图片上传与得到结果

base64图片

你可能会遇到的一些问题

更多相关文章

科普：OpenAI为什么没有发布chatGPT中文版官网?

python爬虫之selenium库，浏览器访问搜索页面并提取信息，及隐藏浏览器运行

html5指纹api,头条：如何获取浏览器指纹信息

OpenAI ChatGPT 图片生成API

OpenAI API Key 获取及测试代码示例 | Python ChatGPT API Key

揭开ChatGPT面纱（1）：准备工作（搭建开发环境运行OpenAI Demo）

Windows10下安装Python+OpenCV

Windows API GetLastError错误代码解释大全(最完整的一篇)

大模型：Python调用chatgpt的三种方法

windows10 Python打包方法——Pyinstaller

qt界面和python怎么交互_Python GUI界面编程-初识

openai visgpt，chatgpt,DALLE2 使用测试

如何免费试用OpenAI o1 preview大模型

Windows API开发

python登录华为路由器

windows+python环境下安装xxx.tar.gz文件

Python在Windows系统中安装matplotlib

python控制手机模拟器_AppiumDesktop控制手机和安卓模拟器（附视频）

哈工大LTP：Windows系统Python本地调用

windows安装python的包管理器poetry

发表评论

推荐文章

windows下安装Elasticsearch7.X，IK分词器

android 电脑文件放到模拟器指定位置

iPhone序列号查询的4个常用方法，赶快get起来！

VMware虚拟机安装Win7专业版详细教程（附镜像包）

windows十大常见解决问题

热门文章

dell r230u盘启动安装2008_制作 macOS Mojave U盘USB启动安装盘方法教程 (全新安装 Mac 系统)...

制作U盘启动盘并用Ghost备份系统

Windows四大傻X功能——那些拖慢系统性能的罪魁祸首

低烟无卤电线的产品特点与应用

流量卡套餐解析：网上申请的短期套餐到底是多久呢？

关于C语言CodeBloks的ignore模板

小白一枚，记录研究生期间深度学习CV方向的点滴感悟

Windows - 隐藏底部任务栏日期和时间（最右侧日期时间星期）

word-重复表格标题

windows10企业版 ltsc系统的激活

最新文章

Raid技术

LSI_阵列卡操作手册

破解Centos7_root用户密码

Redhat重置Root用户密码方法

远程批量修改linux服务器密码的脚本

最新Windows 11教育版下载：专为教育设计的系统！

Win7系统下搭建NFS服务器

零基础使用UltraISO制作并安装纯净Win10系统指南

苹果电脑windows系统换苹果系统

Win11系统崩溃错误修复指南：三种实用方法详解