技术交流 – FreeNAS中文网

FreeNAS中文网是一个编程技术交流的平台，欢迎技术员程序猿前来投稿！

扫一扫

扫一扫

首页技术总结正文内容

零代码编程：用ChatGPT爬取网页数据遇到乱码怎么办？

技术总结

更新时间：2024-12-22 17:36:04 15

admin 管理员组

文章数量: 887007

今天用ChatGPT写了一段代码，爬取中文网站数据，提示词如下：

写一段Python程序，爬取网页数据并保存到excel表格。

具体步骤：

打开网站https://www.zhenfund/Case/?id=3，解析源代码；

定位 id="ma_3" 的div元素；

定位其中所有的li元素；

定位li元素中的img 元素，提取alt值作为excel表格第1列；

定位li元素中的a元素，提取href值作为excel表格第2列；

保存excel表格到电脑d盘

注意：alt值里面有些是中文字符，可能在保存到excel表格时出现乱码问题。

程序运行很成功，但是结果里面有很多乱码，这些乱码在源代码都是中文。

把这个问题向ChatGPT反馈，尝试了几种方式来修改，都没有作用。

爬取出来的excel文件，用各种编码都无法正常显示。

那么，应该是源文件的问题了。

看来ChatGPT 不太懂这个问题，于是转而用搜索引擎搜索这个问题，最后找到一个靠谱答案：一般的网站的编码格式都是 UTF-8，所以当你系统的默认编码也是 UTF-8 时，也就是说，你的默认编码方式和目标网站的编码方式一致时，即使不明确设置编码方式，也不会出问题。但是爬取过程中没问题，但是用打开保存好的 csv 文件时出现乱码，这个其实就是源文件的编码方式和 Excel 的解码方式不一致导致的。这种问题解决也很简单，只要在代码中设置一下 encoding 即可。这里建议一种方法，r.encoding = r.apparent_encoding ，这个可以自动推测目标网站的编码格式，省的你自己去一个个设置。

于是，根据这个情况让ChatGPT进行修改：

随后运行成功，不再有任何乱码出现了：

本文标签：乱码代码网页数据 ChatGpt

版权声明：本文标题：零代码编程：用ChatGPT爬取网页数据遇到乱码怎么办？内容由网友自发贡献，该文观点仅代表作者本人，转载请联系作者并注明出处：http://www.freenas.com.cn/jishu/1729014954h1307094.html，本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容，一经查实，本站将立刻删除。

更多相关文章

Twitter网页版怎么登录？详细步骤与常见问题解答

技术总结

1月前

Twitter作为全球知名的社交媒体平台，通过网页版为用户提供了方便的浏览和互动体验。无论是分享日常动态、关注热门话题，还是查看国际资讯，Twitter都能让您第一时间掌握最

新安装的docker daemon.json位置_使用Docker打包代码配置记录

技术总结

1月前

由于需要将环境和代码打包到Docker中放到其他机器运行，又被无情地消耗了一个周末。听闻大佬说，能将别人不懂的东西，使用通俗易懂的语言解释清楚让别人理解，也是一种能力。因此，特作文以记之。基本概念 Docker 包括三个基本概念: 镜像（

Windows 7 英文版操作系统中文软件乱码解决方法

技术总结

1月前

转载自：http:jingyan.baiduarticlee9fb46e1ca8c3c7521f766e0.html Start --> Control Panel --> Clock, Lang

【ChatGPT】入门指南

技术总结

1月前

前言 ChatGPT是什么？ ChatGPT是一个基于GPT-3.5架构的大型语言模型，由OpenAI开发。GPT代表"Generative Pre-trained Transform

Python数据分析案例47——笔记本电脑价格影响因素分析

技术总结

1月前

案例背景博主对电脑的价格和配置一直略有研究，正好最近也有笔记本电脑相关的数据，想着来做点分析吧，写成一个案例。基本上描述性统计，画图&#xf

生成类似激活码的代码（C#)

技术总结

29天前

因为项目中有个类似激活码的东东，然后就自己写了个。昨天去提问，然后结合自己的思想，最后成功了。只是优化还不是很理想，有时候会死循环&#xff0c

ChatGPT基础内容及使用

技术总结

24天前

ChatGPT基础内容及使用 ChatGPT是由OpenAI开发的一个人工智能聊天机器人程序，于2022年11月推出。该程序使用基于GPT-3.5架构的大型语言模型并通过强化学习进行训练。 ChatGPT目前仍以文字方

ChatGPT OpenAI接口调用示例

技术总结

19天前

最近为公司做了一个ChatGPT工具，这里展示一下OpenAI接口的调用前提条件访问OpenAI官网（国内需要翻墙）的账号，需要sk 地址&am

ChatGPT OpenAI | 多线程or多进程批量调用

技术总结

19天前

🔥 本文讲解的使用chatgpt的openai调用，包含单线程、多线程、多进程的批量调用处理数据。至于哪种方法快，说不准，得自己测测&#xff

windows系统开机自启打开指定网页

技术总结

18天前

windows系统开机自启打开指定网页 1、在电脑桌面右击新建快捷方式，输入想要开机打开的网址 2、点击下一步输入自己想要命名的名字 3、使用快捷键winR运行，输入shell:startup&

win7更新错误0x800b0109_Win7系统Windows update更新出现错误代码800b0101怎么办

技术总结

15天前

有不少win7系统用户在进行Windows update更新的时候，总是会遇到各种各样的错误，比如有win7系统用户在更新的时候，出现错误代码800b0101&#xf

ChatGpt翻译指令

技术总结

15天前

中文----->英文 I want you to act as a scientific Chinese-English translator, I will provide you with some paragraphs in

Claude和ChatGPT到底选择谁？用真实数据对比

技术总结

15天前

关于“Claude和ChatGPT到底选择谁的问题”，如果是放到2个月前，我或许会毫不犹豫选择ChatGPT，不过最近Claude的一顿更新，让我一下子

ChatGPT API 学习

技术总结

15天前

参考：从零开始的 ChatGPT API 使用指南，只需三步！ - 知乎 (zhihu) ChatGPT API 是一种由 OpenAI 提供的 API&#xff0

Windows下C++开机启动代码实现 [转]

技术总结

12天前

Windows下C开机启动代码实现 [转] 原文链接：《Windows下C开机启动功能实现》修改“GISRestart”为需要开机自启动的程序名称，然后直接调用函数即可 #include <

ChatGPT 中文版：国内镜像网站推荐【12月持续更新】

技术总结

11天前

一、ChatGPT中文镜像站 ① https:chat.lify.vip 支持GPT4、4o以及o1，支持MJ绘画什么是镜像站镜像站（Mirror Site）是指

自制ChatGPT批量生成文章多线程多Key Python脚本

技术总结

10天前

本文转载自：自制ChatGPT批量生成文章多线程多Key Python脚本更多内容请访问钻芒博客：https:www.zuanmang 简单多线程GPT3.5模型&#xff1

ChatGPT Canvas：交互式对话编辑器

技术总结

10天前

自两年前 ChatGPT 发布以来，主流 AI 均以对话形式进行交互。传统的对话式界面可以直观看到反馈结果，但在需要深度编辑和协作的项目中就略显局限。为了解决此问题，几个月前

mac 完全删除 docker volume_清理 OSX 系统中的 Docker 容器、镜像与数据卷

技术总结

10天前

本站使用「署名 4.0 国际 (CC BY 4.0)」许可协议，欢迎转载、或重新修改使用，但需要注明来源。署名 4.0 国际 (CC BY 4.0) 本文作者: 苏洋创建时间: 2018年07月19日统计字数: 2595字阅读时间: 6

1.初识ChatGPT：AI聊天机器人的革命（110）

技术总结

21小时前

引言在当今的数字化世界中，人工智能（AI）正以其独特的方式重塑我们的生活和工作。其中，AI聊天机器人作为人机交互的前沿技术，已

发表评论

全部评论 0

暂无评论

推荐文章

做系统ghost步骤图解_用好这工具，小孩都能会重装系统！

java与mysql停车管理系统

深度学习段错误（Segment Core Exit code 139）情况记录

为什么计算机无法访问u盘,WIN10系统无法访问U盘怎么处理_win10电脑u盘无法访问拒绝访问如何解决-win7之家...

windows上安装配置openSSH服务

热门文章

openwrt远程控制插件_远程电脑开机的各种方法详细总结（含智能wifi插座+续电器制作）...
1月前
用Ai绘制蓝色渐变字
29天前
低烟无卤电线的产品特点与应用
29天前
Flask成长笔记
29天前
asp毕业设计——基于asp+access的在线考试系统设计与实现（毕业论文+程序源码）——在线考试系统
29天前
vue点击定位到指定位置
28天前
高效软件工程师的六种习惯
28天前
一个web服务端口被塞满的状态
28天前
虚拟机回收空间
28天前
linux制作U盘启动盘无法使用,完美:使用syslinux制作U盘启动盘
18天前

最新文章

Raid技术
8月前
LSI_阵列卡操作手册
8月前
破解Centos7_root用户密码
8月前
Redhat重置Root用户密码方法
8月前
远程批量修改linux服务器密码的脚本
8月前
win7计算机管理中看不到新加的硬盘,win7系统看不到第二块硬盘的解决方法.
1秒前
[转]笔记本电脑处理器(CPU)性能排行榜
1小时前
project安装包的下载和安装教程
1小时前
测试模式 windows2008 内部版本7601
1小时前
如何区分自己的windows系统是正版还是盗版？从零基础到精通，收藏这篇就够了！
1小时前