当前位置:首页 > python > 正文内容

python bytes怎么转汉字

zhangsir3年前 (2023-03-27)python223

要将bytes类型的数据转换为汉字,需要先将其解码为字符串,然后再进行汉字编码的转换。


在Python中,常用的汉字编码方式有UTF-8、GBK、GB2312等。因此,需要根据数据的编码方式进行相应的解码和编码操作。


下面是一个示例代码,将UTF-8编码的bytes转换为汉字字符串:

b = b'\xe4\xb8\xad\xe6\x96\x87'
s = b.decode('utf-8')
print(s)

输出结果为:

中文

上面的代码中,bytes类型的变量b表示一个UTF-8编码的字符串,使用decode方法将其解码为字符串变量s,然后直接输出即可。


如果要将其他编码方式的bytes转换为汉字字符串,可以使用相应的解码方式进行解码,例如GBK编码:

b = b'\xd6\xd0\xce\xc4'
s = b.decode('gbk')
print(s)

输出结果为:

中文

然后再使用相应的编码方式进行编码即可。例如,将UTF-8编码的字符串转换为GBK编码的字符串:

s = '中文'
b = s.encode('gbk')
print(b)

输出结果为:

b'\xd6\xd0\xce\xc4'

上面的代码中,将字符串s使用GBK编码方式进行编码,得到了一个bytes类型的变量b,即为GBK编码的字符串。


zhangsir版权c3防采集https://mianka.xyz

扫描二维码推送至手机访问。

版权声明:本文由zhangsir or zhangmaam发布,如需转载请注明出处。

本文链接:https://mianka.xyz/post/148.html

分享给朋友:

“python bytes怎么转汉字” 的相关文章

Python post请求报错 Content type 'application/x-www-form-urlencoded;charset=UTF-8' not supported

Python用post方式请求接口数据的时候,报错:Content type 'application/x-www-form-urlencoded;charset=UTF-8' not supported这是由于没有设置 Content-Typ...

python+selenium元素定位的8种方法

定位元素,selenium提供了8中元素定位方法:(1)find_element_by_id() :html规定,id在html中必须是唯一的,有点类似于身份证号(2)find_element_by_name() :html规定,name用来指定元素的名称,有点类似于人名(3)find_elemen...

python selenium 使用代理ip

代码如下:from selenium import webdriver chromeOptions = webdriver.ChromeOptions() chromeOptions.add_argument("--proxy-serv...

python 使用PIL库进行验证码清晰处理

python 使用PIL库进行验证码清晰处理from PIL import Image import sys import os sys.setrecursionlimit(1000000) pixel_list = []...

python Tesseract 验证码识别训练流程

1、用jTessBoxEditor把要训练样本图片文件合并成tif文件(样本图片一定要为有效的格式图片)点击顶栏的Tools选项,选择Merge TIFF..   进入你要训练的样本图片所在的目录,点击Ctrl+Alt+A,选择所有图片点击打开,然后保存文件名到指定目录,我这里保...

Linux之python版本升级

四、python3升级步骤1、下载安装包wget https://www.python.org/ftp/python/3.8.8/Python-3.8.8.tgz2、解压软件包tar -zxvf Python-3.8.8.tgz3、预编译注意在编译结束后会有提示&quo...