您的位置 首页 php

python3的encode()和decode()

python3的encode()和decode()

在python3的内存中. 在程序运行阶段. 使⽤用的是 unicode 编码.

因为unicode是万国码. 什么内容都可以进行显示. 那么在数据传输和存储的时候由于unicode比较浪费空间和资源.

需要把unicode转存成 utf-8 或者 GBK 进行存储. 怎么转换呢.

python 中可以把⽂字信息进行编码. 编码之后的内容就可以进行传输了了.

编码之后的数据是 bytes 类型的数据.其实啊.还是原来的数据只是经过编码之后表现形式发生了改变而已.

bytes 的表现形式

1.英文 b’nihao’英文的表现形式和 字符串 没什么两样

2.中文 b’\xc4\xe3\xba\xc3’这是一个汉子‘你好’的utf-8的bytes表现形式

字符串在传输时转化为bytes->encode(字符集)来实现。

英⽂编码之后的结果和源字符串一致.

中文编码之后的结果根据编码的不同. 编码结果 也不同.

我们知道.一个中⽂的UTF-8编码是3个字节. 一个GBK的中文编码是2个字节.

编码之后的类型就是bytes类型. 在网络传输和存储的时候我们python是保存和存储的bytes

类型. 那么在对方接收的时候. 也是接收的bytes类型的数据.

我们可以使⽤用decode()来进行解码操作. ->把bytes类型的数据还原回我们熟悉的字符串。

例子:编码和解码的时候都需要制定编码格式.

s = “我是文字”

bs = s.encode(“GBK”) # 我们这样可以获取到GBK的⽂字

# 把GBK转换成UTF-8

# ⾸首先要把GBK转换成unicode. 也就是需要解码

s = bs.decode(“GBK”) # 解码

# 然后需要进行重新编码成UTF-8

bss = s.encode(“UTF-8”) # 重新编码

print(bss)

文章来源:智云一二三科技

文章标题:python3的encode()和decode()

文章地址:https://www.zhihuclub.com/76970.shtml

关于作者: 智云科技

热门文章

网站地图