要查看Python字符串的编码,可以使用字符串对象的encode()
方法。该方法将字符串编码为指定的编码格式,并返回一个字节数组。可以使用decode()
方法将字节数组解码为字符串。
以下是一个示例:
str = "你好"
encoded_str = str.encode("utf-8")
print(encoded_str) # b'\xe4\xbd\xa0\xe5\xa5\xbd'
decoded_str = encoded_str.decode("utf-8")
print(decoded_str) # 你好
在上述示例中,str
是一个包含中文字符的字符串。使用encode()
方法将其编码为UTF-8格式。编码后的字符串为b'\xe4\xbd\xa0\xe5\xa5\xbd'
,其中\x
表示十六进制值。然后使用decode()
方法将字节数组解码为字符串,并获得原始的中文字符串。
要查看字符串的当前编码格式,可以使用sys.getdefaultencoding()
函数。该函数返回Python解释器当前默认的字符串编码格式。
import sys
print(sys.getdefaultencoding()) # utf-8
上述示例中,sys.getdefaultencoding()
函数返回的是UTF-8编码格式。