Python任意字符集转换

发布时间：2020-07-01 17:31:19 阅读：584 作者：杨云1028 栏目：编程语言

Python开发者专用服务器限时活动，0元免费领，库存有限，领完即止！点击查看>>

在python处理文本的过程中，经常会有文本字符集转换的情况，
而我们希望用一个方法，不用关心文本原本的字符集是什么样的，直接转换成想要的任何字符集就可以了。

方法一：

import chardet  
def convert_encoding(data,new_coding='UTF-8'):
  # 任意字符集转换
  encoding = chardet.detect(data)['encoding']
  if new_coding.upper() != encoding.upper():
    data  = data.decode(encoding,data).encode(new_coding)
  return data

方法二：

import icu  
def convert_encoding2(data,new_coding='UTF-8'):

  encoding = icu.CharsetDetector(data).detect().getName()  
  # encoding = chardet.detect(content)['encoding']
  if new_coding.upper() != encoding.upper():
    # data  = data.decode(encoding,data).encode(new_coding)
    data = unicode(data,coding).encode(new_coding)
  return data

方法三：

import cchardet
def convert_encoding3(data,new_coding='UTF-8'):
  encoding = cchardet.detect(data)['encoding']
  if new_coding.upper() != encoding.upper():
    data  = data.decode(encoding,data).encode(new_coding)
  return data

使用方法：

此处使用方法一

#转换成utf-8
convert_encoding(data,'utf-8')

#转抱成GBK  
convert_encoding(data,'gbk')

#转抱成GB2312
convert_encoding(data,'gbk')

亿速云「云服务器」，即开即用、新一代英特尔至强铂金CPU、三副本存储NVMe SSD云盘，价格低至29元/月。点击查看>>

向AI问一下细节

Python任意字符集转换

方法一：

方法二：

方法三：

使用方法：

猜你喜欢

最新资讯

相关推荐

开发者交流群：

相关标签