这篇文章主要讲解了“编码的类型有哪些”,文中的讲解内容简单清晰,易于学习与理解,下面请大家跟着小编的思路慢慢深入,一起来研究和学习“编码的类型有哪些”吧!
ASCII
ASCII编码,即美国信息交换标准码,是美国制定用来表示128个英文字符的编码。
ASCII 码一共规定了128个字符的编码,只占用了一个字节的后面7位,最前面的一位统一规定为0。
BASE64
BASE64 是一组相似的二进制到文本(binary-to-text)的编码规则,使得二进制数据在解释成 radix-64 的表现形式后能够用 ASCII 字符串的格式表示出来。
BASE64 编码普遍应用于需要通过被设计为处理文本数据的媒介上储存和传输二进制数据而需要编码该二进制数据的场景。这样是为了保证数据的完整并且不用在传输过程中修改这些数据。
BASE64 要求把每三个8Bit的字节转换为四个6Bit的字节(38 = 46 = 24),然后把6Bit再添两位高位0,组成四个8Bit的字节,也就是说,转换后的字符串理论上将要比原来的长1/3。
BCD
BCD编码,全称 Binary-Coded Decimal,简称BCD,又叫二-十进制代码。
BCD编码是一种二进制的编码形式,是用二进制编码的十进制代码。
将一个十进制数存储到计算中时,直接将十进制数转换成对应的BCD编码比将十进制数通过除法取余转成二进制再存储效率要高很多。
UNICODE
Unicode,就像它的名字都所表示的,这是一种统一的对所有符号的编码。
世界上存在着多种编码方式,同一个二进制数字可以被解释成不同的符号。
因此,要想打开一个文本文件,就必须知道它的编码方式,否则用错误的编码方式解读,就会出现乱码。
UNICODE只是一种字符编码的集合,对如何存储却没有明确的规定,UNICODE目前普遍采用的是UCS-2(Unicode Character Set),即两个字节来编码一个字符,但是实际上有些字符可能需要3个字节甚至4个字节才能编码。
UNICODE有Bom头(Byte Order Mark),Bom头就是2个字节,即FF FE,用来表示存储方式是大端还是小端。如果文档开头的2个字节是FF FE,则是小端,FE FF 则是大端。
UTF8
互联网的普及,强烈要求出现一种统一的编码方式。
UTF-8 就是在互联网上使用最广的一种 Unicode 的实现方式。
其他实现方式还包括 UTF-16(字符用两个字节或四个字节表示)和 UTF-32(字符用四个字节表示),不过在互联网上基本不用。
重复一遍,这里的关系是,UTF-8 是 Unicode 的实现方式之一。
UTF-8 最大的一个特点,就是它是一种变长的编码方式。
它可以使用1~4个字节表示一个符号,根据不同的符号而变化字节长度。
UTF-8 的编码规则很简单,只有二条:
1)对于单字节的符号,字节的第一位设为0,后面7位为这个符号的 Unicode 码。因此对于英语字母,UTF-8 编码和 ASCII 码是相同的。
2)对于n字节的符号(n > 1),第一个字节的前n位都设为1,第n + 1位设为0,后面字节的前两位一律设为10。剩下的没有提及的二进制位,全部为这个符号的 Unicode 码。
ANSI
ANSI是美国国家标准学会的编码。严格来说也不是一种编码,而且只存在于windows系统中。
对于英文来说,ANSI代表ASCII编码,对于简体中文来说,ANSI代表GB2312编码(只针对 Windows 简体中文版,如果是繁体中文版会采用 Big5 码)。
GB2312
简体中文常见的编码方式,使用2个字节表示一个汉字,大约可以表示65536个汉字。
感谢各位的阅读,以上就是“编码的类型有哪些”的内容了,经过本文的学习后,相信大家对编码的类型有哪些这一问题有了更深刻的体会,具体使用情况还需要大家实践验证。这里是亿速云,小编将为大家推送更多相关知识点的文章,欢迎关注!
免责声明:本站发布的内容(图片、视频和文字)以原创、转载和分享为主,文章观点不代表本网站立场,如果涉及侵权请联系站长邮箱:is@yisu.com进行举报,并提供相关证据,一经查实,将立刻删除涉嫌侵权内容。