为什么需要 编码
电脑存的都是 二进制 的,不编码计算机识别不了
常见编码有如下
ASCII 码
ASCII 码,总共有 128 个,用一个字节的低 7 位表示,0~31 是控制字符如换行回车删除等;32~126 是打印字符,可以通过键盘输入并且能够显示出来
ISO-8859-1
ISO-8859 全称 ISO/IEC 8859 ,是国际标准化组织(ISO)及国际电工委员会(IEC)联合制定的一系列8 位 字符集的标准,现时定义了15个字符集。 向下兼容 ASCII, 不支持中文 !
Unicode
包含世界上所有的字符,是一个字符集。
UTF-8
是Unicode字符的实现方式之一,它使用1-4个字符表示一个符号,根据不同的符号而变化字节长度
UTF-16
使用二或四个字节为每个 字符编码 ,其中大部分汉字采用两个字节编码,少量不常用汉字采用四个字节编码。UTF-16 编码有大尾序和小尾序之别,即 UTF-16BE 和 UTF-16LE,在编码前会放置一个 U+FEFF 或 U+FFFE(UTF-16BE 以 FEFF 代表,UTF-16LE 以 FFFE 代表),其中 U+FEFF 字符在 Unicode 中代表的意义是 ZERO WIDTH NO-BREAK SPACE,顾名思义,它是个没有宽度也没有断字的空白。
GBK /GB2312/GB18030
简称国标,表示汉字。GB2312表示简体中文,GBK/GB18030表示繁体中文,其实就是几个不同的版本而已。