UTF-8 编码方案 采用变长编码 1~N方案, 其中英文1个byte
中文3个byte
char[] = ['A','B','中']
utf8 = [41 42 e4 b8 ad]
utf-8: 是将unicode 编码为 byte 序列的方案
中: 4e2d = 0100111000101101
e4 b8 ad = 11100100 10111000 10101101
1110XXXX 10XXXXXX 10XXXXXX
以0为开头的是 英文!(0~127)
110 表示连续2字节表示一个字符
1110 表示连续3字节表示一个字符
11110 表示连续4字节表示一个字符
每个数据字节以 10开头
全国职称计算机考试速成过关系列套装:W .. 定价:¥133 优惠价:¥133.0 更多书籍 | |
全国职称计算机考试速成过关系列套装:W .. 定价:¥124 优惠价:¥124.0 更多书籍 |