字符数据以ASCII码值的形式存储在内存中,该值是一个字节。所有数据类型都以0和1的二进制代码的形式存储在内存中。这个原则不会改变。
在C语言中,char类型数据就是将字符常量插入存储单元中的字符变量中。
编码时,1个汉字需要2个字节来存储。在UTF-8编码中,存储一个英文字母字符需要1个字节,存储一个汉字需要3到4个字节。在UTF-16编码中,存储1个英文字母字符或1个汉字需要2个字节。在UTF-32编码中,存储世界上所有的字符需要4个字节。
扩展信息:
由于标准ASCII字符集中的字符数量有限,往往无法满足实际应用的要求。为此,国际标准化组织制定了ISO2022标准,该标准建立了将ASCII字符集扩展为8位代码的统一方法,同时保持与ISO646的兼容性。
ISO陆续制定了一批适合不同地区的扩展ASCII字符集。每个扩展ASCII字符集可以扩展128个字符。这些扩展字符的编码是8位代码位1(即十进制数128~255),称为扩展ASCII码。
参考来源:-字符编码
上一篇:字符型数据在内存中的存储形式是
下一篇:字符数据在内存中存储形式