字符数据以ASCII代码值(字节)的形式存储在内存中。所有数据类型都以0和1的二进制代码存储在内存中。这个原则保持不变。
C语言中的Char类型数据就是在字符变量中存储一个字符常量,但它不是将字符本身存储在内存单元中,而是存储该字符对应的ASCII码。存储单元内部。
编码需要2个字节来存储1个汉字。在UTF-8编码中,存储英文字母字符需要1个字节,存储汉字字符需要3到4个字节。UTF-16编码需要2个字节来存储1个英文字母字符或1个汉字。UTF-32编码需要4个字节来存储世界上的每个字符。
扩展信息:
标准ASCII字符集的字符数量有限,通常不足以满足实际应用的要求。你不能。为了实现这一目标,国际标准化组织制定了ISO2022标准。该标准提供了一种将ASCII字符集扩展为8位代码的统一方法,同时保持与ISO646的兼容性。
ISO制定了一系列适用于不同地区的扩展ASCII字符集。每个扩展ASCII字符集最多可以扩展128个字符。这些扩展字符的编码是最高级别的8位编码。位1(或十进制128-255)。它被称为扩展ASCII码。
参考来源:-字符编码
上一篇:字符在内存中以什么形式存放