字符数据以ASCII码值的形式存储在内存中,该值是一个字节。所有数据类型都以二进制代码0和1的形式存储在内存中。这个原则不会改变。
在C语言中,char数据就是将一个字符常量放入一个字符变量中,这并不是将字符放入内存单元中,而是将字符对应的ASCII码放入存储中单元。
编码时,1个汉字需要2个字节来存储。在UTF-8编码中,存储一个英文字母字符需要1个字节,存储一个汉字需要3到4个字节。在UTF-16编码中,存储1个英文字母字符或1个汉字需要2个字节。在UTF-32编码中,存储世界上任何字符都需要4个字节。
详细信息:
由于标准ASCII字符集中的字符数量有限,在实际应用中往往难以满足要求。是无能为力。为此,国际标准化组织创建了ISO2022标准,该标准制定了将ASCII字符集扩展为8位代码的统一方法,同时保持与ISO646的兼容性。
ISO已陆续产生了一批适用于不同领域的扩展ASCII字符集。每个扩展ASCII字符集可扩展至128个字符。这些扩展字符的编码是8位代码,高位为1(即十进制数128~255),称为扩展ASCII码。
参考来源:-字符编码
上一篇:虚拟机和主机鼠标切换快捷键
下一篇:字符型数据在内存中的储存形式是