该楼层疑似违规已被系统折叠隐藏此楼查看此楼
以下是我本人通过实例得出的结论,没有参照任何参考书。可能有不对的地方。
哪里不对,情各位大虾指正。
在说明之前,本人编写了一个小代码。
#include
#include
intmain()
{
chara[10];
strcpy(a,"你好吗");
for(inti=0;i<10;i++)
printf("%X",(unsignedchar)a[i]);
printf("\n");
puts(a);
printf("\n");
return0;
}
大家可以调试运行一下。
输出结果是。
C4E3BAC3C2F00CCCCCC
你好吗
Pressanykeytocontinue
字符串a中存放了3个汉字,每个char是占用一个字节。
在C语言中汉字采用的是gb2312编码,每个汉字占两个字节。
printf("%X",(unsignedchar)a[i]);
输出了每个char地址存放的数据的16进制码。
两个char地址存放一个汉字。
所以
你=====C4E3
好=====BAC3
吗=====C2F0
最后由于是一个字符串。在该字符串的结尾又另外存放了一个\0,表示字符串结束。
程序开头声明了chara[10];十个字符空间。
对于没有存放数据的3个char空间默认存放了CC。
a[0]表示的是“你”的gb2312编码的高八位
a[1]表示的是“你”的gb2312编码的低八位
a[2]表示的是“好”的gb2312编码的高八位
a[3]表示的是“好”的gb2312编码的低八位
a[4]表示的是“吗”的gb2312编码的高八位
a[5]表示的是“吗”的gb2312编码的低八位
a[0]表示的是“\0”的gb2312编码的ASCCII编码
其实gb2312兼容是ASCII编码。对于英文字符和中文字符同时具有的字符串。
请看下面这个例子。
#include
#include
intmain()
{
chara[20];
strcpy(a,"你好吗mylove");
for(inti=0;i<20;i++)
printf("%X",(unsignedchar)a[i]);
printf("\n");
puts(a);
printf("\n");
return0;
}
输出结果
C4E3BAC3C2F06D796C6F76650CCCCCCCCCCCCCC
你好吗mylove
从输出结果中我们可以看出总共使用了13个字节。
其中“你好吗”占用6个字节
“mylove”占用6个字节。
字符串结束符占用1个字节。。
这样大家对C语言中汉字的存储是不是很清晰的了解了呢?
下面看C语言中汉字的输入。
在头文件#include
中的gets()可以实现汉字的输入。同样是gb2312码的输入。gb2312兼容了ASCII编码。
好了,就写这些了。我的QQ号791808990
换用大家来交流。