
3.6 字符型数据
字符型数据包括字符常量和字符变量。字符型数据在内存中用一个字节来存放,可分为有符号字符型和无符号字符型两类。字符型数据的存储空间和值的范围见表3-3。
表3-3 字符型数据的存储空间和值的范围

1个字节的字符型数据存储的值对应某一个字符的编码值,即该字符编码。常见的字符编码有ASCII、Extended ASCII(EASCII)、ISO-8859-1、ANSI、unicode、GB2312、GBK、UTF-8等。不支持汉字的C语言编译器主要是用ASCII或EASCII,ASCII与EASCII编码表见附录A。
说明:ASCII (American Standard Code for Information Interchange)用7位二进制编码,从0~127,共128个常用字符。EASCII扩展了ASCII码,用8位二进制编码,0~255,共256个常用字符。
3.6.1 字符常量
字符常量是用单引号括起来的一个字符。例如,′a′,′b′,′=′,′+′,′?′,这些都是合法字符常量。在C语言中,字符常量有以下特点。
1)字符常量只能用单引号括起来,不能用双引号或其他括号。
2)字符常量只能是单个字符,不能是字符串。
字符可以是字符集中的任意字符,但数字被定义为字符型之后就不能参与数值运算了。如′5′和5是不同的。′5′是字符常量,一般不能参与算术运算。若非常规的字符与整数运算的话(如:x=10+′5′;),需要把字符转化成其ASCII码再参与运算。
3)′′单引号间不含字符的空字符是不允许使用的,它与′′,′\0′是完全不同的。
3.6.2 转义字符
转义字符是一种特殊的字符常量。转义字符以反斜线"\"开头,后跟一个或几个字符。转义字符具有特定的含义,不同于字符原有的意义,故称“转义”字符。例如,在前面各例题printf函数的格式串中用到的′\n′就是一个转义字符,其意义是“换行”。转义字符主要用来表示那些用一般字符不便于表示的控制代码。
常用的转义字符及其含义,详见表1-1。
广义地讲,C语言字符集中的任何一个字符均可用转义字符来表示。表1-1中的\ddd和\xhh正是因此而提出的。ddd和hh分别为八进制和十六进制表示的ASCII代码。如′\101′表示字母′A′,′\102′表示字母′B′,′\134′表示反斜线,′\x0A′表示换行,′\0′表示空字符或字符串结束标志等。
注意:转义字符也要用单引号括起来,在字符串中的转义字符等都是省略单引号的。
【例3-12】转义字符的使用。

运行结果:
3.6.3 字符变量
字符变量用来存储字符常量,即单个字符。字符变量的类型说明符是char。字符变量类型定义的格式和书写规则都与整型变量相同,如“char a,b;”。
3.6.4 字符数据的存储与使用
每个字符变量都被分配一个字节的内存空间,用以存放一个字符的字符值。字符值一般采用的是字符的ASCII编码值,字符变量中存放的是字符的ASCII编码值,而显示或打印时才会转换成对应的字符或控制功能(如′\n′换行字符产生换行控制效果)。
如x的十进制ASCII码是120,y的十进制ASCII码是121。对字符变量a,b赋予′x′和′y′的值“a=′x′; b=′y′;”。实际上是在a,b两个单元内存放120和121的二进制代码,即a:01111000,b:01111001。
所以也可以把a,b看成是整型量。C语言允许对整型变量赋以字符值,也允许对字符变量赋以整型值。在输出时,允许把字符变量按整型量输出,也允许把整型量按字符量输出,即在输出时按要求转成整数或字符。
整型量为2或4字节量,字符量为单字节量,当整型量按字符型量处理时,只有低8位字节参与处理,如【例3-13】所示。
【例3-13】向字符变量赋以整数。

运行结果:
本程序中定义a,b为字符型,但在赋值语句中赋以整型值。从结果看,a,b值的输出形式取决于printf函数格式串中的格式符,当格式符为"%c"时,对应输出的变量值为字符,当格式符为"%d"时,对应输出的变量值为整数。
【例3-14】字符型值的输出。

运行结果:
本例中,a,b被定义为字符变量并赋予字符值,C语言也允许字符变量参与数值运算,即是用字符的ASCII码参与运算。由于大小写字母的ASCII码相差32,因此运算后把小写字母换成大写字母,然后分别以整型和字符型输出。
3.6.5 字符串常量
字符串常量是由一对双引号括起的字符序列。例如,"CHINA","C program","$12.5"等都是合法的字符串常量。字符串常量和字符常量是不同的量。它们之间主要有以下区别。
1)字符常量由单引号括起来,字符串常量由双引号括起来。
2)字符常量只能是单个字符,字符串常量则可以含一个或多个字符。
3)可以把一个字符常量赋予一个字符变量,但不能把一个字符串常量赋予一个字符变量。在C语言中没有相应的字符串变量,这是与BASIC等语言的不同之处。但是,可以用一个字符数组来存放一个字符串常量。
4)字符常量占一个字节的内存空间。字符串常量占的内存字节数等于字符串中所有字符占的字节数加1。增加的一个字节中存放字符′\0′(ASCII码为0),这是字符串结束的标志。
字符串"C program"在内存中所占的字节(共10个字节)为C program\0。
字符常量′a′和字符串常量"a"虽然都只有一个字符,但在内存中的情况是不同的。′a′在内存中占一个字节,可表示为a;"a"在内存中占二个字节,可表示为a\0。
注意:<string.h>里定义了一系列专门的字符串处理函数,有些函数后续将介绍。