转义序列
转义序列以反斜杠 \ 开头,用于表示无法直接输入或显示的字符,如换行、制表符、反斜杠本身等。C99 支持简单转义、八进制转义和十六进制转义三种形式,是处理字符串和字符时不可或缺的工具。
简单转义序列
最常用的转义字符:
| 转义序列 | 含义 | ASCII 码 |
|---|---|---|
\n | 换行(Newline) | 10 |
\t | 水平制表符(Tab) | 9 |
\r | 回车(Carriage Return) | 13 |
\\ | 反斜杠 | 92 |
\' | 单引号 | 39 |
\" | 双引号 | 34 |
\0 | 空字符(Null) | 0 |
\a | 警报/响铃(Alert/Bell) | 7 |
\b | 退格(Backspace) | 8 |
\f | 换页(Form Feed) | 12 |
\v | 垂直制表符(Vertical Tab) | 11 |
\? | 问号 | 63 |
printf("Line1\nLine2\n"); /* \n 换行 */
printf("Name:\tAlice\n"); /* \t 制表对齐 */
printf("He said \"Hello\"\n"); /* \" 双引号 */
printf("Path: C:\\Users\\Alice\n"); /* \\ 反斜杠 */
\? 很少使用,它的存在是为了避免三字符组(Trigraphs)的歧义。在标准 C 代码中,??= 会被预处理为三字符组 #,所以 What??! 实际变成 What|,写 What?\?! 可以避免这个问题。
八进制转义
\ 后跟 1–3 位八进制数字,表示对应 ASCII 码的字符:
char a = '\101'; /* 八进制 101 = 十进制 65 = 'A' */
char b = '\102'; /* 'B' */
char c = '\07'; /* 响铃(BEL) */
char d = '\0'; /* 空字符 */
printf("%c %c\n", a, b); /* 输出 A B */
八进制转义最多 3 位数字,范围 \0 到 \377(十进制 0–255)。如果数字不足 3 位,在遇到非八进制数字时结束:
"\1234" /* \123 是一个字符('S'),4 是普通字符 */
"\12 3" /* \12 是一个字符,空格和 3 是普通字符 */
十六进制转义
\x 后跟任意数量的十六进制数字,表示对应 ASCII 码的字符:
char a = '\x41'; /* 十六进制 41 = 十进制 65 = 'A' */
char b = '\x42'; /* 'B' */
char c = '\x7'; /* 响铃(BEL) */
char d = '\x0'; /* 空字符 */
/* 在字符串中使用 */
char *hex_str = "\x48\x65\x6C\x6C\x6F"; /* "Hello" */
十六进制转义不像八进制那样有固定长度限制,它会读取所有连续的十六进制数字。这可能导致意外:
"\xABCD" /* \xABCD 是一个字符(如果值在 char 范围内) */
"\x41B" /* \x41B 是一个字符,不是 'A' + 'B'! */
/* 安全做法:用字符串拼接分隔 */
"\x41" "B" /* 'A' 和 'B' 两个字符 */
实际应用
格式化输出:
printf("Name\tAge\tScore\n"); /* 制表对齐 */
printf("Alice\t25\t90\n");
printf("Bob\t30\t85\n");
多行字符串:
/* 使用 \n 换行 */
char *poem = "Roses are red\nViolets are blue\nC is great\nAnd so are you";
printf("%s\n", poem);
/* 使用 \ 行连接(注意:下一行必须从行首开始,否则空格会被包含) */
char *long_str = "This is a very long string that \
spans multiple lines in the source code";
不可打印字符:
char bell = '\a'; /* 响铃 */
char backspace = '\b'; /* 退格 */
char formfeed = '\f'; /* 换页 */
printf("Beep!\a\n"); /* 某些终端会发出声音 */
字符串中的空字符:
char data[] = "Hello\0World";
printf("%s\n", data); /* 输出 Hello,\0 终止字符串 */
printf("%c\n", data[6]); /* 输出 W(\0 后面的字符) */
常见错误
混淆字符和字符串:
char c = "\n"; /* 警告:用字符串初始化 char */
/* 实际存储的是指针的低字节 */
char correct = '\n'; /* 正确:字符常量 */
八进制转义的意外截断:
"\1234" /* \123 是一个字符,4 是另一个字符 */
/* 不是值为 1234 的字符! */
十六进制转义过度消费:
"\x41BC" /* \x41BC 是一个字符(如果值有效) */
/* 不是 "ABC"! */
/* 正确做法 */
"\x41\x42\x43" /* 三个字符 A、B、C */
反斜杠在行末:
char *s = "Hello \
World"; /* 错误:缩进空格被包含在字符串中 */
char *t = "Hello \
World"; /* 正确:下一行从行首开始 */
与数字字符的区别
char c = 7; /* ASCII 码 7(BEL 响铃控制字符) */
char d = '7'; /* ASCII 码 55 */
printf("%c\n", c); /* 可能无输出或响铃 */
printf("%c\n", d); /* 输出 7 */
/* 数字字符转数值 */
char digit = '7';
int value = digit - '0'; /* 55 - 48 = 7 */