飞翔飞翔
主页
  • 计算机基础

    • TCP/IP协议
    • Linux命令
  • 数据库

    • SQL教程
  • 编程语言

    • C语言
    • Python2
    • Python3
  • 数据格式

    • JSON教程
  • 工具

    • Markdown指南
  • Git

    • GitFlow
  • Quartz

    • Quartz教程
  • Java

    • Java设计模式
  • 缓存

    • Redis教程
联系
阿里云
主页
  • 计算机基础

    • TCP/IP协议
    • Linux命令
  • 数据库

    • SQL教程
  • 编程语言

    • C语言
    • Python2
    • Python3
  • 数据格式

    • JSON教程
  • 工具

    • Markdown指南
  • Git

    • GitFlow
  • Quartz

    • Quartz教程
  • Java

    • Java设计模式
  • 缓存

    • Redis教程
联系
阿里云
  • 学习路径
  • 第1章 编程基础概念

    • 冯·诺依曼体系结构
    • 数据在计算机中的表示
    • 编程语言的层次
    • C语言的起源与发展
    • C99标准的主要改进
    • 开发环境搭建
    • 第一个C程序
    • 编译与运行流程
    • 可移植性风险的三级体系
  • 第2章 数据类型与运算

    • 字符集与标识符
    • 关键字
    • 注释
    • char 类型
    • short 与 int
    • long 与 long long
    • 有符号与无符号
    • 取值范围与 limits.h
    • float 与 double
    • long double
    • _Bool 类型
    • 变量声明与定义
    • 常量
    • 转义序列
    • 算术运算符
    • 赋值运算符
    • 自增自减运算符
    • 关系与判等运算符
    • 逻辑运算符
    • 位运算符
    • 条件运算符
    • 逗号运算符
    • 运算符优先级
    • 隐式类型转换
    • 显式类型转换
  • 第3章 控制流

    • 表达式语句与空语句
    • 复合语句
    • if 语句
    • switch 语句
    • while 循环
    • do-while 循环
    • for 循环
    • break 与 continue
    • goto 语句
    • return 语句
  • 第4章 函数与模块化编程

    • 函数定义
    • 函数声明与原型
    • main 函数
    • 函数调用机制
    • 传值调用
    • 数组参数
    • 作用域
    • 存储期
    • 链接属性
    • static 与 extern
    • 递归
    • 头文件与源文件
    • 头文件保护
    • include 规则
  • 第5章 数组与字符串

    • 一维数组声明与初始化
    • 数组的存储模型
    • 数组访问与越界
    • 数组操作
    • 二维数组
    • 变长数组 VLA
    • 字符串基础
    • 字符串输入输出
    • 字符串处理函数
    • 字符串与数字转换
  • 第6章 指针

    • 指针的概念
    • 指针的声明与使用
    • 指针运算
    • const 与指针
    • 数组名与指针
    • 指针遍历数组
    • 指针与多维数组
    • 指针作为函数参数
    • 函数返回指针
    • 函数指针
    • 二级指针
    • 复杂声明解析
  • 第7章 结构体、联合体与枚举

    • 结构体定义与声明
    • 结构体初始化
    • 结构体成员访问
    • 结构体嵌套
    • 结构体指针
    • 结构体与函数
    • 联合体
    • 联合体与类型双关
    • 枚举类型
    • 位域
    • 内存对齐与填充
  • 第8章 动态内存管理

    • malloc 与 free
    • calloc 与 realloc
    • 内存泄漏
    • 悬垂指针
    • 内存分配策略
    • 自定义内存池
    • Valgrind 与内存检测
    • 内存碎片
    • 内存对齐分配
    • 常见内存错误
  • 第9章 文件输入输出

    • 文件打开与关闭
    • 文本读写
    • 格式化输入输出
    • 二进制读写
    • 文件定位
    • 错误处理
    • 标准流
    • 临时文件
    • 文件操作示例
  • 第10章 预处理器

    • 预处理器基础
    • 宏定义
    • 带参数的宏
    • 条件编译
    • 头文件包含
    • 预定义宏
    • 宏的高级技巧
    • 预处理器陷阱
    • 编译器特定扩展
  • 第11章 标准库概览

    • 标准库概述
    • assert.h
    • ctype.h
    • errno.h
    • float.h
    • limits.h
    • locale.h
    • math.h
    • setjmp.h
    • signal.h
    • stdarg.h
    • stddef.h
    • stdlib.h
  • 第12章 进阶主题

    • 内联函数
    • 变长数组 VLA
    • 复数类型
    • 布尔类型
    • stdint 与 inttypes
    • 灵活数组成员
    • 匿名结构体与联合体
    • 静态断言
    • 线程支持
    • 原子操作

字符集与标识符

C 程序由字符序列构成,编译器首先将源代码分解为词法单元(token)。标识符是程序员为变量、函数、类型等起的名字,必须遵循严格的命名规则。理解字符集和标识符规则,是避免编译错误的第一步。

基本源字符集

C99 §5.2.1 规定了基本源字符集,包含以下字符:

  • 大小写英文字母:A–Z、a–z
  • 十进制数字:0–9
  • 图形字符:! " # % & ' ( ) * + , - . / : ; < = > ? [ \ ] ^ _ { | } ~
  • 空白字符:空格、水平制表符、垂直制表符、换页符、换行符

C99 还支持通用字符名(Universal Character Names),允许在标识符中使用部分 Unicode 字符:\uXXXX 或 \UXXXXXXXX 形式。但实际编译器支持程度不一,为保证可移植性,建议只使用基本字符集的字母和数字。

标识符命名规则

标识符由字母、数字和下划线组成,且不能以数字开头。C99 §6.4.2 规定:

int valid_name;         /* 合法 */
int _underscore;        /* 合法:以下划线开头 */
int name123;            /* 合法:包含数字 */
int Name123;            /* 合法:C 区分大小写 */

int 123name;            /* 非法:以数字开头 */
int name$;              /* 非法:$ 不是标准字符 */
int my-name;            /* 非法:- 被解释为减号 */

大小写敏感:count、Count、COUNT 是三个不同的标识符。

长度限制:C99 要求编译器至少能区分前 63 个字符(外部标识符 31 个),但大多数现代编译器支持更长的标识符。

标识符名字空间

C 语言定义了 4 个独立的名字空间(C99 §6.2.3),同名标识符如果属于不同名字空间,不会冲突:

标签名字空间:goto 语句使用的标签

goto end;
/* ... */
end: printf("Done\n");   /* 标签 end */

标记名字空间:struct、union、enum 的标记名

struct end { int x; };   /* 标记 end,与上面的标签不冲突 */

成员名字空间:每个 struct 或 union 的成员各自拥有独立空间

struct A { int end; };   /* 成员 end */
struct B { int end; };   /* 另一个结构体的成员 end,不冲突 */

普通标识符名字空间:变量、函数、typedef 名、枚举常量等

int end;                 /* 变量 end,与标签、标记、成员都不冲突 */

实际应用:struct stat { int stat; }; struct stat stat; 是完全合法的——标记 stat、成员 stat、变量 stat 分属三个名字空间。

命名约定与最佳实践

虽然编译器只强制执行语法规则,但良好的命名约定能大幅提升代码可读性:

常见风格:

风格示例使用场景
snake_casestudent_name变量、函数(Unix/Linux 传统)
camelCasestudentName变量、函数(Windows 传统)
PascalCaseStudentName结构体名、typedef 名
UPPER_CASEMAX_SIZE宏、常量

避免以下划线开头的名字:

  • 单下划线 + 大写字母开头(如 _Reserved):保留给实现(编译器/标准库)
  • 双下划线开头(如 __internal):保留给实现
  • 以下划线结尾的名字:可能冲突
int _value;             /* 合法但不推荐 */
int __value;            /* 保留给编译器,用户代码应避免 */

选择有意义的名称:

/* 差 */
int a, b, c;

/* 好 */
int width, height, area;

避免过短或过长的名字:

int n;                  /* 循环计数器可以短 */
int numberOfStudentsInThisClass;   /* 太长,考虑 students_count */

三字符组(Trigraphs)

C99 支持三字符组,用三个字符序列表示某些键盘上可能缺失的字符:

三字符组等价字符
??=#
??([
??)]
??<{
??>}
??/\
??=include <stdio.h>    /* 等价于 #include <stdio.h> */

三字符组在 C99 中已标记为废弃,现代键盘都能直接输入这些字符,实际代码中几乎不会用到。某些编译器默认不启用三字符组处理。

下一页
关键字