飞翔飞翔
主页
  • 计算机基础

    • TCP/IP协议
    • Linux命令
  • 数据库

    • SQL教程
  • 编程语言

    • C语言
    • Python2
    • Python3
  • 数据格式

    • JSON教程
  • 工具

    • Markdown指南
  • Git

    • GitFlow
  • Quartz

    • Quartz教程
  • Java

    • Java设计模式
  • 缓存

    • Redis教程
联系
阿里云
主页
  • 计算机基础

    • TCP/IP协议
    • Linux命令
  • 数据库

    • SQL教程
  • 编程语言

    • C语言
    • Python2
    • Python3
  • 数据格式

    • JSON教程
  • 工具

    • Markdown指南
  • Git

    • GitFlow
  • Quartz

    • Quartz教程
  • Java

    • Java设计模式
  • 缓存

    • Redis教程
联系
阿里云
  • 学习路径
  • 第1章 编程基础概念

    • 冯·诺依曼体系结构
    • 数据在计算机中的表示
    • 编程语言的层次
    • C语言的起源与发展
    • C99标准的主要改进
    • 开发环境搭建
    • 第一个C程序
    • 编译与运行流程
    • 可移植性风险的三级体系
  • 第2章 数据类型与运算

    • 字符集与标识符
    • 关键字
    • 注释
    • char 类型
    • short 与 int
    • long 与 long long
    • 有符号与无符号
    • 取值范围与 limits.h
    • float 与 double
    • long double
    • _Bool 类型
    • 变量声明与定义
    • 常量
    • 转义序列
    • 算术运算符
    • 赋值运算符
    • 自增自减运算符
    • 关系与判等运算符
    • 逻辑运算符
    • 位运算符
    • 条件运算符
    • 逗号运算符
    • 运算符优先级
    • 隐式类型转换
    • 显式类型转换
  • 第3章 控制流

    • 表达式语句与空语句
    • 复合语句
    • if 语句
    • switch 语句
    • while 循环
    • do-while 循环
    • for 循环
    • break 与 continue
    • goto 语句
    • return 语句
  • 第4章 函数与模块化编程

    • 函数定义
    • 函数声明与原型
    • main 函数
    • 函数调用机制
    • 传值调用
    • 数组参数
    • 作用域
    • 存储期
    • 链接属性
    • static 与 extern
    • 递归
    • 头文件与源文件
    • 头文件保护
    • include 规则
  • 第5章 数组与字符串

    • 一维数组声明与初始化
    • 数组的存储模型
    • 数组访问与越界
    • 数组操作
    • 二维数组
    • 变长数组 VLA
    • 字符串基础
    • 字符串输入输出
    • 字符串处理函数
    • 字符串与数字转换
  • 第6章 指针

    • 指针的概念
    • 指针的声明与使用
    • 指针运算
    • const 与指针
    • 数组名与指针
    • 指针遍历数组
    • 指针与多维数组
    • 指针作为函数参数
    • 函数返回指针
    • 函数指针
    • 二级指针
    • 复杂声明解析
  • 第7章 结构体、联合体与枚举

    • 结构体定义与声明
    • 结构体初始化
    • 结构体成员访问
    • 结构体嵌套
    • 结构体指针
    • 结构体与函数
    • 联合体
    • 联合体与类型双关
    • 枚举类型
    • 位域
    • 内存对齐与填充
  • 第8章 动态内存管理

    • malloc 与 free
    • calloc 与 realloc
    • 内存泄漏
    • 悬垂指针
    • 内存分配策略
    • 自定义内存池
    • Valgrind 与内存检测
    • 内存碎片
    • 内存对齐分配
    • 常见内存错误
  • 第9章 文件输入输出

    • 文件打开与关闭
    • 文本读写
    • 格式化输入输出
    • 二进制读写
    • 文件定位
    • 错误处理
    • 标准流
    • 临时文件
    • 文件操作示例
  • 第10章 预处理器

    • 预处理器基础
    • 宏定义
    • 带参数的宏
    • 条件编译
    • 头文件包含
    • 预定义宏
    • 宏的高级技巧
    • 预处理器陷阱
    • 编译器特定扩展
  • 第11章 标准库概览

    • 标准库概述
    • assert.h
    • ctype.h
    • errno.h
    • float.h
    • limits.h
    • locale.h
    • math.h
    • setjmp.h
    • signal.h
    • stdarg.h
    • stddef.h
    • stdlib.h
  • 第12章 进阶主题

    • 内联函数
    • 变长数组 VLA
    • 复数类型
    • 布尔类型
    • stdint 与 inttypes
    • 灵活数组成员
    • 匿名结构体与联合体
    • 静态断言
    • 线程支持
    • 原子操作

数组访问与越界

C 语言不进行数组边界检查,访问超出数组范围的元素是未定义行为。这种设计是为了性能——每次数组访问都检查边界会显著降低程序速度。但这也意味着程序员必须自己确保索引在有效范围内,否则可能导致数据损坏、安全漏洞或程序崩溃。

下标访问

数组元素通过下标运算符 [] 访问:

int arr[5] = {10, 20, 30, 40, 50};

printf("%d\n", arr[0]);     /* 10 */
printf("%d\n", arr[4]);     /* 50 */

有效下标范围是 0 到 N-1(N 是数组大小)。

越界访问

访问超出范围的元素是未定义行为:

int arr[5] = {10, 20, 30, 40, 50};

/* arr[5] 越界! */
printf("%d\n", arr[5]);     /* 未定义行为 */

arr[5] = 100;               /* 未定义行为:可能覆盖其他数据 */

越界访问可能:

  • 读取/写入相邻的内存(破坏其他变量)
  • 触发段错误(Segmentation Fault)
  • 在调试模式下"恰好工作",发布模式下崩溃
  • 被利用为安全漏洞(缓冲区溢出攻击)

负数下标

负数下标也是未定义行为:

int arr[5] = {10, 20, 30, 40, 50};
printf("%d\n", arr[-1]);     /* 未定义行为 */

但指针运算中负数偏移是合法的(如果指向数组内部):

int arr[5] = {10, 20, 30, 40, 50};
int *p = &arr[2];           /* p 指向 30 */

printf("%d\n", p[-1]);      /* 20:合法,p[-1] 等价于 *(p-1) */
printf("%d\n", p[1]);       /* 40:合法 */

越界检测

C 语言标准不提供边界检查,但可以通过代码审查和工具检测:

代码中的检查:

void set_element(int arr[], int n, int index, int value)
{
    if (index < 0 || index >= n) {
        printf("Error: index %d out of bounds [0, %d)\n", index, n);
        return;
    }
    arr[index] = value;
}

编译器选项:

/* GCC 的栈保护 */
gcc -fstack-protector-strong program.c

/* 地址 sanitizer(运行时检测) */
gcc -fsanitize=address program.c

静态分析工具:

  • Clang Static Analyzer
  • Coverity
  • PVS-Studio

常见越界场景

循环边界错误:

int arr[5];

/* 差一错误:访问 arr[5] */
for (int i = 0; i <= 5; i++)      /* 应该是 i < 5 */
    arr[i] = i;

/* 正确 */
for (int i = 0; i < 5; i++)
    arr[i] = i;

字符串操作:

char str[5] = "Hello";      /* '\0' 被截断,str 不是有效字符串 */

strlen(str);                /* 未定义行为:找不到 '\0' */
strcpy(str, "World");       /* 如果 str 有 5 字节,'\0' 写入第 6 字节,越界 */

函数参数丢失大小:

void process(int arr[])     /* arr 退化为指针,不知道大小 */
{
    arr[10] = 0;            /* 可能越界! */
}

/* 正确:传递大小 */
void process(int arr[], int n)
{
    if (n > 10)             /* 检查 */
        arr[10] = 0;
}

安全函数

C11 引入了边界检查接口(可选),但 C99 没有。在 C99 中,使用安全的字符串函数:

/* 不安全 */
strcpy(dest, src);          /* 不检查 dest 大小 */
strcat(dest, src);          /* 不检查 dest 大小 */
gets(str);                  /* 已移除,极其危险 */

/* 安全替代 */
strncpy(dest, src, sizeof(dest) - 1);   /* 限制复制长度 */
dest[sizeof(dest) - 1] = '\0';          /* 确保终止 */

strncat(dest, src, sizeof(dest) - strlen(dest) - 1);

fgets(str, sizeof(str), stdin);         /* 限制读取长度 */

/* C99 snprintf */
snprintf(dest, sizeof(dest), "%s", src);   /* 安全格式化 */

常见错误

忘记数组从 0 开始:

int arr[5];
for (int i = 1; i <= 5; i++)    /* 错误:漏了 arr[0],多了 arr[5] */
    arr[i] = 0;

sizeof 计算错误:

void func(int arr[])
{
    for (int i = 0; i < sizeof(arr) / sizeof(arr[0]); i++)
                                /* 错误:sizeof(arr) = sizeof(int*) */
        arr[i] = 0;
}

指针运算越界:

int arr[5];
int *p = arr;

for (int i = 0; i <= 5; i++)
    *p++ = i;                   /* 最后一次 *p = arr[5],越界 */

最佳实践

  • 始终确保索引在 [0, N-1] 范围内
  • 数组作为函数参数时,始终传递大小
  • 使用 const 修饰不修改的数组参数
  • 字符串操作使用带长度限制的函数(strncpy、strncat、fgets、snprintf)
  • 开启编译器栈保护和地址 sanitizer
  • 使用静态分析工具检查越界
  • 循环边界用 < 而非 <=(i < n 比 i <= n-1 更清晰)
上一页
数组的存储模型
下一页
数组操作