飞翔飞翔
主页
  • 计算机基础

    • TCP/IP协议
    • Linux命令
  • 数据库

    • SQL教程
  • 编程语言

    • C语言
    • Python2
    • Python3
  • 数据格式

    • JSON教程
  • 工具

    • Markdown指南
  • Git

    • GitFlow
  • Quartz

    • Quartz教程
  • Java

    • Java设计模式
  • 缓存

    • Redis教程
联系
阿里云
主页
  • 计算机基础

    • TCP/IP协议
    • Linux命令
  • 数据库

    • SQL教程
  • 编程语言

    • C语言
    • Python2
    • Python3
  • 数据格式

    • JSON教程
  • 工具

    • Markdown指南
  • Git

    • GitFlow
  • Quartz

    • Quartz教程
  • Java

    • Java设计模式
  • 缓存

    • Redis教程
联系
阿里云
  • 学习路径
  • 第1章 编程基础概念

    • 冯·诺依曼体系结构
    • 数据在计算机中的表示
    • 编程语言的层次
    • C语言的起源与发展
    • C99标准的主要改进
    • 开发环境搭建
    • 第一个C程序
    • 编译与运行流程
    • 可移植性风险的三级体系
  • 第2章 数据类型与运算

    • 字符集与标识符
    • 关键字
    • 注释
    • char 类型
    • short 与 int
    • long 与 long long
    • 有符号与无符号
    • 取值范围与 limits.h
    • float 与 double
    • long double
    • _Bool 类型
    • 变量声明与定义
    • 常量
    • 转义序列
    • 算术运算符
    • 赋值运算符
    • 自增自减运算符
    • 关系与判等运算符
    • 逻辑运算符
    • 位运算符
    • 条件运算符
    • 逗号运算符
    • 运算符优先级
    • 隐式类型转换
    • 显式类型转换
  • 第3章 控制流

    • 表达式语句与空语句
    • 复合语句
    • if 语句
    • switch 语句
    • while 循环
    • do-while 循环
    • for 循环
    • break 与 continue
    • goto 语句
    • return 语句
  • 第4章 函数与模块化编程

    • 函数定义
    • 函数声明与原型
    • main 函数
    • 函数调用机制
    • 传值调用
    • 数组参数
    • 作用域
    • 存储期
    • 链接属性
    • static 与 extern
    • 递归
    • 头文件与源文件
    • 头文件保护
    • include 规则
  • 第5章 数组与字符串

    • 一维数组声明与初始化
    • 数组的存储模型
    • 数组访问与越界
    • 数组操作
    • 二维数组
    • 变长数组 VLA
    • 字符串基础
    • 字符串输入输出
    • 字符串处理函数
    • 字符串与数字转换
  • 第6章 指针

    • 指针的概念
    • 指针的声明与使用
    • 指针运算
    • const 与指针
    • 数组名与指针
    • 指针遍历数组
    • 指针与多维数组
    • 指针作为函数参数
    • 函数返回指针
    • 函数指针
    • 二级指针
    • 复杂声明解析
  • 第7章 结构体、联合体与枚举

    • 结构体定义与声明
    • 结构体初始化
    • 结构体成员访问
    • 结构体嵌套
    • 结构体指针
    • 结构体与函数
    • 联合体
    • 联合体与类型双关
    • 枚举类型
    • 位域
    • 内存对齐与填充
  • 第8章 动态内存管理

    • malloc 与 free
    • calloc 与 realloc
    • 内存泄漏
    • 悬垂指针
    • 内存分配策略
    • 自定义内存池
    • Valgrind 与内存检测
    • 内存碎片
    • 内存对齐分配
    • 常见内存错误
  • 第9章 文件输入输出

    • 文件打开与关闭
    • 文本读写
    • 格式化输入输出
    • 二进制读写
    • 文件定位
    • 错误处理
    • 标准流
    • 临时文件
    • 文件操作示例
  • 第10章 预处理器

    • 预处理器基础
    • 宏定义
    • 带参数的宏
    • 条件编译
    • 头文件包含
    • 预定义宏
    • 宏的高级技巧
    • 预处理器陷阱
    • 编译器特定扩展
  • 第11章 标准库概览

    • 标准库概述
    • assert.h
    • ctype.h
    • errno.h
    • float.h
    • limits.h
    • locale.h
    • math.h
    • setjmp.h
    • signal.h
    • stdarg.h
    • stddef.h
    • stdlib.h
  • 第12章 进阶主题

    • 内联函数
    • 变长数组 VLA
    • 复数类型
    • 布尔类型
    • stdint 与 inttypes
    • 灵活数组成员
    • 匿名结构体与联合体
    • 静态断言
    • 线程支持
    • 原子操作

字符串处理函数

<string.h> 提供了丰富的字符串处理函数,包括复制、拼接、比较、查找等。这些函数是 C 语言字符串操作的核心工具,但许多函数不检查缓冲区大小,使用时需要格外小心。C99 引入的 snprintf 和长度受限的变体(strncpy、strncat)提供了更安全的替代方案。

复制函数

strcpy:复制字符串(不检查大小)

char dest[100];
strcpy(dest, "Hello");      /* 复制 "Hello" 到 dest */

/* 危险:如果 src 太长,dest 溢出 */
char dest2[5];
strcpy(dest2, "Hello World");   /* 越界! */

strncpy:限制长度的复制

char dest[100];
strncpy(dest, src, sizeof(dest) - 1);
dest[sizeof(dest) - 1] = '\0';  /* 确保终止 */

strncpy 的陷阱:如果 src 长度 >= n,不会添加 \0!

memcpy:内存复制(不检查重叠)

char dest[100];
memcpy(dest, src, strlen(src) + 1);   /* 复制包括 '\0' */

memmove:安全内存复制(处理重叠)

memmove(dest, src, n);      /* 源和目的重叠时安全 */

拼接函数

strcat:拼接字符串(不检查大小)

char str[100] = "Hello";
strcat(str, " World");      /* str = "Hello World" */

/* 危险 */
char str2[10] = "Hello";
strcat(str2, " World");     /* 越界! */

strncat:限制长度的拼接

char str[100] = "Hello";
strncat(str, " World", sizeof(str) - strlen(str) - 1);
str[sizeof(str) - 1] = '\0';    /* 确保终止 */

比较函数

strcmp:比较字符串

int result = strcmp("abc", "def");   /* < 0 */
result = strcmp("abc", "abc");       /* == 0 */
result = strcmp("def", "abc");       /* > 0 */

/* 注意:不要与 0 用判等以外的运算 */
if (strcmp(a, b) == 0)     /* 相等 */
if (strcmp(a, b) < 0)       /* a < b */

strncmp:限制长度的比较

strncmp("abc", "abcdef", 3);     /* == 0:只比较前 3 个字符 */

查找函数

strlen:字符串长度

size_t len = strlen("Hello");    /* 5 */

strchr:查找字符(首次出现)

char *p = strchr("Hello", 'l');     /* 指向第一个 'l' */
printf("%s\n", p);                  /* "llo" */

strrchr:查找字符(最后一次出现)

char *p = strrchr("Hello", 'l');    /* 指向最后一个 'l' */

strstr:查找子串

char *p = strstr("Hello World", "World");   /* 指向 "World" */
if (p != NULL)
    printf("Found at position %zu\n", p - "Hello World");

strtok:分割字符串

char str[] = "Hello,World,C";
char *token = strtok(str, ",");

while (token != NULL) {
    printf("%s\n", token);
    token = strtok(NULL, ",");   /* 继续分割 */
}
/* 输出:
   Hello
   World
   C
*/

strtok 修改原字符串(插入 \0),且不是线程安全。C11 引入了 strtok_s(可选)。

其他函数

memset:填充内存

char str[100];
memset(str, 0, sizeof(str));    /* 全部置 0 */
memset(str, 'A', 10);           /* 前 10 个字符设为 'A' */

strerror:错误信息字符串

#include <errno.h>

FILE *fp = fopen("nonexistent", "r");
if (fp == NULL)
    printf("Error: %s\n", strerror(errno));   /* Error: No such file or directory */

常见错误

strcpy 溢出:

char dest[5];
strcpy(dest, "Hello World");    /* 越界! */

/* 安全替代 */
strncpy(dest, "Hello World", sizeof(dest) - 1);
dest[sizeof(dest) - 1] = '\0';

strncpy 不保证 \0:

char dest[5];
strncpy(dest, "Hello World", 5);    /* dest = "Hello",没有 '\0'! */
printf("%s\n", dest);               /* 未定义行为 */

/* 正确 */
strncpy(dest, "Hello World", sizeof(dest) - 1);
dest[sizeof(dest) - 1] = '\0';

strcmp 返回值误用:

if (strcmp(a, b))           /* 相等时返回 0,条件为假 */
    printf("Different\n");
else
    printf("Equal\n");       /* 实际输出这个 */

/* 正确 */
if (strcmp(a, b) == 0)
    printf("Equal\n");

strtok 修改原字符串:

char *str = "Hello,World";   /* 字符串字面量,只读 */
strtok(str, ",");           /* 未定义行为!修改只读内存 */

/* 正确 */
char str[] = "Hello,World";   /* 可修改的数组 */
strtok(str, ",");

最佳实践

  • 优先使用带长度限制的函数(strncpy、strncat、snprintf)
  • strncpy 后手动添加 \0
  • 不用 strcpy、strcat、sprintf 处理外部输入
  • strcmp 返回值与 0 比较,不要直接作为布尔值
  • strtok 只用于可修改的字符数组
  • 考虑使用更安全的库(如 BSD 的 strlcpy、strlcat)
上一页
字符串输入输出
下一页
字符串与数字转换