飞翔飞翔
主页
  • 计算机基础

    • TCP/IP协议
    • Linux命令
  • 数据库

    • SQL教程
  • 编程语言

    • C语言
    • Python2
    • Python3
  • 数据格式

    • JSON教程
  • 工具

    • Markdown指南
  • Git

    • GitFlow
  • Quartz

    • Quartz教程
  • Java

    • Java设计模式
  • 缓存

    • Redis教程
联系
阿里云
主页
  • 计算机基础

    • TCP/IP协议
    • Linux命令
  • 数据库

    • SQL教程
  • 编程语言

    • C语言
    • Python2
    • Python3
  • 数据格式

    • JSON教程
  • 工具

    • Markdown指南
  • Git

    • GitFlow
  • Quartz

    • Quartz教程
  • Java

    • Java设计模式
  • 缓存

    • Redis教程
联系
阿里云
  • 学习路径
  • 第1章 编程基础概念

    • 冯·诺依曼体系结构
    • 数据在计算机中的表示
    • 编程语言的层次
    • C语言的起源与发展
    • C99标准的主要改进
    • 开发环境搭建
    • 第一个C程序
    • 编译与运行流程
    • 可移植性风险的三级体系
  • 第2章 数据类型与运算

    • 字符集与标识符
    • 关键字
    • 注释
    • char 类型
    • short 与 int
    • long 与 long long
    • 有符号与无符号
    • 取值范围与 limits.h
    • float 与 double
    • long double
    • _Bool 类型
    • 变量声明与定义
    • 常量
    • 转义序列
    • 算术运算符
    • 赋值运算符
    • 自增自减运算符
    • 关系与判等运算符
    • 逻辑运算符
    • 位运算符
    • 条件运算符
    • 逗号运算符
    • 运算符优先级
    • 隐式类型转换
    • 显式类型转换
  • 第3章 控制流

    • 表达式语句与空语句
    • 复合语句
    • if 语句
    • switch 语句
    • while 循环
    • do-while 循环
    • for 循环
    • break 与 continue
    • goto 语句
    • return 语句
  • 第4章 函数与模块化编程

    • 函数定义
    • 函数声明与原型
    • main 函数
    • 函数调用机制
    • 传值调用
    • 数组参数
    • 作用域
    • 存储期
    • 链接属性
    • static 与 extern
    • 递归
    • 头文件与源文件
    • 头文件保护
    • include 规则
  • 第5章 数组与字符串

    • 一维数组声明与初始化
    • 数组的存储模型
    • 数组访问与越界
    • 数组操作
    • 二维数组
    • 变长数组 VLA
    • 字符串基础
    • 字符串输入输出
    • 字符串处理函数
    • 字符串与数字转换
  • 第6章 指针

    • 指针的概念
    • 指针的声明与使用
    • 指针运算
    • const 与指针
    • 数组名与指针
    • 指针遍历数组
    • 指针与多维数组
    • 指针作为函数参数
    • 函数返回指针
    • 函数指针
    • 二级指针
    • 复杂声明解析
  • 第7章 结构体、联合体与枚举

    • 结构体定义与声明
    • 结构体初始化
    • 结构体成员访问
    • 结构体嵌套
    • 结构体指针
    • 结构体与函数
    • 联合体
    • 联合体与类型双关
    • 枚举类型
    • 位域
    • 内存对齐与填充
  • 第8章 动态内存管理

    • malloc 与 free
    • calloc 与 realloc
    • 内存泄漏
    • 悬垂指针
    • 内存分配策略
    • 自定义内存池
    • Valgrind 与内存检测
    • 内存碎片
    • 内存对齐分配
    • 常见内存错误
  • 第9章 文件输入输出

    • 文件打开与关闭
    • 文本读写
    • 格式化输入输出
    • 二进制读写
    • 文件定位
    • 错误处理
    • 标准流
    • 临时文件
    • 文件操作示例
  • 第10章 预处理器

    • 预处理器基础
    • 宏定义
    • 带参数的宏
    • 条件编译
    • 头文件包含
    • 预定义宏
    • 宏的高级技巧
    • 预处理器陷阱
    • 编译器特定扩展
  • 第11章 标准库概览

    • 标准库概述
    • assert.h
    • ctype.h
    • errno.h
    • float.h
    • limits.h
    • locale.h
    • math.h
    • setjmp.h
    • signal.h
    • stdarg.h
    • stddef.h
    • stdlib.h
  • 第12章 进阶主题

    • 内联函数
    • 变长数组 VLA
    • 复数类型
    • 布尔类型
    • stdint 与 inttypes
    • 灵活数组成员
    • 匿名结构体与联合体
    • 静态断言
    • 线程支持
    • 原子操作

字符串输入输出

字符串的输入输出是 C 程序与外部世界交互的主要方式。标准库提供了多种函数:格式化输出 printf、格式化输入 scanf、字符串输出 puts、字符输出 putchar、行输入 fgets 等。理解这些函数的行为和限制,能帮助你安全地处理字符串输入输出,避免缓冲区溢出等安全问题。

输出函数

printf:格式化输出

char str[] = "Hello";
printf("%s\n", str);        /* 输出字符串 */
printf("%10s\n", str);      /* 右对齐,宽度 10 */
printf("%-10s\n", str);     /* 左对齐,宽度 10 */
printf("%.3s\n", str);      /* 只输出前 3 个字符:Hel */

puts:输出字符串并自动换行

puts("Hello");              /* 输出 Hello\n */
puts(str);                  /* 输出 str 内容 + \n */

puts 比 printf("%s\n", str) 稍快,因为不需要解析格式字符串。

putchar:输出单个字符

putchar('A');               /* 输出 A */
putchar('\n');              /* 输出换行 */

输入函数

scanf:格式化输入

char str[100];
scanf("%s", str);           /* 读取一个单词(到空白字符为止) */
                            /* 危险:不检查 str 大小! */

/* 安全:限制长度 */
char str[100];
scanf("%99s", str);         /* 最多读取 99 个字符,留 1 个给 '\0' */

scanf("%s") 遇到空白字符(空格、制表符、换行)停止,不读取换行符。

fgets:读取一行(安全)

char str[100];
if (fgets(str, sizeof(str), stdin) != NULL) {
    /* 移除末尾的换行符 */
    size_t len = strlen(str);
    if (len > 0 && str[len - 1] == '\n')
        str[len - 1] = '\0';
    
    printf("Read: %s\n", str);
}

fgets 读取最多 n-1 个字符,自动添加 \0。如果读取到换行符或文件结束,会提前停止。这是读取字符串最安全的方式。

getchar:读取单个字符

int c;
while ((c = getchar()) != '\n' && c != EOF) {
    /* 处理字符 */
}

注意 getchar 返回 int 而非 char,因为需要区分 EOF(通常是 -1)和有效字符 255。

已废弃的函数

gets:已移除(C11),极其危险

char str[100];
gets(str);                  /* 不检查缓冲区大小,已移除! */

gets 不限制读取长度,是缓冲区溢出攻击的经典目标。永远不要使用 gets,用 fgets 替代。

格式化字符串函数

sprintf:格式化到字符串(不安全)

char buffer[100];
int n = 123;
sprintf(buffer, "The number is %d", n);   /* 不检查 buffer 大小 */

snprintf:安全格式化(C99)

char buffer[100];
int n = 123;
snprintf(buffer, sizeof(buffer), "The number is %d", n);
                            /* 最多写入 sizeof(buffer)-1 字符 + '\0' */
                            /* 如果超出,自动截断并添加 '\0' */

snprintf 是 C99 引入的安全函数,强烈推荐使用。

常见错误

scanf 不检查大小:

char str[10];
scanf("%s", str);           /* 危险:输入超过 9 字符会溢出 */

/* 正确 */
scanf("%9s", str);          /* 限制为 9 字符 + '\0' */

fgets 保留换行符:

char str[100];
fgets(str, sizeof(str), stdin);
printf("[%s]\n", str);     /* 可能输出 [Hello\n] */

/* 正确:移除换行符 */
size_t len = strlen(str);
if (len > 0 && str[len - 1] == '\n')
    str[len - 1] = '\0';

混淆 scanf 和 fgets:

int n;
scanf("%d", &n);            /* 读取数字,但换行符留在输入缓冲区 */

char str[100];
fgets(str, sizeof(str), stdin);   /* 读取到换行符,可能只读到空行! */

/* 正确:清除输入缓冲区 */
int c;
while ((c = getchar()) != '\n' && c != EOF) { }

fgets(str, sizeof(str), stdin);

最佳实践

  • 字符串输入用 fgets,不用 gets 或不限制长度的 scanf
  • 格式化输出用 snprintf,不用 sprintf
  • scanf("%s") 始终指定最大宽度
  • fgets 后检查并移除末尾换行符
  • 混合使用 scanf 和 fgets 时,注意清理输入缓冲区
  • 始终检查输入函数的返回值(NULL 或 EOF 表示失败)
上一页
字符串基础
下一页
字符串处理函数