飞翔飞翔
主页
  • 计算机基础

    • TCP/IP协议
    • Linux命令
  • 数据库

    • SQL教程
  • 编程语言

    • C语言
    • Python2
    • Python3
  • 数据格式

    • JSON教程
  • 工具

    • Markdown指南
  • Git

    • GitFlow
  • Quartz

    • Quartz教程
  • Java

    • Java设计模式
  • 缓存

    • Redis教程
联系
阿里云
主页
  • 计算机基础

    • TCP/IP协议
    • Linux命令
  • 数据库

    • SQL教程
  • 编程语言

    • C语言
    • Python2
    • Python3
  • 数据格式

    • JSON教程
  • 工具

    • Markdown指南
  • Git

    • GitFlow
  • Quartz

    • Quartz教程
  • Java

    • Java设计模式
  • 缓存

    • Redis教程
联系
阿里云
  • 学习路径
  • 第1章 认识Python

    • Python 历史与特点
    • Python 2 与 Python 3 的核心差异
    • 安装与运行 Python 2.7.18
    • 编码规范 PEP 8
  • 第2章 基础语法

    • 变量与对象
    • 数字类型
    • 字符串 str
    • Unicode 字符串
    • 运算符
    • 空值 None
  • 第3章 流程控制

    • if 条件语句
    • if-else 条件语句
    • if-elif-else 多分支
    • 条件表达式(三元运算符)
    • while 循环
    • for 循环
    • range 与 xrange
    • 循环控制:break、continue、pass
    • 循环 else 子句
  • 第4章 数据结构

    • 列表基础
    • 列表方法
    • 列表推导式
    • 元组
    • 字典基础
    • 字典方法
    • 字典循环技巧
    • 集合
    • 序列解包
    • 序列比较
  • 第5章 函数

    • 定义函数
    • 参数传递机制
    • 默认参数
    • 关键字参数
    • 可变参数
    • Lambda 表达式
    • 文档字符串
    • 函数对象
  • 第6章 模块与包

    • import 导入
    • 模块搜索路径
    • name 与主程序
    • 编译文件 .pyc 与 .pyo
    • 包结构
    • dir() 函数
  • 第7章 文件与IO

    • 打开与关闭文件
    • 文件读写方法
    • with 上下文管理器
    • 格式化输出:% 操作符
    • 格式化输出:str.format()
    • JSON 序列化
  • 第8章 面向对象

    • 类定义与实例化
    • init 构造方法
    • 类变量与实例变量
    • 方法调用与 self
    • 继承基础
    • 多重继承
    • 新式类与旧式类
    • 私有变量与名称改写
    • 属性装饰器 property
    • 类方法与静态方法
    • 魔术方法
    • 空类与数据记录
  • 第9章 异常处理

    • 异常类型
    • try-except
    • try-except-else-finally
    • 抛出异常 raise
    • 自定义异常
    • with 语句与上下文管理器
  • 第10章 迭代器与生成器

    • 迭代器协议
    • 生成器函数
    • 生成器表达式
    • itertools模块
  • 第11章 标准库精要

    • os模块
    • sys模块
    • datetime模块
    • re模块
    • json模块
    • collections模块
    • math与random模块
    • urllib2与网络请求
    • subprocess与命令执行
    • threading与并发
    • unittest与测试
    • 虚拟环境与包管理
  • 第12章 工程实践

    • 调试技巧
    • 性能分析
    • 文档与注释
    • 下一步学习

编译文件 .pyc 与 .pyo

Python 是解释型语言,但为了提高加载速度,会把 .py 源文件编译成字节码(bytecode)缓存。Python 2 中,这些缓存文件与源文件放在同一目录,扩展名为 .pyc 或 .pyo。

.pyc 文件

当模块第一次被导入时,Python 把源代码编译成字节码,保存为 .pyc 文件:

myproject/
    hello.py
    hello.pyc         # 编译后的字节码

下次导入时,如果 .pyc 的修改时间比 .py 新,Python 直接加载 .pyc,跳过编译步骤,加快启动速度。

import hello          # 第一次:编译并保存 hello.pyc
import hello          # 第二次:直接加载 hello.pyc

.pyo 文件

.pyo 是优化过的字节码文件,用 python -O 或 python -OO 生成:

$ python -O script.py       # 生成 .pyo,移除 assert 语句
$ python -OO script.py      # 生成 .pyo,移除 assert 和 docstring

-O 优化级别:

  • 移除 assert 语句
  • 设置 __debug__ = False

-OO 优化级别:

  • 包含 -O 的所有优化
  • 移除文档字符串(__doc__ 为 None)
# test_assert.py
assert 1 == 2, "This should fail"

# 普通运行
$ python test_assert.py
AssertionError: This should fail

# -O 运行
$ python -O test_assert.py
# 无输出,assert 被移除了

编译文件的位置

Python 2 中,.pyc 和 .pyo 与 .py 源文件放在同一目录:

project/
    module1.py
    module1.pyc
    module2.py
    module2.pyo
    package/
        __init__.py
        __init__.pyc
        submod.py
        submod.pyc

这会导致目录杂乱,也是 Python 3 改为 __pycache__ 子目录的原因之一。

不生成 .pyc

可以用 -B 选项或设置 PYTHONDONTWRITEBYTECODE 环境变量禁止生成 .pyc:

$ python -B script.py

# 或
$ export PYTHONDONTWRITEBITECODE=1
$ python script.py

也可以在代码中设置:

import sys
sys.dont_write_bytecode = True

这在开发调试时有用,避免修改代码后加载过期的 .pyc。

.pyc 的局限性

.pyc 只加速加载速度,不加速执行速度。字节码在运行时仍需由 Python 虚拟机解释执行,没有编译成机器码。

如果删除 .py 源文件,只保留 .pyc,模块仍然可以导入:

$ rm hello.py
$ python -c "import hello; hello.greet()"   # 可以运行!

但这只是加载 .pyc 中的字节码,无法查看或修改源代码。

与 Python 3 的对比

特性Python 2Python 3
缓存位置与 .py 同目录__pycache__/ 子目录
文件名.pyc / .pyo__pycache__/module.cpython-37.pyc
优化级别-O / -OO相同

Python 3 的 __pycache__ 设计更干净,支持多版本共存(Python 3.7 和 3.8 的 .pyc 可以放在同一目录的不同子目录中)。

上一页
name 与主程序
下一页
包结构