飞翔飞翔
主页
  • 计算机基础

    • TCP/IP协议
    • Linux命令
  • 数据库

    • SQL教程
  • 编程语言

    • C语言
    • Python2
    • Python3
  • 数据格式

    • JSON教程
  • 工具

    • Markdown指南
  • Git

    • GitFlow
  • Quartz

    • Quartz教程
  • Java

    • Java设计模式
  • 缓存

    • Redis教程
联系
阿里云
主页
  • 计算机基础

    • TCP/IP协议
    • Linux命令
  • 数据库

    • SQL教程
  • 编程语言

    • C语言
    • Python2
    • Python3
  • 数据格式

    • JSON教程
  • 工具

    • Markdown指南
  • Git

    • GitFlow
  • Quartz

    • Quartz教程
  • Java

    • Java设计模式
  • 缓存

    • Redis教程
联系
阿里云
  • 学习路径
  • 第1章 认识Python

    • Python 历史与特点
    • Python 2 与 Python 3 的核心差异
    • 安装与运行 Python 2.7.18
    • 编码规范 PEP 8
  • 第2章 基础语法

    • 变量与对象
    • 数字类型
    • 字符串 str
    • Unicode 字符串
    • 运算符
    • 空值 None
  • 第3章 流程控制

    • if 条件语句
    • if-else 条件语句
    • if-elif-else 多分支
    • 条件表达式(三元运算符)
    • while 循环
    • for 循环
    • range 与 xrange
    • 循环控制:break、continue、pass
    • 循环 else 子句
  • 第4章 数据结构

    • 列表基础
    • 列表方法
    • 列表推导式
    • 元组
    • 字典基础
    • 字典方法
    • 字典循环技巧
    • 集合
    • 序列解包
    • 序列比较
  • 第5章 函数

    • 定义函数
    • 参数传递机制
    • 默认参数
    • 关键字参数
    • 可变参数
    • Lambda 表达式
    • 文档字符串
    • 函数对象
  • 第6章 模块与包

    • import 导入
    • 模块搜索路径
    • name 与主程序
    • 编译文件 .pyc 与 .pyo
    • 包结构
    • dir() 函数
  • 第7章 文件与IO

    • 打开与关闭文件
    • 文件读写方法
    • with 上下文管理器
    • 格式化输出:% 操作符
    • 格式化输出:str.format()
    • JSON 序列化
  • 第8章 面向对象

    • 类定义与实例化
    • init 构造方法
    • 类变量与实例变量
    • 方法调用与 self
    • 继承基础
    • 多重继承
    • 新式类与旧式类
    • 私有变量与名称改写
    • 属性装饰器 property
    • 类方法与静态方法
    • 魔术方法
    • 空类与数据记录
  • 第9章 异常处理

    • 异常类型
    • try-except
    • try-except-else-finally
    • 抛出异常 raise
    • 自定义异常
    • with 语句与上下文管理器
  • 第10章 迭代器与生成器

    • 迭代器协议
    • 生成器函数
    • 生成器表达式
    • itertools模块
  • 第11章 标准库精要

    • os模块
    • sys模块
    • datetime模块
    • re模块
    • json模块
    • collections模块
    • math与random模块
    • urllib2与网络请求
    • subprocess与命令执行
    • threading与并发
    • unittest与测试
    • 虚拟环境与包管理
  • 第12章 工程实践

    • 调试技巧
    • 性能分析
    • 文档与注释
    • 下一步学习

name 与主程序

每个 Python 模块都有一个特殊属性 __name__。它的值取决于模块是如何被加载的:直接运行脚本时 __name__ 是 "__main__",被导入时 __name__ 是模块名。利用这个特性,可以写出既可以直接运行、又可以被导入复用的模块。

直接运行 vs 导入

创建文件 hello.py:

# hello.py
print "__name__ is:", __name__

直接运行:

$ python hello.py
__name__ is: __main__

作为模块导入:

import hello
# 输出:__name__ is: hello

主程序保护

利用 __name__ 的特性,可以把测试代码或演示代码放在 if __name__ == "__main__": 块中:

# calculator.py

def add(a, b):
    return a + b

def subtract(a, b):
    return a - b

# 测试代码
if __name__ == "__main__":
    print "Running tests..."
    assert add(2, 3) == 5
    assert subtract(5, 2) == 3
    print "All tests passed!"

直接运行:

$ python calculator.py
Running tests...
All tests passed!

作为模块导入:

import calculator
print calculator.add(2, 3)      # 5,测试代码不会执行

为什么需要这个保护

如果没有 if __name__ == "__main__",模块被导入时会执行所有顶层代码:

# bad_module.py
print "Loading module..."       # 导入时就会执行

data = load_large_dataset()     # 导入时就会加载数据!
import bad_module     # 输出 Loading module...,同时加载大数据集

这会导致导入速度变慢、副作用不可控。好的模块应该:

  1. 顶层只包含定义(函数、类、常量)
  2. 执行代码放在 if __name__ == "__main__": 中

命令行参数处理

if __name__ == "__main__": 块常用于处理命令行参数:

# copyfile.py
import sys
import shutil

def copy_file(src, dst):
    shutil.copy(src, dst)
    print "Copied %s to %s" % (src, dst)

if __name__ == "__main__":
    if len(sys.argv) != 3:
        print "Usage: python copyfile.py <source> <destination>"
        sys.exit(1)
    
    copy_file(sys.argv[1], sys.argv[2])
$ python copyfile.py a.txt b.txt
Copied a.txt to b.txt

多模块项目的主入口

大型项目通常有一个主入口文件:

# main.py
from calculator import add, subtract
from utils import load_data

def main():
    data = load_data()
    result = add(data[0], data[1])
    print "Result:", result

if __name__ == "__main__":
    main()

这样 main.py 可以直接运行,而 calculator.py 和 utils.py 可以被其他项目复用。

main 模块

当直接运行脚本时,Python 创建一个特殊的 __main__ 模块来执行它。sys.modules["__main__"] 就是这个模块:

import sys
print sys.modules["__main__"]       # <module '__main__' from 'script.py'>

被导入的模块不会出现在 __main__ 中,而是以其真实名称注册。

上一页
模块搜索路径
下一页
编译文件 .pyc 与 .pyo