序列比较
Python 支持对序列(列表、元组、字符串等)进行直接比较。比较规则是逐元素字典序比较,这与字符串比较在 C 语言中的行为类似,但 Python 把它推广到了所有序列类型。
基本规则
两个序列比较时,从左到右逐个比较对应位置的元素:
# 列表比较
print [1, 2, 3] < [1, 2, 4] # True,第三个元素 3 < 4
print [1, 2, 3] < [1, 2, 3] # False,相等
print [1, 2] < [1, 2, 3] # True,前者先结束,更短
# 元组比较
print (1, 2) < (1, 2, 0) # True
# 字符串比较
print "abc" < "abd" # True,第三个字符 'c' < 'd'
print "Apple" < "apple" # True,'A' (65) < 'a' (97)
规则总结:
- 从左到右逐个比较对应元素
- 第一个不相等的元素决定结果
- 如果所有对应元素都相等,较短的序列更小
- 如果序列类型不同(如列表 vs 元组),Python 2 允许比较,结果由类型名决定
不同类型序列的比较
Python 2 允许比较不同类型的序列,结果由类型名称的字典序决定:
print [1, 2] < (1, 2) # False,因为 "list" > "tuple"
print "abc" < [1, 2] # False,因为 "str" > "list"
这种隐式比较极易引发 bug。Python 3 中比较不同类型会抛出 TypeError。
元素类型不同的情况
如果对应位置的元素类型不同,Python 2 也会尝试比较:
print [1, 2] < [1, "a"] # True,因为 2 < "a" 在 Python 2 中... 等等
实际上,Python 2 中数字和字符串的比较结果是确定的(数字总是小于字符串),但这完全不符合直觉:
print 1 < "a" # True
print 1000 < "a" # True
print [1, 2] < [1, "a"] # True
这是 Python 2 的另一个设计缺陷。Python 3 中这种比较会抛出 TypeError。
实际应用
排序:
pairs = [(1, "b"), (2, "a"), (1, "a")]
pairs.sort()
print pairs # [(1, 'a'), (1, 'b'), (2, 'a')]
元组按字典序排序:先比较第一个元素,第一个相同再比较第二个。
查找范围:
# 检查版本号是否在范围内
version = (2, 7, 18)
min_version = (2, 7, 0)
max_version = (3, 0, 0)
if min_version <= version < max_version:
print "Supported version"
字符串前缀判断:
# 检查文件名是否以特定前缀开头
files = ["data_2024_01.txt", "data_2024_02.txt", "report.txt"]
for f in files:
if f >= "data" and f < "data\x00": # 以 "data" 开头
print f
更 Pythonic 的写法是用 startswith():
if f.startswith("data"):
print f
相等 vs 相同
== 比较值,is 比较身份:
a = [1, 2, 3]
b = [1, 2, 3]
print a == b # True,值相等
print a is b # False,不是同一个对象
c = a
print a is c # True,c 和 a 指向同一个对象
序列比较总是用 ==,不要用 is。
自定义比较
如果需要非默认的比较逻辑,可以用 key 参数:
# 按字符串长度排序
words = ["banana", "pie", "Washington"]
words.sort(key=len)
print words # ['pie', 'banana', 'Washington']
# 按绝对值排序
nums = [-5, 3, -1, 8]
nums.sort(key=abs)
print nums # [-1, 3, -5, 8]
key 函数为每个元素生成一个"比较键",排序时按这个键比较,而非元素本身。