Version: 3.2.2

﻿

# 5. 数据结构¶

## 5.1. 深入列表¶

`list.``append`(x)

`list.``extend`(L)

`list.``insert`(i, x)

`list.``remove`(x)

`list.``pop`([i])

`list.``index`(x)

`list.``count`(x)

`list.``sort`()

`list.``reverse`()

```>>> a = [66.25, 333, 333, 1, 1234.5]
>>> print(a.count(333), a.count(66.25), a.count('x'))
2 1 0
>>> a.insert(2, -1)
>>> a.append(333)
>>> a
[66.25, 333, -1, 333, 1, 1234.5, 333]
>>> a.index(333)
1
>>> a.remove(333)
>>> a
[66.25, -1, 333, 1, 1234.5, 333]
>>> a.reverse()
>>> a
[333, 1234.5, 1, 333, -1, 66.25]
>>> a.sort()
>>> a
[-1, 1, 66.25, 333, 333, 1234.5]
```

### 5.1.1. 把列表当成堆栈用¶

```>>> stack = [3, 4, 5]
>>> stack.append(6)
>>> stack.append(7)
>>> stack
[3, 4, 5, 6, 7]
>>> stack.pop()
7
>>> stack
[3, 4, 5, 6]
>>> stack.pop()
6
>>> stack.pop()
5
>>> stack
[3, 4]
```

### 5.1.2. 把列表当队列使用¶

```>>> from collections import deque
>>> queue = deque(["Eric", "John", "Michael"])
>>> queue.append("Terry")           # Terry 进入
>>> queue.append("Graham")          # Graham 进入
>>> queue.popleft()                 # 第一个进入的现在离开
'Eric'
>>> queue.popleft()                 # 第二个进入的现在离开
'John'
>>> queue                           # 剩余的队列, 它按照进入的顺序排列
deque(['Michael', 'Terry', 'Graham'])
```

### 5.1.3. 列表推导式¶

```>>> vec = [2, 4, 6]
>>> [3*x for x in vec]
[6, 12, 18]
```

```>>> [[x, x**2] for x in vec]
[[2, 4], [4, 16], [6, 36]]
```

```>>> freshfruit = ['  banana', '  loganberry ', 'passion fruit  ']
>>> [weapon.strip() for weapon in freshfruit]
['banana', 'loganberry', 'passion fruit']
```

```>>> [3*x for x in vec if x > 3]
[12, 18]
>>> [3*x for x in vec if x < 2]
[]
```

```>>> [x, x**2 for x in vec]  # error - parens required for tuples
File "<stdin>", line 1, in ?
[x, x**2 for x in vec]
^
SyntaxError: invalid syntax
>>> [(x, x**2) for x in vec]
[(2, 4), (4, 16), (6, 36)]
```

```>>> vec1 = [2, 4, 6]
>>> vec2 = [4, 3, -9]
>>> [x*y for x in vec1 for y in vec2]
[8, 6, -18, 16, 12, -36, 24, 18, -54]
>>> [x+y for x in vec1 for y in vec2]
[6, 5, -7, 8, 7, -5, 10, 9, -3]
>>> [vec1[i]*vec2[i] for i in range(len(vec1))]
[8, 12, -54]
```

```>>> [str(round(355/113, i)) for i in range(1, 6)]
['3.1', '3.14', '3.142', '3.1416', '3.14159']
```

### 5.1.4. 嵌套列表推导式¶

```>>> mat = [
...        [1, 2, 3],
...        [4, 5, 6],
...        [7, 8, 9],
...       ]
```

```>>> print([[row[i] for row in mat] for i in [0, 1, 2]])
[[1, 4, 7], [2, 5, 8], [3, 6, 9]]
```

```for i in [0, 1, 2]:
for row in mat:
print(row[i], end="")
print()
```

```>>> list(zip(*mat))
[(1, 4, 7), (2, 5, 8), (3, 6, 9)]
```

## 5.2. `del` 语句¶

```>>> a = [-1, 1, 66.25, 333, 333, 1234.5]
>>> del a[0]
>>> a
[1, 66.25, 333, 333, 1234.5]
>>> del a[2:4]
>>> a
[1, 66.25, 1234.5]
>>> del a[:]
>>> a
[]
```

`del` 也可以用于删除变量实体:

```>>> del a
```

## 5.3. 元组和序列¶

```>>> t = 12345, 54321, 'hello!'
>>> t[0]
12345
>>> t
(12345, 54321, 'hello!')
>>> # Tuples may be nested:
... u = t, (1, 2, 3, 4, 5)
>>> u
((12345, 54321, 'hello!'), (1, 2, 3, 4, 5))
```

```>>> empty = ()
>>> singleton = 'hello',    # <-- 注意后面的逗号
>>> len(empty)
0
>>> len(singleton)
1
>>> singleton
('hello',)
```

```>>> x, y, z = t
```

## 5.4. 集合(Set)¶

Python 还包含了 集合(set) 数据类型. 集合是种无序不重复的元素集. 基本用途包括成员关系测试和重复条目消除. 集合对象也支持合(union),交(intersection), 差(difference), 和对称差(sysmmetric difference)等数学操作.

```>>> basket = {'apple', 'orange', 'apple', 'pear', 'orange', 'banana'}
{'orange', 'banana', 'pear', 'apple'}
>>> 'orange' in basket                 # 快速成员关系测试
True
False
```
```>>> # 在两个单词的不重复的字母里演示集合操作
...
>>> b = set('alacazam')
>>> a                                  # a 中的不重复字母
{'a', 'r', 'b', 'c', 'd'}
>>> a - b                              # a 中有而 b 中没有的字母
{'r', 'd', 'b'}
>>> a | b                              # 既有 a 的字母又有 b 的字母
{'a', 'c', 'r', 'd', 'b', 'm', 'z', 'l'}
>>> a & b                              # a 和 b 中都有的字母
{'a', 'c'}
>>> a ^ b                              # a 或 b 中只有一个有的字母
{'r', 'd', 'b', 'm', 'z', 'l'}
```

```>>> a = {x for x in 'abracadabra' if x not in 'abc'}
>>> a
{'r', 'd'}
```

## 5.5. 字典¶

Python 中另一很有用的内建数据类型为 字典 (参考 Mapping Types — dict). 在其它语言中字典一般被叫做 “关联存储” 或 “关联数组”. 与使用某个范围作为索引的序列不一样, 字典通过 来索引, 而键可以是任意不可变类型; 通常用字符串和数字作为键. 如果元组只包含字符串和数字, 元组也可以作为键; 但是, 当元组直接或间接地包含可变对象时, 就不能用作一个键. 不能使用列表作为键, 因为列表可以通过索引, 切片, 或如 `append()``extend()` 方法原地赋值而被改变.

```>>> tel = {'jack': 4098, 'sape': 4139}
>>> tel['guido'] = 4127
>>> tel
{'sape': 4139, 'guido': 4127, 'jack': 4098}
>>> tel['jack']
4098
>>> del tel['sape']
>>> tel['irv'] = 4127
>>> tel
{'guido': 4127, 'irv': 4127, 'jack': 4098}
>>> list(tel.keys())
['irv', 'guido', 'jack']
>>> sorted(tel.keys())
['guido', 'irv', 'jack']
>>> 'guido' in tel
True
>>> 'jack' not in tel
False
```

```>>> dict([('sape', 4139), ('guido', 4127), ('jack', 4098)])
{'sape': 4139, 'jack': 4098, 'guido': 4127}
>>> dict([(x, x**2) for x in (2, 4, 6)])     # 使用列表推导式
{2: 4, 4: 16, 6: 36}
```

```>>> dict(sape=4139, guido=4127, jack=4098)
{'sape': 4139, 'jack': 4098, 'guido': 4127}
```

## 5.6. 遍历技巧¶

```>>> knights = {'gallahad': 'the pure', 'robin': 'the brave'}
>>> for k, v in knights.items():
...     print(k, v)
...
robin the brave
```

```>>> for i, v in enumerate(['tic', 'tac', 'toe']):
...     print(i, v)
...
0 tic
1 tac
2 toe
```

```>>> questions = ['name', 'quest', 'favorite color']
>>> answers = ['lancelot', 'the holy grail', 'blue']
>>> for q, a in zip(questions, answers):
...     print('What is your {0}?  It is {1}.'.format(q, a))
...
What is your name?  It is lancelot.
What is your quest?  It is the holy grail.
What is your favorite color?  It is blue.
```

```>>> for i in reversed(range(1, 10, 2)):
...     print(i)
...
9
7
5
3
1
```

```>>> basket = ['apple', 'orange', 'apple', 'pear', 'orange', 'banana']
...     print(f)
...
apple
banana
orange
pear
```

## 5.7. 深入条件控制¶

`while``if` 语句中使用的条件可以包含任何操作符, 而不仅仅是比较.

• 比较操作符 `in``not in` 检查一个值是否在序列中.
• 操作符 `is``is not` 比较两个对象是否为同一对象; 这只对诸如列表的可变对象有用.

• 逻辑操作符的优先级又低于比较操作符;

• 这其中, `not` 优先级最高, 而 `or` 的优先级最低, 因此 `A and not B or C` 等价于 `(A and (not B)) or C` . 同样, 可以使用圆括号来表达想要的结果.

• 逻辑操作符 `and``or` 被称为 短路 操作符: 它从左至右计算参数,并且当结果确定时计算就立即停止.

• 例如, 如果 `A``C` 为真, 而 `B` 为假时, `A and B and C` 不会计算表达式 `C`.
• 当把短路操作符的返回值作为一个常规值而不是布尔值时, 它的值就是最后计算的参数值.

```>>> string1, string2, string3 = '', 'Trondheim', 'Hammer Dance'
>>> non_null = string1 or string2 or string3
>>> non_null
'Trondheim'
```

• 在使用 `==` 的表达式里键入了 `=` .

## 5.8. 序列和其它类型的比较¶

• 首先比较头两项, 如果它们不同, 它们的比较就决定整个比较的结果;
• 如果它们相同, 就比较下两项, 就这样直到其中有序列被比较完了.
• 如果要被比较的两项本身就是相同类型的序列, 那么就递归进行比较.
• 如果两个序列所有的项都相等, 那么, 它们就相等.
• 如果一个序列是另一个序列的初始子序列(initial sub-sequence),那么短的就是较小的.
• 字符串的 字典编纂 顺序由单个字符的 Unicode 字码来决定.

```(1, 2, 3)              < (1, 2, 4)
[1, 2, 3]              < [1, 2, 4]
'ABC' < 'C' < 'Pascal' < 'Python'
(1, 2, 3, 4)           < (1, 2, 4)
(1, 2)                 < (1, 2, -1)
(1, 2, 3)             == (1.0, 2.0, 3.0)
(1, 2, ('aa', 'ab'))   < (1, 2, ('abc', 'a'), 4)
```

Footnotes

 [1] 调用 `d.keys()` 将返回一个 dictionary view 对象. 它支持类似成员关系测试以及迭代操作, 但是它的内容不是独立于原始字典的 – 它只是一个*视图*.