记录我的 python 学习历程-Day06 is id == / 代码块 / 集合 / 深浅拷贝

一、is == id 用法

　　在Python中，id是内存地址，你只要创建一个数据（对象）那么就会在内存中开辟一个空间，将这个数据临时加载到内存中，这个空间有一个唯一标识，就好比是身份证号，标识这个空间的叫做内存地址，也就是这个数据（对象）的id，那么你可以利用id（）去获取这个数据的内存地址：

name = 'Dylan'

print(id(name))	# 4319709032

== 是比较两边的数值是否相等，其反回的结果是 True 或 False。

is 是比较两边的内存地址是否相等，如果内存地址相等，那么两边所指向是同一个内存地址。其反回的结果是 True 或 False。

name = ['Dylan']

name2 = ['Dylan']

print(name is name2)	# False

print(name == name2)	# True

print(id(name))			# 4387384328

print(id(name2))		# 4387382920

# 这里表示:name name2数值是一样的，但却不是同一个内存地址。

所以：如果内存地址相同，那么值肯定相同，但是如果值相同，内存地址不一定相同。

二、代码块

Python 程序是由代码块构造的，块是一个 python 程序的文本,他是作为一个单元执行的。

代码块：一个模块、一个函数、一个类、一个文件等都是一个代码块。
作为交互方式输入的每个命令都是一个代码块。

什么是交互方式？

就是咱们在 cmd 中进入 Python 解释器里面，每一行代码都是一个代码块。

三、同一代码块下的缓存机制

前提条件：同一个代码块内。
机制内容：Python在执行同一个代码块的初始化对象的命令时，会检查是否其值是否已经存在，如果存在，会将其重用。换句话说：执行同一个代码块时，遇到初始化对象的命令时，他会将初始化的这个变量与值存储在一个字典中，在遇到新的变量时，会先在字典中查询记录，如果有同样的记录那么它会重复使用这个字典中的之前的这个值。所以在你给出的例子中，文件执行时（同一个代码块）会把i1、i2两个变量指向同一个对象，满足缓存机制则他们在内存中只存在一个，即：id相同。
适用对象：int（float）、bool、str。
具体细则：
- int（float）：任何数字在同一代码块下都会复用。
- bool：True 和 False 在字典中会以1,0的方式存在，并且复用。
- str：几乎所有的字符串都会符合缓存机制。
优点：提升性能，节省内存。

不同代码块下的缓存机制（小数据池）

前提条件：不同代码块内。
机制内容：Python自动将-5~256的整数进行了缓存，当你将这些整数赋值给变量时，并不会重新创建对象，而是使用已经创建好的缓存对象。

python会将一定规则的字符串在字符串驻留池中，创建一份，当你将这些字符串赋值给变量时，并不会重新创建对象，而是使用在字符串驻留池中创建好的对象。

　　其实，无论是缓存还是字符串驻留池，都是python做的一个优化，就是将~5-256的整数，和一定规则的字符串，放在一个‘池’（容器，或者字典）中，无论程序中那些变量指向这些范围内的整数或者字符串，那么他直接在这个‘池’中引用，言外之意，就是内存中之创建一个。
适用对象：int（float）、bool、str。
具体细则：
- int（float）：那么大家都知道对于整数来说，小数据池的范围是-5~256 ，如果多个变量都是指向同一个（在这个范围内的）数字，他们在内存中指向的都是一个内存地址。
- bool：True 和 False 在字典中会以1,0的方式存在，并且复用。
- str：满足规则的字符串。
优点：提升性能，节省内存。
总结：
- 面试题考。
- 回答的时候一定要分清楚：同一个代码块下适用一个缓存机制。不同的代码块下适用另一个缓存机制（小数据池）
- 小数据池：数字的范围是-5~256.
- 缓存机制的优点：提升性能，节省内存。

四、集合（了解）

集合是无序的，不重复的数据集合，它里面的元素是可哈希的(不可变类型)，但是集合本身是不可哈希（所以集合做不了字典的键）的。

集合最重要的两点：
- 去重，把一个列表变成集合，就自动去重了。
- 关系测试，测试两组数据之前的交集、差集、并集等关系。

集合和字典

集合的创建

# 方法一

set1 = set({'name', 'Dyaln', 'age', 111, 434})

# 方法二

set1 = {'name', 'Dyaln', 'age', 111, 434}

字典和集合的格式:

# 字典

dic = {'name':'Dylan', 'age': 18}

# 集合

set1 = {'name', 'age', 18, False, True, }

空字典:

dic = {}

# 或者

{}

print({}, type({}))		# {} <class 'dict'>

空集合:

set()

print(set(), type(set()))		# set() <class 'set'>

集合的有效性:

set1 = {[1, 3, 5], 3, {'name': 'Dylan'}}

print(set1)

# 报错

  File "/Users/yaoyaoba/Full_stack_22/day06/练习.py", line 24, in <module>

set() <class 'set'>

    set1 = {[1, 3, 5], 3, {'name': 'Dylan'}}

TypeError: unhashable type: 'list'

# 集合内的元素必须是 可合希类型(不可变数据类型)

集合的操作

增

set.add()

set1 = {'name', 'Dylan', 'xiaowang', 'yaoyao', 'age'}

set1.add('xx')

print(set1)		# {'xiaowang', 'xx', 'age', 'yaoyao', 'name', 'Dylan'}

set.update() 迭代增加(有重复的会自动除去)

set1 = {'name', 'Dylan', 'xiaowang', 'yaoyao', 'age'}

set1.update('abcdedfdaefdafdsa')

print(set1) 	# {'yaoyao', 'age', 'd', 'e', 'a', 'Dylan', 'xiaowang', 'b', 'f', 'c', 'name', 's'}

删

set.remove() 按元素删除

set1 = {'name', 'Dylan', 'xiaowang', 'yaoyao', 'age'}

set1.remove('age')

print(set1) 	# {'xiaowang', 'yaoyao', 'Dylan', 'name'}

set.pop() 随机删除

set1 = {'name', 'Dylan', 'xiaowang', 'yaoyao', 'age'}

set1.pop()

print(set1) 	 # {'yaoyao', 'age', 'xiaowang', 'Dylan'}

set.clear() 清空集合

set1 = {'name', 'Dylan', 'xiaowang', 'yaoyao', 'age'}

set1.clear()

print(set1) 	# set()

del set 删除集合

set1 = {'name', 'Dylan', 'xiaowang', 'yaoyao', 'age'}

del set1

print(set1) 	# 会报错,因为己经没有这个集合了

# 报错信息如下:

Traceback (most recent call last):

  File "/Users/yaoyaoba/Full_stack_22/day06/练习.py", line 28, in <module>

    print(set1) 	# 会报错,因为己经没有这个集合了

NameError: name 'set1' is not defined

集合的其它操作

交集。（& 或者 intersection）

set1 = {1, 2, 3, 4, 5}

set2 = {4, 5, 6, 7, 8}

print(set1 & set2) 	# {4, 5}

并集。（| 或者 union）

set1 = {1, 2, 3, 4, 5}

set2 = {4, 5, 6, 7, 8}

print(set1 | set2) 	# {1, 2, 3, 4, 5, 6, 7, 8}

差集。（- 或者 difference）

set1 = {1, 2, 3, 4, 5}

set2 = {4, 5, 6, 7, 8}

print(set1 - set2) 	# {1, 2, 3}

反交集。（^ 或者 symmetric_difference）

set1 = {1, 2, 3, 4, 5}

set2 = {4, 5, 6, 7, 8}

print(set1 ^ set2)  # {1, 2, 3, 6, 7, 8}

子集与超集

set1 = {1,2,3}

set2 = {1,2,3,4,5,6}

print(set1 < set2)

print(set1.issubset(set2))  # 这两个相同，都是说明set1是set2子集。

print(set2 > set1)

print(set2.issuperset(set1))  # 这两个相同，都是说明set2是set1超集。

列表去重

 l1 = [1,'Dylan', 1, 2, 2, 'Dylan',2, 6, 6, 3, 'Dylan', 4, 5]

# set1 = set(l1)

# l1 = list(set1)

# print(l1)

# 用处：数据之间的关系，列表去重。

五、深浅copy

copy其实就是复制一份，也就是所谓的抄一份。深浅copy其实就是完全复制一份，和部分复制一份的意思。

先看赋值运算
```
l1 = [1, 2, 3, ['Dylan', 'age']]

l2 = l1

l1.append(456)

print(l1)	# [1, 2, 3, ['Dylan', 'age'], 456]

print(l2)	# [1, 2, 3, ['Dylan', 'age'], 456]

print(id(l1))	# 4387382920 内存地址是一样的

print(id(l2))	# 4387382920 内存地址是一样的
```
对于赋值运算来说，l1与l2指向的是同一个内存地址，所以它们是完全一样的，l1,l2指向的是同一个列表，任何一个变量对列表进行改变，剩下那个变量在使用列表之后，这个列表就是发生改变之后列表。
浅拷贝 copy
```
l1 = [1, 2, 3, ['Dylan', 'age']]

l2 = l1.copy()

print(id(l1))	# 4335892104

print(id(l2))	# 4335903304

# 这说明,通过 copy 出来的新列表,在内存中又开辟了一块新的内存空间,两者间不是指向的同一个列表。

# 但是，如果再做如下操作你会发现什么？

print(id(l1[-1])) 	# 4370607112

print(id(l2[-1]))	# 4370607112

# 你会发现，咦？内存地址是一样的，说明是同一个数据。
```
由此我们可以得知，浅拷贝其实只是拷贝了一个列表的外壳。

对于浅copy来说，只是在内存中重新创建了开辟了一个空间存放一个新列表，但是新列表中的元素与原列表中的元素是公用的。

这里还有一个问题：

当改变列表中的不可变数据类型时，新列表中的内容是不会一同被更改的，因为它是可哈希数据类型，如列表中，可变数据类型被列改或增删改，则新列表会一同更改。

深拷贝 deepcopy

import copy

l1 = [1, 2, 3, ['Dylan', 'age']]

l2 = copy.deepcopy(l1)

print(id(l1))	# 4343088456

print(id(l2))	# 4370618248

# 这说明,通过 copy 出来的新列表,在内存中又开辟了一块新的内存空间,两者间不是指向的同一个列表。

print(id(l1[-1])) 	# 4379005512

print(id(l2[-1]))	# 4379005832

# 咦？内存地址不一样了，说明不是同一个数据了。

print(id(l1[0])) 	# 4305226112

print(id(l2[0]))	# 4305226112

# 哎我去！又一样了，咋回事儿？

深 copy 的特性就是将可变的数据类型在内存中重新创建一份，而不可变的数据类型则沿用之前的。

但，同样如浅拷贝那样，不可变的数据类型，即便内存地址相同，当你改变他时，新列表也不会一同被更改，只因为他是不可变数据类型（可哈希）。

相关面试题

l1 = [1, 2, 3, [22, 33]]

l2 = l1[:]

l1[-1].append(666)

print(l1)	# [1, 2, 3, [22, 33, 666]]

print(l2)	# [1, 2, 3, [22, 33, 666]]

浅copy： list dict: 嵌套的可变的数据类型是同一个。

深copy： list dict: 嵌套的可变的数据类型不是同一个 。