day 06 列表去重，数据类型的补充，编码，深浅copy

因为重要，所以放前面

列表去重

l1 = [1, 2, 3, 4, 5]

l2 = [3, 4, 5, 6, 7]

set = list(set(l1 + l2))      # set自动去重，然后变成list类型

print(set)     #  [1, 2, 3, 4, 5, 6, 7]

1、 id is ==

== 是比较的两边的数值是否相等，而 is 是比较的两边的内存地址是否相等。如果内存地址相等，那么这两边其实是指向同一个内存地址。

l1 = [1, 2, 3]

l2 = [1, 2, 3]

print(l1, l2)

print(id(l1), id(l2))      # 值相同，ID不同

l1 = [1, 2, 3]

l2 = [1, 2, 3]

print(l1 == l2)  # True

print(l1 is l2)  # False

可以说如果内存地址相同，那么值肯定相同，但是如果值相同，内存地址不一定相同。

代码块：　了解

Python程序是由代码块构造的。块是一个python程序的文本，他是作为一个单元执行的。

代码块：一个模块，一个函数，一个类，一个文件等都是一个代码块。

而作为交互方式输入的每个命令都是一个代码块。

对于一个文件中的两个函数，也分别是不同的代码块

代码块的缓存机制 了解　

代码块的缓存机制的适用范围： int（float），str，bool

int(float):任何数字在同一代码块下都会复用。

bool:True和False在字典中会以1，0方式存在，并且复用。

str：几乎所有的字符串都会符合缓存机制

小数据池：提升效率，节约内存

Python自动将-5~256的整数进行了缓存，当你将这些整数赋值给变量时，并不会重新创建对象，而是使用已经创建好的缓存对象。

python会将一定规则的字符串在字符串驻留池中，创建一份，当你将这些字符串赋值给变量时，并不会重新创建对象，而是使用在字符串驻留池中创建好的对象。

其实，无论是缓存还是字符串驻留池，都是python做的一个优化，就是将~5-256的整数，和一定规则的字符串，放在一个‘池’（容器，或者字典）中，无论程序中那些变量指向这些范围内的整数或者字符串，那么他直接在这个‘池’中引用，言外之意，就是内存中之创建一个。

优点：能够提高一些字符串，整数处理人物在时间和空间上的性能；需要值相同的字符串，整数的时候，直接从‘池’里拿来用，避免频繁的创建和销毁，提升效率，节约内存。

总结：

　　如果在同一代码块下，则采用同一代码块下的换缓存机制。

　　如果是不同代码块，则采用小数据池的驻留机制

# pycharm 通过运行文件的方式执行下列代码：  这是在同一个文件下也就是同一代码块下，采用同一代码块下的缓存机制。

i1 = 1000

i2 = 1000

print(i1 is i2)  # 结果为True 因为代码块下的缓存机制适用于所有数字

通过交互方式中执行下面代码：   # 这是不同代码块下，则采用小数据池的驻留机制。

>>> i1 = 1000

>>> i2 = 1000

>>> print(i1 is i2)

False  # 不同代码块下的小数据池驻留机制 数字的范围只是-5~256.

# 虽然在同一个文件中，但是函数本身就是代码块，所以这是在两个不同的代码块下，不满足小数据池（驻存机制），则指向两个不同的地址。

def func():

    i1 = 1000

    print(id(i1))  #

def func2():

    i1 = 1000

    print(id(i1))  #

func()

func2()

2、数据类型补充： int， str， bool，list，tuple，dict，set。

# 数据类型之间的转换：
# str ---> list split 

# list ---> str join  

# bool ：False   0 '' [] () {}  set()

list <----> tuple

# list <--->  tuple

l1 = [1,2,3]

tu1 = tuple(l1)

l2 = list(tu1)

print(tu1)

print(l2)

list <------ dict

# list <---- dict

dic1 = {'name': 'alex', 'age': 12}

print(list(dic1))

list <------dict

# list <---- dict

dic1 = {'name': 'alex', 'age': 12}

print(list(dic1))

list <------> set

# list <---> set ***

li = [1, 2, 3, 4, 5]

set = set(li)

print(set, type(set))

set = {1, 2, 3, 4, 5}

list = list(set)

print(list)

元组补充：　

元组中只有一个元素并且没有逗号，则他不是元组，与元素数据类型相同。

tu1 = (1)

tu2 = (1)

print(tu1, id(tu1), type(tu1))  # 1 1558496944 <class 'int'>

print(tu2, id(tu2), type(tu2))  # 1 1558496944 <class 'int'>

tu1 = (1,)

tu2 = (1,)

print(tu1, id(tu1), type(tu1))  # (1,) 2880293370120 <class 'tuple'>

print(tu2, id(tu2), type(tu2))  # (1,) 2880294252048 <class 'tuple'>

踩坑题

坑1：li = [11, 22, 33, 'alex', 55] 将列表中索引为奇数位的元素删除

错误事例：

li = [11, 22, 33, 'alex', 55]

for index in range(len(li)):

    if index % 2 == 1:

        li.pop(index)

print(li)                    #  [11, 33, 'alex']   删除的是索引为1,4 的元素

# 原因：pop在删除索引1后，会将后面元素，全部向前提一位 （补空）

#  解决方法: 循环从后面开始

解决方法：

一，从后面开始循环

li = [11, 22, 33, 'alex', 55]

for index in range(len(li)-1, -1, -1):

    if index % 2 == 1:

        li.pop(index)

print(li)

二，创建新列表，将偶数选出，然后覆盖 li 列表

li = [11, 22, 33, 'alex', 55]

l1 = []

for index in range(len(li)):

    if index % 2 == 0:

        l1.append(li[index])

li = l1

print(li)

总结：在循环一个列表时，最好不要改变列表的大小，这样会影响你的最终结果

坑二：

 dic = {'k1':1,'k2':2, 'k3': 3, 'name': '太白'}
 将字典中键含有k元素的键值对删除
错误示例：

dic = {'k1':1,'k2':2, 'k3': 3, 'name': '太白'}

for key in dic:

    if 'k' in key:

        dic.pop(key)

l1 = []
#  结果报错  dictionary changed size during iteration

解决方法：

dic = {'k1': 1, 'k2': 2, 'k3': 3, 'name': '太白'}

l1 = []

for key in dic:

    if 'k' in key:

        l1.append(key)

for k1 in l1:

    dic.pop(k1)

print(dic)

总结：dict 在循环一个字典时，不能改变字典的大小，会报错


编码的进阶：

 ascii，unico，utp-8，gbk四个编码本：
    1，不同的编码之间能否互相识别（报错或者出现乱码）。 不能！！
    2， 规定：文字通过网络传输，或者硬盘存储不能使用Unicode编码方式。 耗内存

大前提：
    python3x环境：
    唯独str类型：他在内部编码方式是unicode
    所以 python3x中的字符串不能用于直接的网络传输 文件的存储   '中午请我去吃饭'

    补充一个数据类型：bytes类型 与str类型是海尔兄弟。
    为啥要有bytes：
        bytes内部编码方式非unicode

    为啥还要有str？ bytes直接就解决了所有问题呀?
    bytes 中文是16进制表示，看不懂。
    英文：
        str：
            表现形式：'alex'
            内部编码：unicode

        bytes：
            表现形式：b'alex'
            内部编码：非unicode

    中文：
        str：
            表现形式：'屌丝'
            内部编码：unicode

        bytes：
            表现形式：b'\xe5\xb1\x8c\xe4\xb8\x9d''
            内部编码：非unicode

        bytes：当你需要网络传输数据，文件存储数据时要考虑到bytes。

        str ---> bytes(gbk  utf-8)
        unicode ---> gbk  utf-8


bype 用法：

s1 = 'alex'

b1 = b'alex'

print(b1,type(b1))    # b'alex' <class 'bytes'>

print(b1.upper())　　　# b'ALEX'

编码之间的转换

# unicode ---> gbk 字符串 ---> gbk编码方式的bytes

s1 = '太白'

b1 = s1.encode('gbk') # 编码

s2 = b1.decode('gbk') # 解码

print(s2)

# unicode ---> utf-8  字符串 ---> utf-8 编码方式的bytes

s2 = '太白'

b2 = s2.encode('utf-8')

s3 = b2.decode('utf-8')

print(s3)

# gbk ---> utf-8

#

b1 = b'\xcc\xab\xb0\xd7'  # gbk编码的bytes类型

s = b1.decode('gbk')

b2 = s.encode('utf-8')  # utf-8编码的bytes类型

print(b2)

深浅copy

浅copy，在内存中创建一个新的list(dict)，但是新的列表里面的元素还是与原列表共用一个

# 浅copy

# 在内存中创建一个新的list(dict)，但是新的列表里面的元素还是与原列表共用一个。

l1 = [1, 'alex', [11, 22]]

l2 = l1.copy()

print(id(l1), id(l2))     #  1893402849992 1893402850760

l1.append(33)

print(l1, l2)             # [1, 'alex', [11, 22], 33] [1, 'alex', [11, 22]]

print(id(l1[0]))          #

print(id(l2[0]))          #

print(id(l1[-1]))         #

print(id(l2[-1]))         #

print(l1 is l2)           # print(l1 is l2)

深COPY

深copy会在内存中对原列表（dict）以及列表里面的可变的数据类型重新创建一份，而列表中不可变的数据类型还是沿用原来的

import copy

l1 = [1, 'alex', [11,22]]

l2 = copy.deepcopy(l1)

# l1[0] = 1000

print(l1)

print(l2)

# print(id(l1))

print(id(l2))

print(id(l1[-1]))  #

print(id(l2[-1]))  #

print(id(l1[0]))

print(id(l2[0]))

l1[-1].append(666)

print(l1)

print(l2)

day 06 列表去重，数据类型的补充，编码，深浅copy的更多相关文章

基础数据类型的补充和深浅copy
一:关于str 的操作方法补充 1,s.isspace() 判断字符串是否只由空格组成,是,为True,否则,为False. s = ' ' #只能是以至少一个空格组成的字符串(全空格) prin ...
python之路--基础数据类型的补充与深浅copy
一 . join的用法 lst =['吴彦祖','谢霆锋','刘德华'] s = '_'.join(lst) print(s) # 吴彦祖_谢霆锋_刘德华 # join() "*" ...
python--基础数据类型的补充与深浅copy
一 . join的用法 lst =['吴彦祖','谢霆锋','刘德华'] s = '_'.join(lst) print(s) # 吴彦祖_谢霆锋_刘德华 # join() "*" ...
python基础(三)编码,深浅copy
编码,深浅copy encode,decode在python2中使用的一些迷糊,python3中更容易理解要理解encode和decode,首先我们要明白编码,字符和二进制的相关概念,简单来说,计算 ...
《Python》基础数据类型补充和深浅copy
一.基础数据类型的补充元组: 如果元组中只有一个数据,且没有逗号,则该‘元组’数据类型与里面的数据类型一致列表: 列表之间可加不可减,可跟数字相乘 l1=['wang','rui'] l2=['c ...
基础数据类型之集合和深浅copy，还有一些数据类型补充
集合集合是无序的,不重复的数据集合,它里面的元素是可哈希的(不可变类型),但是集合本身是不可哈希(所以集合做不了字典的键)的.以下是集合最重要的两点: 去重,把一个列表变成集合,就自动去重了. 关系 ...
基本数据类型补充，深浅copy
#str s=' ' #只能是以至少一个空格组成的字符串(全空格) print(s.isspace()) #tuple 当元组只有一个元素组成,并没有",",则该元素是什么数据类型 ...
Python基础学习Day7 基础数据类型的扩展集合深浅copy
一.基础数据类型的扩展 1.1GBK ---> UTF - 8 # str --->bytes s1 = '太白' # 字符串是unicode编码 b1 = s1.encode('gbk' ...
day 07 数据类型，集合，深浅copy
1.day 06 内容回顾小数据池 int :-5-256 str:特殊字符 ,*20 ascii:8位 1字节表示一个字符 unicode:32位 4个字节 , 表示一个字符字节表示8位表示一 ...

随机推荐

Eclipse各种配置
1.配置工作空间编码 Window -- Preferences-- Genereal -- Workspace (Text file encoding -- orther -- utf-8) 2 ...
js--闭包的理解
从技术上来讲,在JS中,每个function都是闭包,因为它总是能访问在它外部定义的数据. 当该内部函数在外部函数外被调用,就生成了闭包. 函数内部可以直接读取全局变量. 闭包就是能够读取其他函数内部 ...
easyUI tree点击文字展开节点
easyUI默认展开树的时候,点击节点前边的黑色小三角 ,这样操作存在不人性化的地方,在实际使用中由于老旧电脑的存在和大龄使用者的眼花经常点不准:因此要实现点击节点名称展开的方式,其实就是在展开事件上 ...
Git的安装与配置
在安装Git之前,首先要下载Git安装包. 下载地址:https://gitforwindows.org/ 下载完后打开安装:如下步骤按着以上步骤安装完成 ...
Python对象相关内置函数
针对一个对象,通过以下几个函数,可以获取到该对象的一些信息. 1.type() ,返回某个值的类型 >>> type() <class 'int'> >>&g ...
python命令行解析模块--argparse
python命令行解析模块--argparse 目录简介详解ArgumentParser方法详解add_argument方法参考文档: https://www.jianshu.com/p/aa ...
linux解压缩命令之unzip,tar（持续更新）
unzip apache-tomcat-7.0.78.zip -d /usr/local/src/ 解压zip压缩包到/usr/local/src,-d就是指定解压路径的意思
使用SpringMVC的&commat;CrossOrigin注解解决跨域请求问题
跨域问题,通俗说就是用ajax请求其他站点的接口,浏览器默认是不允许的.同源策略(Same-orgin policy)限制了一个源(orgin)中加载脚本或脚本与来自其他源(orgin)中资源的交互方 ...
0510进程 multiprocess模块
process模块是一个创建进程的模块,借助这个模块,就可以完成进程的创建. 创建模块 import os import time from multiprocessing import Proces ...
[linux] C语言Linux系统编程-捕获进程信号
typedef void( *sighandler_t)(int); 1.用typedef给类型起一个别名. 2.为函数指针类型定义别名, 3.函数指针(指向函数的指针) sighandler_t s ...

day 06 列表去重， 数据类型的补充，编码，深浅copy

day 06 列表去重， 数据类型的补充，编码，深浅copy的更多相关文章

随机推荐

相关文章

day 06 列表去重，数据类型的补充，编码，深浅copy

day 06 列表去重，数据类型的补充，编码，深浅copy的更多相关文章