Python数据类型(python3)

基础数据类型

整型 <class 'int'>
- 带符号的，根据机器字长32位和64位表示的范围不相同，分别是：
- -2^31 - 2^31-1 和 -2^63 - 2^63 -1
- Python为了程序运行速度，使用了小整数对象池，避免整数对象的频繁申请和销毁，增加程序运行速度的开销。也就是声明多个小整数赋值给变量，这些变量都是指向的小整数对象池里面的那个小整数对象。相反大整数都会重新实例一个在内存中。

>>>id(258)
1971357673680
>>>id(258)
1971357675120
>>>id(258)
1971357672720
#以上三次实例的整数都是单独的
>>>id(256)
1390248128
>>>id(256)
1390248128
#以上两次实例的小整数都是同一个实例

.
- 所谓小整数是[-5,257)的左闭右开区间。
- 而对于大整数也会有个对象池，将没有使用的保留在对象池中，不会销毁，有需要的时候直接被使用。
- 整数对象能进行算数运算，特别的是%取模，和divmod(a,b) -> (整除数,余数) 形式的一个元组tuple
- 多种表示方式
  - 二进制binary：0b111011
  - 八进制octonary：0o7237
  - 十进制decimalism：10392049
  - 十六进制hexadecimal：0xAB23CF
  - 进制转化间使用bin(),oct(),hex()
浮点<class 'float'>
- 即分数，有限小数和无限循环小数
- 之所以叫浮点，是按照科学计数法表示时，小数点位是可变的1.23*109
- 不精确，默认是17位精度。如果都是用严格的科学计数法表示的话，那么小数点后能表示16位，小数点前只有1位
- 当需要更高精度，超过16位，那么就得使用decimal模块。1st,先使用getcontext(位数)设置精确位数，然后在使用Decimal(1.232)对象来表示小数并使用其进行算数运算，最后得到的也是Decimal对象
- 如果用格式化字符串来设定精确位数，会非常的不准确。

>>> a = "%.30f" % (1.0/3)
>>> a

'0.333333333333333314829616256247'

字符串<class 'str'>
- 字符串也是序列，很多序列的工厂函数都可以使用
- 字符串是不可变对象，immutable，可以hash，可以做字典key
- 表示法：
  - 单引号，双引号，三对单/双引号
  - r"dsf" 表示的字符，取消引号中的特殊字符意义
  - u"kdsjf"表示unicode编码的字符串，在python3中等同于普通字符串表示法；但在python2中这就是一种单独类型的数据对象，叫unicode。所以蛋疼的python2和python3在字符编码上让人头晕。好了，这里我们只提python3,那python3多了一个bytes类型,因为是独立的一个类型，但是还是是序列的一种。下面说：
  - b'sdfs' 在python3中这个可不是字符串，是bytes。应该可以认为是可以表示数据流。python2中就是字符串。
  - 在python3中通过str.encode()转换为bytes，通过bytes.decode()转换为str。和两个方法互转。
- 字符串工厂方法：
  1. string.capitalize() -> str 首字母大写剩下的变小写
  2. string.center(self,width,fillchar=None) -> str 返回一个指定字节宽度，string在中间，其它有填充字符填充
  3. string.count(self,sub,start=None,end=None) -> int
  4. string.encode(self,encoding='utf-8',errors='strict') -> bytes
  5. string.endwith(self,suffix,start=None,end=None) -> bool
  6. string.startwith(self,prefix,start=None,en=None) -> bool
  7. string.expandtab(self,tabsize=8) -> str 将字符串中tab字符转换为指定个数的空格字符
  8. string.find(self,sub,start=None,end=None) -> int 最小的索引值sub在string之一
  9. string.format(self,*args,**kwargs) -> str 将string中{}无论根据名字还是数字使用函数参数进行替换。
  10. string.index(self,sub,start=None,end=None) -> int 不同于find的是，没有不会返回-1而是抛出ValueError异常。
  11. string.isalnum()-> bool 字符串不为空且都是字母和数字
  12. string.isdigit()-> bool
  13. string.isalpha()-> bool
  14. string.isdecimal() -> bool 是否是十进制证书
  15. string.isidentifier() -> bool 是否是关键字字符
  16. 序列的特性都有
- python3解释器默认utf-8编码，是支持对utf-8的转码为unicode的。python2就需要显示指定编码。同样python3的源码如果是gbk的编码，那么也是需要在文件头添加gbk的编码指定，代码加载到内存中后会转码为unicode

>>>import sys
>>>print(sys.getdefaultencoding())
utf-8

.
- 编码不能说太多了，太多只有看网上大牛的文章了。
- 字符的编码查看ord('s')返回字符的unicode编码十进制，通过chr(103923)返回十进制编码对应的字符。
- 对于小于4个字节字符串使用一个类似小整数的字符串对象池。
- 还有大于4个字节字符串也有想大整数类似的字符串对象缓冲池，而且提供intern()方法手动都指定同一个字符串实例。

布尔<class 'bool'>
- False True
- 隐含bool值：[] {} 0 () '' 0 None 0.0 0j 作False, 其它所有非空的数据都可以作True,还有 instances of user-defined classes,if the class defines a __bool()__ or __len__() method,when that method returns the integer zero or bool value False.
空值
- None 什么都没有

其它常用类型(进行ing)

列表list
- mutable可变数据类型，不能hash不能做key，属于序列即有序的，可以嵌套，有深浅copy一说的特性，可迭代。
- 列表相当于一个容器，存放其它数据类型对象，列表容器也有容器自己的内存地址，列表中的是有序的存放其它数据的内存地址。
- 通过列表生成式，产生一个列表实例
- a = [] ; b = list(可迭代对象/单个元素/无参数) 来实例化一个列表对象。
- 支持通用的可迭代对象遍历方式
- 支持：
  - 索引访问(正反)；
  - 切片(可自定步长第三个表示步长)->返回一个新列表存着切片出来的元素，原列表没变化。隐含有浅copy，虽然是切片部分copy。就是改变子列表元素，原列表也看的见改变的元素。
  - 追加append(从列表尾部压入)-> 改变列表
  - 删除：1) list.remove(元素)根据元素删 2） del list[idx1][idx2]根据索引删... ->改变列表
  - 取出：pop(ele) ->改变列表。和删除针对列表上，都是将元素移除列表。两者不同的是：删除是内存中删除了；取出是从列表移除，在内存中还是存在的，只是可以被其它变量引用。
  - 插入:list.insert(idx,ele)-> 改变列表
  - 列表长度：len(list) -> 不改变列表
  - 判断元素在列表容器中没：'seve' in list -> False or True 应该是判断有没相等的，而不是判断是否同一个对象。
  - 删除多个元素：del list[1:n]
  - list.clear() 清空列表字典也有这个功能
元组tuple
- immutable,可hash,有序
- t = (2,) 一个元素需要在后加上一个逗号，表明是元组，不然等价于没有() ; tt = tuple(可迭代对象/无参数) 来实例化一个元组对象。
- 上面一条意思是：a = ('str') <=> a = 'str' 两种方式变量都是class 'str'而不是tuple 这点在声明元组时就最好使用tuple(可迭代对象)函数
- 可以使用元组进行多变量赋值： a, b = (1, 2) # unpack
- 支持：
  - 索引访问(正反)；
  - 切片同list
  - tuple长度：len(tuple)
  - 判断元素是否在tuple中： 'seven' in tuple
字典dict
- mutable，可变的不能hash，是map映射的一种，好像python唯一映射类型。
- 通过key->value 就是一种不可变数据对象映射另一个任意数据对象。
- 实例字典对象：

实例方式	说明
d1 = {key1:value1,key2:value2}	直接
d2 = dict(name='seven', age=20)	间接通过dict()之关键字参数方式
d3 = dict(mapping)	间接通过dict()之带入一个mapping对象
d4 = dict(iterable)	间接通过dict()之带入一个可迭代并且每次迭代出一个二元的序列的对象,如 iterable = ('ab','cd','ef') -> dict(iterable) == {'a': 'b', 'c': 'd', 'e': 'f'},这种的反向操作是d4.items()

- key必须不可变，在字典中唯一；字典是无序的。
- 方法(python3)：
  - dict.keys() -> key的迭代对象，可list()
  - dict.values() -> value的迭代对象，可list()
  - dict.items() -> 返回key,value二元组的可迭代对象
  - len(dict)-> 返回字典键值对个数
  - dict.clear() 清空字典可变容器都有这个功能
  - dict.setdefault(k,None) 不存在就设置default值，这样添加就不会因为key冲突而报异常
  - dict.pop(key[,defaultvalue]) 和list.pop()类似，取出key对应的值，没有key就返回defaultvalue，没有default值抛异常
  - dict.get(self,k,d=None) 返回key对应的值，没有key返回default值，默认default为None
  - dict.copy() a shallow浅 copy of dict
  - dict.popitem(self) -> 返回键值对元组
  - dict.update(E,**F) 如果给了一个字典参数，那么使用参数字典的key更新dict有相同的key；如果是关键字参数，类似的，参数名作k,值做v,更新dict
集合set
- 可变，剔重，集合运算，set()，元素没顺序,因为元素必须唯一，所以集合中不能出现可变数据类型，如容器list，容器dict.
- 强调集合本身也是一个容器，是可变的。可以通过frozenset()实例不可变集合。
- 用处除了检查成员资格，还可以集合运算，剔重可迭代对象。
- s1 = {1,2,3} s2 = set(可迭代对象)
- in not in
- 集合运算：
  - s1和s2并集： s1 | s3 ; s1.union(s2)
  - s1 s2 交集： s1 & s2 ; s1.intersection(s2)
  - s1 s2 对称差集： s1^s2 ; s1.symmetric_difference(b)
  - s1 差集 s2 ： s1-s2 ; s1.difference(s2)
- 集合包含关系：
  - 集合相等或不等: = ; !=
  - 集合s1 包含 s2: s1>=s2 ; s1.issuperset(s2)
  - 集合s1 包含于s2： s1<=s2 ; s1.issubset(s2)
  - 集合s1 不相交于 s2: s1.isdisjoin(s2)
- 集合常用操作：
  1. set.add() 添加元素
  2. set.pop() 从集合中取出元素
  3. set.update() 将新元素和原集合并集的新集合
  4. set.clear() 清空集合
  5. set.copy() 浅copy
  6. set.remove() 删除元素，没有报异常
  7. set.discard() 删除元素，没有不报异常
collections模块
深浅copy(copy.deepcopy())/enumerate(,索引起点)/rang()/is not is/split join/zip()/

秒客网

Python数据类型(python3)

Python数据类型(python3)

基础数据类型

其它常用类型(进行ing)

相关文章