笔记-python-standard library-12.1 pickle

时间:2023-03-09 19:21:20
笔记-python-standard library-12.1 pickle

笔记-python-standard library-12.1 pickle

1.      pickle简介

source code: Lib/pickle.py

pickle模块实质上是一个实现python对象结构序列化的二进制协议。可以“序列化”,当然也可以“反序列化“。

python中也有一些其它的模块实现类似的功能,但一般情况下序列化使用pickle:

  1. marshal

主要用于支持.pyc文件。考虑到扩展性以及功能性,一般情况下序列化使用Pickle。

  1. json

json是一种文本序列化格式,是人类可读的,而Pickle不是。

关键是json支持的Python对象类型仅限于内置类型。

1.1.    数据流格式

pickle使用的数据格式是python特定的。好处是不与其它协议冲突,坏处是其它协议不支持pickle格式。

默认情况下,pickle数据数据格式使用较高压缩率的二进制格式,当然,可以指定压缩率。

有5种协议用于序列化,越新的协议版本号越大,同样,需要新版的python。支持:

  1. version 0

最原始的“人类可读”版协议,与早期的python版本兼容。

  1. version 1

旧的二进制格式,与早期的Python兼容。

  1. version 2              python 2.3中引进。
  2. version 3              Python3.0 中引进。
  3. version 4              python 3.4中引进。

1.2.    模块接口

序列化使用dumps(),反序列化使用loads()。如果需要进行更多的细节控制,可以使用Pickler和Unpickler对象。

模块常量:

  1. pickle.HIGHEST_PROTOCOL

整数,支持协议的最高版本。

  1. pickle.DEFAULT_PROTOCOL

整数,默认协议版本。目前默认是3.

方法:

  1. pickle.dump(obj, file, protocol=None, *, fix_imports=True)

将对象序列化并写入文件句柄。

protocol,一个可选参数,整数,使用指定版本协议。

file参数必需有支持字节写入的write()方法,

fix_imports主要用于与python2的兼容,一般不用设置。

  1. pickle.dumps(obj, protocol=None, *, fix_imports=True)

将对象序列化并返回一个二进制对象。

  1. pickle.load(file, *, fix_imports=True, encoding="ASCII", errors="strict")

从指定文件对象中读取序列化对象。

协议版本自动查看。

  1. pickle.loads(bytes_object, *, fix_imports=True, encoding="ASCII", errors="strict")

对应于dumps。

1.2.1.   代码案例

import pickle

from json import load

a = pickle.HIGHEST_PROTOCOL

print(a)

a = pickle.DEFAULT_PROTOCOL

print(a)

with open('nums.txt', 'r', encoding='utf-8') as fi:

lisa = load(fi)

print(len(lisa))

file_a = 'pickle_a.txt'

with open(file_a, 'wb+') as fi:

pass

pickle.dump(lisa,fi)

file_a = 'pickle_a.txt'

with open(file_a, 'rb+') as fi:

pass

pickle.dump(lisa,fi)

1.3.    异常

pickle模块定义了三种异常:

  1. exception pickle.PickleError

pickle模块异常类的基类,继承于Exception.

  1. exception pickle.PicklingError  序列化失败时抛出
  2. exception pickle.UnpicklingError 反序列化失败时抛出

1.4.    class

  1. class pickle.Pickler(file, protocol=None, *, fix_imports=True)

This takes a binary file for writing a pickle data stream.

methods:

dump(obj) 将obj pickle化并写入file

  1. class pickle.Unpickler(file, *, fix_imports=True, encoding="ASCII", errors="strict")

This takes a binary file for reading a pickle data stream.

load() 从文件句柄中读取pikled对象并反序列化。返回反序列化后的对象。

1.5.    pickled 和unpickled范围

下面这些对象是可以序列化和反序列化的。

None, True, and False

integers, floating point numbers, complex numbers

strings, bytes, bytearrays

tuples, lists, sets, and dictionaries containing only picklable objects

functions defined at the top level of a module (using def, not lambda)

built-in functions defined at the top level of a module

classes that are defined at the top level of a module

instances of such classes whose __dict__ or the result of calling __getstate__() is picklable (see section Pickling Class Instances for details).