Python中的序列化以及pickle和json模块介绍

Python中的序列化指的是在程序运行期间，变量都是在内存中保存着的，如果我们想保留一些运行中的变量值，就可以使用序列化操作把变量内容从内存保存到磁盘中，在Python中这个操作叫pickling，等下次再使用保存的变量时，可以通过反序列化操作提取数据内容到内存，即unpickling

我们先来介绍pickle模块，它就是Python提供用来序列化对象的模块，假如现在我们把一个对象序列化。

import pickle

d=dict(name='zhangkang',age=20,sex='man')

#以二进制的方式写入pk.txt

with open('pk.txt','wb') as f:

    pickle.dump(d,f)

这样在当前程序运行目录就会生成一个pk.txt文件，里面保存着d对象，下面我们把序列化的对象内容提取出来，也就是反序列化。

import pickle

with open('pk.txt','r') as f:

    d=pickle.load(f)

print(type(d))

print(d)

输出:

<type 'dict'>

{'age': 20, 'name': 'zhangkang', 'sex': 'man'}

**pickle.dump()直接把对象序列化后写入一个file-like Object：

pickle.load()方法从一个file-like Object中直接反序列化出对象**

当然我们也可以使用pickle.dumps()方法把对象序列化成一个str，然后，就可以把这个str写入文件。当我们要把对象从磁盘读到内存时，可以先把内容读到一个str，然后用pickle.loads()方法反序列化出对象

import pickle

d=dict(name='zhangkang',age=20,sex='man')

s=pickle.dumps(d)

#先看下s的类型和内容

print(type(s))

print(s)

print('\n')

#把s保存到文件，再从文件读取，就是文件

#操作的内容了，本程序不演示了，现在我们把s

#反序列化

ss=pickle.loads(s)

print(type(ss))

print(ss)

输出：

<type 'str'>

(dp0

S'age'

p1

I20

sS'name'

p2

S'zhangkang'

p3

sS'sex'

p4

S'man'

p5

s.

<type 'dict'>

{'age': 20, 'name': 'zhangkang', 'sex': 'man'}

json模块

假如我们需要在不同的编程语言之间传递对象，就需要把对象序列化成标准格式，类型于XML，但是序列化成json比XML更好，速度也更快，并且可以直接在web页面读取，序列成json后其实就是个字符串，任何语言都能读取，也可以方便的存储到磁盘或者通过网络传输。

JSON表示的对象就是标准的JavaScript语言的对象，JSON和Python内置的数据类型对应如下：

json类型——Python类型

{ }——dict

[ ]——,list

string——str或者u’unicode’

true/false——True/False

null ——None

Python内置的json模块提供了完善的Python对象到json格式的转换。先看看如何把Python对象变成一个json：

import json

d=dict(name='zhangkang',age=20,score=88)

#这里dumps(),loads(),dump(),load()的用法和pickle模块一样

a=json.dumps(d)

print(type(a))

#这里输出的字符串和上面讲的pickle的不同，格式变了。

print(a)

print('\n')

c=json.loads(a)

print(type(c))

#这里注意，所有反序列化后的字符串对象类型不是str，而是unicode，因为

#JSON标准规定JSON编码是UTF-8，所以我们总能在Python的str或unicode与JSON的字符串之间转换。

print(c)

输出：

<type 'str'>

{"age": 20, "score": 88, "name": "zhangkang"}

<type 'dict'>

{u'age': 20, u'score': 88, u'name': u'zhangkang'}

如果我们要对一个类对象序列化成标准格式：

import json

class People(object):

    def __init__(self,name,age,sex):

        self.name=name

        self.age=age

        self.sex=sex

def people_dict(p):

    d=dict()

    d['name']=p.name

    d['age']=p.age

    d['sex']=p.sex

    return d

p=People('zhangkang',24,'man')

js_p=json.dumps(p,default=people_dict)

print(type(js_p))

print(js_p)

输出:

<type 'str'>

{"age": 24, "name": "zhangkang", "sex": "man"}

默认情况下，dumps()方法不知道如何将People()实例变为一个json的{ }对象。可选参数default就是把任意一个对象变成一个可序列为json的对象，我们只需要为People专门写一个转换函数，再把函数传进去。People()实例首先被people_dict()函数转换成dict，然后再被顺利序列化为json。

如何把类对象反序列化呢？

import json

class People(object):

    def __init__(self,name,age,sex):

        self.name=name

        self.age=age

        self.sex=sex

def people_dict(p):

    d=dict()

    d['name']=p.name

    d['age']=p.age

    d['sex']=p.sex

    return d

def dict_people(d):

    return People(d['name'],d['age'],d['sex'])

#序列化

p=People('zhangkang',24,'man')

js_p=json.dumps(p,default=people_dict)

print(type(js_p))

print(js_p)

print('\n')

#反序列化

pp=json.loads(js_p, object_hook=dict_people)

print(type(pp))

print(pp.name)

print(pp.age)

print(pp.sex)

输出:

<type 'str'>

{"age": 24, "name": "zhangkang", "sex": "man"}

<class '__main__.People'>

zhangkang

24

man

我们要把json反序列化为一个People对象实例，loads()方法首先把js_p转换成一个dict对象，然后把这个dict传入object_hook函数被转换为People实例。

秒客网

Python中的序列化以及pickle和json模块介绍

相关文章