python数据分析之pandas库的Series应用

一、pandas的数据结构介绍

1. Series

1.1 Series是由一种类似于一维数组的对象，它由一组数据以及一组与之相关的数据索引构成。仅由一组数据可产生最简单的Series。

from pandas import *

obj=Series([4,5,-7,6])

print  obj

print  obj[1]

通过索引获取数组值

python数据分析之pandas库的Series应用

1.2Series的数组运算会保留索引与值的连接

from pandas import *

obj2=Series([4,7,-5,3],index=['d','b','a','c'])

print obj2

print obj2[obj2>0]

print obj2*2

1.2数组运算保留索引与值的对应

python数据分析之pandas库的Series应用

1.3如果数据存放在一个字典中，可以根据这个字典来创建Series，Series中的索引就是原字典的键

　　字典是Python语言中唯一的映射类型。

　　映射类型对象里哈希值（键，key）和指向的对象（值，value）是一对多的的关系，通常被认为是可变的哈希表。

　　字典对象是可变的，它是一个容器类型，能存储任意个数的Python对象，其中也可包括其他容器类型。

adict = {key1：value2， key2：value2， …}

　　字典特点：
　　1）、键与值用冒号“：”分开；
　　2）、项与项用逗号“，”分开；
　　3）、字典中的键必须是唯一的，而值可以不唯一。

from pandas import *

sdata={'ohio':35000,'texas':71000,'oregon':16000,'utah':5000}

obj3=Series(sdata)

print obj3

obj4=Series(sdata,index=['california','ohio','oregon','texas'])

print obj4

数据存放在一个字典

python数据分析之pandas库的Series应用

1.4 Series最重要的功能是在算术运算中会自动对齐不同的索引数据

from pandas import *

sdata={'ohio':35000,'texas':71000,'oregon':16000,'utah':5000}

obj3=Series(sdata)

print obj3

obj4=Series(sdata,index=['california','ohio','oregon','texas'])

print obj4

print obj3+obj4

按索引自动对应并计算

python数据分析之pandas库的Series应用

秒客网

python数据分析之pandas库的Series应用

相关文章