python数据分析之pandas库的Series应用

时间:2023-03-09 14:44:37
python数据分析之pandas库的Series应用

一、pandas的数据结构介绍

1. Series

1.1 Series是由一种类似于一维数组的对象,它由一组数据以及一组与之相关的数据索引构成。仅由一组数据可产生最简单的Series。

from pandas import *

obj=Series([4,5,-7,6])

print  obj
print obj[1]

通过索引获取数组值

python数据分析之pandas库的Series应用

1.2Series的数组运算会保留索引与值的连接

from pandas import *

obj2=Series([4,7,-5,3],index=['d','b','a','c'])

print obj2
print obj2[obj2>0]
print obj2*2

1.2数组运算保留索引与值的对应

python数据分析之pandas库的Series应用

1.3如果数据存放在一个字典中,可以根据这个字典来创建Series,Series中的索引就是原字典的键

  字典是Python语言中唯一的映射类型。

  映射类型对象里哈希值(键,key)和指向的对象(值,value)是一对多的的关系,通常被认为是可变的哈希表。

  字典对象是可变的,它是一个容器类型,能存储任意个数的Python对象,其中也可包括其他容器类型。

adict = {key1:value2, key2:value2, …}

  字典特点:
  1)、键与值用冒号“:”分开;
  2)、项与项用逗号“,”分开;
  3)、字典中的键必须是唯一的,而值可以不唯一。

from pandas import *

sdata={'ohio':35000,'texas':71000,'oregon':16000,'utah':5000}

obj3=Series(sdata)
print obj3 obj4=Series(sdata,index=['california','ohio','oregon','texas'])
print obj4

数据存放在一个字典

python数据分析之pandas库的Series应用

1.4 Series最重要的功能是在算术运算中会自动对齐不同的索引数据

from pandas import *

sdata={'ohio':35000,'texas':71000,'oregon':16000,'utah':5000}

obj3=Series(sdata)
print obj3 obj4=Series(sdata,index=['california','ohio','oregon','texas'])
print obj4 print obj3+obj4

按索引自动对应并计算

python数据分析之pandas库的Series应用