利用Python进行数据分析(8) pandas基础: Series和DataFrame的基本操作

时间:2022-10-27 09:26:51

一、reindex() 方法:重新索引

针对 Series
 
重新索引指的是根据index参数重新进行排序。
如果传入的索引值在数据里不存在,则不会报错,而是添加缺失值的新行。
不想用缺失值,可以用 fill_value 参数指定填充值。
例如:
利用Python进行数据分析(8) pandas基础: Series和DataFrame的基本操作
 
fill_value 会让所有的缺失值都填充为同一个值,如果不想这样而是用相邻的元素(左或者右)的值填充,则可以用 method 参数,可选的参数值为 ffill 和 bfill,分别为用前值填充和用后值填充:
利用Python进行数据分析(8) pandas基础: Series和DataFrame的基本操作

针对 DataFrame
 
重新索引操作:
利用Python进行数据分析(8) pandas基础: Series和DataFrame的基本操作

二、drop() 方法:丢弃数据
 

针对 Series
 
利用Python进行数据分析(8) pandas基础: Series和DataFrame的基本操作
 

针对 DataFrame
 
不仅可以删除行,还可以删除列:
利用Python进行数据分析(8) pandas基础: Series和DataFrame的基本操作

三、索引、选取和过滤
 

针对 Series
 
利用Python进行数据分析(8) pandas基础: Series和DataFrame的基本操作
 
需要注意一点的是,利用索引的切片运算与普通的 Python 切片运算不同,其末端是包含的,既包含最后一个的项。比较:
利用Python进行数据分析(8) pandas基础: Series和DataFrame的基本操作
 
赋值操作:
利用Python进行数据分析(8) pandas基础: Series和DataFrame的基本操作
 

针对 DataFrame
 
利用Python进行数据分析(8) pandas基础: Series和DataFrame的基本操作
 
DataFrame 中的 ix 操作:
利用Python进行数据分析(8) pandas基础: Series和DataFrame的基本操作

四、算术运算和数据对齐
 

针对 Series
 
将2个对象相加时,具有重叠索引的索引值会相加处理;不重叠的索引则取并集,值为 NA:
利用Python进行数据分析(8) pandas基础: Series和DataFrame的基本操作
 

针对 DataFrame
 
对齐操作会同时发生在行和列上,把2个对象相加会得到一个新的对象,其索引为原来2个对象的索引的并集:
利用Python进行数据分析(8) pandas基础: Series和DataFrame的基本操作
 
和Series 对象一样,不重叠的索引会取并集,值为 NA;如果不想这样,试试使用 add() 方法进行数据填充:
利用Python进行数据分析(8) pandas基础: Series和DataFrame的基本操作
 

五、函数应用和映射
 
将一个 lambda 表达式应用到每列数据里:
利用Python进行数据分析(8) pandas基础: Series和DataFrame的基本操作
 
除了lambda 表达式还可以定义一个函数:
利用Python进行数据分析(8) pandas基础: Series和DataFrame的基本操作
 

六、排序
 

针对 Series
利用Python进行数据分析(8) pandas基础: Series和DataFrame的基本操作
 

针对 DataFrame
利用Python进行数据分析(8) pandas基础: Series和DataFrame的基本操作
 

七、排名
 
利用Python进行数据分析(8) pandas基础: Series和DataFrame的基本操作
八、带有重复值的轴索引
 
索引不强制唯一,例如一个重复索引的 Series:
利用Python进行数据分析(8) pandas基础: Series和DataFrame的基本操作
 
安装步骤已经在首篇随笔里写过了,这里不在赘述。利用Python进行数据分析(1) 简单介绍
接下来一篇随笔内容是:利用Python进行数据分析(9) pandas基础: 汇总统计和计算,有兴趣的朋友欢迎关注本博客,也欢迎大家添加评论进行讨论。

利用Python进行数据分析(8) pandas基础: Series和DataFrame的基本操作的更多相关文章

  1. 利用Python进行数据分析(7) pandas基础: Series和DataFrame的简单介绍

    一.pandas 是什么 pandas 是基于 NumPy 的一个 Python 数据分析包,主要目的是为了数据分析.它提供了大量高级的数据结构和对数据处理的方法. pandas 有两个主要的数据结构 ...

  2. 利用Python进行数据分析(12) pandas基础: 数据合并

    pandas 提供了三种主要方法可以对数据进行合并: pandas.merge()方法:数据库风格的合并: pandas.concat()方法:轴向连接,即沿着一条轴将多个对象堆叠到一起: 实例方法c ...

  3. 利用Python进行数据分析(9) pandas基础: 汇总统计和计算

    pandas 对象拥有一些常用的数学和统计方法.   例如,sum() 方法,进行列小计:   sum() 方法传入 axis=1 指定为横向汇总,即行小计:   idxmax() 获取最大值对应的索 ...

  4. 利用Python进行数据分析(11) pandas基础: 层次化索引

      层次化索引 层次化索引指你能在一个数组上拥有多个索引,例如: 有点像Excel里的合并单元格对么? 根据索引选择数据子集   以外层索引的方式选择数据子集: 以内层索引的方式选择数据: 多重索引S ...

  5. 利用Python进行数据分析(10) pandas基础: 处理缺失数据

      数据不完整在数据分析的过程中很常见. pandas使用浮点值NaN表示浮点和非浮点数组里的缺失数据. pandas使用isnull()和notnull()函数来判断缺失情况. 对于缺失数据一般处理 ...

  6. 利用Python进行数据分析(14) pandas基础: 数据转换

    数据转换指的是对数据的过滤.清理以及其他的转换操作. 移除重复数据 DataFrame里经常会出现重复行,DataFrame提供一个duplicated()方法检测各行是否重复,另一个drop_dup ...

  7. 利用Python进行数据分析(15) pandas基础: 字符串操作

      字符串对象方法 split()方法拆分字符串: strip()方法去掉空白符和换行符: split()结合strip()使用: "+"符号可以将多个字符串连接起来: join( ...

  8. 利用Python进行数据分析(13) pandas基础: 数据重塑/轴向旋转

    重塑定义     重塑指的是将数据重新排列,也叫轴向旋转. DataFrame提供了两个方法: stack: 将数据的列“旋转”为行. unstack:将数据的行“旋转”为列. 例如: 处理堆叠格式 ...

  9. 利用Python进行数据分析(5) NumPy基础: ndarray索引和切片

    概念理解 索引即通过一个无符号整数值获取数组里的值. 切片即对数组里某个片段的描述. 一维数组 一维数组的索引 一维数组的索引和Python列表的功能类似: 一维数组的切片 一维数组的切片语法格式为a ...

随机推荐

  1. NSDecimalNumber用于精度准确的计算

    在处理金额计算时,往往会涉及到小数,由于Double类型不准确,无法做到产品的要求.为了保证金额计算的准确性,建议使用NSDecimalNumber. 1.创建对象(常用的方法) // mantiss ...

  2. PL/SQL编程基础

    范例:编写不做任何工作的PL/SQL块 BEGIN NULL ; END ; /   范例:编写一个简单的PL/SQL程序 DECLARE v_num NUMBER ; -- 定义一个变量v_num ...

  3. thinkphp学习笔记7—多层MVC

    原文:thinkphp学习笔记7-多层MVC ThinkPHP支持多层设计. 1.模型层Model 使用多层目录结构和命名规范来设计多层的model,例如在项目设计中如果需要区分数据层,逻辑层,服务层 ...

  4. Bootstrap字体无法显示

    下载的font文件没有放进你的项目文件里.

  5. GitHub 近 100,000 程序员“起义”:向“996”开炮!

    作者 | 伍杏玲 出品 | 程序人生(ID:coder_life) 平常CSDN推送关于程序员加班的文章时,很多程序员边吐槽边调侃地留言“比拼”:“我们也是996”.“007来报道”…… 可在简单的数 ...

  6. centos7救援模式--单机模式(单用户模式)

    前序 经典问题: 单机模式, 当系统忘记某用户登录密码的时候可以解决密码重置问题 操作 1 开机的时候出现选择进入系统的界面时, 按E键 2 选择定位到ro这里, 替换成rw init=/sysroo ...

  7. zha男/女的三种境界

    本文为chedan贴,谈一谈找对象时渣男/女的三种表现,分别对应三种境界,涉世未深的男生女生可加以小心,自身属于zha类型的可略过本文.    另,本文的恋爱观基于两个原则.一是对象应是从朋友到恋人的 ...

  8. 本地win7ping VM linux ipv6地址问题

    前述 在windows和linux同时安装ipv6之后,系统将会自动分配一个link-local(链接本地)地址也就是ifconfig -a看到的一行[inet6 addr: fe80::20c:29 ...

  9. 论文笔记: Dual Deep Network for Visual Tracking

    论文笔记: Dual Deep Network for Visual Tracking  2017-10-17 21:57:08  先来看文章的流程吧 ... 可以看到,作者所总结的三个点在于: 1. ...

  10. 不要62(数位DP)

    不要62 http://acm.hdu.edu.cn/showproblem.php?pid=2089 Time Limit: 1000/1000 MS (Java/Others)    Memory ...