pandas进行条件格式化以及线性回归的预测

时间:2022-09-03 14:59:29

条件格式化

  • 需求1:

    • 将三次考试的成绩小于60分的值找出来,并将字体变为红色
  • 需求2:

    • 将每次考试的第一名找出来,将背景变为绿色
  • 需求3:

    • 使用背景颜色的深浅来表示数值的大小
  • 需求4:

    • 使用数据条的长度表示数值的大小

在这里我们需要用到两个函数apply和applymap

apply和applymap的区别:

apply是指根据轴进行匹配,从左往右是用轴为1即axis=1,从上至下是用轴为0即axis=0,默认是从上往下进行列匹配

applymap是指无差别的进行指定区域匹配

# 定义一个函数,如果分数少于60就变为红色(color:{color}将改变字体颜色)
def low_score_red(s):
color = 'red' if s<60 else 'black'
return f'color:{color}'
# 定义一个函数,每次考试的第一名变为绿色(background-color:lime将底部颜色变为绿色)
def highest_score_green(col):
return ['background-color:lime' if s == col.max() else 'background-color:white' for s in col]
students = pd.read_excel('C:/Users/1/Downloads/Students.xlsx')
students.style.applymap(low_score_red,subset=['Test_1','Test_2','Test_3']).apply(highest_score_green,subset=['Test_1','Test_2','Test_3'])

pandas进行条件格式化以及线性回归的预测

Seaborn包:在matplotlib的基础上进行了更高级的API封装,从而使得作图更加容易,在大多数情况下使用seaborn就能做出很具有吸引力的图,而使用matplotlib就能制作具有更多特色的图。应该把Seaborn视为matplotlib的补充,而不是替代物。

使用背景颜色的深浅来表示数值的大小

import seaborn as sns
# light_palette调色板
color_map = sns.light_palette('green', as_cmap=True)
students.style.background_gradient(color_map,subset=['Test_1','Test_2','Test_3'])

pandas进行条件格式化以及线性回归的预测

使用数据条的占比表示数值的大小

students.style.bar(color='orange',subset=['Test_1','Test_2','Test_3'])

pandas进行条件格式化以及线性回归的预测

线性回归预测

准备的数据如下图:

pandas进行条件格式化以及线性回归的预测

import matplotlib.pyplot as plt
sales = pd.read_excel('C:/Users/1/Downloads/Sales.xlsx',dtype={'Month':str})
# 绘制散点图,以索引为x轴,以收益为Y轴
plt.scatter(sales.index,sales.Revenue)
# 将x轴刻度从索引改为年月,并将年月的方向旋转90°,rotation是旋转的意思
plt.xticks(sales.index, sales.Month, rotation=90)
# tight_layout是选择紧凑型图形的意思
plt.tight_layout()
plt.show()

pandas进行条件格式化以及线性回归的预测

# 导入科学库,线性回归包
from scipy.stats import linregress '''
slope 代表斜率
intercept 代表与Y轴的截点
'''
# 计算出斜率和截点根据索引与收益
slope,intercept,r,p,std_err = linregress(sales.index,sales.Revenue)
# 线性回归方程
erp = sales.index*slope + intercept
# 先绘制出散点图
plt.scatter(sales.index, sales.Revenue)
# 更改刻度
plt.xticks(sales.index, sales.Month, rotation=90)
# 绘制出直线
plt.plot(sales.index, erp, color='red')
# 修改标题名为线性方程
plt.title(f'y={slope}*X+{intercept}')
plt.show()

pandas进行条件格式化以及线性回归的预测

根据此方程可以预测未来的收益,只需要将年月输入即可

pandas进行条件格式化以及线性回归的预测的更多相关文章

  1. 通过机器学习的线性回归算法预测股票走势(用Python实现)

    在本人的新书里,将通过股票案例讲述Python知识点,让大家在学习Python的同时还能掌握相关的股票知识,所谓一举两得.这里给出以线性回归算法预测股票的案例,以此讲述通过Python的sklearn ...

  2. python pandas进行条件筛选时出现ValueError&colon; The truth value of a Series is ambiguous&period; Use a&period;empty&comma; a&period;bool&lpar;&rpar;&comma; a&period;item&lpar;&rpar;&comma; a&period;any&lpar;&rpar; or a&period;all&lpar;&rpar;&period;”

    在使用pandas进行条件筛选时,使用了如下的代码: fzd_index=data[(data['实际辐照度']<mi)or(data['实际辐照度']>ma)].index 原本以为,并 ...

  3. TensorFlow从1到2(七)线性回归模型预测汽车油耗以及训练过程优化

    线性回归模型 "回归"这个词,既是Regression算法的名称,也代表了不同的计算结果.当然结果也是由算法决定的. 不同于前面讲过的多个分类算法或者逻辑回归,线性回归模型的结果是 ...

  4. 线性回归 - LinearRegression - 预测糖尿病 - 量化预测的质量

    线性回归是分析一个变量与另外一个或多个变量(自变量)之间,关系强度的方法. 线性回归的标志,如名称所暗示的那样,即自变量与结果变量之间的关系是线性的,也就是说变量关系可以连城一条直线. 模型评估:量化 ...

  5. Pandas根据条件赋值

    我们有以下判断条件,我们想要更改B中的数, 而更改的位置是取决于 A 的. 对于A大于4的位置. 更改B在相应位置上的数为0. df.B[df.A>4] = 0

  6. 用matplotlib和pandas绘制股票MACD指标图,并验证化交易策略

    我的新书<基于股票大数据分析的Python入门实战>于近日上架,在这篇博文向大家介绍我的新书:<基于股票大数据分析的Python入门实战>里,介绍了这本书的内容.这里将摘录出部 ...

  7. scikit-learn 和pandas 基于windows单机机器学习环境的搭建

    很多朋友想学习机器学习,却苦于环境的搭建,这里给出windows上scikit-learn研究开发环境的搭建步骤. Step 1. Python的安装 python有2.x和3.x的版本之分,但是很多 ...

  8. R语言解读多元线性回归模型

    转载:http://blog.fens.me/r-multi-linear-regression/ 前言 本文接上一篇R语言解读一元线性回归模型.在许多生活和工作的实际问题中,影响因变量的因素可能不止 ...

  9. Ng线性回归实现学习&lbrack;转载&rsqb;

    转自:https://github.com/huanting74/Coursera-ML-AndrewNg 1.可视化数据 import pandas as pd import seaborn as ...

随机推荐

  1. 关于sql中in 和 exists 的效率问题,in真的效率低吗

    原文: http://www.cnblogs.com/AdamLee/p/5054674.html 在网上看到很多关于sql中使用in效率低的问题,于是自己做了测试来验证是否是众人说的那样. 群众: ...

  2. 输入输出流(IO)

    输入输出流(IO)文件(File)java.io.File用于表示文件(目录),也就是说程序员可以通过File类在程序中操作硬盘上的文件和目录.File类只用于表示文件(目录)的信息(名称.大小等), ...

  3. 再谈扩展方法,从string&period;IsNullOrEmpty&lpar;&rpar;说起

    string.IsNullOrEmpty()这个方法算得上是.net中使用频率最高的方法之一.此方法是string的一个静态方法,类似的静态方法在string这个类中还有很多.那么这样的方法作为静态方 ...

  4. Java工具

    1. Groovy shell 可以在Java代码里执行脚本,可以将Java方法配置在文件里 依赖 <dependency> <groupId>org.codehaus.gro ...

  5. dip的全称

    dip的全称是Density-independent pixel,密度无关像素.很多地方误认为是device independent pixel,即设备无关像素.这是错误的. 因为dip也就是dp只能 ...

  6. Spring的线程池ThreadPoolTaskExecutor使用案例

    1.Sping配置文件 <!-- 线程池配置 --> <bean id="threadPool" class="org.springframework. ...

  7. Windows phone 8 学习笔记&lpar;3&rpar; 通信(转)

    Windows phone 8 可利用的数据通信方式比较广泛,在硬件支持的前提下,我们可以利用WiFi.蓝牙.临近感应等多种方式.数据交互一般通过套接字来完成,我们将在本文详细的分析. 快速导航:一. ...

  8. 1&period;5如何学习Linux驱动开发

    1.准备一个自己熟悉的Linux操作系统,用于开发和测试Linux驱动,建议使用Ubuntu Linux 10.04及以上版本: 2.准备一块开发板,建议采用基于ARM11的开发板: 3.学习GUN ...

  9. apache RewriteCond RewriteRule

    http://www.rockbb.com/blog/?p=319 http://www.cnblogs.com/scgw/archive/2011/12/10/2283029.html 我的理解:当 ...

  10. 带你深度解析Maven

    一.What`s Maven? Maven是基于项目对象模型(POM project object model),可以通过一小段描述信息(配置)来管理项目的构建,报告和文档的软件项目管理工具,简单的说 ...