• 在pycharm中import pandas或者import numpy时出现no module named pandas或者no module named numpy

    时间:2024-04-08 10:53:30

    当正确安装pandas和numpy后,在pycharm中导入这两个时,会出现如标题所示问题,解决的方法很简单:点击file—>settings点击project:untitled —>project interpreter点击最右边我红框那里的的加号在搜索框中输入pandas 或nump...

  • pycharm中调用pandas

    时间:2024-04-08 10:52:19

    pycharm中调用pandas1.因为学习了pandas的知识点,所以就找些实例去练手。结果在pycharm中输入 import pands as pd 时,pandas单词这里会被标注红色,然后根据提示,我就去settings…中去进行设置,settings->project->pr...

  • Pandas相关函数:透视表pivot_table、删除缺失值dropna、定位loc、按字段排序sort_values、自定义函数apply

    时间:2024-04-06 21:37:53

    1、透视表privot_table当得到一张数据平面表数据时,例如:要想实现表中一个变量与其他多个变量之间的关系,可以用pivot_table实现,table.pivot_table(index='变量1',values=[变量2]‘,’变量3‘,....,aggfunc=np.sum)其中最后的a...

  • 使用Python语言对班级学生成绩进行数据可视化——pandas,matplotlib和numpy库的应用,条形图,直方图,饼图,热力图,箱形图的可视化

    时间:2024-04-05 22:13:37

    1.首先,导入所需要的库,并且读取csv数据文件import pandas as pdimport matplotlib.pyplot as pltdf = pd.read_csv('stu_scores.csv')print(df)2.设置中文显示,没画一个图都要设置,在这里提前设置最好,这样就没...

  • pandas DataFrame applymap()函数

    时间:2024-04-01 21:48:51

    pandas DataFrame的 applymap() 函数可以对DataFrame里的每个值进行处理,然后返回一个新的DataFrame:import pandas as pddf = pd.DataFrame({ 'a': [1, 2, 3], 'b': [10, 20, 30],...

  • Pandas:关于pandas中筛选的效率测试

    时间:2024-04-01 10:55:50

    前言上一篇说到,最近我在做地址匹配的一个竞赛,目前陷入了瓶颈,所以想从pandas效率上玩玩。比如给出一个切分好的地址列表,如[‘福建省’, ‘厦门市’, ‘思明区’, ‘梧村街道’, ‘湖滨南路’],需要将这个地址在140+万条数据的地址库里筛选出满足条件的所有地址,应该怎么做呢?一、常规方法最常...

  • pandas学习笔记(三)-DataFrame类型

    时间:2024-03-31 21:17:04

    DataFrame类型:由共用相同索引的一组列构成,其实就是个表格.纵向的就叫索引,横向的就叫列表示索引的列就是零列,axis=0如果要跨行操作,就要设置axis=1DataFrame是一个表格型的数据类型,每列值类型可以不同.DataFrame既有行索引,也有列索引.DataFrame常用于表达二...

  • 【Python学习】Pandas之DataFrame

    时间:2024-03-31 21:16:40

    1 简介DataFrame是Python中Pandas库中的一种数据结构,它类似excel,是一种二维表。或许说它可能有点像matlab的矩阵,但是matlab的矩阵只能放数值型值(当然matlab也可以用cell存放多类型数据),DataFrame的单元格可以存放数值、字符串等,这和excel表很...

  • python学习笔记(pandas、DataFrame)

    时间:2024-03-31 21:12:57

    创建Series对象import pandas as pdimport numpy as npimport string查看pandas版本信息print(pd.__version__)通过列表创建Series对象array = ["粉条", "粉丝", "粉带"]# 如果不指定索引, 默认从0开...

  • Python+pandas 特殊时间序列的生成

    时间:2024-03-31 16:33:30

    一、 date_range()函数date_range()函数是pandas库的函数,顾名思义,该函数应该能生成指定区间的时间序列。举例:1、 使用“开始时间”和“结束时间” 生成2020-01-01至2020-01-07的7个日期【脚本】 print(pd.date_range(‘20200101...

  • pandas 箱型图(boxplot)详解

    时间:2024-03-29 15:51:11

    首先看一段例子:import pandas as pdfrom pandas import DataFrame,Seriesdf = DataFrame(np.random.randn(10, 2), columns=['Col1', 'Col2'])boxplot=df.boxplot()  ...

  • Python 每日一记34>>>pandas多条件筛选,写多sheet的excel

    时间:2024-03-29 13:13:15

    在今天的工作中,又遇到了一些小问题。都是关于pandas操作excel的。一是多条件筛选数据,二是将数据写入excel,但是要保存在同一个工作簿的多个sheet。先上一个完整代码源数据是这样的:得到的结果是:我在做的是,得到不同级距(门槛)下‘人数’,‘占比’,‘达到级距会员客单’,‘会员客单’,并...

  • 【Python】pandas的describe()参数

    时间:2024-03-29 13:06:33

    Pandas提供describe方法,可以查看各列的计数、均值、最大最小值等,功能强大。下面介绍一种可根据自身要求,添加各个特征的其他描述的方法。统计值变量说明:   count:数量统计,此列共有多少有效值   mean:均值                                    ...

  • 数据分析之Pandas(六)文件读取与存储

    时间:2024-03-29 12:59:32

    文件读取与存储我们的数据大部分存在于文件当中,所以pandas会支持复杂的IO操作,pandas的API支持众多的文件格式,如CSV、SQL、XLS、JSON、HDF5。注:最常用的HDF5和CSV文件文件读取与存储CSV读取与存储pd.read_csv()usecols参数用于选择部分列,而不是全...

  • python pandas 读取列名以及index

    时间:2024-03-29 12:57:01

    读取df的列名[col for col in df]df.columns.values返回一个array,用tolist()返回一个listdf.columns返回一个index,用tolist()返回一个listlist(df)读取indexdf.index.tolist()...

  • pandas 给没有列名的dataframe添加列名

    时间:2024-03-29 10:09:36

    今天处理的文件发现没有列名源文件是一个txt文件,用的read_csv方法读取,现在添加一个参数,header=None即可发现列名为1-n接着使用df2.columns = [列名的列表]即可 ...

  • Python—实训day9—使用pandas进行数据预处理

    时间:2024-03-28 19:35:16

    1合并数据1.1堆叠合并数据1.1.1横向堆叠(行对齐,左右拼接)横向堆叠,即将两个表在X轴向拼接在一起,可以使用concat函数完成,concat函数的基本语法如下。pandas.concat(objs, axis=0, join='outer', join_axes=None, ignore_i...

  • Python操作Mysql数据库入门——数据导入pandas(数据分析准备)

    时间:2024-03-27 22:28:13

    前言上一篇写到了mysql与python的简单交互还讲到了一些基础的面向对象设计这两天探索了一下,发现如果是用pandas做数据分析简单的几行代码即可将mysql的数据导入pandas进行分析环境Python 3.XIDE : juyter notebook使用Python连接数据库 导入表中所有数...

  • 数据分析笔记--numpy和pandas的数据合并

    时间:2024-03-27 22:27:25

    import pandas as pdimport numpy as np1.numpy的数据合并(concatenate,将两个ndarray合并为一个ndarray)默认是进行列合并,通过指定axis=1可以对行进行合并2.Series的数据合并(concat)1.当各个表的索引值没有重复的情况...

  • 数据分析之Pandas(四)DataFrame运算

    时间:2024-03-27 22:26:37

    本章内容算术运算逻辑运算统计运算累计统计函数自定义运算第一节 算术运算add(other)比如进行数学运算加上具体的一个数字sub(other)如果想要得到每天的涨跌大小?求出每天 close- open价格差第二节 逻辑运算逻辑运算符号<、 >、|、 &逻辑运算类型:>,...