numpy函数笔记(持续更新)

时间:2023-03-08 22:35:12

numpy函数笔记

np.isin用法

  • np.isin(a,b) 用于判定a中的元素在b中是否出现过,如果出现过返回True,否则返回False,最终结果为一个形状和a一模一样的数组。(注意:这里的a和b是像数组类型就行,比如列表的话,传入进去之后,numpy会自动将其转化为numpy数组)
  • 但是当参数invert被设置为True时,情况恰好相反,如果a中元素在b中没有出现则返回True,如果出现了则返回False.
import numpy as np
# 这里使用reshape是为了验证是否对高维数组适用,返回一个和a形状一样的数组
a=np.array([1,3,7]).reshape(3,1)
b=np.arange(9).reshape(3,3)
# a 中的元素是否在b中,如果在b中显示True
Np_No_invert=np.isin(a, b, invert=False)
print("Np_No_invert\n",Np_No_invert)
# a 中的元素是否在b中,如果设置了invert=True,则情况恰恰相反,即a中元素在b中则返回False
Np_invert=np.isin(a, b, invert=True)
print("Np_invert\n",Np_invert)
# Np_No_invert
# [[ True]
# [ True]
# [ True]]
# Np_invert
# [[False]
# [False]
# [False]]

numpy.cumsum()

numpy.cumsum(a, axis=None, dtype=None, out=None)

axis=0,按照行累加。

axis=1,按照列累加。

axis不给定具体值,就把numpy数组当成一个一维数组。

注意这里的行和列和普通认为的不一样,只要认定为是往哪一个轴进行相加。

也就是按照指定维度进行相加

例子如下:

a
Out[6]:
array([[-0.94525613, -0.84632869, 0.65120093],
[ 0.11813225, 0.22240677, -1.6212242 ],
[-0.80511744, 1.04439191, -1.45651271]])
np.cumsum(a,1)
Out[8]:
array([[-0.94525613, -1.79158482, -1.14038389],
[ 0.11813225, 0.34053902, -1.28068518],
[-0.80511744, 0.23927446, -1.21723825]])

np.around 和np.round四舍五入

这两个函数的功能是一样的,np.round内部调用的就是np.around。

np.around 返回四舍五入后的值,可指定精度。

around(a, decimals=0, out=None)

a 输入数组

decimals 要舍入的小数位数。 默认值为0。 如果为负,整数将四舍五入到小数点左侧的位置

import numpy as np

n = np.array([-0.746, 4.6, 9.4, 7.447, 10.455, 11.555])

around1 = np.around(n)
print(around1) # [ -1. 5. 9. 7. 10. 12.] around2 = np.around(n, decimals=1)
print(around2) # [ -0.7 4.6 9.4 7.4 10.5 11.6] around3 = np.around(n, decimals=-1)
print(around3) # [ -0. 0. 10. 10. 10. 10.] a=np.random.randn(3,3)
a
Out[6]:
array([[-0.94525613, -0.84632869, 0.65120093],
[ 0.11813225, 0.22240677, -1.6212242 ],
[-0.80511744, 1.04439191, -1.45651271]])
np.round(a,2)
Out[7]:
array([[-0.95, -0.85, 0.65],
[ 0.12, 0.22, -1.62],
[-0.81, 1.04, -1.46]])

np.floor 向下取整

np.floor 返回不大于输入参数的最大整数。 即对于输入值 x ,将返回最大的整数 i ,使得 i <= x。 注意在Python中,向下取整总是从 0 舍入。

import numpy as np

n = np.array([-1.7, -2.5, -0.2, 0.6, 1.2, 2.7, 11])

floor = np.floor(n)
print(floor) # [ -2. -3. -1. 0. 1. 2. 11.]

np.ceil 向上取整

np.ceil 函数返回输入值的上限,即对于输入 x ,返回最小的整数 i ,使得 i> = x。

import numpy as np

n = np.array([-1.7, -2.5, -0.2, 0.6, 1.2, 2.7, 11])

ceil = np.ceil(n)
print(ceil) # [ -1. -2. -0. 1. 2. 3. 11.]

NumPy中的diag函数

NumPy包中的内置diag函数很有意思。

假设创建一个1维数组a,和一个3*3数组b

import numpy as np
a = np.arange(1, 4)
b = np.arange(1, 10).reshape(3, 3)

结果如下:

>>> a
array([1, 2, 3])
>>> b
array([[1, 2, 3],
[4, 5, 6],
[7, 8, 9]])

使用diag函数,看一看结果:

>>> np.diag(a)
array([[1, 0, 0],
[0, 2, 0],
[0, 0, 3]])
>>> np.diag(b)
array([1, 5, 9])

可以发现,当 np.diag(array)

array是一个1维数组时,结果形成一个以一维数组为对角线元素的矩阵

array是一个二维矩阵时,结果输出矩阵的对角线元素

np.set_printoptions函数

设置打印选项。也就是指定如何打印numpy数组,如何显示numpy数组。

这些选项确定浮点数、数组和其他 NumPy 对象的显示方式。

参数解释

  • precision:int 或无,可选

    浮点输出的精度位数(默认 8)。如果浮点模式不是固定的可能是"无",以打印尽可能多的数字以唯一指定值。

  • threshold:int, 可选

    触发汇总而不是完全 repr 的数组元素总数(默认 1000)。要始终使用完整重供而不汇总,请传递sys.maxsize

  • edgeitems :int, 可选

    每个维度的开头和末尾汇总中的数组项数(默认值 3)。

  • linewidth:int, 可选

    用于插入换行符/行数(默认为 75)。

  • suppress :布尔, 可选

    如果为 True,则始终使用固定点表示法打印浮点编号,在这种情况下,当前精度中等于零的数字将打印为零。如果 False,则当最小数字的绝对值为 < 1e-4 或最大绝对值与最小值的比率为 > 1e3 时,则使用科学表示法。默认值为 False。

  • nanstr: str,可选

    浮点非数字(默认 nan)的字符串表示形式。

  • infstr :str, 可选

    浮点无穷大的字符串表示形式(默认 inf)。

  • sign :字符串,"-","+"或"",可选

    控制浮点类型的符号的打印。如果为"+",请始终打印正值的符号。如果 '',则始终在正值的符号位置打印空格(空白字符)。如果为"-",则省略正值的符号字符。(默认为"-")

  • formatter :调用的字典,可选

    如果不是"无",则键应指示相应格式函数应用于的类型。可调用项应返回字符串。未指定的类型(由其相应的键)由默认格式器处理。可设置可处理的单个类型包括:

    • "布尔"
    • "int"
    • "时间德尔塔" : anumpy.timedelta64
    • "日期时间": anumpy.datetime64
    • "浮动"
    • "长浮":128位浮子
    • "复杂漂浮"
    • "长共体浮":由两个128位浮子组成
    • "数字":类型和numpy.string_``numpy.unicode_
    • "对象":np.object_数组
    • "str" : 所有其他字符串

    可用于同时设置一组类型的其他键包括:

    • "全部":设置所有类型
    • "int_kind": 设置"int"
    • "float_kind":设置"浮动"和"长浮"
    • "complex_kind":设置"复杂浮"和"长复杂浮"
    • "str_kind":设置"str"和"numpystr"
  • **floatmode : **str,可选

    控制浮点类型的精度选项的解释。可以采取以下值(默认maxprec_equal):

    • "固定":始终打印精确分数数字,

      即使这样打印的数字数会超过唯一指定值所需的数字。

    • "唯一":打印所需的最小小数数字

      以唯一方式表示每个值。不同的元素可能具有不同的数字数。精度选项的值将被忽略。

    • "maxprec":以最精确的小数打印,但如果

      元素可以唯一表示,数字较少,只能用这么多数字打印它。

    • "maxprec_equal":以最精确的小数打印,

      但是,如果数组中的每个元素都可以以相同数量的较少数字的唯一表示,则所有元素都使用该数字。

官方文档例子

可以设置浮点精度:

>>>

>>> np.set_printoptions(precision=4)
>>> np.array([1.123456789])
[1.1235]

可以总结长数组:

>>>

>>> np.set_printoptions(threshold=5)
>>> np.arange(10)
array([0, 1, 2, ..., 7, 8, 9])

小结果可以抑制:

>>>

>>> eps = np.finfo(float).eps
>>> x = np.arange(4.)
>>> x**2 - (x + eps)**2
array([-4.9304e-32, -4.4409e-16, 0.0000e+00, 0.0000e+00])
>>> np.set_printoptions(suppress=True)
>>> x**2 - (x + eps)**2
array([-0., -0., 0., 0.])

自定义格式可用于根据需要显示数组元素:

>>>

>>> np.set_printoptions(formatter={'all':lambda x: 'int: '+str(-x)})
>>> x = np.arange(3)
>>> x
array([int: 0, int: -1, int: -2])
>>> np.set_printoptions() # formatter gets reset
>>> x
array([0, 1, 2])

若要放回默认选项,可以使用:

>>>

>>> np.set_printoptions(edgeitems=3, infstr='inf',
... linewidth=75, nanstr='nan', precision=8,
... suppress=False, threshold=1000, formatter=None)

此外,若要临时覆盖选项,请使用打印选项作为上下文管理器:

>>>

>>> with np.printoptions(precision=2, suppress=True, threshold=5):
... np.linspace(0, 10, 10)
array([ 0. , 1.11, 2.22, ..., 7.78, 8.89, 10. ])

np.vdot点积函数

矩阵点积为两个矩阵对应元素乘积之和

定义两个矩阵a和b

#定义两个矩阵
a=np.array([[4,3],[5,6]])
b=np.array([[10,11],[12,13]])
print("a")
print(a)
print("b")
print(b) 输出结果:
a
[[4 3]
[5 6]]
b
[[10 11]
[12 13]]

使用vdot函数计算a和b的点积

#矩阵点积 vdot函数,
#矩阵点积计算公式:两个矩阵对应位置元素乘积之和
c=np.vdot(a,b)
print("c")
print(c) 输出结果:
c
211

np.nonzero(a)

返回:数组a中非零元素的索引值数组

import numpy as np
a = np.random.uniform(-10, 10, 4)
print(a)
[ 2.69869382 -8.87937198 4.70100555 1.87901029]
b = np.nonzero(a)
print(b)
(array([0, 1, 2, 3], dtype=int64),)
#a是一维数组,有4个非零元素,返回4个非零元素的序号 a = [[0, 1, 1],
[1, 0, 1],
[1, 1, 0]]
print(a)
[[0, 1, 1], [1, 0, 1], [1, 1, 0]]
b = np.nonzero(a)
print(b)
(array([0, 0, 1, 1, 2, 2], dtype=int64), array([1, 2, 0, 2, 0, 1], dtype=int64))
#a是二维数组,array长度为6,即a有6个非零元素,第一个array是对非零元素的row描述,
#第二个array是对col的描述。索引元组b一直都是二维数组
print(np.transpose(b))
[[0 1]
[0 2]
[1 0]
[1 2]
[2 0]
[2 1]]
#调用transpose转置索引序号b元组,非零元素的序号[0,1],即第0行,第一列,以此类推。

np.amin(a,axis=k)

返回 :一维数组a中的最小值,二维数组需通过axis指定行或列,获取行或列的最小值,如不指定,则是所有元素的最小值

import numpy as np

a = [[0, 1, 2],
[1, 0, 3],
[1, 4, 0]]
a1 = np.asarray(a, dtype = np.float32)
print(a1[np.nonzero(a1)])
[ 1. 2. 1. 3. 1. 4.]
#使用a[np.nonzero(a)]获取a中所有非零值,变一维数组,但需要将a转换成array
print(np.amin(a1[np.nonzero(a1)]))
1.0
#获取数组的最小值 #把a1中等于0的值换成a1数组中的最小值
a1[a1==0] = np.amin(a1[np.nonzero(a1)])
print('a1 = ', a1)
a1 = [[ 1. 1. 2.]
[ 1. 1. 3.]
[ 1. 4. 1.]]

np.amax(a, axis=k)

返回:一维数组a中的最大值,二维数组需通过axis指定行或列,获取行或列的最大值,如不指定,则是所有元素的最大值

import numpy as np

a = [[1,4,7],
[2,5,8],
[3,6,9]]
b = np.amax(a, axis=0)
print(b) b = [3,6,9]