机器学习 Numpy库入门

时间:2023-12-27 13:12:55

2017-06-28 13:56:25

Numpy 提供了一个强大的N维数组对象ndarray,提供了线性代数,傅里叶变换和随机数生成等的基本功能,可以说Numpy是Scipy,Pandas等科学计算库的基础。

使用前需要引入numpy包,一般会给他起个别名为np。

import numpy as np

一、ndarray的元素类型

ndarray一个特点就是同构,就是说其中的元素类型是一致的。并且为了减少从存储空间和提高运行效率,ndarray的数据类型相较于python本身多了很多具体的类型。

所支持的数据类型包括整数、浮点数、复数、布尔值、字符串或是普通的 Python 对象(object)。

机器学习 Numpy库入门

二、ndarray创建方法

(1)使用python自带的数据结构列表或者元组进行创建。

  • x = np.array(list/tuple)
  • x = np.array(list/tuple, dtype=np.float32) 当用户不指定dtype时,python编辑器会自动选择合适的数据类型
import numpy as np

a=np.array([[1,2,3],[4,5,6]])
print(a)

用元组创建同理,也可以使用元组加列表的混合方式进行创建,不过,需要注意的是,这种创建需要同构,也就是首先数据类型要一致,其次每个元素中的数据个数也要一致,否则,称为异构,异构模型将不再适用numpy库中的库函数。

(2)使用Numpy中的库函数进行创建。

常用的函数:

机器学习 Numpy库入门

#linspace默认情况下是全闭的,有一个参数可以进行控制,即endpoint,默认情况下是True
a=np.linspace(1,10,4)
b=np.linspace(1,10,4,endpoint=False)
print(a)
print(b)
#a=array([ 1. 4. 7. 10.])
#b=array([ 1. 3.25 5.5 7.75])

有一点需要注意的是这些默认函数,除了arange()已经规定了生成整数外,其他的默认生成的都是浮点型的数据。

(3)从csv文件中读取生成ndarray

np.savetxt(frame, array, fmt='%.18e', delimiter=None)

  • frame : 文件、字符串或产生器,可以是.gz或.bz2的压缩文件
  • array : 存入文件的数组
  • fmt : 写入文件的格式,例如:%d %.2f %.18e
  • delimiter : 分割字符串,默认是任何空格,如果是存成csv格式,所以最后一个参数需要写成‘,’

np.loadtxt(frame, dtype=np.float, delimiter=None, unpack=False)

  • frame : 文件、字符串或产生器,可以是.gz或.bz2的压缩文件
  • dtype : 数据类型,可选
  • delimiter : 分割字符串,默认是任何空格
  • unpack  : 如果True,读入属性将分别写入不同变量
import numpy as np

a=np.ones((3,2))
np.savetxt("e:/ee.csv",a,fmt="%d",delimiter=',')
b=np.loadtxt("e:/ee.csv",dtype=np.int,delimiter=',')
print(b)

 三、narray的一些属性

机器学习 Numpy库入门

这些是narray的成员数据值,可以直接使用成员访问符进行查看。

import numpy as np

a = np.array([[1,2,3],[4,5,6],[7,8,9]])
print(a.shape)
print(a.size)
print(a.dtype)
print(a.ndim) # output:
# (3, 3)
#
# int32
#