这篇文章主要介绍了 Python 科学计算之 NumPy,文中给出了详细的介绍与示例代码,对大家的理解具有一定的参考借鉴价值,有需要的朋友可以一起来学习学习。
Python 是一种面向对象、解释型计算机程序设计语言,由 Guido van Rossum 于 1989 年底发明,第一个公开发行版发行于 1991 年。Python 语法简洁而清晰,具有丰富和强大的类库。它常被昵称为胶水语言,它能够把用其他语言制作的各种模块(尤其是 C/C++)很轻松地联结在一起。
前言
NumPy 是 Python 用于处理大型矩阵的一个速度极快的数学库。它允许你在 Python 中做向量和矩阵的运算,而且很多底层的函数都是用 C 写的,你将获得在普通 Python 中无法达到的运行速度。这是由于矩阵中每个元素的数据类型都是一样的,这也就减少了运算过程中的类型检测。
矩阵基础
在 numpy 包中我们用数组来表示向量,矩阵和高阶数据结构。他们就由数组构成,一维就用一个数组表示,二维就是数组中包含数组表示。
创建
- # coding: utf-8
- import numpy as np
- a = np.array([
- [1.73, 1.68, 1.71, 4],
- [1, 2, 3, 4],
- [1, 2, 3, 4]
- ])
- print type(a) # <type 'numpy.ndarray'>
ndarray (N-dimensional array object) 意思就是 n 维数组。例子中就表示一个 3 行 4 列的二维数组。
形状
数组的大小可以通过其 shape 属性获得:
- print a.shape # (3L,4L)
数组的元素数量可以通过 ndarray.size 得到:
- print a.size # 12
使用 ndarray 的 dtype 属性我们能获得数组元素的类型:
- print a.dtype # float64
可以用过 shape 重新设置矩阵的形状或者通过 reshape 方法创建一个改变了尺寸的新数组,原数组的 shape 保持不变:
- a.shape = 4, 3
- b = a.reshape((2, 6))
- # 尽管b的形状是新的,但是a和b是共享数据存储内存区域的,如果b[0][1] = 8 那么a[0][1] 也会是8
数组生成
可以用过
来创建数组, 参数与 range 类似:
- np.arange
- x = np.arange(0, 10, 1)#arguments: start,
- stop,
- step
也可以用 np.linspace 创建等差数列:
- x = np.linspace(1, 10, 5) # arguments: start, stop, num元素个数
- # [ 1. 3.25 5.5 7.75 10. ]
- # np.logspace 是创建等比数列
矩阵运算
计算将变量直接参与运算符,操作符优先级不变:
- a = np.random.rand(5, 5)
- b = np.random.rand(5, 5)
- print a + b
- print a - b
- print a * b
- print a / b
- print a ** 2
- print a < b
- print a > b
一个数组中除了
函数,其他这些操作都是单元操作。
- dot()
- np_arr = np.array([2,3,34,5,5])
- print np.mean(np_arr) # 平均数
- print np.median(np_arr) # 中位数
- print np.corrcoef(a[0], a[1]) # 判断两个轴的数据是否有相关性
- print np.std(np_arr) # 标准差
数据提取
切片索引语法:
- M[lower:upper:step]
- a = np.array([1,2,3,4,5])
- a[1:3] # array([2, 3])
- # 进行切片赋值时,原数组会被修改
- a[1:3] = [-2, -3] # array([ 1, -2, -3, 4, 5])
- b = np.random.rand(5, 5)
- b[1:4, 1:4] # 提取 1~4 行,1~4列
- b > 0.1 #array([False, False, False, ...])
- # 因此要提取可以用, 这是利用了布尔屏蔽这个特性
- b[ b > 0.1 ]
- # where()函数是另一个有用的方式,当需要以特定条件来检索数组元素的时候。只需要传递给它一个条件,它将返回符合条件的元素列表。
- c = np.where(b > 0.1)
矩阵运算
NumPy 和 Matlab 不一样,对于多维数组的运算,缺省情况下并不使用矩阵运算,如果你希望对数组进行矩阵运算的话,可以调用相应的函数。
matrix 对象
numpy 库提供了 matrix 类,使用 matrix 类创建的是矩阵对象,它们的加减乘除运算缺省采用矩阵方式计算,因此用法和 matlab 十分类似。但是由于 NumPy 中同时存在 ndarray 和 matrix 对象,因此用户很容易将两者弄混。这有违 Python 的 "显式优于隐式" 的原则,因此并不推荐在较复杂的程序中使用 matrix。
- >>> a = np.matrix([[1,2,3],[5,5,6],[7,9,9]])
- >>> a*a**-1
- matrix([[ 1.00000000e+00, 1.66533454e-16, -8.32667268e-17],
- [ -2.77555756e-16, 1.00000000e+00, -2.77555756e-17],
- [ 1.66533454e-16, 5.55111512e-17, 1.00000000e+00]])
从数组转换为矩阵可以用
进行转换, 使用 m.T 可以得到 m 的转置矩阵。
- m = np.matrix(a)
矩阵求逆
- m.I * m
- => matrix([[ 1.00000000e+00+0.j, 4.44089210e-16+0.j],
- [ 0.00000000e+00+0.j, 1.00000000e+00+0.j]])
浅拷贝与深拷贝
为了获得高性能,Python 中的赋值常常不拷贝底层对象,这被称作浅拷贝。使用 copy 进行深拷贝:
- b = copy(a)
遍历数组元素
通常情况下,我们是希望尽可能避免遍历数组元素的。因为迭代相比向量运算要慢的多。但是有些时候迭代又是不可避免的,这种情况下用 Python 的 for 是最方便的:
- v = np.array([1,2,3,4])
- for element in v:
- print(element)
- M = np.array([[1,2], [3,4]])
- for row in M:
- print("row", row)
- for element in row:
- print(element)
总结
以上就是关于 Python 科学计算之 NumPy 的全部内容了,希望本文的内容对大家的学习或者工作能带来一定的帮助,如果有疑问大家可以留言交流。
来源: