Python数据科学利器:NumPy库详解
Python数据科学利器:NumPy库详解
NumPy (Numerical Python) 是 Python 中一个用于科学计算的核心库。它提供了一个高性能的多维数组对象,以及用于处理这些数组的各种函数。NumPy 是 Pandas、SciPy 等众多数据科学库的基础,是进行数据分析、机器学习等任务的必备工具。
1. 安装 NumPy
使用 pip 可以轻松安装 NumPy:bashpip install numpy
2. 导入 NumPy
安装完成后,使用以下代码导入 NumPy 库:pythonimport numpy as np
通常使用 np 作为 NumPy 的别名,方便后续使用。
3. NumPy 数组
3.1 创建数组
使用 np.array() 函数可以创建 NumPy 数组:python# 一维数组arr1 = np.array([1, 2, 3, 4, 5])
二维数组arr2 = np.array([[1, 2, 3], [4, 5, 6]])
3.2 数组属性
shape:返回数组的形状,例如(2, 3)表示二维数组,包含 2 行 3 列。*size:返回数组元素的总数。*ndim:返回数组的维度。*dtype:返回数组中元素的数据类型。pythonprint(arr2.shape) # 输出: (2, 3)print(arr2.size) # 输出: 6print(arr2.ndim) # 输出: 2
3.3 常用数组创建函数
np.arange(start, stop, step):创建从 start 到 stop(不包含 stop),步长为 step 的数组。*np.zeros(shape):创建指定形状的全 0 数组。*np.ones(shape):创建指定形状的全 1 数组。*np.linspace(start, stop, num):创建从 start 到 stop 均匀分布的 num 个元素的数组。*np.random.rand(shape):创建指定形状的随机数组,元素值在 0 到 1 之间。
4. 数组操作
4.1 索引和切片
NumPy 数组支持类似列表的索引和切片操作:pythonprint(arr1[0]) # 访问第一个元素print(arr2[1, 2]) # 访问第二行第三列元素print(arr1[1:4]) # 切片,获取索引 1 到 3 的元素
4.2 数组运算
NumPy 支持对数组进行各种数学运算,例如:
- 加减乘除:
+,-,*,/* 幂运算:*** 比较运算:>,<,>=,<=,==,!=pythonarr3 = arr1 + 10 # 每个元素加 10arr4 = arr2 * 2 # 每个元素乘以 2arr5 = arr1 > 3 # 判断每个元素是否大于 3
4.3 统计函数
NumPy 提供了丰富的统计函数,例如:
np.sum(arr):计算数组中所有元素的和。*np.mean(arr):计算数组中所有元素的平均值。*np.max(arr):找到数组中的最大值。*np.min(arr):找到数组中的最小值。*np.std(arr):计算数组的标准差。
5. 更多资源
本篇仅介绍了 NumPy 库的一小部分功能,还有许多其他强大的功能等待你去探索。
- NumPy 官方文档:https://numpy.org/doc/
希望这篇简要介绍能够帮助你入门 NumPy,并在数据科学的学习和实践中发挥作用!
原文地址: http://www.cveoy.top/t/topic/n2f 著作权归作者所有。请勿转载和采集!