深入解析 Pandas DataFrame 的 info() 方法 (verbose=True)
Pandas DataFrame 的 info() 方法详解 (verbose=True)
在数据分析中,了解 DataFrame 的基本信息至关重要,而 raw_df.info(verbose=True) 这一行代码正是为此而设计的。
info() 方法是 Pandas DataFrame 的内置方法,它可以打印出 DataFrame 的基本信息,包括:
- 数据类型: 每列数据的类型 (例如 int64, float64, object 等)
- 非空值数量: 每列中非空值的数量
- 内存使用情况: DataFrame 占用的内存空间
- 唯一值数量: 每列中唯一值的数量 (当
verbose=True时) - 前五行值: DataFrame 前 5 行的值 (当
verbose=True时)
verbose=True 参数是 info() 方法的关键。它告诉 Python 打印更详细的信息,包括每列的唯一值数量和前 5 行的值。
通过使用 info() 方法,你可以快速了解 DataFrame 的结构和数据概况,从而更好地进行数据分析和处理。
示例:
import pandas as pd
data = {'姓名': ['张三', '李四', '王五'], '年龄': [25, 30, 28], '城市': ['北京', '上海', '广州']}
df = pd.DataFrame(data)
df.info(verbose=True)
这段代码会打印出如下信息:
<class 'pandas.core.frame.DataFrame'>
RangeIndex: 3 entries, 0 to 2
Data columns (total 3 columns):
# Column Non-Null Count Dtype
--- ------ -------------- -----
0 姓名 3 non-null object
1 年龄 3 non-null int64
2 城市 3 non-null object
dtypes: object(2), int64(1)
memory usage: 200.0 bytes
总结:
raw_df.info(verbose=True) 是一个强大的工具,可以帮助你全面了解 Pandas DataFrame 的结构和数据概况。它可以帮助你快速发现数据中的错误和异常,并为下一步数据处理提供重要的参考。
原文地址: https://www.cveoy.top/t/topic/n8Zx 著作权归作者所有。请勿转载和采集!