Pandas DataFrame 的 info() 方法详解 (verbose=True)

在数据分析中,了解 DataFrame 的基本信息至关重要,而 raw_df.info(verbose=True) 这一行代码正是为此而设计的。

info() 方法是 Pandas DataFrame 的内置方法,它可以打印出 DataFrame 的基本信息,包括:

  • 数据类型: 每列数据的类型 (例如 int64, float64, object 等)
  • 非空值数量: 每列中非空值的数量
  • 内存使用情况: DataFrame 占用的内存空间
  • 唯一值数量: 每列中唯一值的数量 (当 verbose=True 时)
  • 前五行值: DataFrame 前 5 行的值 (当 verbose=True 时)

verbose=True 参数是 info() 方法的关键。它告诉 Python 打印更详细的信息,包括每列的唯一值数量和前 5 行的值。

通过使用 info() 方法,你可以快速了解 DataFrame 的结构和数据概况,从而更好地进行数据分析和处理。

示例:

import pandas as pd

data = {'姓名': ['张三', '李四', '王五'], '年龄': [25, 30, 28], '城市': ['北京', '上海', '广州']}

df = pd.DataFrame(data)

df.info(verbose=True)

这段代码会打印出如下信息:

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 3 entries, 0 to 2
Data columns (total 3 columns):
 #   Column  Non-Null Count  Dtype 
---  ------  --------------  ----- 
 0   姓名     3 non-null      object
 1   年龄     3 non-null      int64 
 2   城市     3 non-null      object
dtypes: object(2), int64(1)
memory usage: 200.0 bytes

总结:

raw_df.info(verbose=True) 是一个强大的工具,可以帮助你全面了解 Pandas DataFrame 的结构和数据概况。它可以帮助你快速发现数据中的错误和异常,并为下一步数据处理提供重要的参考。

深入解析 Pandas DataFrame 的 info() 方法 (verbose=True)

原文地址: https://www.cveoy.top/t/topic/n8Zx 著作权归作者所有。请勿转载和采集!

免费AI点我,无需注册和登录