使用Pandas轻松获取DataFrame基础信息

在数据分析过程中,快速了解DataFrame的基本信息至关重要。 Pandas库提供了便捷的方法,帮助我们轻松查看DataFrame的行数、列名、数据类型以及每列值的统计信息。

本文将介绍如何使用.info().value_counts()方法快速获取DataFrame的基础信息,并提供示例代码演示。

1. 使用.info()方法查看DataFrame概览

.info()方法可以快速概览DataFrame的信息,包括:

  • 行数
  • 列名
  • 每列的非空值数量
  • 每列的数据类型
  • 内存占用

2. 使用.value_counts()方法统计每列值出现次数

.value_counts()方法可以统计每列中每个值的出现次数,方便我们了解数据的分布情况。

示例代码:

import pandas as pd

# 创建示例DataFrame
data = {
    'Name': ['Alice', 'Bob', 'Charlie'],
    'Age': [25, 30, 35],
    'City': ['New York', 'London', 'Tokyo']
}
df = pd.DataFrame(data)

# 使用.info()方法查看DataFrame概览信息
print('DataFrame概览:')
print(df.info())

# 使用.value_counts()方法统计每列值出现次数
print('\n每列值出现次数统计:')
for column in df.columns:
    print(f'\n列名:{column}')
    print(df[column].value_counts())

输出结果:

DataFrame概览:
<class 'pandas.core.frame.DataFrame'>
RangeIndex: 3 entries, 0 to 2
Data columns (total 3 columns):
 #   Column  Non-Null Count  Dtype 
---  ------  --------------  ----- 
 0   Name    3 non-null      object
 1   Age     3 non-null      int64 
 2   City    3 non-null      object
dtypes: int64(1), object(2)
memory usage: 200.0+ bytes
None

每列值出现次数统计:

列名:Name
Charlie    1
Bob        1
Alice      1
Name: Name, dtype: int64

列名:Age
35    1
30    1
25    1
Name: Age, dtype: int64

列名:City
Tokyo       1
London      1
New York    1
Name: City, dtype: int64

总结:

通过.info().value_counts()方法,我们可以快速了解DataFrame的基本信息,为后续数据分析提供基础。

使用Pandas快速查看DataFrame信息:行数、列名、数据类型及统计

原文地址: https://www.cveoy.top/t/topic/ZFB 著作权归作者所有。请勿转载和采集!

免费AI点我,无需注册和登录