使用Pandas快速查看DataFrame信息:行数、列名、数据类型及统计
使用Pandas轻松获取DataFrame基础信息
在数据分析过程中,快速了解DataFrame的基本信息至关重要。 Pandas库提供了便捷的方法,帮助我们轻松查看DataFrame的行数、列名、数据类型以及每列值的统计信息。
本文将介绍如何使用.info()和.value_counts()方法快速获取DataFrame的基础信息,并提供示例代码演示。
1. 使用.info()方法查看DataFrame概览
.info()方法可以快速概览DataFrame的信息,包括:
- 行数
- 列名
- 每列的非空值数量
- 每列的数据类型
- 内存占用
2. 使用.value_counts()方法统计每列值出现次数
.value_counts()方法可以统计每列中每个值的出现次数,方便我们了解数据的分布情况。
示例代码:
import pandas as pd
# 创建示例DataFrame
data = {
'Name': ['Alice', 'Bob', 'Charlie'],
'Age': [25, 30, 35],
'City': ['New York', 'London', 'Tokyo']
}
df = pd.DataFrame(data)
# 使用.info()方法查看DataFrame概览信息
print('DataFrame概览:')
print(df.info())
# 使用.value_counts()方法统计每列值出现次数
print('\n每列值出现次数统计:')
for column in df.columns:
print(f'\n列名:{column}')
print(df[column].value_counts())
输出结果:
DataFrame概览:
<class 'pandas.core.frame.DataFrame'>
RangeIndex: 3 entries, 0 to 2
Data columns (total 3 columns):
# Column Non-Null Count Dtype
--- ------ -------------- -----
0 Name 3 non-null object
1 Age 3 non-null int64
2 City 3 non-null object
dtypes: int64(1), object(2)
memory usage: 200.0+ bytes
None
每列值出现次数统计:
列名:Name
Charlie 1
Bob 1
Alice 1
Name: Name, dtype: int64
列名:Age
35 1
30 1
25 1
Name: Age, dtype: int64
列名:City
Tokyo 1
London 1
New York 1
Name: City, dtype: int64
总结:
通过.info()和.value_counts()方法,我们可以快速了解DataFrame的基本信息,为后续数据分析提供基础。
原文地址: https://www.cveoy.top/t/topic/ZFB 著作权归作者所有。请勿转载和采集!