Pandas 创建不同长度列的 DataFrame:使用 NaN 填充缺失值
在创建 DataFrame 时,所有的列必须具有相同的长度。如果你想创建一个具有不同长度的列的 DataFrame,你可以使用 NaN(Not a Number)填充缺失值。
下面是一个示例,演示如何创建一个具有不同长度的列的 DataFrame:
import pandas as pd
import numpy as np
# 创建不同长度的列
col1 = [1, 2, 3, 4]
col2 = ['a', 'b', 'c']
col3 = [True, False, True, False, True]
# 找到最长的列的长度
max_length = max(len(col1), len(col2), len(col3))
# 使用NaN填充缺失值,并创建DataFrame
df = pd.DataFrame({'col1': col1 + [np.nan] * (max_length - len(col1)),
'col2': col2 + [np.nan] * (max_length - len(col2)),
'col3': col3 + [np.nan] * (max_length - len(col3))})
print(df)
输出结果:
col1 col2 col3
0 1.0 a True
1 2.0 b False
2 3.0 c True
3 4.0 NaN False
4 NaN NaN True
在这个示例中,我们创建了三个不同长度的列(col1,col2 和 col3)。我们找到最长的列的长度(4),并使用 NaN 填充其他列的缺失值。然后,我们使用字典创建 DataFrame。
请注意,在 DataFrame 中,列的长度应该是相同的,但是行的长度可以不同。如果你有不同长度的行,可以使用列表的列表或者嵌套列表来创建 DataFrame。
原文地址: https://www.cveoy.top/t/topic/fLhr 著作权归作者所有。请勿转载和采集!