1. 使用 pd.concat() 参数 ignore_index=True,避免每次拼接时重新生成索引。
  2. 使用 pd.concat() 参数 axis=1,避免每次拼接时重新生成列。
  3. 使用 DataFrame.append() 代替 pd.concat(),因为 append() 只在末尾添加数据,避免了重新生成索引和列的开销。
  4. 将多个 DataFrame 放入列表中,使用 pd.concat() 一次性拼接,避免多次拼接的开销。
  5. 使用 Pandas 中的 merge() 方法进行数据合并,这个方法比 pd.concat() 更快,尤其是在对列进行拼接时。
  6. 使用 NumPy 中的 concatenate() 方法进行数据拼接,这个方法比 pd.concat() 更快,尤其是在拼接大量数据时。但是需要注意数据类型的一致性。
Pandas Concat 速度优化技巧:提升数据拼接效率

原文地址: https://www.cveoy.top/t/topic/lMgJ 著作权归作者所有。请勿转载和采集!

免费AI点我,无需注册和登录