pandas 2.0 新变化


Pandas 2.0来了!这是自Pandas诞生以来最大的一次大修,而且已经酝酿了多年。

然而,你可能不会注意到太多的变化,你现有的Pandas代码很可能会像以前一样运行。

所有的主要变化都在引擎盖下。
这是因为Pandas已经脱离了它表示数据的方式,从numpy转向Apache Arrow。

Pandas最初是建立在numpy之上的,对于许多任务来说,它是一个足够的解决方案。然而,numpy有很多局限性,这些年来才变得越来越明显。Apache Arrow将极大地帮助解决这些痛点,并将加速许多Pandas任务。
它大大加快了csv文件的加载和保存,并使新版本的Pandas在这方面与Polars相提并论。