几行代码提升Pandas性能150倍


Pandas是一个强大的Python数据分析和操作库!NVIDIA让Pandas的速度提高了150倍,无需更改代码

您只需添加几行代码:

%load_ext cudf.pandas import pandas as pd

Pandas在内存中运行,因为它将整个数据集加载到运行它的机器的本地内存中。这限制了它处理大型数据集的能力。

借助cuDF的pandas加速器,您现在可以为pandas工作流带来加速计算。

此外,这个github cuDF库将自动知道你是在GPU还是CPU上运行,并加快你的处理速度。

cuDF(读作 "KOO-dee-eff")是一个 GPU DataFrame 库,用于加载、连接、聚合、过滤和以其他方式操作数据。cuDF 利用 libcudf(一个超快的 C++/CUDA 数据帧库)和 Apache Arrow 列式格式,提供了一个 GPU 加速的 pandas API。

CUDA/GPU 要求

  • CUDA 11.2+
  • NVIDIA 驱动程序 450.80.02+
  • Volta 架构或更高(计算能力 >=7.0)


详细点击标题