近乎原生的性能来自于核心 Python 数值包的加速。这是使用英特尔® 性能库完成的,例如英特尔® oneAPI 数学内核库 (oneMKL) 和英特尔® oneAPI 数据分析库 (oneDAL)。使用核心编译器技术(例如 Numba* 和 Cython)编译您的自定义代码。这些将向量化和多线程应用到您的代码中,将 Python 提升到新的水平。通过英特尔® oneAPI 线程构建块 (oneTBB) 和对称多处理 (SMP) 来利用可组合并行性。这些技术可帮助您避免过多的空间,使用嵌套并行性而不会超额订阅,并优化特定工作负载以获得最高性能。使用相同的编程模型 DPPy(数据并行 Python)为多个设备编程,从而避免将 CPU 代码重写为设备代码。其包含的包 dpCtl 可让您跨主机和设备控制执行和数据管理。在数据并行和异构硬件上运行数字和机器学习 (ML) 工作负载,而无需脱离 Python 生态系统,同时使用 DPPy 不会影响性能。免费获取构建和优化 oneAPI 项目所需的内容。使用英特尔® DevCloud 帐户,您可以在 120 天内访问最新的英特尔® 硬件(CPU、GPU、FPGA)以及英特尔® oneAPI 工具和框架。没有软件下载。没有配置步骤。没有安装。英特尔 Python 发行版作为英特尔® oneAPI AI 分析工具套件的一部分包含在内,该工具套件通过优化的深度学习框架和高性能 Python 库提供加速的机器学习和数据分析管道。
数据并行 Python (DPPy),一组 Python 开发必不可少的包。 DPPy 包括 dpCtl,用于控制多个设备上的执行和数据管理的包,以及数据并行数值 Python (dpnp),一个与 dpCtl 兼容的设备加速包。 dpCtl 文档 | dpnp 文档 使用 XGBoost*、scikit-learn 和高级 ML 用法(包括多个设备)加快机器学习速度,使用 daal4py。 Scikit-ipp 用于图像变形、图像过滤和形态学操作。包括对使用 OpenMP 的过滤器的变换函数多线程和部分多线程的支持。