本项目面向那些对利用深度学习技术(尤其是模型推理)实现高性能程序感兴趣,但可能尚未动手的读者。我们假设读者的基本背景是之前只对Numpy有经验。考虑到这一点,我们将从头开始解释事情,并在需要时介绍相关背景。然而,有经验的读者也应该发现这些内容很有用。
我们大致将内容分为三大部分。在第一部分中,我们将介绍如何在各种硬件平台上实现和优化操作符,例如矩阵乘法和卷积。这是深度学习和科学计算的基本组成部分。在第二部分中,我们将展示如何从各种深度学习框架中转换神经网络模型,并在程序层面上进一步优化它们。最后一部分,我们将讨论如何将优化后的程序部署到各种环境中,例如手机。此外,在本书的最后,我们计划介绍一些深度学习编译器领域的最新进展。