利用ML Compute在Mac上进行加速培训

2020-11-21 11:50:18

Mac一直是开发人员,工程师和研究人员的流行平台。现在,借助由全新M1芯片提供支持的Mac,以及macOS Big Sur中提供的ML Compute框架,神经网络可以在Mac上进行训练,从而实现巨大的性能飞跃。

到目前为止,TensorFlow仅将CPU用于Mac培训。 TensorFlow 2.4的新tensorflow_macos分支利用ML Compute使机器学习库不仅可以充分利用CPU,而且可以充分利用M1和Intel驱动的Macs中的GPU,从而显着提高培训性能。首先,通过应用更高级别的优化(如融合层),选择合适的设备类型并编译图形并将其作为图元执行,并由CPU上的BNNS和GPU上的Metal Performance Shaders进行加速。

Mac优化的TensorFlow培训的性能基准表明,利用GPU进行培训时,跨M1和Intel驱动的Mac的通用模型的显着提高。例如,TensorFlow用户现在可以在配备M1的新型13英寸MacBook Pro上获得多达7倍的培训速度:

要开始使用Mac优化的TensorFlow,请访问tensorflow_macos GitHub存储库。您还可以访问TensorFlow的博客文章以了解更多信息。

苹果公司于2020年10月和2020年11月使用配备Apple M1芯片,16GB RAM和256GB SSD的预生产13英寸MacBook Pro系统以及基于1.7GHz四核Intel Core i7的生产13英寸MacBook进行了测试Pro系统配备Intel Iris Plus Graphics 645、16GB RAM和2TB SSD。已在预发行版macOS Big Sur,TensorFlow 2.3,预发行版TensorFlow 2.4,具有微调功能的ResNet50V2,CycleGAN,Style Transfer,MobileNetV3和DenseNet121上进行了测试。性能测试是使用特定的计算机系统进行的,反映了MacBook Pro的大致性能。

Apple在2020年10月和2020年11月使用生产的3.2GHz 16核,基于Intel Xeon W的Mac Pro系统,32GB RAM,具有64GB HBM2的AMD Radeon Pro Vega II Duo图形和256GB SSD进行了测试。已在预发行版macOS Big Sur,TensorFlow 2.3,预发行版TensorFlow 2.4,具有微调功能的ResNet50V2,CycleGAN,Style Transfer,MobileNetV3和DenseNet121上进行了测试。性能测试是使用特定的计算机系统进行的,反映了Mac Pro的大致性能。

成功的机器学习(ML)应用程序需要对建模和基础数据进行迭代。虽然以前的ML可视化工具主要集中在建模上,但我们对23名ML从业人员的访谈显示,他们通过迭代数据(例如收集新数据,添加标签)而不是模型来提高模型性能。我们还将确定常见的数据迭代类型以及相关的分析任务,并…

查看纸张详细信息

苹果开始在iOS 10中使用深度学习进行人脸检测。随着Vision框架的发布,开发人员现在可以在其应用程序中使用该技术和许多其他计算机视觉算法。我们在开发框架时面临着严峻的挑战,以便我们可以保护用户隐私并在设备上高效运行。本文讨论了这些挑战并描述了人脸检测算法。

查看文章详细信息