Plumber:数据流水线追踪器与计算图重构
Plumber: Diagnosing and Removing Performance Bottlenecks in Machine Learning Data Pipelines
这篇文章发表在MLSys22上,作者是Michael Kuchnik,Ana Klimovic,Jiri Samansa,Virginia Smith,George Amvrosiadis,机构是CMU。本文主要是介绍了数据流水线的工作模式和分析了性能瓶颈的所在:软件因素。然后提出了一个流水线追踪+计算图优化的工具Plumber。
1.问题背景(Motivation)
数据管道的优化能给性能获得数倍提升。但是目前的模型加载数据在很大比例上会造成1ms以上的延迟,这使得数据加载的能力相比于计算能力有更大不足。而且数据管道的优化是一个复杂的问题,因为数据管道的性能瓶颈可能是由于软件因素造成的。因此,需要一个工具来帮助用户诊断数据管道的性能瓶颈,并提供优化建议。
基于此,本文提出了Plumber,基于200万个ML任务的统计数据进行分析,通过自动化分析设备性能需求,以线性规划的方式进行运行时使用率追踪,从而规划计算图。
本博客所有文章除特别声明外,均采用 CC BY-SA 4.0 协议 ,转载请注明出处!