EN
2022年03月24日研究成果

人工智能张量程序的局部等价变换编译优化

翟季冬团队

近年来,人工智能已经在很多实际生产和生活领域中发挥了重要作用,如图像分类、语音识别、机器翻译、自动驾驶等。为了能够在通用和专用的处理器上高效地部署人工智能应用,针对人工智能应用的编译优化具有重要意义。清华大学计算机系长聘副教授、智源青年科学家翟季冬团队提出了一个人工智能编译器的自动优化系统,可以充分结合应用特征,对人工智能应用在给定的处理器(如GPU)上进行自动化的编译优化。在NVIDIA V100 GPU上的实验结果表明,该系统在常见深度学习模型上可以取得至多2.5倍的加速比,而通过与不同的后端,包括cuDNN/cuBlas、TVM、Ansor等结合,可以将算子性能优化至多2倍以上。相关成果发表于计算机系统领域顶级会议OSDI 2021(CCF A类)。



分享到: