Skip to content

Files

Latest commit

5f321e5 · Jul 8, 2023

History

History
This branch is 1147 commits behind chenzomi12/AISystem:main.

034CM_Backend

Folders and files

NameName
Last commit message
Last commit date

parent directory

..
Jul 6, 2023
Jul 6, 2023
Jul 6, 2023
Jul 6, 2023
Jul 6, 2023
Jul 6, 2023
Jul 6, 2023
Jul 6, 2023
Jul 6, 2023
Jul 6, 2023
Jul 6, 2023
Jul 6, 2023
Jul 6, 2023
Jul 6, 2023
Jul 6, 2023
Jul 6, 2023
Jul 6, 2023
Jul 6, 2023
Jul 6, 2023
Jul 6, 2023
Jul 6, 2023
Jul 6, 2023
Jul 8, 2023

后端优化

《编译后端优化》后端优化作为AI编译器跟硬件之间的相连接的模块,更多的是算子或者Kernel进行优化,而优化之前需要把计算图转换称为调度树等IR格式,然后针对每一个算子/Kernel进行循环优化、指令优化和内存优化等技术。

我在这里抛砖引玉,希望您可以一起参与到这个开源项目中,跟更多的您一起探讨学习!

内容大纲

PPT字幕需要到 Github 下载,网页课程版链接会失效哦~

建议优先下载 PDF 版本,PPT 版本会因为字体缺失等原因导致版本很丑哦~

名称 名称 备注
后端优化 01 AI编译器后端优化介绍 PPT, 视频, 字幕
后端优化 02 算子分为计算与调度 PPT, 视频, 字幕
后端优化 03 算子优化手工方式 PPT, 视频, 字幕
后端优化 04 算子循环优化 PPT, 视频, 字幕
后端优化 05 指令和内存优化 PPT, 视频, 字幕
后端优化 06 Auto-Tuning原理 PPT, 视频, 字幕
:maxdepth: 2

01.introduction
02.ops_compute
03.optimization
04.loop_opt
05.other_opt
06.auto_tuning