智能加速实验室
智能加速实验室
主页
研究简介
研究团队
发明专利
学术论文
招生指南
LLMQ
LLM Inference Unveiled: Survey and Roofline Model Insights
The field of efficient Large Language Model (LLM) inference is rapidly evolving, presenting a unique blend of opportunities and …
Zhihang Yuan
,
Yuzhang Shang
,
Yang Zhou
,
Zhen Dong
,
Chenhao Xue
,
Bingzhe Wu
,
Zhikai Li
,
Qingyi Gu
,
Yong Jae Lee
,
Yan Yan
引用
代码
DOI
引用
×