您现在的位置是:天际琨瑜网 > 时尚
清华宣告SmartMoE:一键实现高功能MoE浓密大模子扩散式磨炼
天际琨瑜网2025-02-23 22:17:52【时尚】3人已围观
简介PACMAN 试验室探究大模子扩散式磨炼零星再出新下场。2023 年 7 月,清华大学合计机系 PACMAN 试验室宣告浓密大模子磨炼零星 SmartMoE,反对于用户一键实现 MoE 模子扩散式磨炼
PACMAN 试验室探究大模子扩散式磨炼零星再出新下场。清华
2023 年 7 月,宣告现高清华大学合计机系 PACMAN 试验室宣告浓密大模子磨炼零星 SmartMoE,键实反对于用户一键实现 MoE 模子扩散式磨炼,密大模扩磨炼经由自动搜查重大并行策略 ,散式抵达开源 MoE 磨炼零星争先功能。清华同时,宣告现高PACMAN 试验室在国内顶级零星团聚 USENIX ATC’23 宣告长文 ,键实作者搜罗博士生翟明书、密大模扩磨炼何家傲等,散式通讯作者为翟季冬教授 。清华PACMAN 试验室在机械学习零星规模不断深入钻研 ,宣告现高SmartMoE 是键实继 FastMoE, FasterMoE 以及 “八卦炉” 后在大模子扩散式磨炼零星上的又一次探究。欲清晰更多相关下场可魔难翟季冬教授首页:https://pacman.cs.tsinghua.edu.cn/~zjd
Mixture-of-Experts (MoE) 是密大模扩磨炼一种模子浓密化技术,因其高效扩展大模子参数目的散式特色而备受钻研者关注。为了后退 MoE 模子的易用性 、优化 MoE 模子磨炼功能