独家|小米“AI才女”罗福莉团队最新突破!自研Agent效率系统使算力成本直降71.2%

罗福莉已经给我的文章亲手点过赞了。

就在刚刚,95后AI“天才少女”、前DeepSeek研究员、小米MiMo大模型负责人罗福莉再度发表重磅论文。

3月16日,罗福莉领导的小米MiMo大模型团队,与北京大学联合研发出统一的资源管理系统ARL-Tangram。

ARL-Tangram采用统一的动作级公式和弹性调度算法,不仅满足异构资源约束,而且最大限度地缩短动作完成时间(ACT),以及实现定制化异构资源管理器。

在真实世界的智能体强化学习任务上的评估表明,ARL-Tangram可以将平均ACT提高高达4.3 分。可将强化学习训练的步骤持续时间缩短至多1.5倍,并节省高达71.2%的外部资源。

这是罗福莉在小米发表的第二份突破性技术成果论文。

就在发布不久,罗福莉就在后台给我点赞了。
 
 
Back to Top