资讯

MIT等机构研究人员开发了名为"TLT"的新训练方法,通过利用处理器空闲时间训练小型模型预测大型推理模型输出,将训练速度提升70-210%且保持准确性。该方法解决了强化学习训练中85%时间消耗在生成多个答案的瓶颈问题,为开发复杂任务处理模型提供了节能高效的解决方案。
活动推荐

2026数字政府智能应用与创新发展大会

中国·北京

本站热榜

日排行
周排行
月排行
热点资讯