7 × 24,AI 也吃不用。 卡内基梅隆大学和马里兰大学发了篇论文,《Language Models Need Sleep》—— 大模子处治长高下文的时辰,硬撑着束缚息,确凿会累傻。 这项估量的灵感源自东说念主脑运作机制。 东说念主睡觉的时辰海马体会把白日的短期顾忌一遍遍回放,沉稳进皮层突触,酿成长期学问。 估量团队觉得模子也不错这么,盘算了一个寝息机制,让大模子高下文窗口快满的时辰别硬撑了,打个盹把最近的高下文反复咀嚼几遍,压缩进长期权重,清空缓存,醒了再接着干。 测试发现,合理增多"寝息...