分类
-
- 2025-09-29
- 陈丹琦新作:大模型强化学习的第三条路,8B 小模型超越 GP
结合RLHF与RLVR的优势,仅需8B参数的小模型便能超越GPT-4o,并媲美Claude-3.7-Sonnet。陈丹琦团队最新研究引发广泛关注。他们提出了一种名为RLMT(ReinforcementLearningwi...Read More -
- 2025-09-26
- 不靠英伟达,中科院在国产 GPU 上跑通 76B 类脑大模型
过去几年,大模型几乎都依赖Transformer,它支撑了GPT、Claude、Gemini等一众前沿模型的进步,但也一直被诟病:一旦文本变长,计算量和内存消耗就会成倍膨胀,百万级token几乎不可承受。与此同时,大模型...Read More
共1页 2条


