快速导航×

News Center新闻动态

分类

当前所在位置：首页

2025-09-29

陈丹琦新作：大模型强化学习的第三条路，8B 小模型超越 GP

结合RLHF与RLVR的优势，仅需8B参数的小模型便能超越GPT-4o，并媲美Claude-3.7-Sonnet。陈丹琦团队最新研究引发广泛关注。他们提出了一种名为RLMT（ReinforcementLearningwi...

Read More
2025-09-26

不靠英伟达，中科院在国产 GPU 上跑通 76B 类脑大模型

过去几年，大模型几乎都依赖Transformer，它支撑了GPT、Claude、Gemini等一众前沿模型的进步，但也一直被诟病：一旦文本变长，计算量和内存消耗就会成倍膨胀，百万级token几乎不可承受。与此同时，大模型...

Read More

共1页 2条