分类
-
- 2024-06-04
- AI预测极端天气提速5000倍!微软发布Aurora,借AI
个人类有历史以来,就一直执着于预测天气,以各种方式破解“天空之语”,我们慢慢发现,草木、云层似乎与天气有关,这不仅仅是因为人类从事生产的需要,也是人类想要对着大风歌唱、在月光下吟诗的需要。《冰与火之歌》中的风雨歌师,就是...Read More -
- 2024-06-04
- 快速学会一个算法,xLSTM
今天给大家分享一个超强的算法模型,xLSTM。xLSTM(ExtendedLongShort-TermMemory)是对传统LSTM(LongShort-TermMemory)模型的扩展和改进,旨在提升其在处理时间序列数...Read More -
- 2024-06-03
- 英伟达新研究:上下文长度虚标严重,32K性能合格的都不多
无情戳穿“长上下文”大模型的虚标现象——英伟达新研究发现,包括GPT-4在内的10个大模型,生成达到128k甚至1M上下文长度的都有。但一番考验下来,在新指标“有效上下文”上缩水严重,能达到32K的都不多。新基准名为RU...Read More -
- 2024-06-03
- 不同数据集有不同的Scaling law?而你可用一个压缩算
一般而言,训练神经网络耗费的计算量越大,其性能就越好。在扩大计算规模时,必须要做个决定:是增多模型参数量还是提升数据集大小——必须在固定的计算预算下权衡这两项因素。增加模型参数量的好处是可以提高模型的复杂度和表达能力,从...Read More -
- 2024-06-03
- 超越Devin!姚班带队,他们创大模型编程新世界纪录
超越Devin!SWEBench排行榜上迎来了新玩家——StarShipCodeGenAgent,姚班带队初创公司OpenCSG出品,以23.67%的成绩获得全球第二名的成绩。同时创造了非GPT-4o基模的最高纪录(SO...Read More -
- 2024-05-30
- 速度秒掉GPT-4o、22B击败Llama 3 70B,Mi
对标OpenAI的法国AI独角兽MistralAI有了新动作:首个代码大模型Codestral诞生了。作为一个专为代码生成任务设计的开放式生成AI模型,Codestral通过共享指令和补全API端点帮助开发人员编写并与代...Read More


