分类
-
- 2025-08-24
- 北大提出首个复数大模型,2 比特量化,推理仅加法,可手机部署
首个复数大模型!北大推出2比特超低比特量化新方案。当前,大模型在推理过程中往往面临巨大的存储与计算开销,主要原因在于模型权重普遍采用FP16格式存储,占用大量空间。北京大学研究团队首次提出iFairy方案,将模型权重量化...Read More -
- 2025-08-05
- AI 竞赛再升级 谷歌推出 Gemini 2.5 Deep
8月2日,谷歌正式推出全新的Gemini2.5DeepThink模型,标志着其在人工智能研发方向上的又一次重大跃进。此次发布意味着谷歌正逐步将重心从追求通用能力的广泛覆盖,转向更具深度的问题解决、复杂推理与系统性规划能力...Read More -
- 2025-07-19
- 华为人工智能领域新专利公布 可降低扩散模型训练成本
CNMO获悉,7月18日,华为技术有限公司申请的"一种模型训练方法、数据生成方法及相关设备"专利公布。该专利类型为发明公布,申请日是2024年1月16日,法律状态为审中。华为集团根据专利摘要显示,本申...Read More -
- 2024-06-06
- 首次证实白盒Transformer可扩展性!马毅教授CRAT
在过去的几年里,Transformer架构在自然语言处理(NLP)、图像处理和视觉计算领域的深度表征学习中取得了显著进展。这些成果使得AI领域的主导技术成为了深度表征学习。然而,虽然Transformer架构及其众多变体...Read More -
- 2024-06-06
- 把整个地球装进神经网络,北航团队推出全球遥感图像生成模型
北航的研究团队,用扩散模型“复刻”了一个地球?在全球的任意位置,模型都能生成多种分辨率的遥感图像,创造出丰富多样的“平行场景”。而且地形、气候、植被等复杂的地理特征,也全都考虑到了。受GoogleEarth启发,北航的研...Read More -
- 2024-06-04
- 套壳丑闻让斯坦福AI Lab主任怒了!抄袭团队2人甩锅1人失
斯坦福团队抄袭清华系大模型事件后续来了——Llama3-V团队承认抄袭,其中两位来自斯坦福的本科生还跟另一位作者切割了。最新致歉推文,由SiddharthSharma(悉达多)和AkshGarg(阿克什)发出。不在其中、...Read More


