分类
-
- 2023-09-03
- 阿里巨型模型再次开源!图像理解与物体识别功能一应俱全,基于通
阿里巴巴开源了一个新的大模型,非常令人兴奋~继通义千问-7B(Qwen-7B)之后,阿里云又推出了大规模视觉语言模型Qwen-VL,并且一上线就直接开源。Qwen-VL是一种基于通义千问-7B的多模态大模型,具体而言,它...Read More -
- 2023-08-31
- ZOTAC VR GO 4.0 A2000 上市:无界沉浸,
自2016年ZOTAC发布首款可背负式背包电脑以来,每一代ZOTACVR背包都凭借其卓越的质量、出色的性能和广泛的适配性赢得了业界的一致认可。为了满足用户需求,本月,ZOTAC推出了全新的VR背包系列新品——VRGO4....Read More -
- 2023-08-17
- 轻量级视觉网络新主干:高效的傅里叶算子Token混合器
1.背景这些年来,Transformer、Large-kernelCNN和MLP这三种视觉主干网络在广泛的计算机视觉任务中取得了巨大的成功,这主要归功于它们在全局范围内高效地融合信息的能力Transformer、CNN和...Read More -
- 2023-06-21
- Meta发布音频AI模型,仅需2秒片段模拟真人语音
近日,Meta发布了VoiceboxAI模型,它在音频模拟方面有着显著优势。据悉,Voicebox只需要一段2秒钟的音频样本,即可准确辨别出音频细节、音色,并基于文字结果转换为语音输出。Voicebox是一种生成式AI模...Read More


