分类
-
- 2025-12-14
- Gemini TTS— 谷歌推出的AI文本转语音模型
GeminiTTS是什么GeminiTTS是谷歌研发的前沿AI语音合成技术,当前最新版本已集成于Gemini2.5Flash与Gemini2.5Pro模型中。该技术支持多角色语音、覆盖24种以上语言,可输出高度自然、富有...Read More -
- 2025-12-14
- GWM-1— Runway推出的首个通用世界模型
GWM-1是什么GWM-1是Runway正式发布的首款通用世界模型,底层基于Gen-4.5架构打造,采用自回归式建模方式,按帧顺序预测视频内容,具备实时响应与交互能力。该模型涵盖三大核心分支:GWMWorlds专注于构建...Read More -
- 2025-12-13
- GLM-TTS— 智谱开源的工业级语音合成系统
GLM-TTS是什么GLM-TTS是智谱AI自主研发的工业级语音合成系统,依托多目标强化学习技术构建,集音色克隆、情感化表达、深层文本解析与高保真语音生成于一体。该系统采用语义建模与声学建模相协同的两阶段合成架构,兼顾生...Read More -
- 2025-12-12
- VoxCPM1.5— 面壁智能开源的端到端语音合成模型
VoxCPM1.5是什么VoxCPM1.5是由面壁智能研发的新一代端到端文本转语音(TTS)系统,具备上下文理解能力与高保真声音复刻特性。该模型采用端到端扩散+自回归混合架构,直接从原始文本生成连续语音波形,支持高达44...Read More -
- 2025-12-08
- 为什么5G还没普及就要研发6G 发展6G的战略意义是什么
6G研发已启动,因5G在垂直行业存在智能化不足、算力分离等瓶颈,无法满足工业互联网、智慧医疗等高要求场景。1、通过“通感算智安”一体化设计,实现网络内生智能与安全;2、抢占标准制定权,构建自主可控产业链,强化国家战略竞争...Read More -
- 2025-11-27
- 构建AI智能体:精雕细琢:驾驭关键词的细微差别,解锁高质量提
一、似是而非随着人工智能图像生成模型的迅猛发展,我们仿佛一夜之间踏入了"人人都是创作者"的新纪元。只需输入一段文字描述,AI就能在数十秒内将其转化为令人惊叹的视觉图像。然而,在这个过程中,许多人发现了...Read More


