商汤发布 NEO-unify 技术博客,探索原生多模态统一架构

网站小编 2

商汤科技联合南洋理工大学发布 NEO-unify 预览版,这是一种摒弃传统视觉编码器与变分自编码器、直接从像素与文本中学习的端到端原生架构。它在图像重建任务中接近 Flux VAE 性能,图像编辑基准达 3.32 分,理解与生成协同提升,数据训练效率优于现有方案。

标签: 商汤 架构 多模

抱歉,评论功能暂时关闭!