DeepSeek发布全新图像生成模型Janus-Pro

热门AI公司深度求索(DeepSeek)发布了一套全新的多模态AI模型,该公司声称这些模型的表现优于OpenAI的DALL-E 3

这些模型可以从AI开发平台Hugging Face下载,是深度求索称为Janus Pro的新模型家族的一部分。这些模型的参数规模从10亿到70亿不等。参数大致对应模型的解决问题能力,参数更多的模型通常比参数较少的模型表现更好。

Janus Pro采用MIT许可证,这意味着它可以不受限制地用于商业用途。

深度求索图像

深度求索Janus Pro模型的图像输出。图片来源:深度求索

深度求索将Janus Pro描述为一种“新颖的自回归框架”,它既能分析图像,也能生成新图像。据该公司称,在两项AI评估基准测试GenEval和DPG-Bench中,最大的Janus Pro模型Janus Pro 7B击败了DALL-E 3以及PixArt-alpha、Emu3-Gen和Stability AI的Stable Diffusion XL等模型。

诚然,其中一些模型已经有些过时,而且大多数Janus Pro模型只能分析分辨率最高为384 x 384的小图像。但考虑到这些模型的紧凑规模,Janus Pro的表现令人印象深刻。

深度求索在Hugging Face的一篇帖子中写道:“Janus Pro超越了之前的统一模型,并与特定任务模型的性能相匹配或超越。Janus Pro的简洁性、高灵活性和有效性使其成为下一代统一多模态模型的有力候选者。”

深度求索图像

深度求索的新Janus Pro模型与竞争对手的比较。图片来源:深度求索

深度求索是一家主要由量化交易公司高飞资本管理(High-Flyer Capital Management)资助的中国AI实验室,本周其聊天机器人应用登上苹果App Store排行榜榜首后,进入了主流视野。深度求索的语言模型采用了计算效率高的技术进行训练,这让许多华尔街分析师——以及技术专家——质疑美国是否能在AI竞赛中保持领先地位,以及AI芯片的需求是否会持续。

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注