1月28日消息,爆火的国产大模型DeepSeek又放大招,今天凌晨突然发布Janus-Pro多模态大模型,进军文生图领域。
在GenEval和DPG-Bench基准测试中,Janus-Pro-7B不仅击败了OpenAI的DALL-E 3,还击败了Stable Diffusion、Emu3-Gen等热门模型。
Janus-Pro采用MIT开源协议,这意味着可无限制用于商业场景。
DeepSeek方面表示,该大模型是2024年11月13日发布的JanusFlow大模型的高级版本。
相比前代模型,Janus-Pro优化训练策略、扩展了训练数据,模型也更大。
得益于此,Janus-Pro在多模态理解和文本到图像的指令跟踪功能方面取得重大进步,同时还增强了文本到图像生成稳定性。
虽然Janus-Pro暂时只能处理384x384分辨率的图像,但考虑到模型如此“紧凑”却能达到如此水准,足以令人惊艳。
作为多模态模型,Janus-Pro不仅能文生图,还能对图片进行描述,识别地标景点,识别图像中的文字,并能对图片中的知识进行介绍。
文章来源:
快科技
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至23467321@qq.com举报,一经查实,本站将立刻删除;如已特别标注为本站原创文章的,转载时请以链接形式注明文章出处,谢谢!