bwin·必赢(河北)农业科技发展有限公司

◉ 健康资讯

Health information

好味道源于好产地


DeepSeek深夜发布多模态大模子 图像机能跑分力压

发布时间:

2025-02-16 15:15



  虽然DALL-E 3是OpenAI正在2023年发布的一款“老模子”,同时Janus Pro目前只能阐发和生陈规格较小的图像(384 x 384)。DeepSeek正在如斯紧凑的模子尺寸中仍然展示了令人印象深刻的机能。

  据DeepSeek引见,Janus-Pro是一个新鲜的自回归框架,同一了多模态理解和生成。通过将视觉编码分手为“理解”和“生成”两条径,处理了以往方式的局限性。这种分手不只缓解了视觉编码器正在理解和生成中的脚色冲突,还提拔了框架的矫捷性。

  大年节凌晨钟声敲响前不久,DeepSeek工程师们正在“抱抱脸”平台上传了Janus Pro 7B和1。5B模子。这俩模子是对客岁10月发布的Janus模子的升级。意味着这两个模子具备正在消费级电脑上当地运转的潜力。Janus Pro采用MIT许可证,正在商用方面没有。

  做为一个多模态模子,Janus-Pro不只能够“文生图”,同样也能对图片进行描述,识别地标景点(例如杭州的西湖),识别图像中的文字,并能对图片中的学问(例如下图中的“猫和老鼠”蛋糕)进行引见。

  就正在华尔街周一严重评估“DeepSeek风暴”之际,这家中国公司再度甩出新品:正在图像生成基准测试中超越OpenAI“文生图”模子DALL-E 3的多模态大模子Janus-Pro。

 

 

 

 

 

关键词:

推荐新闻


分享到

返回列表