首页 > 业界 > 关键词  > DeepSeek最新资讯  > 正文

DeepSeek深夜发布全新多模态大模型 性能碾压OpenAI

2025-01-28 08:38 · 稿源: 快科技

近日,DeepSeek宣布推出其最新多模态大模型Janus-Pro,标志着文生图领域的突破性进展。

在GenEval和DPG-Bench基准测试中,Janus-Pro-7B超越了OpenAI的DALL-E 3、Stable Diffusion和Emu3-Gen等主流模型。

作为JanusFlow大模型的升级版,Janus Pro采用MIT开源协议,允许商业场景中的无限制使用。

通过优化训练策略、扩展训练数据以及增大模型规模,Janus-Pro显著提升了多模态理解能力和文本到图像生成指令跟踪能力,同时增强了生成稳定性。

尽管目前Janus-Pro仅支持384x384分辨率图像生成,但其紧凑的模型尺寸和优异的性能令人印象深刻。

作为多模态模型,Janus-Pro具备丰富的功能,包括文本到图像生成、图像描述、地标识别、图像文本识别和知识介绍等。

举报

  • 相关推荐
  • OpenAI急了?一再主张封杀Deepseek,还要求“开放版权”

    Deepseek成立于2023年,凭借创新的AI产品——尤其是其R1推理大模型——迅速在全球崭露头角。与OpenAI的ChatGPT等相比,Deepseek的产品价格极具竞争力。谷歌敦促美国政府增加对人工智能长期研究的投资,并提供公共数据集,以推动商业人工智能的发展——不是削减联邦开支。

  • 知情人士:微软开启AI反击战 测试DeepSeek模型欲替代OpenAI

    当地时间3月7日,媒体报道称,自微软内部AI部门负责人MustafaSuleyman接手微软AI业务以来,其与OpenAI的合作并非一帆风顺。在去年秋天的一次视频会议上,Suleyman与OpenAI管理层因思维链”推理过程产生争执,最终愤怒地提前结束了通话。微软能否摆脱对OpenAI的依赖,打造真正具有竞争力的AI生态,这一答案可能要到MAI模型正式落地后才能见分晓。

  • 球首次!2B复现DeepSeek-R1「啊哈时刻」,UCLA等用纯RL实现多模态推理

    【新智元导读】由UCLA等机构共同组建的研究团队,全球首次在20亿参数非SFT模型上,成功实现了多模态推理的DeepSeek-R1「啊哈时刻」!就在刚刚,我们在未经监督微调的2B模型上,见证了基于DeepSeek-R1-Zero方法的视觉推理「啊哈时刻」!这一成就,再次让AI社区轰动。博客地址:https://turningpointai.notion.site/the-multimodal-aha-moment-on-2b-model开源项目:https://github.com/turningpoint-ai/VisualThinker-R1-ZeroDeepSeek-R1的独特推理能力,能成功扩展到多模态推理领域吗?UCLA等机构的研究者发现,虽然目前已经涌现出许多试图复现DeepSeek-R1的研究,然这些研究大多遭遇了这个难点:很难复现出R1所表现出的回答长度增加和思考模式。在台湾大学获得硕士学位,导师是Chih-JenLin教授。

  • OpenAI最新15页报告:DeepSeek缩小,中美AI竞争差距

    全球最大金融媒体CNBC消息,OpenAI向特朗普政府提交了一份最新的15页报告,从监管政策、出口限制、AI基础设施等多个维度介绍了,美国该如何保持全球AI领导地位。特朗普上台后,立刻就废除了拜登时期发布的14110号非常严厉的AI监管命令,并要求在180天内提交一份有效的AI发展计划。OpenAI的整份报告都把DeepSeek当成中美AI竞争最重要的对手,所有建议策略也是围绕它来展开。

  • “复制”DeepSeek,量化巨头为何能成大模型顶流?

    又成AI大模型圈顶流?据媒体最新报道,幻方量化的老对手的九坤投资,携手微软团队成功复现DeepSeek-R1首次发现了语言混合会显著降低推理能力等问题。有投资人调侃道,“以后找大模型项目,是不是得先去量化机构排队拿号?”一些关注AI领域的风投的第一反应是:“什么?梁文峰见不到,难道我们要找关系拜访王琛了?”王琛,正是九坤投资的创始人,也是最近风投圈关注的又一

  • 反超DeepSeek!阿里万相大模型登上球开源榜首

    如今,开源大模型成为了当前科技圈内默契达成共识的风向标”,就连其排行榜一举一动,都在牵引着外界关注的神经。据开源社区HuggingFace最新榜单显示,开源仅6天的阿里万相大模型已反超DeepSeekR1,登顶模型热榜、模型空间榜两大榜单,成为近期全球开源社区最受欢迎的大大模型。同时能在消费级显卡运行,仅需8.2GB显存就可以生成480P视频,适用于二次模型开发和学术研究。

  • 阿里推出全新推理模型:仅1/21参数媲美DeepSeek R1

    阿里Qwen团队正式发布他们最新的研究成果QwQ-32B大语言模型。这是一款拥有320亿参数的模型,其性能可与具备6710亿参数的DeepSeek-R1媲美。QwQ-32B已在HuggingFace和ModelScope开源,大家也可通过QwenChat直接进行体验!

  • 寻找DeepSeek梁文锋

    AI大模型DeepSeek凭借好用、开源、免费三大特点火爆全球,成为史上最快突破3000万日活跃用户的APP,如今当下各行各业都在被DeepSeek化。就是这样一家公司,在爆火之前,外界知之甚少,它极少出现在媒体报道、猎头招聘、同行调研之中,也从未像“AI六小龙”那样激起过市场的水花。但无论如何,DeepSeek打破巨头了在AI领域的叙事,现在投资人们迫切希望在下一个DeepSeek出现之�

  • 广告盯上DeepSeek

    AI搜索加广告,是必然吗?定焦One原创作者|王璐编辑|魏佳DeepSeek们最近因为答案中疑似“夹带”广告被骂了。起因是科普博主“三个老爸实验室”称在腾讯元宝接入的DeepSeek里发现,生成答案中有“建议通过58到家等正规平台比价预约”“建议通过快回收平台或本地正规回收商询价”等广告倾向性内容。需要提醒大家的是,即便有没有广告,AI的回答也不是绝对客观中立。

  • e签宝AI合同大模型已接入DeepSeek

    国产AI技术遍地开花、不断升级这段时间,最火的AI话题就是DeepSeek了一夜之间,DeepSeek以其卓越的自然语言处理能力和深度学习技术震撼全球!这样牛的大模型什么时候接入e签宝智能合同里呢?来了,来了!他终于来了!e签宝AI合同大模型已接入DeepSeek!实现了更高效的推理能力和多模态支持为SaaS用户带来了更流畅、更智能的交互体验DeepSeek作为通用大模型,凭借其广泛的知识储备、�