深度求索开源多模态大模型DeepSeek-VL系列

2024-03-13 09:23 · 稿源：站长之家

站长之家(ChinaZ.com) 3月13日消息:3月11日，DeepSeek-AI开源了全新多模态大模型 DeepSeek-VL系列，分为1.3b 和7b 两种规模，共有4个版本。它具有融合语言和视觉能力，可以在不损失语言理解能力的情况下处理多模态任务，识别高分辨率图像中的细小物体。这个模型结合了视觉和语言信息，通过预训练微调的方法，在种领域中展现出很好的性能。

在数据构建阶段，DeepSeek VL 模型使用了多种不同领域的数据集，包括公开数据集如 ShareGPT4V、LAION-GPTV、LVIS-Instruct4V 等，以及纯文本数据集如 DeepSeek-LLM。

模型训练过程分为三个关键阶段:视觉 - 语言适配器训练、联合视觉 - 语言预训练和监督微调，以确保模型在不同任务和领域中的准确性和鲁棒性。

据悉，深度求索（DeepSeek），成立于2023年，专注于研究世界领先的通用人工智能底层模型与技术，挑战人工智能前沿性难题。

微信截图_20240313092554.png

包括:

deepseek-vl-1.3b-chat:

https://modelscope.cn/models/deepseek-ai/deepseek-vl-1.3b-chat

deepseek-vl-7b-chat:

https://modelscope.cn/models/deepseek-ai/deepseek-vl-7b-chat

deepseek-vl-7b-base:

https://modelscope.cn/models/deepseek-ai/deepseek-vl-7b-base

deepseek-vl-1.3b-base:

https://modelscope.cn/models/deepseek-ai/deepseek-vl-1.3b-base

（举报）

相关推荐

关键词：

如何用 DeepSeek 生成备课教案

本教程介绍如何利用AI工具DeepSeek快速生成七年级中国古代史教案。操作流程包括：1.登录DeepSeek官网；2.进入文本生成界面；3.输入详细指令，包含教学目标、重难点、教学过程等要素；4.等待AI生成教案；5.检查并调整内容。该工具能帮助教师高效完成系统化的教案设计，但生成后仍需根据实际教学需求进行适当修改和完善，最后保存为所需格式使用。

教案生成 DeepSeek工具教育技术
如何用 DeepSeek 生成星球日更内容

本文介绍如何利用DeepSeek工具高效生成星球日更内容。主要内容包括：1.注册登录DeepSeek官网进入对话界面；2.输入精准指令获取内容，如"生成7篇藏马鸡主题的星球日更"；3.对生成内容进行相关性、实用性评估；4.通过补充指令优化不满意内容。该工具能快速提供多样化素材，解决持续创作压力，经过多次调整可获得符合定位的优质内容。操作流程简单，适合自媒体运营和社群内容创作。

日更内容知识星球社群运营
如何用 DeepSeek 进行论文降重

本文介绍了如何利用DeepSeek AI工具降低学术论文重复率。该工具能对重复率超标的段落进行学术化改写，在保证专业术语准确性的同时降低查重率。使用方法是：1)在DeepSeek网站输入降重指令和段落；2)可指定改写风格（如某期刊格式）或具体方向（如主动改被动句）；3)审查改写结果，确保语义准确、术语恰当、逻辑连贯。若发现问题可再次优化。该工具适用于毕业论文、期刊�

学术写作论文降重 AI工具
如何用 DeepSeek 进行合同审核

本文介绍如何利用DeepSeek AI工具高效审核合同法律风险。合同是商业活动的重要保障，但隐藏的法律风险可能带来巨大损失。DeepSeek能快速识别合同条款中的合法性存疑、违约责任模糊、交付条款不清等问题，并提供专业修改建议。操作流程包括：1.登录DeepSeek平台；2.上传合同文件；3.输入审核指令；4.查看详细审核结果。该工具适用于企业法务、律师及商务人员，能有效规避合同风险，提高审核效率。

合同审核法律风险 AI工具
利用DeepSeek和豆包生成工作总结

本文介绍如何利用AI工具快速撰写高质量工作总结。通过DeepSeek生成内容框架，再使用豆包填充具体内容，可大幅提升写作效率。操作步骤：1）在DeepSeek输入需求获取大纲；2）将大纲粘贴至豆包生成详细内容；3）根据需要进行调整优化。该方法适用于教师学期总结、员工季度报告、项目总结等多种场景，能有效节省时间精力，提升工作效率。

工作总结 AI工具 DeepSeek
如何用 DeepSeek 生成爆款标题

本文介绍如何利用DeepSeek工具快速生成15个爆款标题，提升内容吸引力。操作步骤：1.访问DeepSeek官网；2.输入指令，如"为夏日低卡甜品生成15个小红书标题"，要求包含emoji、数字或关键词；3.根据不同平台特性调整风格：小红书需活泼多用emoji，知乎要理性干货，抖音则简短有力突出冲突。该工具能帮助创作者在海量信息中脱颖而出，解决标题创作难题。
如何用 DeepSeek 制定项目管理计划

本文介绍了如何利用DeepSeek AI工具快速完成电商双十二促销网页开发项目。关键点包括：1.通过DeepSeek平台输入详细需求指令，系统会生成项目管理计划和甘特图代码；2.将代码复制到Mermaid等在线渲染工具中可视化查看项目进度安排；3.根据可视化结果优化调整计划，确保任务时间节点和依赖关系合理。该方法能帮助团队在一个月内高效完成女鞋促销页面的开发上线，特别适合电商节日促销等时效性强的项目。

电商促销项目管理 AI工具
荐MiniMax深夜开源首个推理模型M1，这次是真的卷到DeepSeek了。

不知道还有多少人记得，AI行业的六小虎。行业内都在说，他们已经寂静好久了。上一次相关的项目发布，还是前一段时间我写的MiniMax声音模型的更新，Speech-02。而昨晚凌晨将近12点的时候，又是MiniMax，居然在X上，预告了他们一整周的发布计划。

AI行业 MiniMax推理模型声音模型更新
如何用 DeepSeek 生成重点知识梳理

本教程介绍如何使用DeepSeek AI工具快速生成结构化知识梳理。以"光合作用"为例，通过简单指令即可获得包含定义、过程、影响因素、意义及与呼吸作用比较的思维导图。操作流程：1.登录DeepSeek官网；2.输入指定格式的指令；3.选择输出格式；4.提交生成；5.查看并调整结果。该工具适用于学习资料整理、知识框架搭建等场景，能高效呈现复杂知识的逻辑结构，帮助用户快速掌握重点内容。

光合作用 DeepSeek AI
如何用deepseek生成短视频脚本

本文介绍如何利用DeepSeek工具快速生成30秒短视频脚本。该工具可根据用户需求，自动生成包含开场悬念、核心干货、反转情节和结尾互动的优质脚本。操作流程包括：1.登录DeepSeek官网；2.输入具体指令（如"生成洗发水广告脚本，需包含开场悬念+3个核心干货+结尾互动"）；3.检查并优化脚本内容；4.补充画面风格、背景音乐等细节。通过多次指令调整可获得更理想的脚本

短视频创作脚本生成创意工具

热文

3 天
7天

深度求索开源多模态大模型DeepSeek-VL系列

如何用 DeepSeek 生成备课教案

如何用 DeepSeek 生成星球日更内容

如何用 DeepSeek 进行论文降重

如何用 DeepSeek 进行合同审核

利用DeepSeek和豆包生成工作总结

如何用 DeepSeek 生成爆款标题

如何用 DeepSeek 制定项目管理计划

荐MiniMax深夜开源首个推理模型M1，这次是真的卷到DeepSeek了。

如何用 DeepSeek 生成重点知识梳理

如何用deepseek生成短视频脚本

热文

微信公众平台与微信小店深度联动公众号可带货微信小店

张朝阳退回的LABUBU换了一辆车：新去向揭晓

苹果用户再也不敢乱用emoji了客服回应：iOS和安卓有差异性

小米MIX Flip 2开启预约：将于6月底正式发布

REDMI K80至尊版外观公布：金属中框+玻纤背板

微信公众平台与微信小店深度联动公众号可带货微信小店

张朝阳退回的LABUBU换了一辆车：新去向揭晓

从心脏、到血管……3D打印开启“器官替换”时代

苹果用户再也不敢乱用emoji了客服回应：iOS和安卓有差异性

无缝且安全的密钥导入、导出功能将登陆苹果系统

小米MIX Flip 2开启预约：将于6月底正式发布

REDMI K80至尊版外观公布：金属中框+玻纤背板

站长商机