首页 > 原创 > 关键词  > AI日报最新资讯  > 正文

AI日报:昆仑万维开源R1V多模态推理模型;豆包AI编程能力上线三大功能;英伟达推DGX个人AI计算机

2025-03-19 15:35 · 稿源:站长之家

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解:https://top.aibase.com/

1、昆仑万维开源Skywork R1V视觉思维链推理模型

昆仑万维推出全球首个开源多模态推理模型Skywork R1V,具有38亿参数,性能接近知名闭源模型DeepSeek-R1。R1V在视觉问答和复杂推理任务中表现优异,特别是在MMMU和MathVista基准测试中分别取得69分和67.5分的高分。

image.png

【AiBase提要:】

🌟 全球首个工业界开源多模态推理模型Skywork R1V正式发布,参数高达38亿。

🚀 R1V在多个基准测试中表现卓越,尤其在MMMU和MathVista中分别取得69分和67.5分的高分。

📚 昆仑万维的开源举措旨在推动技术共享,为全球AI开源社区注入活力,助力AGI的梦想实现。

详情链接:https://huggingface.co/Skywork/Skywork-R1V-38B

2、豆包AI编程能力再升级 上线HTML预览等三大功能

豆包最近对其网页版和电脑版的AI编程功能进行了重要升级,旨在提升用户的编程效率和体验。这次升级包括HTML实时预览、Python代码直接运行以及生成完整项目代码的功能。用户可以更直观地开发网页和小游戏,快速修复Python代码错误,并轻松生成完整项目代码,简化了开发流程。这些新功能将大大提高用户在编程过程中的便利性和效率。

image.png

【AiBase提要:】

🌐 新增HTML实时预览功能,用户可以直观制作小游戏和网页,提升开发体验。

🐍 支持Python代码直接运行,AI一键修复错误,减少调试时间。

📦 新增生成完整项目代码功能,简化前后端逻辑生成,提高开发便捷性。

3、Google Gemini 推出 “画布” 与音频概览功能,提升用户协作体验

Google 最近推出了 Gemini 的新功能“Canvas”,旨在提升用户的创作和协作体验。此功能允许用户轻松编辑和分享写作与编程项目,提供了更高效的协作方式。通过 Canvas,用户可以实时更新草稿,并生成代码预览。此外,音频概览功能也被引入,方便用户生成文档的音频摘要。这些新工具使 Gemini 成为一个更强大的创作伙伴,极大地便利了用户的工作流程。

image.png

【AiBase提要:】

📝 Canvas 功能允许用户在 Gemini 中轻松起草和编辑长篇信息,支持实时更新和协作。

💻 提供编程工具,用户可以生成和预览 HTML、React 代码,实时查看效果。

🎧 新增音频概览功能,用户可快速生成文档的音频摘要,便于分享和下载。

4、Cursor 推出 Claude Max,改写 AI 编程格局

Cursor 最新推出的 Claude Max 模型以其卓越的性能和创新能力,重新定义了 AI 辅助编程的标准。该模型的上下文处理能力极为出色,能够一次性处理高达20万字的内容,使得开发者可以更高效地管理整个项目代码库。同时,Claude Max 还具备强大的工具调用能力和代码理解能力,显著提升了编程效率。

image.png

【AiBase提要:】

🚀 Claude Max 具备高达20万字的上下文处理能力,允许开发者一次性输入整个项目代码库。

⚙️ 支持多达200次工具调用,显著提升了编辑和优化代码的效率。

💰 按使用量计费,适合需要处理复杂项目的高级用户,而非日常编码任务。

5、Adobe放大招!一口气推出10个AI智能体,可为客户创建个人网站

Adobe再次在生成式AI领域引领潮流,推出10个全新的AI智能体,旨在提升客户体验。这些智能体涵盖了客户互动、内容生产、数据管理等多个方面,协同作战,帮助企业更有效地管理客户关系和优化网站。与此同时,Adobe还推出了名为Brand Concierge的新功能,提供个性化的网站访问体验,进一步增强客户的参与度和忠诚度。

image.png

【AiBase提要:】

🤖 Adobe推出10个AI智能体,旨在提升客户互动和内容生产效率。

🌐 新功能Brand Concierge提供个性化网站体验,增强客户参与度。

📈 生成式AI流量在零售和旅游网站上显著增长,显示消费者对AI体验的接受度提高。

6、字节跳动豆包大模型团队召开全员会,探索 AI 新高度

在人工智能迅速发展的背景下,字节跳动的豆包大模型团队召开全员会议,明确未来发展方向。会议由朱文佳与吴永辉共同主持,强调探索智能上限的重要性,鼓励团队成员参与具有挑战性的研究。吴永辉还提出将增加对Seed Edge项目的资源投入,以吸引和培养顶尖人才。

【AiBase提要:】

🚀 Seed团队的首要目标是探索智能的边界,围绕AGI研究计划进行深入研究。

💡 朱文佳鼓励团队参与具有不确定性的AI技术研究,强调挑战性课题的重要性。

🌍 团队计划开源中小尺寸的Dense模型,以促进技术应用和外部合作。

7、Stability AI 发布新模型Stable Virtual Camera,2D 照片轻松转3D 视频

Stability AI推出的Stable Virtual Camera是一款创新的人工智能模型,能够将2D图像转换为沉浸式视频,提供真实的深度和视角。该模型允许用户从一张或多张图像中生成新视角,并指定相机角度,支持多种动态效果。然而,当前版本仍为研究预览版,存在在特定场景下质量下降的风险。

【AiBase提要:】

🌟 Stable Virtual Camera可将2D图像转换为沉浸式视频,提供多种相机路径选择。

📉 当前模型为研究预览版,处理某些场景可能会出现质量下降的问题。

💼 Stability AI在经历管理危机后,正在积极重组并推出新产品,以改善公司前景。

详情链接:https://top.aibase.com/tool/stable-virtual-camera

8、每秒1000万亿次计算!Nvidia发布两款个人AI超级计算机DGX Spark 与 DGX Station

在2025年全球技术大会上,Nvidia的创始人兼CEO黄仁勋发布了两款颠覆性的个人AI超级计算机DGX Spark和DGX Station。这两款设备不仅具备超强的计算能力,分别实现每秒高达1000万亿次的AI计算,还为边缘计算领域的创新提供了新的可能性。

image.png

【AiBase提要:】

⚡ DGX Spark具备每秒1000万亿次的AI计算能力,采用GB10Grace Blackwell超级芯片,适合复杂AI模型处理。

🖥️ DGX Station搭载GB300Grace Blackwell Ultra Desktop超级芯片,配备784GB内存,提供卓越的桌面计算体验。

🌐 Nvidia的两款超级计算机旨在支持边缘计算,助力企业快速实现AI模型的原型设计与调优。

9、Nvidia推新Dynamo软件,计划将DeepSeek的AI速度提升30倍

在3月18日的GTC大会上,Nvidia首席执行官黄仁勋宣布推出Dynamo软件,旨在将DeepSeek的AI处理速度提升30倍。此举回应了DeepSeek公司R1人工智能程序引发的市场动荡。Dynamo软件能够将AI推理任务分配到多达1000个GPU上并行处理,显著提升查询吞吐量,服务提供商能够更高效地处理客户查询,从而提高收入。

image.png

【AiBase提要:】

🌟 Nvidia推出Dynamo软件,显著提升DeepSeek AI的处理速度。

💰 服务提供商通过Dynamo能够更高效地处理客户查询,提高整体收入。

🖥️ 新版Blackwell芯片“Ultra”和DGX Spark计算机在大会上正式发布。

10、Grok上线DeeperSearch功能,提升实时AI资讯检索能力

近日,xAI推出的人工智能助手Grok新增DeeperSearch功能,显著提升了其在Twitter上实时检索AI资讯的能力。该功能能够快速分析过去48小时内的热点话题,用户反馈积极,显示出Grok在信息处理方面的强大实力。

image.png

【AiBase提要:】

📰 DeeperSearch功能能够深入分析Twitter上过去48小时的AI热点资讯,提供及时信息。

🚀 Grok的升级提升了其实时数据处理能力,尤其在信息流速极高的社交媒体上表现突出。

🏆 此次功能的推出为Grok在与ChatGPT等竞品的竞争中提供了差异化优势,展现出独特的潜力。

举报

  • 相关推荐
  • 格创东智亮相深圳国际人工智能展览会:“章鱼智脑”+智能体集群,解锁工业智造新路径

    5月14日,2026全球人工智能终端展暨第七届深圳国际人工智能展以“端启未来·万物新生”为主题开幕,汇聚TCL、荣耀等超400家展商。TCL展示AI创新产品矩阵,格创东智则凭“章鱼大脑”智能决策中枢及智能体集群成为焦点,其以“打造AI自主决策的超级工厂”为核心,通过章鱼大脑、品质管理等四大板块,呈现工业智能决策实践路径。章鱼大脑采用“决策+执行Agent”架构,实现数据闭环,已落地多家半导体工厂,达成分钟级异常处置、良率实时监控等成效。未来,格创东智将持续迭代,推动从AI辅助向自主决策转型,助力中国智造高质量发展。

  • 卓世科技荣膺「2026 福布斯中国人工智能科技企业 TOP50」

    近日,《福布斯》发布“2026福布斯中国人工智能科技企业TOP50”榜单,卓世科技凭借其行业大模型创新、自主可控的“璀璨玉衡”大模型体系、Tri-Core三核协同具身智能通用大脑,以及在工业制造、企业服务、健康养老、教育等多领域的深度商业化落地能力成功入选。同时,其创始人屠静女士也入选“人工智能影响力人物”。这标志着卓世科技已跻身中国人工智能产业核心阵营,其技术实力与产业价值获得高度认可。

  • 得一微担任世界人工智能眼镜联盟(WAEA)董事会员,共推AI眼镜存力新前景

    近日,“2026AI眼镜产业生态大会”在深圳举行,汇聚全球顶尖企业与专家,探讨产业创新趋势。得壹微电子(YEESTOR)作为国内领先AI存力芯片设计企业受邀出席,被授予“世界人工智能眼镜联盟(WAEA)董事会成员单位”。大会指出,AI眼镜正从极客玩具迈向大众消费品,预计2026年全球出货量将突破2368万台。得壹微电子深耕存力主控芯片,为AI眼镜提供从端到云的全栈存力支持,推动端侧AI与智能穿戴生态规模化商用。

  • 多模态训练提速45% 百度智能云推出开源全模态训练框架

    多模态大模型时代,训练基础设施正面临结构性错位。传统框架基于“数据同质、结构单一、平台固定”设计,难以应对多模态异构数据、模型组件协同及跨平台算力需求。百度百舸开源的全模态训练框架LoongForge,以Megatron为核心引擎,通过统一模型抽象、系统层优化和硬件插件化设计,实现“一套代码多平台运行”。其CCT通算传并行、ChunkPipe流水线并行、自适应FP8等技术,在主流模型上实现15%-45%端到端训练加速,在DeepSeek等前沿架构上实现倍级性能提升,并在5000+卡昆仑P800集群上达到90%+线性扩展效率。

  • OpenAI成立OpenAI部署公司:帮助企业构建人工智能系统

    OpenAI正式成立OpenAI 部署公司”,在帮助企业构建人工智能系统。 同时,OpenAI已同意收购Tomoro一家专注于将AI转化为运营优势的应用 AI 咨询与工程公司。 新成立的部署公司由OpenAI控股,无论客户是与OpenAI、OpenAI部署公司,还是与两者同时合作,都将获得统一的服务体验。

  • 北京国际人力获评世界品牌莫干山大会“人工智能+”生态创新实践范本

    5月9日,第十个中国品牌日之际,2026世界品牌莫干山大会“搜索·点赞·传播品牌好故事论坛”在浙江德清举办,发布“人工智能+”生态创新实践范本。北京国际人力旗下万维招聘AI智能招聘平台获评“人工智能+”创新产品。论坛聚焦品牌强国建设,北京国际人力以47年行业积淀,推出全流程智能招聘平台,针对传统招聘痛点,运用大模型等技术构建PC端、微信小程序、线下求职一体机三位一体服务矩阵,赋能企业招聘管理与求职者职业成长,彰显国企担当,助力“中国服务”品牌高质量发展。

  • 算力生态金融齐发力 仙工智能夯实具身智能发展根基

    近日,仙工智能在具身智能领域达成三项重磅合作:与芯擎科技签署战略协议,共建“车规级芯片算力+工业机器人算法”一体化平台;向张江租赁交付首单设备,实现“设备租赁+智能制造”闭环模式;参与香港中文大学“香港具身智能实验室”建设,推动产学研成果转化。这些合作覆盖底层算力、产业生态和金融赋能,完善了其“算力+生态+金融”三维布局,加速具身智能机器人规模化商业应用。

  • AI日报:腾讯发布设计智能体Ardot;千问5月20日将发布重大模型;OpenAI推出ChatGPT个人理财工具

    本期AI日报聚焦八大热点:腾讯发布AI设计平台Ardot,一句话生成可编辑设计稿并一键转代码;通义千问“重量级”大模型将于5月20日阿里云峰会亮相,实现全面升级;AI大模型在基层警务中落地,豆包助力破获柴油盗窃案;Google I/O大会将推出Gemini 4.0等创新产品;索尼澄清Xperia 1XIII的AI相机助手仅提供拍摄建议;OpenAI推出ChatGPT个人理财工具,结合GPT-5.5支持连接银行账户;中国大模型周调用量连续三周超越美国,腾讯Hy3 preview以2.66万亿Token领先;红果短剧回应取消AI仿真人剧本保底传闻,称部分剧本仍保留保底政策。

  • AI日报:谷歌发布最強模型Gemini 3.5 Flash;阿里云“千问云”上线;苹果AI辅助功能升级

    本期AI日报聚焦六大热点:谷歌发布性能与效率显著提升的Gemini 3.5 Flash模型并免费开放;阿里云推出面向Agent时代的“千问云”平台,重构大模型服务链路;谷歌与三星联合推出两款集成Gemini的智能眼镜;苹果推出Apple Intelligence驱动的AI辅助功能及Vision Pro眼控轮椅;谷歌发布多模态交互模型Gemini Omni;通义实验室发布Qwen3.7-Max模型,采用正交解耦技术,多项评测国内第一。

  • AI日报:千问PC端上线AI语音输入;字节发布全模态大模型Doubao-Seed-2.0-lite;谷歌更新AI搜索功能

    本期AI日报涵盖多项重要进展:千问PC端上线AI语音输入,提升办公效率;字节跳动发布全模态大模型Doubao-Seed-2.0-lite,实现视频、图像、音频与文本统一理解;腾讯联合多所高校推出开源多模态深度搜索智能体方案OpenSearch-VL;月之暗面申请“KimiClaw”商标,或涉硬件领域;Mininglamp开源Cider和Mano-P,打造本地AI工作站;OpenAI携手硬件巨头发布MRC协议,解决GPU闲置浪费;谷歌升级AI搜索功能,整合Reddit等社交观点;xAI推出Grok Imagine API质量模式,提升图像生成写实度。

今日大家都在搜的词: