首页 > 原创 > 关键词  > 人工智能最新资讯  > 正文

AI日报:阿里腾讯全面支持MCP协议;阶跃星辰多模态推理模型Step-R1-V-Mini;美图WHEE图像生成模型Miracle F1

2025-04-09 15:41 · 稿源:站长之家

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解:https://top.aibase.com/

1、阿里巴巴已宣布全面支持MCP协议 腾讯紧随其后

近日,中国人工智能领域迎来技术标准的变革,Model Context Protocol(MCP)成为国内AI生态的事实标准。阿里巴巴和腾讯的支持标志着中国科技巨头在全球AI标准竞争中的新一轮角力。MCP作为开源协议,简化了AI模型与外部工具的交互,提升了互操作性。

image.png

【AiBase提要:】

🚀 MCP协议的快速崛起凸显了中国科技企业对标准化协议的迫切需求。

🤝 阿里巴巴和腾讯的支持将加速MCP在国内的推广,推动AI代理的应用落地。

⚖️ MCP的普及虽面临挑战,但也可能催生新的AI开发生态,影响未来技术竞争。

2、阶跃星辰发布全新多模态推理模型——Step-R1-V-Mini

阶跃星辰科技团队推出的Step-R1-V-Mini是一个创新的多模态推理模型,标志着该领域的新突破。该模型支持图文输入和文字输出,具备优秀的指令遵循能力和通用性。通过采用多模态联合强化学习和verifiable reward机制,Step-R1-V-Mini在视觉推理、数学逻辑等方面表现优异,尤其在MathVision视觉推理榜单中名列前茅。

微信截图_20250409085809.png

【AiBase提要:】

🧠 Step-R1-V-Mini支持图文输入和文字输出,具备良好的指令遵循能力和通用性。

🔍 该模型在视觉推理领域表现优异,特别是在MathVision榜单中位列国内第一

⚙️ 已上线阶跃AI网页端并提供API接口,供开发者和研究人员使用。

详情链接:https://yuewen.cn/chats/new

3、美图WHEE推出图像生成模型 Miracle F1

WHEE平台近日推出的人工智能图像生成模型Miracle F1,以其卓越的图像生成质量和对复杂概念的深刻理解,革新了AI图像创作领域。该模型不仅能生成极具真实感的图像,还在语义理解和风格多样性方面表现出色,满足了不同用户的需求。用户通过WHEE官方网站即可体验这一视觉魔法。

微信截图_20250409103106.png

【AiBase提要:】

✨ Miracle F1能生成极具真实感的图像,模拟真实世界的光影和材质效果。

🧠 该模型精准理解复杂概念,提升创作效率和精准度,仿佛拥有“读心术”。

🌈 Miracle F1具备多元风格,能够满足电商、活动视觉和插画等多样化需求。

4、Deep Research现已搭载Gemini2.5Pro:谷歌最智能AI模型闪耀登场

谷歌宣布其Deep Research功能升级至Gemini2.5Pro实验版,展现出卓越的推理能力和信息整合技术。这一技术突破引发了行业广泛关注,标志着AI研究工具的重要里程碑。Gemini2.5Pro不仅提升了搜索效率,还能进行综合分析,改变了研究方法,推动专业人士适应新技术。未来,谷歌计划扩展Deep Research的适用范围,为学术和商业研究提供更智能的支持。

image.png

【AiBase提要:】

🚀 Gemini2.5Pro的升级显著提升了Deep Research的搜索效率和分析能力,能够处理复杂课题并生成全面报告。

📊 该模型在多个基准测试中表现卓越,尤其在长上下文任务中具备高达100万token的上下文窗口,能够分析海量数据。

🌐 这一技术进步标志着AI研究工具的重要里程碑,预计将对学术和商业研究带来革命性变化。

5、开源新模型 DeepCoder:超高效编程,超越OpenAI o1模型

DeepCoder-14B-Preview模型由Together AI和Agentica联合开源,凭借140亿参数在编程测试中表现出色,得分超越OpenAI的o1模型。该模型的开源内容丰富,包括模型权重、训练数据和训练方法,极大地方便了开发者深入研究。通过分布式强化学习和高质量的数据集,DeepCoder在训练效率和代码质量上均有显著提升,展示了其在AI编程领域的强大潜力。

image.png

【AiBase提要:】

🌟 DeepCoder-14B-Preview模型表现优秀,得分超过OpenAI的o1模型。

📈 开源内容丰富,包括模型权重和训练数据,方便开发者研究。

⚙️ 采用多种技术确保数据质量和训练效率,显著提升了模型性能。

详情链接:https://huggingface.co/agentica-org/DeepCoder-14B-Preview

6、推理性能再飞跃!DeepSeek推创新技术SPCT,让大模型更懂人心

DeepSeek AI推出的自主演原则批判调优技术(SPCT),标志着在大型语言模型领域的一次重大突破。此技术旨在构建更通用和可扩展的AI奖励模型,提升AI在复杂环境中的理解与应对能力。SPCT通过动态生成原则和评论,解决了现有奖励模型面临的输入灵活性、准确性、推理时可扩展性和学习可扩展性等挑战。

image.png

【AiBase提要:】

✨ SPCT技术旨在提升AI奖励模型的通用性与扩展性,克服现有模型的局限性。

💡 通过动态生成原则和评论,SPCT有效提高了AI在复杂任务中的表现和推理能力。

📈 DeepSeek-GRM-27B在多项基准测试中表现优于传统模型,显示出更高的奖励质量和推理时的可扩展性。

详情链接:https://arxiv.org/abs/2504.02495

7、Anthropic官方发布!大学生Claude AI使用报告大公开

这篇文章探讨了人工智能(AI)在大学生学习中的应用,特别是Claude.ai的使用情况。通过分析大量匿名对话数据,研究揭示了不同专业学生对AI的使用偏好,以及AI在学习中的角色。尽管AI为学生提供了便利,但也引发了关于认知能力外包的担忧,强调了教育者在AI时代面临的挑战与机遇。

image.png

【AiBase提要:】

📊 STEM专业学生是AI工具的早期采用者,尤其是计算机科学专业的使用率显著高于其他专业。

🛠️ 学生主要利用AI进行创作和分析,尤其是在教育内容的设计和技术问题的解决上。

🤔 AI的使用引发了关于学生认知能力外包的担忧,教育者需关注如何平衡AI的辅助作用与学生的基础技能发展。

8、亚马逊推新一代AI语音模型Nova Sonic,捕捉语气、语调变化和节奏

亚马逊最新推出的AI语音模型Nova Sonic,旨在提升其语音助手Alexa +的性能。该模型通过本地处理语音,能够生成自然流畅的回复,标志着语音识别技术的重大突破。Nova Sonic不仅具备在复杂环境下的语音识别能力,还能根据用户的语调和风格调整响应,提升用户体验。

image.png

【AiBase提要:】

🌟 Nova Sonic 是亚马逊新推出的 AI 语音模型,旨在提升 Alexa + 的性能。

💰 该模型的成本比 OpenAI 的 GPT-4o 低80%,为开发者提供更多选择。

🔊 Nova Sonic 具备在复杂环境下的语音识别能力,能够快速准确地处理用户请求。

详情链接:https://www.aboutamazon.com/news/innovation-at-amazon/nova-sonic-voice-speech-foundation-model

9、谷歌NotebookLM即将推出移动应用程序版本

谷歌旗下的人工智能研究工具NotebookLM即将推出独立的移动客户端应用程序,标志着其从网页端向移动端的扩展。这一升级将为用户提供更便捷的使用体验,满足对移动应用的需求。NotebookLM自推出以来,凭借其创新功能受到广泛关注,未来的移动应用将进一步整合谷歌的搜索能力,提升信息处理的效率。

【AiBase提要:】

🚀 NotebookLM将推出iOS和Android版本,提升移动端的使用便捷性。

🔍 新增“Discover Sources”功能,允许用户自动搜索并整合网页内容至笔记本。

🎙️ 未来可能深度整合谷歌搜索能力,实现从URL到摘要、思维导图的转化。

10、AI视频生成技术TTT:可直出一分钟完整猫和老鼠动画 无需编辑、拼接

这项研究通过引入测试时训练层,成功生成了一分钟的《猫和老鼠》动画视频,标志着AI视频生成技术的新突破。该技术在画面连贯性和故事完整性上表现出色,且无需后期编辑,展现了AI在创意内容生产中的巨大潜力。尽管存在一些瑕疵,但其应用前景广阔,未来有望改变视频制作模式。

【AiBase提要:】

🚀 通过引入TTT层,模型能够生成完整的一分钟动画,无需后期剪辑。

🎨 生成的视频在时间一致性和故事连贯性上表现优异,接近传统动画质量。

💡 该技术有望降低视频制作成本,加速创意流程,未来可扩展至更复杂的内容。

详情链接:https://test-time-training.github.io/video-dit/

11、网信办:截至2025年3月31日已有346款生成式AI服务完成备案

4月8日,网信上海发布公告,透露截至2025年3月31日的生成式人工智能服务备案情况。根据国家互联网信息办公室的要求,网信部门与相关单位共同推进生成式人工智能服务的备案工作,以促进这一领域的创新和规范应用。

【AiBase提要:】

🌟 截至2025年3月31日,346款生成式人工智能服务已在国家网信办完成备案。

📊159款通过API接口等方式调用的生成式人工智能应用在地方网信办登记。

🔍 所有上线应用需公示所用的已备案服务信息,包括模型名称和备案号。

12.英伟达发布 Llama3.1Nemotron Ultra253B,性能超越 Llama4Behemoth

英伟达推出 Llama3.1Nemotron Ultra253B 模型,性能超越 Llama4系列,并在 Hugging Face 平台开源,具备商业友好特性。

QQ_1744161895807.png

【AiBase 提要:】

🌟 Llama3.1Nemotron Ultra253B 拥有2530亿参数,性能卓越。

🚀 优化架构降低内存占用,适合高效推理。

📈 开源发布,支持商业使用,推动 AI 民主化。

项目入口:https://top.aibase.com/tool/llama-3-1-nemotron-ultra-253b

举报

  • 相关推荐
  • 北京国际人力获评世界品牌莫干山大会“人工智能+”生态创新实践范本

    5月9日,第十个中国品牌日之际,2026世界品牌莫干山大会“搜索·点赞·传播品牌好故事论坛”在浙江德清举办,发布“人工智能+”生态创新实践范本。北京国际人力旗下万维招聘AI智能招聘平台获评“人工智能+”创新产品。论坛聚焦品牌强国建设,北京国际人力以47年行业积淀,推出全流程智能招聘平台,针对传统招聘痛点,运用大模型等技术构建PC端、微信小程序、线下求职一体机三位一体服务矩阵,赋能企业招聘管理与求职者职业成长,彰显国企担当,助力“中国服务”品牌高质量发展。

  • OpenAI成立OpenAI部署公司:帮助企业构建人工智能系统

    OpenAI正式成立OpenAI 部署公司”,在帮助企业构建人工智能系统。 同时,OpenAI已同意收购Tomoro一家专注于将AI转化为运营优势的应用 AI 咨询与工程公司。 新成立的部署公司由OpenAI控股,无论客户是与OpenAI、OpenAI部署公司,还是与两者同时合作,都将获得统一的服务体验。

  • 得一微担任世界人工智能眼镜联盟(WAEA)董事会员,共推AI眼镜存力新前景

    近日,“2026AI眼镜产业生态大会”在深圳举行,汇聚全球顶尖企业与专家,探讨产业创新趋势。得壹微电子(YEESTOR)作为国内领先AI存力芯片设计企业受邀出席,被授予“世界人工智能眼镜联盟(WAEA)董事会成员单位”。大会指出,AI眼镜正从极客玩具迈向大众消费品,预计2026年全球出货量将突破2368万台。得壹微电子深耕存力主控芯片,为AI眼镜提供从端到云的全栈存力支持,推动端侧AI与智能穿戴生态规模化商用。

  • 中国优秀的AI企业有哪些?科技巨头——联想集团用“AI原生”战略给出答案

    联想集团作为中国优秀AI企业的标杆,通过混合式AI战略和ESG双重底色展现多维竞争力。其不仅在CDP气候、水安全及供应商参与度三项评级中获最高“A”级,连续三年蝉联供应商参与度A级,更在AI领域加速布局,提出成为AI原生公司目标,预计营收突破5600亿元。通过构建从终端到云端的全栈AI能力,联想推动AI规模化应用,并深度融合绿色供应链管理,实现技术与社会责任的平衡,成为全球AI竞赛中不可忽视的中国力量。

  • 流量巨头跨界车圈,京东、美团、阿里在下一盘什么棋

    汽车零售赛道正迎来电商巨头的密集布局,京东、美团、天猫等平台近期动作频频,从试驾体验到联名车型,再到生态化服务,试图抢占汽车新零售市场份额。 4月13日,京东上线“Open出发”,聚焦济南地区推出为期一个月的上门深度试驾服务,用户可预约“深蓝L06增程版”的试驾体验。 这一动作并非孤例,此前京东已联合广汽埃安、宁德时代推出“国民好车”埃安UT super,�

  • 领润生态落子 AI 基建?超掘科技重塑地下智能掘进新范式

    地下工程面临三大痛点:地质复杂导致设备停机事故频发、传统施工依赖人工经验且熟练技工加速流失、恶劣环境影响工程稳定性。超掘科技提出"AI装备+群体智能"解决方案,通过地质感知融合、物联网泛在感知、边缘计算协同、大数据集群控制四张王牌,实现毫秒级地质模型更新、多设备自主分工与无人化集群作业。对标马斯克The Boring Company,更聚焦中国硬岩地质,采用"装备销售+管控制授权+数据运营"复合模式,切入千亿美元级市场。

  • 快消巨头狂卷AI营销:效率拉满之后,问题浮出水面

    趋势越来越明显。 百事仅凭5分钟的梅西录像素材,生成400万条覆盖10种语言的个性化视频,每个消费者看到的梅西都在用自己的语言说话。联合利华的营销团队以名为Sketch Pro的内部工具,在两小时内就把一个创意概念转化为可投放市场的素材。还有雀巢用数字孪生技术为旗下多个品牌生成电商视觉,而无需任何实物拍摄…… AI+营销实现降本增效已是种常识。以上案例背后的

  • AI日报:腾讯云QClaw发布文件空间;阿里通义千问接入淘宝;微信推AI支付等功能

    本日AI日报涵盖八大热点:腾讯云QClaw发布“文件空间”打通生态;微信4月大升级引入AI支付;阿里通义千问接入淘宝重塑购物体验;Google升级Gemini API文件搜索;阶跃星辰StepAudio2.5语音模型位列全球前三;贾跃亭重返法拉第未来转型物理AI公司;中国AI大模型周调用量2.11倍反超美国;MiniMax关联公司增资至40亿元。

  • AI眼镜,阿里求稳

    4月15日,千问AI眼镜S1现货开售,近期对硬件颇为执着的阿里,似乎又在AI眼镜赛道拿出了一款力作。 实际上,在很多人眼中,千问AI眼镜S1,有点像是夸克AI眼镜S1的二进宫。 千问S1与夸克S1,在硬件端几乎没有差异,核心零部件也都搭载了高通骁龙AR1+恒玄BES2800双旗舰芯片、双目Micro-LED双光机、索尼IMX681等等。 相比之下,最大的差别其实在于软件层面——夸克S1的默认系统为�

  • 忆联亮相2026移动云大会,以全场景AI存储方案共筑Token智能新生态

    2026移动云大会在苏州举办,聚焦“Agent使用Token、Token驱动算力、算力激发AIDC/网络流量”核心议题,共建Token智能新生态。忆联受邀参展,展示AI时代存储实力,推出Gen5 DSSD UH713a等全场景新品矩阵,精准适配AI训练、推理等多样化需求。忆联还发表主题演讲,指出AI驱动存储需求爆发,SSD正从“容器”向“引擎”演进,并明确从高规格、高可靠、高适配、优TCO四大方向持续发力,深化与中国移动合作,共建国产存储生态。

今日大家都在搜的词: