首页 > 原创 > 关键词  > 人工智能最新资讯  > 正文

AI日报:豆包大模型1.6发布;OpenAI推o3-pro模型、o3价格暴降80%;Figma官方MCP重磅上线

2025-06-11 16:08 · 稿源:站长之家

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解:https://top.aibase.com/

1、火山引擎正式发布豆包大模型1.6和豆包·视频生成模型Seedance1.0pro

在FORCE原动力大会上,火山引擎推出了豆包大模型1.6和Seedance1.0pro视频生成模型,标志着AI云原生全栈服务的全面升级。豆包大模型1.6在功能和性能上均有显著提升,价格更具竞争力,而Seedance1.0pro在视频生成领域表现出色。

image.png

image.png

【AiBase提要:】

🔥 豆包大模型1.6采用统一定价模式,大幅降低使用成本。

🎥 Seedance1.0pro视频生成模型在文生视频和图生视频领域处于领先地位。

🌟 提供“边想边搜”和“DeepResearch”功能,大幅提升工作效率。

2、OpenAI 推出 o3-pro AI 模型:更高的可靠性与工具集成,但速度有所牺牲

OpenAI 发布了最新o3-pro AI模型,专注于提高可靠性和工具集成,但响应速度较慢且成本较高。

image.png

【AiBase提要:】

🌟 o3-pro 提供高可靠性与精准度,适合复杂问题处理,但响应速度较慢。

💰 使用成本高昂,可能限制部分开发者的尝试意愿。

💻 支持多种工具功能,如网页搜索、文件分析、视觉输入推理等,但尚不支持图像生成。

3、Figma官方MCP重磅上线!设计到代码一键转换,革新开发工作流

Figma推出了Dev Mode MCP服务器的Beta版,通过标准化协议将设计数据直接传递给AI编码工具,显著提升设计到代码的转换效率与准确性。

【AiBase提要:】

✨Figma Dev Mode MCP Beta版支持设计数据实时传递至AI编码工具,消除手动步骤和误差。

🌐MCP作为‘USB-C接口’,提高代码输出保真度和一致性,促进设计与开发深度融合。

🤝Figma Make与MCP结合,提供从原型设计到生产级代码的完整工作流,挑战行业竞争者。

详情链接:https://www.figma.com/blog/introducing-figmas-dev-mode-mcp-server/

4、AI图像生成新王者!Krea1发布,免费试用解锁无限创意

Krea AI推出了首款图像生成模型Krea1,解决了传统AI图像生成中的纹理、对比度和构图问题,并支持个性化定制,为艺术创作提供了更高的自由度。

【AiBase提要:】

✨ Krea1通过技术创新实现高度逼真的纹理和多样化风格表达,适用于各种创作需求。

🎨 支持风格参考和定制化训练,用户可上传样本或数据集生成符合特定审美的图像。

🌟 提供免费测试版,降低技术门槛,让设计师和普通用户轻松体验AI艺术创作。

5、火山引擎豆包日调用量突破16.4万亿,市占率高达46.4%

在‘火山引擎FORCE原动力大会’上,谭待披露了豆包大模型的显著增长数据,并强调其在多个领域的广泛应用。火山引擎凭借强大的技术实力和市场占有率稳居国内领先地位,未来将继续深化AI技术的应用。

【AiBase提要:】

🔥 截至2025年5月底,豆包大模型的日均tokens调用量达16.4万亿,较初期增长137倍。

📊 火山引擎占据国内46.4%的大模型市场份额,位居榜首。

🚀 未来将加大研发投入,推动AI能力更广泛地融入企业业务。

6、法国 AI 实验室 Mistral 发布全新推理模型 Magistral,Small 版已开放下载

Mistral 推出了其首个推理模型系列 Magistral,包括 Small 和 Medium 两个版本,分别在不同平台上可用。Magistral 在多语言支持和答题速度上具有优势,但其性能在某些基准测试中未超越竞争对手。

image.png

【AiBase提要:】

🚀 Magistral 推出推理模型系列,Small 已开放下载,Medium 处于预览阶段。

🌍 支持多语言,答题速度快,适用于多种企业应用场景。

📊 Magistral 性能在部分基准测试中不及竞争对手,但有独特优势。

详情链接:https://mistral.ai/news/magistral

7、苹果新系统引入ChatGPT,图乐园支持吉卜力风格 AI 生图

苹果在iOS26、iPadOS26和macOS26系统中升级了图乐园功能,整合了ChatGPT的图像生成能力,新增多种艺术风格如吉卜力动漫风格,提供多样化的创作选择。用户可通过文本描述或照片生成图像,但生成速度较慢且有内容限制,免费用户生成次数有限。

【AiBase提要:】

✨新增吉卜力动漫风格等多风格选项,创作选择更多样化。

🎨通过文本或照片生成图像,AI助力艺术创作。

💰免费用户生成次数有限,需升级付费账户获得更多机会。

8、OpenAI放大招!o3价格暴降80% ,o3-pro强势上线

OpenAI大幅下调o3模型价格,并推出高性能的o3-pro模型,显著降低了开发者的使用成本,引发AI市场的激烈竞争。

image.png

【AiBase提要:】

o3模型价格下调80%,现价格与GPT-4o相当甚至更低,大幅降低开发者成本。

新推出的o3-pro模型针对高可靠性需求,定价合理,已在ChatGPT Pro和Team用户中上线。

o3在多个基准测试中表现优异,降价后将推动更多创新应用,而o3-pro为企业用户提供高性能选择。

详情链接:https://platform.openai.com/docs/models/o3

9、Hugging Face发布开放权重模型贡献榜:中国团队Qwen与DeepSeek跻身TOP15

全球知名开源AI平台Hugging Face发布了开放权重模型贡献榜,中国团队Qwen和DeepSeek成功入围前15名,彰显了中国在全球开源AI领域的技术实力与影响力。

image.png

【AiBase提要:】

阿里云支持的Qwen团队凭借Qwen3系列模型在指令跟随和代码生成任务中的卓越表现,位列开源大语言模型前列。

DeepSeek以高性能低成本的R1系列模型闻名,并在特定领域展现竞争优势,其轻量化版本在数学测试中击败Google Gemini2.5Flash。

Qwen计划探索多模态技术,DeepSeek将推出R2模型,持续推动AI创新,获得全球认可。

详情链接:https://huggingface.co/spaces/cfahlgren1/model-release-heatmap

10、阿里开源MaskSearch!AI学会主动搜索+多步推理,复杂问题精准破解

阿里通义实验室开源了全新预训练框架MaskSearch,通过检索增强掩码预测(RAMP)和强化学习技术,显著提升AI在复杂问题解决中的表现。

image.png

【AiBase提要:】

✨ MaskSearch通过RAMP机制让AI主动搜索与多步推理,提升模型在开放域问答和复杂推理任务中的表现。

🌟 DAPO算法结合格式奖励与回答奖励,优化AI生成答案的准确性和逻辑性,使小型模型性能媲美大规模模型。

🌐 MaskSearch完全开源,支持多种模型,推动智能搜索与推理技术在教育、医疗等领域的广泛应用。

详情链接:https://github.com/Alibaba-NLP/MaskSearch

举报

  • 相关推荐
  • AI日报:接入MJ!夸克发布造点AI;Wan2.5-Preview发布;可灵推最新视频生成模型可灵2.5Turbo

    近日AI领域迎来多项重要更新:阿里夸克发布AI创作平台“造点”,整合通义万相Wan2.5与Midjourney V7,支持音画同步视频生成;Wan2.5-Preview实现多模态输入与电影级视频同步生成,提升视觉创作能力;可灵AI推出视频生成模型2.5Turbo并降价30%,降低使用门槛;阿里通义推出Qwen3-ASR-Toolkit,实现小时级音视频转录;谷歌相册AI编辑功能扩展至安卓用户,支持语音修图;谷歌Mixboard工具助力创意设计,生成情绪板;Qwen发布Qwen3-Max模型,在代码生成与智能体能力表现突出;Figma推出MCP服务器,实现设计到代码的一键转换,提升开发效率。

  • 马斯克:Grok 5模型有望实现通用人工智能的突破

    马斯克旗下xAI公司正研发Grok 5模型,有望实现通用人工智能(AGI)重大突破。该模型采用全新架构设计,预计未来几周启动训练。若成功将代表AI从专用领域向通用认知能力的质的飞跃,被视为人工智能发展的终极目标。科技界密切关注xAI能否在激烈竞争的大模型赛道实现突破。

  • 每日互动参与发起《人工智能安全行业自律倡议》 守护人工智能产业可持续发展

    9月17日,2025年国家网络安全宣传周人工智能安全治理分论坛在昆明召开,会上正式发布《人工智能安全行业自律倡议》。该倡议由中国网络空间安全协会联合多家科研院所、互联网头部企业、网络安全厂商及人工智能企业共同发起,提出筑牢安全根基、强化技管结合、深化协同共治等七方面共识,旨在推动构建可控、可信、可靠的人工智能产业生态,为全球人工智能治理贡献中国智慧。

  • 考拉悠然开源悠然无界大模型BLM-1.0,以空间智能引擎驱动产业变革

    9月28日,在成都举行的“2025天府人工智能产业生态大会”上,考拉悠然宣布其自主研发的“悠然无界大模型BLM-1.0”完成迭代升级并全面开源,同时发布基于该模型的UU Holo Glass O1 AR工业眼镜。此举标志着公司以“技术开源+场景落地”双轮驱动策略,推动空间智能产业生态共建。BLM-1.0突破传统模型局限,具备跨空间、跨任务、跨本体的“三跨”统一能力,在空间理解、推理与执行三大核心能力上刷新行业纪录。配套AR眼镜深度融合空间感知与多模态交互,实现工业运维、安装巡检等场景的全程自动化与智能辅助,显著提升效率并降低成本。

  • 市值一日暴增近3000亿港元,阿里迈向超级人工智能之路

    9月24日,阿里巴巴股价创下四年新高,单日涨超9%,市值达到约3.32万亿港元,一日增加近3000亿港元。 引爆股价的,是阿里集团每年一度的云栖大会。在会上,阿里释放多条重磅消息,尤其是在阿里集团CEO、阿里云智能集团董事长兼CEO吴泳铭的演讲结束后,阿里的股价表现就出现了明显的拉升。

  • 基于通义万相 美图多款APP上线全新动漫特效、AI变身等视频生成功能

    今日,美图公司旗下美图秀秀、RoboNeo、Wink和开拍等多款产品,推出全新动漫特效、AI变身等视频生成功能。 据悉,新功能基于通义万相系列模型进行深度开发与训练,为美图的全球用户提供全新的创作体验。 近年来,美图加速布局生产力场景,不仅推出面向企业的AI算法服务和解决方案,旗下消费级产品也在快速集成大模型。 去年6月,美图就开始和阿里展开大模型合作。

  • 十方融海:以开源生态为基,绘就“人工智能 +”产业融合新蓝图

    国务院印发《关于深入实施“人工智能+”行动的意见》,推动AI技术与产业深度融合。深圳企业十方融海凭借AI大模型研发、产品创新及开源生态构建等领域的卓越实践,成为行业先锋。其开源模型如OpenBuddy、小智AI等突破传统技术局限,实现多模态交互与跨领域知识融合,覆盖教育、办公、养老、文体等多元场景。通过开放共享模式,十方融海有效降低AI应用门槛,激发行业创新活力,助力我国人工智能产业迈向新征程。

  • 小度发布多模态智能摄像机,AI大模型重塑家庭看护体验

    小度科技推出首款多模态智能摄像机C800,搭载800万像素4K超清摄像头,支持AI大模型技术。该产品不仅能实现高清监控,还具备智能行为识别、语音交互等功能,可自定义看护提醒。结合视觉与语音交互,支持复杂语义查询和家庭设备联动,扩展智能家居应用场景。目前产品已全网发售,年底还将推出三摄版本,持续探索AI硬件创新。

  • AI日报:生数科技推出Vidu Q2;火山引擎推出炉米Lumi;通义千问开源300+模型

    本文汇总了近期AI领域多项重要进展:生数科技推出Vidu Q2模型,显著提升视频生成中细微表情的真实感;火山引擎发布炉米Lumi平台,支持视觉模型LoRA微调以定制独特风格;阿里云通义千问开源超300个模型,下载量突破6亿次;百度开源多模态视觉理解模型Qianfan-VL,适配不同场景需求;微软在Copilot中引入Anthropic模型,拓展AI助手功能;OpenAI计划在美国新建五个数据中心以加速Stargate项目;英伟达开源Audio2Face模型,提升实时面部动画生成效果;Meta发布具备沙箱推演能力的32B代码世界模型CWM,优化代码调试效率。这些动态展示了AI技术在视觉、多模态、开源生态及硬件支持等方面的快速迭代与创新突破。

  • AI日报:可灵AI发布数字人新功能;腾讯混元新技术给大模型 “去油”;抖音上线AI求真功能

    AI日报今日聚焦多项技术突破:可灵AI推出图片转视频功能,腾讯混元SRPO技术提升图像真实感,IBM开源文档处理模型Granite-Docling-258M。Meta发布带屏AI眼镜Ray-Ban,DeepSeek论文登《Nature》封面。OpenAI新增GPT-5思考时长调节功能,抖音上线“AI求真”辟谣工具,通用DeepResearch开源模型性能超越国际知名模型。

今日大家都在搜的词: