首页 > 原创 > 关键词  > 人工智能最新资讯  > 正文

AI日报:豆包大模型1.6发布;OpenAI推o3-pro模型、o3价格暴降80%;Figma官方MCP重磅上线

2025-06-11 16:08 · 稿源:站长之家

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解:https://top.aibase.com/

1、火山引擎正式发布豆包大模型1.6和豆包·视频生成模型Seedance1.0pro

在FORCE原动力大会上,火山引擎推出了豆包大模型1.6和Seedance1.0pro视频生成模型,标志着AI云原生全栈服务的全面升级。豆包大模型1.6在功能和性能上均有显著提升,价格更具竞争力,而Seedance1.0pro在视频生成领域表现出色。

image.png

image.png

【AiBase提要:】

🔥 豆包大模型1.6采用统一定价模式,大幅降低使用成本。

🎥 Seedance1.0pro视频生成模型在文生视频和图生视频领域处于领先地位。

🌟 提供“边想边搜”和“DeepResearch”功能,大幅提升工作效率。

2、OpenAI 推出 o3-pro AI 模型:更高的可靠性与工具集成,但速度有所牺牲

OpenAI 发布了最新o3-pro AI模型,专注于提高可靠性和工具集成,但响应速度较慢且成本较高。

image.png

【AiBase提要:】

🌟 o3-pro 提供高可靠性与精准度,适合复杂问题处理,但响应速度较慢。

💰 使用成本高昂,可能限制部分开发者的尝试意愿。

💻 支持多种工具功能,如网页搜索、文件分析、视觉输入推理等,但尚不支持图像生成。

3、Figma官方MCP重磅上线!设计到代码一键转换,革新开发工作流

Figma推出了Dev Mode MCP服务器的Beta版,通过标准化协议将设计数据直接传递给AI编码工具,显著提升设计到代码的转换效率与准确性。

【AiBase提要:】

✨Figma Dev Mode MCP Beta版支持设计数据实时传递至AI编码工具,消除手动步骤和误差。

🌐MCP作为‘USB-C接口’,提高代码输出保真度和一致性,促进设计与开发深度融合。

🤝Figma Make与MCP结合,提供从原型设计到生产级代码的完整工作流,挑战行业竞争者。

详情链接:https://www.figma.com/blog/introducing-figmas-dev-mode-mcp-server/

4、AI图像生成新王者!Krea1发布,免费试用解锁无限创意

Krea AI推出了首款图像生成模型Krea1,解决了传统AI图像生成中的纹理、对比度和构图问题,并支持个性化定制,为艺术创作提供了更高的自由度。

【AiBase提要:】

✨ Krea1通过技术创新实现高度逼真的纹理和多样化风格表达,适用于各种创作需求。

🎨 支持风格参考和定制化训练,用户可上传样本或数据集生成符合特定审美的图像。

🌟 提供免费测试版,降低技术门槛,让设计师和普通用户轻松体验AI艺术创作。

5、火山引擎豆包日调用量突破16.4万亿,市占率高达46.4%

在‘火山引擎FORCE原动力大会’上,谭待披露了豆包大模型的显著增长数据,并强调其在多个领域的广泛应用。火山引擎凭借强大的技术实力和市场占有率稳居国内领先地位,未来将继续深化AI技术的应用。

【AiBase提要:】

🔥 截至2025年5月底,豆包大模型的日均tokens调用量达16.4万亿,较初期增长137倍。

📊 火山引擎占据国内46.4%的大模型市场份额,位居榜首。

🚀 未来将加大研发投入,推动AI能力更广泛地融入企业业务。

6、法国 AI 实验室 Mistral 发布全新推理模型 Magistral,Small 版已开放下载

Mistral 推出了其首个推理模型系列 Magistral,包括 Small 和 Medium 两个版本,分别在不同平台上可用。Magistral 在多语言支持和答题速度上具有优势,但其性能在某些基准测试中未超越竞争对手。

image.png

【AiBase提要:】

🚀 Magistral 推出推理模型系列,Small 已开放下载,Medium 处于预览阶段。

🌍 支持多语言,答题速度快,适用于多种企业应用场景。

📊 Magistral 性能在部分基准测试中不及竞争对手,但有独特优势。

详情链接:https://mistral.ai/news/magistral

7、苹果新系统引入ChatGPT,图乐园支持吉卜力风格 AI 生图

苹果在iOS26、iPadOS26和macOS26系统中升级了图乐园功能,整合了ChatGPT的图像生成能力,新增多种艺术风格如吉卜力动漫风格,提供多样化的创作选择。用户可通过文本描述或照片生成图像,但生成速度较慢且有内容限制,免费用户生成次数有限。

【AiBase提要:】

✨新增吉卜力动漫风格等多风格选项,创作选择更多样化。

🎨通过文本或照片生成图像,AI助力艺术创作。

💰免费用户生成次数有限,需升级付费账户获得更多机会。

8、OpenAI放大招!o3价格暴降80% ,o3-pro强势上线

OpenAI大幅下调o3模型价格,并推出高性能的o3-pro模型,显著降低了开发者的使用成本,引发AI市场的激烈竞争。

image.png

【AiBase提要:】

o3模型价格下调80%,现价格与GPT-4o相当甚至更低,大幅降低开发者成本。

新推出的o3-pro模型针对高可靠性需求,定价合理,已在ChatGPT Pro和Team用户中上线。

o3在多个基准测试中表现优异,降价后将推动更多创新应用,而o3-pro为企业用户提供高性能选择。

详情链接:https://platform.openai.com/docs/models/o3

9、Hugging Face发布开放权重模型贡献榜:中国团队Qwen与DeepSeek跻身TOP15

全球知名开源AI平台Hugging Face发布了开放权重模型贡献榜,中国团队Qwen和DeepSeek成功入围前15名,彰显了中国在全球开源AI领域的技术实力与影响力。

image.png

【AiBase提要:】

阿里云支持的Qwen团队凭借Qwen3系列模型在指令跟随和代码生成任务中的卓越表现,位列开源大语言模型前列。

DeepSeek以高性能低成本的R1系列模型闻名,并在特定领域展现竞争优势,其轻量化版本在数学测试中击败Google Gemini2.5Flash。

Qwen计划探索多模态技术,DeepSeek将推出R2模型,持续推动AI创新,获得全球认可。

详情链接:https://huggingface.co/spaces/cfahlgren1/model-release-heatmap

10、阿里开源MaskSearch!AI学会主动搜索+多步推理,复杂问题精准破解

阿里通义实验室开源了全新预训练框架MaskSearch,通过检索增强掩码预测(RAMP)和强化学习技术,显著提升AI在复杂问题解决中的表现。

image.png

【AiBase提要:】

✨ MaskSearch通过RAMP机制让AI主动搜索与多步推理,提升模型在开放域问答和复杂推理任务中的表现。

🌟 DAPO算法结合格式奖励与回答奖励,优化AI生成答案的准确性和逻辑性,使小型模型性能媲美大规模模型。

🌐 MaskSearch完全开源,支持多种模型,推动智能搜索与推理技术在教育、医疗等领域的广泛应用。

详情链接:https://github.com/Alibaba-NLP/MaskSearch

举报

  • 相关推荐
  • AI日报:腾讯混元推3D生成大模型Hunyuan3D-PolyGen;钉钉AI表格重磅来袭;阿里推多模态大语言模型HumanOmniV2

    本文介绍了AI领域多项重要进展:1)腾讯推出首个美术3D生成大模型Hunyuan3D-PolyGen,显著提升建模效率;2)阿里发布多模态大模型HumanOmniV2,准确率达69.33%;3)钉钉AI表格实现1小时处理千项任务;4)百度PaddleOCR3.1版本在多语种识别和文档翻译方面升级;5)微软推出Deep Research智能体,自动化研究流程;6)香港理工与OPPO联合开源视频超清框架DLoRAL;7)谷歌开源MCP工具箱简化AI与数据库集成;8)Win11将推出AI动态壁纸功能。这些创新展示了AI在3D生成、多模态理解、办公效率、视觉处理等领域的突破性进展。

  • AI日报:美图发布影像AI Agent RoboNeo;1.8bit量化Kimi K2模型上线;亚马逊推AI代码编辑器 Kiro

    【AI日报】今日AI领域重要动态:1)美图推出RoboNeo,通过自然语言指令实现图片精修、品牌设计等全能影像处理;2)Unsloth AI将Kimi K2模型量化至1.8bit,体积缩减78%保持性能;3)谷歌Gemini嵌入模型登顶MTEB榜单,超越OpenAI;4)亚马逊发布免费AI代码编辑器Kiro,集成Claude模型;5)Claude新增应用工具目录功能提升工作效率;6)MiniMax完成近3亿美元融资,估值超40亿美元;7)UTCP新协议让AI代理直

  • AI日报:智谱上线PPT生成功能AI Slides;可灵 AI 发布可图2.1模型

    本文介绍了AI日报栏目及近期AI领域多项突破性进展:1)智谱推出免费AI Slides工具,基于GLM模型快速生成高质量PPT;2)可灵AI发布可图2.1模型,支持180多种风格图像生成;3)NVIDIA推出DiffusionRenderer技术,实现视频到可编辑3D场景转换;4)墨刀AI新增30秒生成高保真原型功能;5)Higgsfield推出Soul ID工具,10张照片即可生成虚拟形象;6)谷歌DeepMind开源GenAI Processors工具库;7)谷歌Veo新增图像转视频功能;8)Mistral AI发布专为代码建模的Devstral2507系列模型。这些创新展示了AI在内容生成、3D建模、产品设计等领域的快速发展。

  • AI日报:xAI 震撼发布Grok4;微软开源全新Phi-4-mini版本;上海累计82款大模型通过备案

    AI日报栏目聚焦人工智能领域最新动态:1)xAI发布旗舰模型Grok4,在数学推理和代码生成表现突出,同时推出开发者专用Grok4Code;2)微软开源Phi-4-mini模型,推理效率提升10倍,适合边缘设备;3)上海82款大模型完成备案,垂直领域应用取得突破;4)Hugging Face推出开源桌面机器人Reachy Mini,支持Python编程;5)Perplexity发布AI浏览器Comet挑战Chrome;6)OpenAI将首次发布开放权重模型,打破闭源惯例;7)谷歌医疗AI模型MedGemma系列上新,单个GPU即可运行;8)OpenAI以约65亿美元收购AI硬件公司io Products,正式进军硬件市场。

  • iPhone 17 Pro/Pro Max大曝光:比16 Pro多了一款配色

    随着iPhone 17系列发布时间的临近,有关这款新品的细节陆续被曝光。 最新爆料显示,iPhone 17 Pro、iPhone 17 Pro Max共有5款配色,比iPhone 16 Pro系列多了一款。 具体来说,iPhone 17 Pro系列提供黑色、灰色、银色、深蓝色和橙色五种配色,而iPhone 16 Pro系列提供沙漠色、原色、白色和黑色,从爆料来看,iPhone 17 Pro系列配色中最具辨识度的是深蓝色。

  • AI日报:阿里通义开源音频生成模型ThinkSound;谷歌Veo3支态图片生成视频;昆仑万维发布 Skywork-R1V 3.0

    【AI日报】今日AI领域重要动态:1)阿里开源支持链式推理的音频生成模型ThinkSound,实现高保真空间音频生成;2)谷歌Veo3升级,支持静态图片生成生动视频;3)Hugging Face发布30亿参数小模型SmolLM3,性能优于Llama-3.2-3B;4)阿里开源网络智能体WebSailor,展现强大推理和检索能力;5)Moonvalley发布原生1080P视频生成模型Marey Realism v1.5;6)Vidu Q1支持最多七张参考图像生成一致性视频;7)苹果�

  • AI日报:腾讯元宝升级一句话搜索图片视频;微信支付MCP上线;谷歌在全球推出 Veo 3

    【AI日报】今日AI领域重要动态:1)腾讯元宝升级,支持一句话搜索呈现图文视频;2)微信支付MCP上线,AI与支付结合开启商业新纪元;3)谷歌Veo3视频生成模型向Pro/Ultra会员开放,新增"照片生成视频"功能;4)开源DeepSeek R1增强版推理效率提升200%;5)美图WHEE推出"一句话修图"功能;6)芯片公司Ambiq申请美国IPO,受益生成式AI需求;7)昆仑万维开源奖励模型Skywork-Reward-V2;8)Kyutai发布超低延迟开源语音合成技术;9)Figma拟以200亿美元估值登陆纽交所;10)字节跳动开源Trae-Agent智能开发工具。

  • 自研大模型遥遥无期!苹果Siri考虑用外援:转向OpenAI合作

    据媒体报道,知名爆料人马克古尔曼透露,苹果正重新评估其人工智能发展策略,考虑放弃自研大语言模型(LLM)计划,转而与OpenAI展开合作谈判。 若合作达成,苹果原定于2026年推出的基于自研Apple Foundation Models”的Siri升级计划可能被搁置,这一变动或引发行业广泛关注。 目前,由苹果AI负责人约翰詹南德雷亚(John Giannandrea)主导的LLM Siri”项目仍在进行中,但进展不及预�

  • OpenAI核心模型采用物理隔离:为防窃密 上网需明确许可

    据媒体报道,OpenAI近期全面升级其安全体系,以应对企业间谍活动风险。此次升级的核心举措之一是推出信息隔离”政策,旨在严格限制员工对敏感算法和新产品的访问权限。 例如,在开发o1模型期间,OpenAI规定只有经过严格审查并获得相应权限的团队成员,才可在公共办公区域讨论相关细节。 同时,公司还采取了多项物理与网络安全强化措施:将核心专有技术存储在隔离�

  • 八位堂十二周年献礼!复古旗舰Pro 3蓝牙手柄正式发布

    八位堂(8BitDo)在品牌12周年之际推出全新Pro3蓝牙游戏手柄,首发价299元。作为Pro2的全面升级版,Pro3采用复古设计搭配现代工艺,配备高精度TMR摇杆和独立主控芯片,提升操控精准度。创新双扳机切换功能可适配不同类型游戏需求,ABXY按键采用可拆卸磁吸设计支持自定义布局。兼容Switch/PC/Android等多平台,配备智能充电底座和趣味配件。八位堂凭借对游戏的热爱与极致追求,打造了这款集性能与个性于一体的专业手柄,为玩家带来更精彩的游戏体验。