首页 > 原创 > 关键词  > AI日报最新资讯  > 正文

AI日报:通义千问3大模型全球爆火;即梦图片3.0智能参考全量上线;智谱AI企业级助手Agent CoCo上线

2025-06-09 16:24 · 稿源:站长之家

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用

新鲜AI产品点击了解:https://top.aibase.com/

1、通义千问3大模型全球爆火:下载量超1250万,衍生模型13万+

通义千问3大模型开源后一个月内全球下载量突破1250万次,在多个主流AI开源平台上表现出色,尤其在Hugging Face平台上衍生模型数量超过13万个,跃居全球第一

通义 Qwen (5)

【AiBase提要:】

🚀开源仅一个月,全球累计下载量突破1250万次,展现强劲吸引力。

🌐支持多版本选择,各版本下载量均破百万,覆盖广泛需求。

🌟衍生模型数量超13万,跃居Hugging Face全球第一,体现高度创新活力。

2、即梦图片3.0智能参考全量上线!一键生成影视级海报,AI设计进入“零门槛”时代!

字节跳动旗下AI创作平台即梦AI更新,其智能参考功能上线,大幅降低设计门槛,使普通用户也能轻松创作专业级海报。

image.png

【AiBase提要:】

✨ 强大的中文理解能力,影视级生成效果,颠覆传统设计流程。

🌟 支持一键生成符合特定风格的设计作品,涵盖多种场景应用。

💯 细节保留精准,成本低,效率高,适合各层次用户快速实现创意。

3、智谱AI全新企业级超级助手Agent CoCo正式上线

今日,智谱AI发布企业级超级助手Agent CoCo,以‘懂你懂企业,能干能交付’为核心理念,提升企业工作效率。

image.png

【AiBase提要:】

🌟 CoCo以交付为导向,全流程辅助工作,确保任务成果最大化。

💼 引入独特记忆机制,提供个性化服务,主动跟踪行业动态。

🔗 可无缝嵌入企业系统,融合已有资源,打造专属智能助手。

详情链接:https://aiworker.aminer.cn/ai_worker/verification?utm_source=zhipuai_social&utm_medium=wechat&utm_campaign=p250609

4、百度推出金融行业大模型,智能体成为AI竞争新焦点

在2025智能经济论坛上,百度智能云发布了千帆慧金大模型,专为金融行业设计,旨在提供更精准高效的AI解决方案。沈抖强调了行业大模型建设的重要性,并展示了百度在智能体方面的创新成果。

image.png

【AiBase提要:】

📊 百度智能云推出千帆慧金大模型,专注金融领域,满足行业对准确性与实时性的高要求。

💼 百度已与65%的央企合作,证明智能云技术受到市场的广泛认可。

🤖 智能体成为AI竞争新焦点,百度通过轻量化定制助力企业数字化转型。

5、小红书发布首个开源大模型dots.llm1:11.2万亿非合成数据助力中文性能提升

小红书开源首个大规模模型dots.llm1,具有1420亿参数的专家混合模型,使用11.2万亿非合成高质量数据,在中文测试中表现优异。

【AiBase提要:】

🌟 dots.llm1采用1420亿参数的专家混合结构,大幅降低训练和推理成本。

📊 使用11.2万亿非合成数据,中文测试平均得分91.3,超越多款竞品。

🔍 引入严格的数据处理流水线,确保高质量训练数据的有效性与可靠性。

详情链接:https://huggingface.co/rednote-hilab/dots.llm1.base/tree/main

6、机械臂也能“接大模型”!Hugging Face LeRobot重磅开源,AI机器人研发门槛大降!

Hugging Face推出的LeRobot项目通过整合先进算法和开发工具链,提供了一个高效、易用的机器人AI开发平台,显著降低了硬件适配成本和技术门槛。

image.png

【AiBase提要:】

统一接口适配多款硬件,降低开发者硬件适配成本。

内置海量预训练模型,支持快速加载SOTA机器人控制模型。

智能评估与高效训练功能,加速开发进程并提升模型复用效率。

详情链接:https://github.com/huggingface/lerobot

7、ChatGPT 语音功能升级,实时翻译对话更自然流畅

OpenAI对ChatGPT的语音功能进行了全面升级,包括自然流畅的语音表达和新增的实时翻译功能,但仍有音频质量和“幻觉”现象的问题。

【AiBase提要:】

🌟语音更自然流畅,情感表达更丰富。

🌍新增实时翻译功能,支持多语言对话。

⚠️存在音频质量波动和无故生成奇怪声音的问题。

8、谷歌 Gemini 应用月下载量超越 ChatGPT,用户活跃度仍显不足

自2025年4月底以来,谷歌的 Gemini 应用在全球 Android 下载量上超过了 ChatGPT,每周安装量达到600万以上,但用户活跃度仅为4.9%,远低于 ChatGPT 的42.52%。尽管下载量增长显著,Gemini 面临着提升用户日常使用率的挑战。

【AiBase提要:】

🌟 Gemini 应用下载量已达每周600万,超越 ChatGPT。

📉 ChatGPT 的下载量降至每周300万,但用户活跃度仍高达42.52%。

🔄 Gemini 需提升用户日常活跃度,以确保在市场中的长期竞争力。

9、文档解析LLM MonkeyOCR震撼登场:3B小模型完胜Gemini

作为一款轻量级文档解析模型,MonkeyOCR以3B参数量在英文文档解析任务中表现出色,尤其在公式和表格解析上有显著提升。它不仅速度快,还采用了创新的‘结构-识别-关系’三元组范式,为行业带来新的技术方向。

image.png

【AiBase提要:】

猴子 🐒 MonkeyOCR以3B参数量在多种文档解析任务中超越Gemini2.5Pro和Qwen2.5-VL-72B,尤其在公式解析上提升15.0%。

闪电 ⚡ MonkeyOCR解析速度达0.84页/秒,远超MinerU和Qwen2.5-VL-7B,适合企业级快速响应需求。

齿轮 🔧 其‘结构-识别-关系’三元组范式提升了解析准确率,同时降低资源需求,为企业提供灵活的AI解析方案。

详情链接:https://arxiv.org/abs/2506.05218

10、Google Veo3FAST/TURBO模式上线!五倍性价比,AI视频生成进入“超速”时代!

Google推出了Veo3的全新FAST/TURBO模式,大幅降低视频生成成本并提高效率,同时支持带声音的视频输出,为内容创作者提供更多可能性。

image.png

【AiBase提要:】

FAST/TURBO模式以五倍性价比优势,大幅降低生成成本,适合高频次视频制作需求。

支持原生音频生成,实现音画同步,大幅提升沉浸式体验。

兼具快速生成与高质量细节表现,满足从社交媒体到专业领域的多样化需求。

11、Google AI Studio 政策变动:Gemini2.5Pro 模型免费访问遭“限流”

Google 将调整其 AI 模型使用政策,停止向免费用户提供 Gemini2.5Pro 系列模型的调用权限,转向基于 API 密钥的使用系统。尽管如此,免费用户仍可使用 Gemini2.0系列模型,但能力有限。

【AiBase提要:】

💎 Google 官方宣布停止免费调用 Gemini2.5Pro 系列模型,转向 API 密钥认证。

🚀 当前免费用户仍能使用 Gemini2.0系列模型,但性能不及 Gemini2.5Pro。

🌟 开发者需权衡性能与成本,未来高性能模型或将全面商业化。

举报

  • 相关推荐
  • AI日报通义千问开源Qwen3向量模型;字节跳动像编辑模型SeedEdit 3.0;ElevenLabs推v3语音模型

    本文汇总了近期AI领域的重要动态:1)通义千问发布Qwen3-Embedding系列模型,在多语言文本处理表现优异;2)字节跳动推出图像编辑模型SeedEdit3.0,提升细节保持能力;3)ElevenLabs发布情感语音合成系统Eleven v3 Alpha;4)Anthropic推出面向国家安全的Claude Gov模型;5)可灵AI月收入连续两月超1亿元;6)Meta公布智能眼镜Aria Gen2技术细节;7)爱诗科技上线AI视频工具"拍我AI";8)富国银行预测2030年ChatGPT广告收入将达千亿美元。

  • AI日报:Anthropic推最强编码AI模型Claude4;苹果计划推AI智能眼镜;QQ浏览器上线首个高考Agent

    【AI日报】今日AI领域重要动态:1)Anthropic发布Claude4系列AI模型,编程能力超越竞争对手;2)苹果计划2026年推出集成AI技术的智能眼镜;3)字节跳动与清华合作推出时序多模态大模型ChatTS;4)3DTown框架实现单张照片生成逼真3D场景;5)OpenAI秘密开发无屏幕AI设备;6)商汤科技推出儿童AI下棋机器人;7)微软记事本新增AI写作功能;8)深圳设立70亿元基金支持AI硬件初创企业;9)谷歌发布3D视频通信平台Beam;10)阿联酋推出"星际之门"计划,免费提供ChatGPT服务;11)法国Mistral推出开源模型Devstral;12)Anthropic API新增四大功能;13)美国众议院通过法案限制各州监管AI;14)QQ浏览器推出高考AI助手。

  • 阿里云首款AI原生开发环境工具AI IDE上线:适配千问3 可调用3000多款工具

    AI IDE还全面支持长期记忆、行间建议预测(NES-Next Edit Suggestion)、行间会话(Inline Chat)等能力,为开发者带来更丝滑、更智能的编程体验。 据悉,在通义灵码AI IDE上线后,通义灵码拥有插件和IDE两种产品形态。 深度融入开发者工作流,实现从辅助编码到沉浸式智能开发的跨越,全面覆盖开发者的工作场景。

  • AI日报:Manus面向所有人开放注册;全球首款设计Agent Lovart内测;教育部划清AI使用边界

    【AI日报】今日AI领域重要动态:1)国产AI平台Manus开放注册,无需邀请码即可使用;2)Lovart推出全球首款设计Agent,支持全链路自动化设计;3)教育部发布AI教育指南,禁止学生直接复制AI生成内容;4)昆仑万维开源Matrix-Game大模型,专注交互式世界生成;5)Google Gemma模型下载量突破1.5亿次;6)OpenAI新增一键导出PDF功能;7)字节跳动推出图像编辑框架DreamO;8)Kimi智能助手界面升级;9)阿里MNN更新支持通义千问2.5;10)ChatGPT新增SharePoint连接器;11)OpenVision视觉编码器发布;12)福布斯中国AI企业TOP50榜单发布;13)腾讯"元宝"工具上线,基于混元T1-Vision模型实现图片深度理解。

  • 如何用AI Agent企业效率翻倍?

    2025年5月,红杉资本AI峰会在旧金山落下帷幕。这场汇聚150位全球顶尖AI公司创始人的大会达成重要共识:下一轮AI竞争的核心不再是工具本身,而是为用户创造的实际收益。在此背景下,Agent的重要性被前所未有的推至所有人的视野前沿。 硅谷大厂开启了第一波加速,微软CEO纳德拉在主题演讲中宣布:“我们已经进入了AI Agent时代,正在见证AI系统如何以全新方式帮助我们解决问�

  • 火山引擎Data Agent体验中心正式上线企业级AI数据专家触手可及

    火山引擎数智平台开放企业级数据智能体Data Agent体验中心,用户可零门槛体验"企业数字专家"在数据垂直领域的深度能力。该产品定位为"企业第一位AI数据专家",已上线股票分析、经营复盘、营销策略等6大场景应用。通过"数据+知识"融合、人机协同等核心价值,突破传统分析工具边界,实现从描述性分析到行动建议的跨越。作为L3级智能体,它能将企业内外部信息转化为可量化数字资产,显著降低数据使用门槛,提升决策效率。Gartner预测到2028年至少15%的日常决策将由AI自主完成。火山引擎此举标志着企业数据应用正式进入"动态智能体"时代。

  • AI日报:GPT-4.1正式上线ChatGPT;阿里通义万相Wan2.1-VACE开源;可灵大模型视频生成约占30%份额

    本文报道了AI领域最新动态:1)阿里通义万相开源视频编辑统一模型VACE;2)OpenAI发布GPT-4.1增强编码能力;3)Stability AI推出超轻量341M文字转语音模型;4)快手可灵视频生成模型占据30%市场份额;5)微软WizardLM团队整体加入腾讯混元大模型研发体系;6)腾讯宣布混元图像2.0将于5月16日发布;7)上海成立人工智能标识生态联盟;8)Lightricks发布13B参数视频生成模型LTX-Video;9)谷歌DeepMind推出AlphaEvolve优化AI训练速度;10)腾讯元宝浏览器插件上线Chrome平台。这些进展展示了AI技术在视频处理、大模型、语音合成等领域的快速发展。

  • AI日报:DeepSeek开源新版R1-0528;字节发布Agent小云雀AI;可灵2.1重磅上线

    本期AI日报聚焦多项AI领域突破:1)DeepSeek发布R1-0528模型,支持128K上下文且性能媲美GPT-4;2)字节推出"小云雀AI"图像创作工具;3)可画2.1版本价格降65%性能提升;4)Opera发布全球首款AI浏览器Neon;5)Meta推出多模态空间理解模型;6)北大团队研发ZeroSearch框架降低大模型训练成本88%;7)字节推出AI视频剪辑应用"剪小映";8)MotionPro实现40ms/帧精准视频控制;9)xAI与Telegram达成3亿美元合作部署Grok聊天机器人;10)OpenAI重组架构为IPO铺路;11)像素蛋糕"方糖大模型"获国内首个影像行业备案;12)Paper2Poster实现论文自动转海报;13)Resemble AI开源TTS模型性能比肩ElevenLabs;14)蚂蚁集团开源对标GPT-4o的多模态模型Ming-lite-omni。

  • Agent真的卷疯了,AI办公Agent也来了。

    ​我一直说,每个行业,都一定会有专门优化的垂直领域的Agent。 你看,通用Agent的王座上有Manus,研究类的有DeepResearch,旅游有飞猪问一问,设计类有Lovart。 那现在,办公领域的Agent也来了。 专为办公打造。 这玩意就是昆仑万维的Skywork Super Agents。

  • AI日报:美团AI编程工具NoCode将上线;火山引擎发布MCP Servers;腾讯混元上线游戏视觉生成平台

    本文汇总了近期AI领域的重要动态:1)美团将推出对话式编程工具"NoCode";2)火山引擎发布大模型生态平台MCP Servers;3)B站开源动画视频生成模型Index-AniSora;4)字节跳动升级AI耳机Ola Friend的英语学习功能;5)GitHub推出AI编程助手自动修复代码漏洞;6)腾讯混元上线游戏视觉生成平台;7)微软将VS Code转型为开源AI编辑器;8)Windows 11原生支持MCP协议;9)Anthropic发布AI代理开发指南;10)谷歌推出编程AI代理Jules;11)NotebookLM推出iOS版;12)Genspark创3600万美元ARR纪录;13)Bright Data发布开源MCP服务器;14)马斯克宣布Grok模型将登陆Azure平台。这些进展展示了AI技术在编程、内容生成、操作系统等领域的快速发展和应用创新。