首页 > 业界 > 关键词  > 人工智能最新资讯  > 正文

AI日报:昆仑万维天工智能体APP上线;谷歌重磅发布三大Gemma模型变体;字节推出开源多模态模型BAGE

2025-05-26 16:13 · 稿源:站长之家

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解:https://top.aibase.com/

1、全球首款Office智能体APP!昆仑万维天工超级智能体APP上线

昆仑万维集团推出全球首款基于AI Agent架构的Office智能体手机应用,天工超级智能体APP通过四大智能体协同工作,重新定义移动办公效率,支持跨端协同和私人知识库搭建,未来还将扩展至更多领域。

6388384555375819598691648.png

【AiBase提要:】

✨ 天工超级智能体APP是全球首款基于AI Agent架构的Office智能体手机应用,重新定义移动办公效率。

💻 支持跨端协同和私人知识库搭建,实现文档、PPT、表格和通用智能体的高效协作。

🌍 计划扩展至教育、医疗、法律等垂直领域,并优化多语言支持,覆盖更多市场。

2、最新研究:ChatGPT 助力中小学生学习成效提升近87%

研究表明,利用 ChatGPT 等大型语言模型可显著提升 K12阶段学生的学习成绩,整体提升达86.7%,并能增强高阶思维能力。

image.png

【AiBase提要:】

✨ 使用 ChatGPT 学生学习成绩平均提升0.867个标准差,涵盖多学科。

🧠 学生高阶思维能力提升0.457个标准差,推理与创新能力得到增强。

📚 能减轻学生精神负担,提升学习积极性,尤其在技能课程中表现突出。

3、谷歌通过 Gemini 应用扩展了其热门新视频机型 Veo3的访问权限

谷歌的AI视频生成工具Veo3在发布后迅速扩展到全球更多地区,但未涵盖欧盟。Gemini Pro和Ultra用户享有不同配额,Veo3虽受关注但也引发对虚假信息传播的担忧。

【AiBase提要:】

🌟 Veo3现支持71国用户,但欧盟暂未开放。

🎥 Gemini Ultra用户每月享125次生成机会,Pro用户仅10次。

⚠️ 能生成逼真虚假内容,可能威胁信息真实性。

4、谷歌重磅发布三大Gemma模型变体,AI医疗、手语翻译与海豚语言解锁新可能!

谷歌推出了MedGemma、SignGemma和DolphinGemma三款基于Gemma架构的人工智能模型,分别针对医疗、手语翻译和海豚语言研究领域,展示了AI技术在跨领域应用的巨大潜力。

6388384771738084508743444.png

【AiBase提要:】

🌟 MedGemma革新医疗AI,助力精准诊疗,提供多模态和文字推理两种模型。

🗣️ SignGemma专注手语翻译,支持ASL到英语,促进无障碍沟通。

🐬 DolphinGemma解析海豚语言,探索跨物种交流,为科学研究提供新工具。

5、AI教育革命!VideoTutor一句话即可生成K12定制教学视频

作为一款创新的AI教育工具,VideoTutor凭借其强大的一键生成功能和多语言支持,为K12教育和SAT备考带来了全新的学习体验。

image.png

【AiBase提要:】

🌟 一键生成个性化教学视频,输入问题或上传截图即可获得直观易懂的讲解。

🌍 支持多语言生成,灵活适配不同年级和语言需求,打破语言障碍。

📚 教学内容逻辑清晰,视觉效果直观,有效提升学习效率,减轻教师备课负担。

6、字节跳动推出开源多模态模型BAGE

字节跳动发布了最新开源多模态基础模型BAGEL,该模型在图像理解和生成方面表现出色,超越了许多主流开源视觉语言模型,展示了强大的文本转图像生成能力和复杂的图像编辑功能。

【AiBase提要:】

✨ BAGEL基于70亿参数规模,超越主流VLM如Qwen2.5-VL和InternVL-2.5,在图像理解、生成和编辑任务中表现卓越。

🌐 模型采用混合变压器-专家结构,支持高效多模态预训练,具备文本转图像生成能力,媲美专业生成器Stable Diffusion3。

🤝 提供开源模型、评估脚本、使用文档及Gradio WebUI,鼓励社区参与优化并推动模型进步。

详情链接:https://github.com/ByteDance-Seed/Bagel

7、AI开发神器Rork:一句话打造iOS+Android应用,零编程也能当开发者!

Rork是一款AI驱动的无代码开发工具,通过自然语言描述即可生成完整应用,支持iOS和Android双平台,极大降低开发门槛。

image.png

【AiBase提要:】

✨一键生成应用:无需编程经验,用自然语言描述即可快速生成功能齐全的应用。

📱跨平台支持:基于React Native技术,同时支持iOS和Android,提供原生体验。

🌟智能集成后端:自动整合Supabase、Firebase等数据库,简化开发流程。

详情链接:https://rork.com/

8、AI新手福音!AingDesk一键打造智能助手,多模型对话即将引爆

AingDesk是一款对新手友好的AI助手构建工具,支持本地知识库、联网搜索、智能体构建及多模型对话等功能,降低了AI助手开发的技术门槛,使更多人能参与其中。

6388385619746952201728160.png

【AiBase提要:】

🌟零门槛设计,无需编程经验即可快速构建个性化智能助手。

🌐支持本地与云端灵活部署,兼顾隐私保护与高效性能。

💬联网搜索与智能体构建功能强大,即将推出多模型对话功能提升响应质量。

详情链接:https://github.com/aingdesk/AingDesk

9、Claude4登陆Amazon Bedrock 企业AI的‘最后一公里’打通了

Anthropic 推出最新Claude4系列大模型,包含 Claude Opus4和 Claude Sonnet4,分别面向高复杂性和高并发场景。两款模型均支持强大的上下文理解和多步推理能力,在多个行业测试中表现优异。

image.png

【AiBase提要:】

🌟Claude4系列新模型Claude Opus4和Claude Sonnet4在Amazon Bedrock平台上线,标志着Agentic AI进入企业级应用新时代。

🚀Claude Opus4被誉为‘全球最佳编码模型’,适合高复杂性任务,Sonnet4则优化了推理和编码能力,适合高并发场景。

🌐开发者可通过Amazon Bedrock统一API访问Claude4系列,实现与多种主流模型的无缝切换,显著提高任务完成率和执行精度。

10、Youware重磅更新:MCP加持一键生成复杂网页,AI建站进入新时代!

Youware通过深度集成Model Context Protocol (MCP),显著提升了网页生成的能力与效率,推出积分系统和社区功能,为用户带来更便捷的创作体验。

image.png

【AiBase提要:】

✨通过MCP实现智能化网页生成,用户只需简单提示即可一键生成复杂网页。

🌟推出积分系统和社区功能,为创作者提供收益激励和互动平台。

💻简化建站流程,降低门槛,支持多种MCP服务,提升用户体验。

举报

  • 相关推荐
  • AI日报昆仑万维天工超级智能体发布;OpenAI核心API支持MCP;百度飞桨PaddleOCR 3.0开源

    【AI日报】汇总了近期AI领域重要动态:1)百度飞桨发布PaddleOCR3.0,提升文字识别精度13%;2)昆仑万维发布天工超级智能体,AI办公成本仅为OpenAI的40%;3)OpenAI API新增MCP支持简化开发流程;4)xAI推出实时网页搜索API;5)谷歌Sparkify可将问题秒变动画;6)Mistral发布高效代码模型Devstral;7)Video Ocean推出4K视频生成工具;8)谷歌推出AI内容识别工具SynthID;9)谷歌NotebookLM使用量半年增长56%;10)硅基流动升级128K长文本模型;11)DeepMind发布音乐生成模型Lyria2;12)多模态大模型MMaDA实现跨模态推理;13)微软发布网页智能体Magentic-UI;14)Framer推出AI建站套件。

  • AI日报:腾讯AI智能编程插件CodeBuddy;字节推Seed1.5-VL多模态模型Manus母公司否认15亿美元融资传闻

    《AI日报》今日聚焦多项AI领域突破:腾讯推出CodeBuddy 3.0编程助手,深度整合微信小程序开发工具;字节跳动发布仅20B参数的Seed1.5-VL多模态模型,性能达行业领先;通义千问上线"Deep Research"智能研究系统,免费开放体验。此外,苹果推出革命性3D建模工具Matrix3D,Anthropic即将发布Claude Neptune新模型,清华与面壁智能联合推出端侧GUI智能体AgentCPM-GUI。谷歌搜索正测试"AI Mode"新功能,或将取代传统"手气不错"按钮。

  • AI日报:DeepSeek开源新版R1-0528;字节发布图像Agent小云雀AI;可灵2.1重磅上线

    本期AI日报聚焦多项AI领域突破:1)DeepSeek发布R1-0528模型,支持128K上下文且性能媲美GPT-4;2)字节推出"小云雀AI"图像创作工具;3)可画2.1版本价格降65%性能提升;4)Opera发布全球首款AI浏览器Neon;5)Meta推出多模态空间理解模型;6)北大团队研发ZeroSearch框架降低大模型训练成本88%;7)字节推出AI视频剪辑应用"剪小映";8)MotionPro实现40ms/帧精准视频控制;9)xAI与Telegram达成3亿美元合作部署Grok聊天机器人;10)OpenAI重组架构为IPO铺路;11)像素蛋糕"方糖大模型"获国内首个影像行业备案;12)Paper2Poster实现论文自动转海报;13)Resemble AI开源TTS模型性能比肩ElevenLabs;14)蚂蚁集团开源对标GPT-4o的多模态模型Ming-lite-omni。

  • 联想Lecoo战者G1智能体AI眼镜首发1999元:搭载天禧个人超级智能体

    据悉,这款产品搭载天禧个人超级智能体,天禧的突破在于,它首次将感知、认知、决策与自主演进能力深度融合,形成了一套完整的人工智能双胞胎”逻辑。支持AI翻译/AI对话/AI识图,通过Hi小天”启动多模态AI助手。

  • 1445元起!一图读懂联想moto edge 60系列:搭载天禧个人超级智能体

    值得注意的是,moto edge 60系列搭载全新的天禧个人超级智能体,它能根据输入上下文并结合用户个人特点,理解用户复杂意图,不仅能针对有多种涵义的专有名词缩写,给出最符合用户职业属性的解读,还能利用端云协同的计算与学习技术,将存在不同个人设备

  • 重估昆仑万维:Meta式开源、Adobe级爆款、腾讯级生态

    中国AI公司昆仑万维凭借独特商业模式实现快速增长,其战略融合了Meta的开源技术、Adobe的垂直产品矩阵和腾讯的生态思维。公司90%收入来自海外市场,通过视频、音乐、社交等产品矩阵在东南亚、中东等新兴市场快速扩张。核心产品包括短剧平台DramaWave(年收入1.2亿美元ARR)和AI音乐平台Mureka(年收入1200万美元ARR),均实现盈利。技术层面,公司采用"垂直开源+商业验证"模式,推出SkyReels视频生成等开源模型,形成开发者生态闭环。其独特之处在于:既非单纯对标国际巨头的通用模型,也避免国内同质化竞争,而是通过开源底座+垂类产品+生态卡位的组合构建差异化优势。2024年财报显示,公司AI业务年收入达10亿元,研发投入同比增长23.4%。市场看好其"平台型AI矩阵"价值,近一月股价上涨20.7%。这家中型科技企业的突围路径,为行业提供了技术出海与生态共建的新范式。

  • 字节最强多模态模型登陆火山引擎!Seed1.5-VL靠20B激活参数狂揽38项SOTA

    5月13日,火山引擎在上海搞了场 FORCE LINK AI 创新巡展,一股脑发布了5款模型和产品,包括豆包・视频生成模型 Seedance1.0lite、升级后的豆包1.5・视觉深度思考模型,以及新版豆包・音乐模型。同时,Data Agent 和 Trae 等产品也有了新进展。

  • AI日报:阿里开源长文本深度思考模型QwenLong-L1;GPT-4o语音模式上线唱歌功能;秘塔AI搜索推出全新“极速”模型

    本文汇总了AI领域最新动态:1)中国信通院发布智能体开发标准,推动AI商业化进程;2)阿里推出QwenLong-L1-32B长文本推理模型,性能媲美Claude-3;3)GPT-4o语音模式升级,新增唱歌功能;4)秘塔AI搜索推出极速模型,响应速度达400tokens/秒;5)谷歌发布LMEval评估框架,统一大模型评测标准;6)Chrome浏览器集成Gemini AI助手;7)阿联酋全民免费使用ChatGPT Plus;8)苏州成立60亿元AI产业基金;9)法国Kyutai实验室推出10秒定制语音的Unmute系统;10)UAV-Flow项目实现无人机语音精准控制;11)Claude将升级支持百万字上下文和记忆功能;12)百度心响iOS版上线;13)夸克推出高考深度搜索功能;14)Chrome v137开发者工具升级;15)美团AI业务接近GPT-4o水平;16)Direct3D-S2实现3D生成速度提升10倍;17)OpenAI计划2026年推出首款AI硬件。

  • AI日报:阿里通义千问Qwen3问鼎全球开源模型;Kimi长思考模型API发布;OpenAI发布新一代GPT-4.1模型

    【AI日报】汇总了近期AI领域重要动态:1)阿里通义千问3开源模型上线7天即登顶全球开源模型榜首,在指令遵循和推理能力上超越闭源模型;2)月之暗面推出Kimi长思考模型API,可解决复杂代码和数学问题;3)OpenAI发布GPT-4.1模型,性能提升显著;4)Google推出Gemini2.5Pro模型,提升开发者编码能力;5)联想发布"天禧超级智能体",具备多模态感知能力;6)腾讯元宝上线"对话分

  • AI日报:QQ浏览器升级为AI浏览器;OpenAI全新编程智能体Codex;B站团队推动漫视频生成模型AniSora

    本文介绍了AI领域多项最新进展:1)B站团队推出开源动漫视频生成模型AniSora,支持多种风格创作;2)OpenAI发布编程智能体Codex,提升开发效率;3)Google测试AI问答功能AI Mode;4)ChatGPT将整合MCP协议,支持第三方AI服务对接;5)阿里推出ZeroSearch框架,减少对搜索引擎的依赖;6)Stability AI与Arm合作推出手机端音频生成AI;7)Qwen发布WorldPM系列大模型;8)GPT-5将整合多款产品功能;9)ListenHub上线AI播客生成工具;10)QQ浏览器升级为AI浏览器;11)数学建模AI助手MathModelAgent面世;12)GenSpark推出全球首个智能下载代理;13)谷歌NotebookLM将推出视频摘要功能。这些创新展现了AI技术在各领域的快速发展和广泛应用。