首页 > 业界 > 关键词  > 人工智能最新资讯  > 正文

AI日报:昆仑万维天工智能体APP上线;谷歌重磅发布三大Gemma模型变体;字节推出开源多模态模型BAGE

2025-05-26 16:13 · 稿源:站长之家

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解:https://top.aibase.com/

1、全球首款Office智能体APP!昆仑万维天工超级智能体APP上线

昆仑万维集团推出全球首款基于AI Agent架构的Office智能体手机应用,天工超级智能体APP通过四大智能体协同工作,重新定义移动办公效率,支持跨端协同和私人知识库搭建,未来还将扩展至更多领域。

6388384555375819598691648.png

【AiBase提要:】

✨ 天工超级智能体APP是全球首款基于AI Agent架构的Office智能体手机应用,重新定义移动办公效率。

💻 支持跨端协同和私人知识库搭建,实现文档、PPT、表格和通用智能体的高效协作。

🌍 计划扩展至教育、医疗、法律等垂直领域,并优化多语言支持,覆盖更多市场。

2、最新研究:ChatGPT 助力中小学生学习成效提升近87%

研究表明,利用 ChatGPT 等大型语言模型可显著提升 K12阶段学生的学习成绩,整体提升达86.7%,并能增强高阶思维能力。

image.png

【AiBase提要:】

✨ 使用 ChatGPT 学生学习成绩平均提升0.867个标准差,涵盖多学科。

🧠 学生高阶思维能力提升0.457个标准差,推理与创新能力得到增强。

📚 能减轻学生精神负担,提升学习积极性,尤其在技能课程中表现突出。

3、谷歌通过 Gemini 应用扩展了其热门新视频机型 Veo3的访问权限

谷歌的AI视频生成工具Veo3在发布后迅速扩展到全球更多地区,但未涵盖欧盟。Gemini Pro和Ultra用户享有不同配额,Veo3虽受关注但也引发对虚假信息传播的担忧。

【AiBase提要:】

🌟 Veo3现支持71国用户,但欧盟暂未开放。

🎥 Gemini Ultra用户每月享125次生成机会,Pro用户仅10次。

⚠️ 能生成逼真虚假内容,可能威胁信息真实性。

4、谷歌重磅发布三大Gemma模型变体,AI医疗、手语翻译与海豚语言解锁新可能!

谷歌推出了MedGemma、SignGemma和DolphinGemma三款基于Gemma架构的人工智能模型,分别针对医疗、手语翻译和海豚语言研究领域,展示了AI技术在跨领域应用的巨大潜力。

6388384771738084508743444.png

【AiBase提要:】

🌟 MedGemma革新医疗AI,助力精准诊疗,提供多模态和文字推理两种模型。

🗣️ SignGemma专注手语翻译,支持ASL到英语,促进无障碍沟通。

🐬 DolphinGemma解析海豚语言,探索跨物种交流,为科学研究提供新工具。

5、AI教育革命!VideoTutor一句话即可生成K12定制教学视频

作为一款创新的AI教育工具,VideoTutor凭借其强大的一键生成功能和多语言支持,为K12教育和SAT备考带来了全新的学习体验。

image.png

【AiBase提要:】

🌟 一键生成个性化教学视频,输入问题或上传截图即可获得直观易懂的讲解。

🌍 支持多语言生成,灵活适配不同年级和语言需求,打破语言障碍。

📚 教学内容逻辑清晰,视觉效果直观,有效提升学习效率,减轻教师备课负担。

6、字节跳动推出开源多模态模型BAGE

字节跳动发布了最新开源多模态基础模型BAGEL,该模型在图像理解和生成方面表现出色,超越了许多主流开源视觉语言模型,展示了强大的文本转图像生成能力和复杂的图像编辑功能。

【AiBase提要:】

✨ BAGEL基于70亿参数规模,超越主流VLM如Qwen2.5-VL和InternVL-2.5,在图像理解、生成和编辑任务中表现卓越。

🌐 模型采用混合变压器-专家结构,支持高效多模态预训练,具备文本转图像生成能力,媲美专业生成器Stable Diffusion3。

🤝 提供开源模型、评估脚本、使用文档及Gradio WebUI,鼓励社区参与优化并推动模型进步。

详情链接:https://github.com/ByteDance-Seed/Bagel

7、AI开发神器Rork:一句话打造iOS+Android应用,零编程也能当开发者!

Rork是一款AI驱动的无代码开发工具,通过自然语言描述即可生成完整应用,支持iOS和Android双平台,极大降低开发门槛。

image.png

【AiBase提要:】

✨一键生成应用:无需编程经验,用自然语言描述即可快速生成功能齐全的应用。

📱跨平台支持:基于React Native技术,同时支持iOS和Android,提供原生体验。

🌟智能集成后端:自动整合Supabase、Firebase等数据库,简化开发流程。

详情链接:https://rork.com/

8、AI新手福音!AingDesk一键打造智能助手,多模型对话即将引爆

AingDesk是一款对新手友好的AI助手构建工具,支持本地知识库、联网搜索、智能体构建及多模型对话等功能,降低了AI助手开发的技术门槛,使更多人能参与其中。

6388385619746952201728160.png

【AiBase提要:】

🌟零门槛设计,无需编程经验即可快速构建个性化智能助手。

🌐支持本地与云端灵活部署,兼顾隐私保护与高效性能。

💬联网搜索与智能体构建功能强大,即将推出多模型对话功能提升响应质量。

详情链接:https://github.com/aingdesk/AingDesk

9、Claude4登陆Amazon Bedrock 企业AI的‘最后一公里’打通了

Anthropic 推出最新Claude4系列大模型,包含 Claude Opus4和 Claude Sonnet4,分别面向高复杂性和高并发场景。两款模型均支持强大的上下文理解和多步推理能力,在多个行业测试中表现优异。

image.png

【AiBase提要:】

🌟Claude4系列新模型Claude Opus4和Claude Sonnet4在Amazon Bedrock平台上线,标志着Agentic AI进入企业级应用新时代。

🚀Claude Opus4被誉为‘全球最佳编码模型’,适合高复杂性任务,Sonnet4则优化了推理和编码能力,适合高并发场景。

🌐开发者可通过Amazon Bedrock统一API访问Claude4系列,实现与多种主流模型的无缝切换,显著提高任务完成率和执行精度。

10、Youware重磅更新:MCP加持一键生成复杂网页,AI建站进入新时代!

Youware通过深度集成Model Context Protocol (MCP),显著提升了网页生成的能力与效率,推出积分系统和社区功能,为用户带来更便捷的创作体验。

image.png

【AiBase提要:】

✨通过MCP实现智能化网页生成,用户只需简单提示即可一键生成复杂网页。

🌟推出积分系统和社区功能,为创作者提供收益激励和互动平台。

💻简化建站流程,降低门槛,支持多种MCP服务,提升用户体验。

举报

  • 相关推荐
  • 格创东智亮相深圳国际人工智能展览会:“章鱼智脑”+智能体集群,解锁工业智造新路径

    5月14日,2026全球人工智能终端展暨第七届深圳国际人工智能展以“端启未来·万物新生”为主题开幕,汇聚TCL、荣耀等超400家展商。TCL展示AI创新产品矩阵,格创东智则凭“章鱼大脑”智能决策中枢及智能体集群成为焦点,其以“打造AI自主决策的超级工厂”为核心,通过章鱼大脑、品质管理等四大板块,呈现工业智能决策实践路径。章鱼大脑采用“决策+执行Agent”架构,实现数据闭环,已落地多家半导体工厂,达成分钟级异常处置、良率实时监控等成效。未来,格创东智将持续迭代,推动从AI辅助向自主决策转型,助力中国智造高质量发展。

  • OpenAI成立OpenAI部署公司:帮助企业构建人工智能系统

    OpenAI正式成立OpenAI 部署公司”,在帮助企业构建人工智能系统。 同时,OpenAI已同意收购Tomoro一家专注于将AI转化为运营优势的应用 AI 咨询与工程公司。 新成立的部署公司由OpenAI控股,无论客户是与OpenAI、OpenAI部署公司,还是与两者同时合作,都将获得统一的服务体验。

  • 北京国际人力获评世界品牌莫干山大会“人工智能+”生态创新实践范本

    5月9日,第十个中国品牌日之际,2026世界品牌莫干山大会“搜索·点赞·传播品牌好故事论坛”在浙江德清举办,发布“人工智能+”生态创新实践范本。北京国际人力旗下万维招聘AI智能招聘平台获评“人工智能+”创新产品。论坛聚焦品牌强国建设,北京国际人力以47年行业积淀,推出全流程智能招聘平台,针对传统招聘痛点,运用大模型等技术构建PC端、微信小程序、线下求职一体机三位一体服务矩阵,赋能企业招聘管理与求职者职业成长,彰显国企担当,助力“中国服务”品牌高质量发展。

  • 得一微担任世界人工智能眼镜联盟(WAEA)董事会员,共推AI眼镜存力新前景

    近日,“2026AI眼镜产业生态大会”在深圳举行,汇聚全球顶尖企业与专家,探讨产业创新趋势。得壹微电子(YEESTOR)作为国内领先AI存力芯片设计企业受邀出席,被授予“世界人工智能眼镜联盟(WAEA)董事会成员单位”。大会指出,AI眼镜正从极客玩具迈向大众消费品,预计2026年全球出货量将突破2368万台。得壹微电子深耕存力主控芯片,为AI眼镜提供从端到云的全栈存力支持,推动端侧AI与智能穿戴生态规模化商用。

  • 未来智能完成亿元级A+轮融资,与传音合作打造下一代AI Agent硬件

    2026年5月8日,AI硬件公司未来智能完成亿元级A+轮融资,传音参与投资并达成战略合作。双方将整合未来智能在AI算法、可穿戴硬件研发及场景化数据沉淀方面的能力,与传音在消费电子产业链、全球渠道及规模化制造上的优势,共同推动具备自主感知、决策与执行能力的下一代AI Agent硬件产品研发与落地。耳机因其全天候、低延迟、高隐私及随身性,正成为个人AI的最佳入口。未来智能已积累超150万全球注册用户,覆盖200多个国家和地区,其场景化数据沉淀成为训练Agent能力的核心资产。本轮融资将重点用于人才投入、生态建设及上游供应链拓展,加速AI Agent从会议室走向全球用户日常。

  • RingConn Gen 3发布:以血管健康AI洞察,定义智能戒指新品类

    5月5日,全球智能戒指领导品牌RingConn发布年度旗舰新品RingConn Gen3血管健康AI智能戒指。该产品以长期血管健康洞察为核心突破,搭载AI震动提醒、超长续航及多维度健康监测能力,通过个性化基线模型和深度学习算法,实现从单点测量到长期趋势管理的跃升,为用户提供无感、连续、智能的慢病防控新方案。

  • 腾讯自研AI设计智能体Ardot公测:一句话生成可编辑设计稿

    今日,腾讯云宣布,腾讯自研AI设计智能体平台Ardot正式公测,现在注册即可获得1000 Credits免费额度。 据介绍,过去不少AI设计工具的使用方式,往往是通过一句话生成一张图片,视觉效果虽然不错,但后续修改、复用和交付并不方便,难以真正进入团队生产流程。 而Ardot的核心思路,是让AI生成的每一张图片、每一个界面,都成为可编辑、可复用、可交付的团队资产。 Ardot�

  • 考拉悠然智能体工厂:以多智能体协同重构政企 AI 全场景运营

    考拉悠然通过全栈自研技术打造智能体工厂,解决企业部署多Agent后面临的管理分散、信息孤岛、迭代闭环缺失等痛点。其平台以集中化管理、数据驱动运营和标准化发布三大优势,实现智能体全生命周期管理,并融合空间智能技术,精准解析人、物、空间、时间关系,降低告警误报率。该方案已覆盖城市治理、智慧政务、工业智检等场景,推动Agent从工具向可管、可控、可复用的体系化数字生产力转型,助力企业降本增效。

  • 豆包付费是字节整理Agent生态的开始

    这是《窄播weekly》的第89期,本周我们关注的商业动态是:豆包开始筹划付费,国内头部AI助手的竞争要从免费的Chatbot阶段进入到付费的Agent阶段了。 5月4日,豆包的App Store页面出现了订阅服务声明,在免费的基础版之外,增加了三个付费版本:标准版连续包月每月68元,连续包年每年688元;加强版连续包月每月200元,连续包年每年2048元;专业版连续包月每月500元,连续包年每年5088�

  • 纵览全球趋势,解码标杆价值——企业级智能体平台选型

    2026年企业级AI智能体将进入规模化商业爆发期,全球市场规模已达8.3万亿元,中国以71.9%年增速领跑。行业形成四大技术流派:可信智能派(蚂蚁数科Agentar)主攻金融政务等高合规场景,全栈工具派(字节Coze)侧重快速落地,大模型原生派(百度文心)聚焦通用效率,开源技术派(Dify)支持深度定制。平台能力分化明显,其中Agentar凭借金融级安全合规、全链路长思维链及低代码开发体系,成为复杂决策场景标杆方案。企业选型建议采用"Agentar+多平台"组合策略,实现安全决策与效率提升的双向赋能。

今日大家都在搜的词: