首页 > 原创 > 关键词  > 人工智能最新资讯  > 正文

AI日报:Manus面向所有人开放注册;全球设计Agent Lovart内测;教育部划清AI使用边界

2025-05-13 15:48 · 稿源:站长之家

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用

新鲜AI产品点击了解:https://top.aibase.com/

1、无需邀请码!国产AI智能体Manus宣布向所有人开放注册

国产AI智能体平台Manus近期开放用户注册,无需等待,用户可直接注册并获得积分奖励。该平台由Monica公司推出,凭借其通用型AI Agent的独特魅力迅速走红。Manus通过创新的工程架构,结合思考与行动,极大提升了用户的创作潜力,涵盖多个领域的任务执行,标志着AI应用的转变。

国产AI智能体Manus宣布开放注册:邀请码曾被炒到 10 万

【AiBase提要:】

🚀 Manus平台现已开放注册,用户可每日免费执行任务并获得积分奖励。

🤖 Manus通过工程化创新,将思考与行动结合,支持复杂任务的执行。

🌐 与阿里通义千问团队合作,探索国产模型与算力平台的应用,提升用户体验。

2、全球首款设计Agent Lovart内测!一句话搞定Logo、视频、品牌全套

Lovart AI推出全球首款设计Agent,集成图像、视频和音乐模型,颠覆传统设计工作流。用户通过自然语言指令可实现全链路自动化设计,吸引了设计师和初创企业的关注。其核心功能包括任务拆解、跨媒介内容创作及智能图文分离,极大提升设计效率。Lovart在Beta测试阶段表现出色,预计将推动AI设计工具市场的进一步发展。

【AiBase提要:】

🛠️ Lovart AI通过自然语言指令实现全链路自动化设计,用户只需一句话即可完成复杂任务。

🎥 支持多模态模型集成,用户可轻松生成图像、视频和音乐内容,提升创作灵活性。

🌐 Lovart在Beta测试阶段受到热烈反响,用户称赞其设计效率提升超5倍,展现出强大的市场潜力。

详情链接:https://lovart.ai

3、教育部划清AI使用边界:小学到高中分阶段引导,禁止复制AI答案

教育部发布的《中小学人工智能通识教育指南(2025年版)》和《中小学生成式人工智能使用指南(2025年版)》明确了人工智能在教育中的使用规范,强调禁止学生直接复制AI生成的内容,以防止对独立思考能力的影响。同时,指南根据不同学段的特点,提出了分阶段的使用策略,强化教师的引导职责,确保学生在安全的环境中合理使用AI工具。

【AiBase提要:】

🚫 禁止学生直接复制AI生成内容作为作业或考试答案,防止依赖AI削弱独立思考能力。

👩‍🏫 教师需引导学生进行批判性思维训练,分析AI生成文本的逻辑缺陷和文化偏差。

🔒 建立AI工具白名单制度,确保校园内使用的AI工具符合教育需求和数据安全合规。

4、从图像出发构建可控交互世界!昆仑万维正式开源Matrix-Game

昆仑万维集团于5月13日宣布开源Matrix-Game大模型,这是一个专注于交互式世界生成的先进模型,标志着该领域技术的新突破。Matrix-Game不仅是工业界首个开源的10B+空间智能大模型,还通过其三大核心部分实现了高质量生成与精确控制。

image.png

【AiBase提要:】

🛠️ Matrix-Game是首个开源的10B+空间智能大模型,专注于交互式世界生成,刷新技术上限。

📊 该模型通过GameWorld Score评测体系,从视觉质量、时序质量等四个维度全面量化性能,超越现有基线模型。

🌍 Matrix-Game具备多场景泛化能力,支持不同地形和环境,提升用户交互体验。

详情链接:https://matrix-game-homepage.github.io

5、Google Gemma AI 模型下载量突破1.5亿次

Google最近宣布其Gemma人工智能模型集合的下载量已突破1.5亿次,显示出其在AI领域的显著进展。Gemma是一款多模态模型,能够处理文本和图像,支持超过100种语言,满足全球用户需求。尽管下载量可观,但仍低于竞争对手Llama的12亿次下载,且因复杂的许可条款受到开发者的批评。

【AiBase提要:】

🌟 下载量突破1.5亿次: Google的Gemma AI模型集合吸引了大量开发者关注,标志着显著进展。

🖼️ 多模态功能: Gemma支持文本和图像处理,能够满足全球用户需求,支持超过100种语言。

⚠️ 许可条款争议: Gemma和Llama因复杂的许可条款受到批评,开发者担心在商业使用中存在风险。

6、OpenAI推出深度研究报告一键导出PDF功能

OpenAI最近推出了一项新功能,允许用户将其深度研究报告一键导出为PDF格式。这一更新极大提升了报告的实用性和分享效率,特别是在企业环境中。用户可以轻松生成包含引用、表格和图片的专业文档,从而更好地支持决策和沟通。

【AiBase提要:】

📝 新增的PDF导出功能让用户可以一键生成完整格式的深度研究报告,提升了分享效率。

🔗 该功能支持新生成和历史报告,确保用户可以随时调用已有成果,增强了报告的实用性。

🚀 OpenAI通过这一更新,将尖端AI技术与企业现有工作流程无缝衔接,推动了AI工具的实用化进程。

7、字节跳动发布统一图像定制框架DreamO:集成换装、换脸与风格迁移

字节跳动在Hugging Face平台推出了DreamO,一个集成多种图像编辑功能的全新框架,标志着AI图像编辑技术的重大突破。DreamO不仅支持换装、换脸、风格迁移等功能,还通过开源特性吸引开发者参与,推动行业创新。其一站式解决方案降低了使用门槛,使得专业设计师和普通用户都能轻松实现高质量的图像编辑。

image.png

【AiBase提要:】

✨ DreamO是一款集成图像换装、换脸、风格迁移等多种功能的统一框架,支持多样化的图像编辑需求。

🔧 通过灵活的参数设置,用户可以轻松实现精准的图像编辑,降低了使用门槛,适合各种用户。

🌍 DreamO的开源特性促进了全球开发者的参与,推动了AI图像编辑领域的创新和应用。

详情链接:https://github.com/bytedance/DreamO

8、月之暗面Kimi界面升级:气泡样式优化 改为无边界内容展示

月之暗面科技有限公司的智能助手Kimi进行了重大界面升级,旨在提升用户体验和信息呈现能力。此次升级引入了多模态容器,支持实时K线图、HTML预览和语音播报等功能,增强了用户与Kimi的互动。尽管新界面引发了一些用户对旧版的怀念,但公司强调这是Kimi成长的一部分,希望通过这些更新让其成为更强大的智能助手。

image.png

【AiBase提要:】

📈 Kimi支持实时K线图,提供直观的市场走势分析。

🎤 新增语音播报功能,帮助用户跟踪信息。

🔧 用户可实时查看Kimi服务状态,增强系统透明度。

9、阿里MNN神更新!移动端开源多模态AI支持Qwen-2.5,文本图像语音全搞定!

阿里巴巴的MNN项目发布了新版MnnLlmApp,支持Qwen-2.5-Omni-3B和7B模型,极大增强了移动端多模态AI的能力。该应用支持多种模态任务,包括文本、图像和音频的生成与识别,且具备高效性能和低资源占用,吸引了开发者的关注。

QQ20250513-094907.jpg

【AiBase提要:】

🛠️ 新版MnnLlmApp集成Qwen-2.5-Omni-3B和7B模型,支持文本、图像、音频等多模态任务,提升了综合处理能力。

📱 应用完全本地运行,无需联网,确保数据隐私,且在CPU推理上表现卓越,速度远超同类产品。

🌐 MNN的开源属性和对主流模型的支持,使其成为移动端多模态AI开发的理想平台,推动了行业的快速发展。

详情链接:https://github.com/alibaba/MNN/blob/master/apps/Android/MnnLlmChat/README.md

10、ChatGPT 推出 SharePoint 连接器,企业数据分析更高效!

ChatGPT 最近推出了一项新功能,允许用户通过 SharePoint 连接器访问公司数据。这一功能目前正在测试中,专为 ChatGPT Plus、Pro 和 Team 用户设计。通过此集成,ChatGPT 可以从多个 SharePoint 站点中分析和总结内容,并提供来源引用,帮助企业在数据管理和分析方面实现更高效的工作。

image.png

【AiBase提要:】

✅ ChatGPT 通过 SharePoint 连接器,支持公司数据分析与总结。

📊 新功能适用于 ChatGPT Plus、Pro 和 Team 用户,帮助跨部门信息整合。

🔒 数据隐私有保障,ChatGPT 仅访问用户有权限的数据。

11、新一代开源视觉编码器 OpenVision 发布:超越 CLIP 与 SigLIP 的强大选择

加州大学圣克鲁兹分校推出的OpenVision是一个全新的视觉编码器系列,为开发者和企业提供了灵活的选择,旨在提升图像处理和理解的效率。OpenVision不仅支持多种模型和灵活的部署架构,还在多模态基准测试中表现优异。

image.png

【AiBase提要:】

🔍 OpenVision提供26种不同模型,参数规模从590万到6.32亿,适应多种应用场景。

⚙️ 灵活的部署架构支持服务器级负载与边缘计算,模型可自适应补丁大小以优化性能。

📊 在多模态基准测试中表现优异,采用渐进式训练策略提高训练效率,确保下游性能。

详情链接:https://ucsc-vlaa.github.io/OpenVision/

12、AI 突围!阿里云与 DeepSeek 脱颖而出,福布斯发布中国人工智能企业 TOP50榜单

2025年福布斯发布的中国人工智能科技企业TOP50榜单,展现了中国在全球AI领域的崛起。随着市场规模的快速扩张,超过4500家AI企业在智能制造、医疗、自动驾驶等领域实现了规模化应用。尤其是中西部地区企业的崛起,显示出科技创新的突破。11家企业在大模型领域占据主导地位,推动了生成式AI技术的商业化。

图片

【AiBase提要:】

🚀 中国人工智能企业数量超过4500家,涵盖多个领域,推动行业进步。

🌍 中西部地区企业入选数量显著增加,显示出科技创新的突破。

💡11家企业在大模型领域占据22%市场份额,推动生成式AI技术商业化。

13.腾讯混元 T1-Vision 上线元宝 可深度理解图片内容

腾讯推出的 “元宝” 工具利用 Hunyuan T1-Vision 模型,能深度理解图片内容,简化信息获取,提高准确性和效率。

微信截图_20250512175402.png

【AiBase 提要:】

1. 🌸 识别植物:用户拍照即可获得植物的详细信息。

2. 🎮 游戏辅助:翻译游戏界面,帮助理解角色技能。

3. 🧠 深度思考:支持图文切换,快速提供决策建议。

举报

  • 相关推荐
  • AI智能生成2万封邮件,全球首款外贸信AI Agent亮相

    2025年印尼雅加达国际工业周于6月4-7日盛大开幕,米奥兰特推出全球首个展会场景外贸AI+Agent系统,实现"沟通即生成"的智能贸易新模式。展会吸引超4.5万专业买家,AI预展平台和智能体技术驱动下,买卖对接率突破50%。核心亮点包括:1)AI眼镜支持128种语言实时翻译,打破语言壁垒;2)外贸信AI Agent自动生成含产品参数、运输条款等定制邮件,10分钟完成传统需通宵的工

  • AI日报:月之暗面首款自主智能体Kimi-Researcher;MiniMax推音色设计功能;Jaaz发布Lovart AI本地化替代品

    【AI日报】今日AI领域重要动态:1)月之暗面发布Kimi-Researcher智能体,多轮搜索推理能力超越谷歌和OpenAI同类产品;2)MiniMax推出Voice Design功能,支持多语言/音色组合;3)火山引擎上线AI智能域名推荐功能;4)Anthropic强化VSCode集成;5)Google推出Gemini2.5Flash-Lite模型,可实时生成交互界面;6)苹果拟300亿美元收购AI公司Perplexity;7)月之暗面开源Kimi-2506多模态模型;8)Firecrawl将推出开源问答引擎Fireplexity;9)银河通用机器人获宁德时代10亿元融资;10)字节跳动发布DreamActor-H1视频生成系统;11)Google推出开源实时音乐生成模型Magenta RealTime;12)开源AI设计工具Jaaz发布。

  • Agent成了腾讯AI最大的牌面

    抓住DeepSeek带来的契机扭转AI领域的竞争态势之后,腾讯围绕AI应用的布局正在快速深化。 元宝、ima等原生AI应用是腾讯进行探索的最前线。腾讯元宝通过大规模市场投入获得用户增长后,继续拓展了更多能力,包括将元宝放入微信好友列表,打通与腾讯地图、腾讯文档的连接,以及上线Chrome浏览器插件。腾讯管理层目前还在观察用户对这些新增功能的反馈,判断哪些功能可以�

  • 如何用AI Agent让企业效率翻倍?

    2025年5月,红杉资本AI峰会在旧金山落下帷幕。这场汇聚150位全球顶尖AI公司创始人的大会达成重要共识:下一轮AI竞争的核心不再是工具本身,而是为用户创造的实际收益。在此背景下,Agent的重要性被前所未有的推至所有人的视野前沿。 硅谷大厂开启了第一波加速,微软CEO纳德拉在主题演讲中宣布:“我们已经进入了AI Agent时代,正在见证AI系统如何以全新方式帮助我们解决问�

  • AI日报:DeepSeek开源新版R1-0528;字节发布图像Agent小云雀AI;可灵2.1重磅上线

    本期AI日报聚焦多项AI领域突破:1)DeepSeek发布R1-0528模型,支持128K上下文且性能媲美GPT-4;2)字节推出"小云雀AI"图像创作工具;3)可画2.1版本价格降65%性能提升;4)Opera发布全球首款AI浏览器Neon;5)Meta推出多模态空间理解模型;6)北大团队研发ZeroSearch框架降低大模型训练成本88%;7)字节推出AI视频剪辑应用"剪小映";8)MotionPro实现40ms/帧精准视频控制;9)xAI与Telegram达成3亿美元合作部署Grok聊天机器人;10)OpenAI重组架构为IPO铺路;11)像素蛋糕"方糖大模型"获国内首个影像行业备案;12)Paper2Poster实现论文自动转海报;13)Resemble AI开源TTS模型性能比肩ElevenLabs;14)蚂蚁集团开源对标GPT-4o的多模态模型Ming-lite-omni。

  • AI日报:阿里开源3D数字人项目MNN TaoAvatar;MiniMax Agent上线;罗永浩数字人直播再探“AI+IP”带货模式

    本文汇总了AI领域最新动态:1)阿里开源MNN+TaoAvatar技术,实现手机端3D数字人实时交互;2)MiniMax升级AI工具Agent,新增智能图像搜索和多语言支持;3)罗永浩数字人将登陆百度电商直播;4)OpenAI员工套现近30亿美元,软银成最大接盘方;5)ChatGPT推出深度研究和语音模式升级;6)Meta发布V-JEPA2模型,提升机器人环境适应能力;7)AMD与OpenAI合作推出新一代AI芯片;8)Google Gemini集成Imagen4图像生成模型;9)谷歌AI实现10公里级精准天气预报;10)Gartner预测到2028年80%的AI应用开发时间将缩短50%。

  • AI日报:通义千问3大模型全球爆火;即梦图片3.0智能参考全量上线;智谱AI企业级超级助手Agent CoCo上线

    【AI日报】今日AI领域重要动态:1.通义千问3大模型全球下载量超1250万,衍生模型13万+;2.即梦图片3.0上线,AI设计进入"零门槛"时代;3.智谱AI发布企业级超级助手Agent CoCo;4.百度推出金融行业大模型"千帆慧金";5.小红书开源首个大模型dots.llm1,含1420亿参数;6.Hugging Face开源LeRobot项目,降低机器人研发门槛;7.ChatGPT语音功能升级,支持更自然对话翻译;8.Google Gemini应用下载量超ChatGPT但活跃度不足;9.轻量级文档解析模型MonkeyOCR表现优异;10.Google Veo3推出高速视频生成模式;11.Google调整AI Studio政策,限制Gemini2.5Pro免费访问。

  • 发布AI Agent开发平台,做强AI生态… 网易数智接下来这么干

    AI时代正从AIGC转向AI Agent发展。微软CEO纳德拉预测AI Agent将成为新应用,Gartner预计到2028年超1/3企业软件将集成AI Agent功能。网易数智发布CoreAgent智能体开发平台及多款行业智能体,助力企业快速落地AI应用。文章指出当前AI Agent面临技术门槛高、场景适配难等挑战,网易提出"技术共生、市场共拓、利润共享"的生态协同理念,强调AI需要与行业know-how结合才能创造真实价值。网易数智宣布品牌升级,从"科技蓝"变为"网易红",展现拥抱AI时代的决心。

  • AI日报:夸克发布首个高考志愿大模型;Trae月活跃用户破100万;Manus推出免费无限聊天模式

    【AI日报】今日AI领域热点速览: 1. 夸克APP推出高考志愿大模型,免费提供个性化填报指导 2. Manus AI开放免费无限聊天模式,挑战行业巨头 3. Trae开发者平台月活破百万,累计交付60亿行代码 4. 迪士尼环球起诉Midjourney侵犯影视版权 5. 维基百科暂停AI生成摘要实验 6. 360发布"纳米AI超级搜索智能体",内置80多款大模型 7. PartCrafter项目实现单张图片生成高精度3D模型 8. Meta推出AI视频编辑工具,支持50多种预设效果 9. 阿里工程师放弃春节假期全力追赶DeepSeek技术 10. 火山引擎发布PromptPilot智能提示优化平台 11. OpenAI洽谈400亿美元融资,拓展AI生态系统 12. 新一代o3-pro推理模型发布并调整API定价策略

  • AI日报:MiniMax发布视频智能体Hailuo Agent;昆仑万维开源 Skywork-SWE-32B;B站接入Qwen 3等模型

    本期AI日报聚焦多项AI领域创新:1)MiniMax推出视频Agent工具,支持文本生成高清视频及人脸驱动;2)昆仑万维开源Skywork-SWE-32B模型,提升软件工程任务表现;3)B站接入通义千问模型,推出数据分析智能体InsightAgent;4)ChatGPT深度整合Gmail与日历功能;5)腾讯云发布全链路AI开发平台"AI Builder";6)HeyGen推出UGC广告数字人功能;7)研究显示过度依赖AI或削弱批判性思维。此外还涵盖AI音乐生成、内容检测工具停运等动态,展现AI技术快速发展的多元应用与潜在影响。