首页 > 原创 > 关键词  > 人工智能最新资讯  > 正文

AI日报:美团AI编程工具NoCode将上线;火山引擎发布MCP Servers;腾讯混元上线游戏视觉生成平台

2025-05-20 16:14 · 稿源:站长之家

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解:https://top.aibase.com/

1、美团AI编程工具“NoCode”即将上线,对话式开发工具对标Lovable

美团正在加速其AI战略布局,即将推出一款名为“NoCode”的AI编程工具,定位于“Vibe Coding”赛道,通过对话式交互实现应用构建,面向非程序员用户,强调自然语言多轮对话完成代码生成、部署和修改。

image.png

【AiBase提要:】

“NoCode”由美团研发质量与效率团队打造,采用Code Agent技术架构,支持复杂逻辑推理和多种任务调度,适用于数据分析、原型设计等场景。

产品起源于内部AI黑客松活动,现已实现与美团技术体系的打通,助力非技术人员轻松开发自定义工具。

美团AI战略包括“AI in Products”和“AI at Work”,“NoCode”是前者代表项目,同时内部工具“CatPaw”显著提升了研发效率。

详情链接:https://nocode.cn/

2、火山引擎发布大模型生态广场 MCP Servers

火山引擎推出了MCP Servers,这是一个集成了多种工具和服务的大模型生态平台,通过模块化组装和全链路开发闭环,极大简化了AI应用开发流程。

image.png

【AiBase提要:】

🌟 MCP Servers是一个‘大模型工具超市’,提供丰富的MCP协议适配工具,覆盖高频应用场景,无需复杂代码即可快速调用。

🚀 火山方舟提升模型智能交互能力,从被动执行到主动调用资源解决问题,优化用户体验。

🌐 Trae提供智能开发支持,任务自动拆解和接口调试均由AI完成,实现高效开发和一键部署。

详情链接:https://www.volcengine.com/mcp-marketplace

3、专为二次元打造!B站开源SOTA动画视频生成模型 Index-AniSora

哔哩哔哩(B站)于2025年5月19日开源了最新的动画视频生成模型Index-AniSora,该模型基于AniSora模型并引入强化学习技术框架,显著提升了二次元视频生成的质量与效率。

image.png

【AiBase提要:】

✨ Index-AniSora支持多种二次元风格视频一键生成,涵盖番剧、国创、漫改动画等,大幅提高生产效率与质量。

📚 构建高质量奖励数据集,提出AnimeReward和GAPO优化技术,显著改善生成内容的人类偏好对齐。

🌐 开源项目提供宝贵资源,支持漫画转动画,助力二次元内容创作发展。

详情链接:https://github.com/bilibili/Index-anisora/tree/main

4、字节跳动豆包AI耳机Ola Friend升级 可直接唤醒英语学习智能体

字节跳动豆包旗下的AI智能体耳机Ola Friend迎来升级,新增英语学习智能体Owen,支持实时对话,强化口语练习功能。

image.png

【AiBase提要:】

🎧 Ola Friend耳机升级,新增英语学习智能体Owen,支持实时对话。

📚 Owen专为英语学习设计,问答逻辑与交互模式围绕学习需求。

🌟 提供高度拟人化交互体验,满足用户英语口语提升需求。

5、GitHub 推出全新 AI 编程智能体,助力开发者自动修复代码漏洞

GitHub 在 Build 大会上推出了 AI 编程智能体,集成于 GitHub Co pilot 中,能自动修复漏洞、优化代码并提升开发效率。

image.png

【AiBase提要:】

🌟 GitHub 推出 AI 编程智能体,自动修复漏洞、添加功能和优化文档,提升开发效率。

🚀 AI 实时保存更改、记录决策过程,增强透明度与协作效率。

🤖 支持企业版和 Plus 用户,Visual Studio Code 开源,二次开发更便捷。

6、边画边出图!腾讯混元上线游戏视觉生成平台

腾讯混元游戏视觉生成平台通过AI技术整合了传统繁琐的设计流程,极大提升了创作效率。无论是灵感捕捉还是细节调整,都能快速完成,让我有更多时间专注于创意本身。

image.png

【AiBase提要:】

🎨 一款依托混元大模型打造的AI内容引擎,专为游戏工业级内容生产而生。

🔄 实时画布功能实现秒级响应,所见即所得,大幅提高试错效率。

🌐 支持多种主流游戏风格和题材的高一致性生成,简化语言描述难度。

详情链接:https://hunyuan.tencent.com/game/

7、微软放大招!VS Code转型开源AI编辑器,狙击Cursor与Windsurf

微软在Build2025大会上宣布,将旗下的Visual Studio Code转型为全球首款开源AI编辑器,GitHub Co pilot Chat扩展完全开源,此举不仅深化了微软对开源社区的承诺,还通过整合AI功能重塑开发者工具生态。

image.png

【AiBase提要:】

🌟 VS Code将升级为AI驱动的开发平台,核心在于将AI功能深度嵌入编辑器内核。

🌐 GitHub Co pilot Chat扩展开源,降低AI编码工具使用门槛,支持开发者定制化AI功能。

🤝 微软通过开源VS Code和Co pilot Chat,巩固GitHub地位,对抗竞争对手的闭源模式。

8、微软宣布Windows11原生支持MCP

微软通过引入模型上下文协议(MCP)使AI应用与Windows系统深度整合,开启以AI为核心的操作系统新时代。

image.png

【AiBase提要:】

🌟 MCP作为AI应用与Windows互动的新标准,简化了开发者的工作流程。

🔒 微软优先考虑安全性,通过预览版测试确保MCP功能的可靠性。

🤖 推出Windows AI Foundry,助力开发者轻松集成AI模型至应用中。

详情链接:https://blogs.windows.com/windowsexperience/2025/05/19/securing-the-model-context-protocol-building-a-safer-agentic-future-on-windows/

9、Anthropic发布AI代理开发“圣经”:超越提示工程的7大实战策略

Anthropic发布的AI代理开发指南强调了构建实用可靠代理的关键策略,包括结构化工作流、内存管理、工具集成等。

image.png

【AiBase提要:】

🌟 代理设计需具备推理、行动、反思等结构化工作流,而非简单无状态函数。

📚 内存管理优于直接放入完整文件,采用摘要和结构化文件检索提升效率。

🔄 强调规划、工具使用及自主性控制,确保代理能高效完成复杂任务。

10、谷歌Jules测试版全球上线!挑战Codex,AI自主生成PR,每天5次免费任务

谷歌推出了基于Gemini2.5的AI编码代理Jules,定位为OpenAI Codex的直接竞争对手。Jules能自主分析代码库、制定计划并生成GitHub PR,简化开发流程,提高效率。

image.png

【AiBase提要:】

🌟 Jules通过Gemini2.5Pro的多模态能力,实现自主任务执行、代码库理解和异步操作,显著提升开发者效率。

🌐 支持Python和JavaScript项目,与GitHub无缝集成,提供每日5次免费任务和2个并发任务,适合个人开发者和小型团队。

🚀 提供透明控制,执行前提供计划预览,缓解企业在代码质量和安全上的担忧,同时具备生态整合和成本优势。

详情链接:https://jules.google.com/home

11、Google NotebookLM 正式推出 iOS 版本,Gemini2.5Flash 赋能

Google NotebookLM 推出 iOS 版本,与 Android 版本同步上线,新增移动端功能如便捷分享与上传、音频概述支持及平板优化,同时整合 Gemini2.5Flash 模型,提升文本交互综合性和准确性。

image.png

【AiBase提要:】

📱 NotebookLM 移动端支持跨平台同步,随时随地创建和管理笔记本。

🔊 强大的音频概述功能将复杂文档转换为简洁的音频摘要,便于高效学习。

🌟 Gemini2.5Flash 模型赋能,提升复杂推理问题处理能力,增强用户体验。

12、Genspark45天实现3600万美元ARR!20人团队创最快增长神话

Genspark以惊人的增长速度震惊业界,仅用45天就实现了3600万美元的ARR,展示了AI驱动商业模式的巨大潜力。

image.png

【AiBase提要:】

🌟20人团队45天实现3600万美元ARR,创历史最快增长记录。

📊 推出AI Sheet、Agentic Download Agent和AI Drive,大幅提升生产力。

🚀 采用零付费分销模式,依靠口碑传播,实现高效市场渗透。

13、Bright Data MCP 服务器发布,集成超过30种强大工具

Bright Data 推出开源 MCP 服务器,集成30+工具解决AI代理网络数据交互难题,提升数据采集效率,同时强调开源、安全性和大规模数据处理能力。

image.png

【AiBase提要:】

🌟 动态工具选择与平台适配:支持多种平台工具,自动适配目标网站特性,简化开发者配置。

🌐 开源与易用性并重:100%开源,提供GitHub代码支持,支持多客户端,降低使用门槛。

🔒 安全与信任的保障:采用严格认证机制,建议容器化部署,避免敏感数据泄露风险。

详情链接:https://github.com/luminati-io/brightdata-mcp

14、马斯克与微软携手,Grok人工智能模型将登陆Azure平台

在微软Build开发者大会上,马斯克宣布xAI公司的Grok3和Grok3迷你模型将被引入Azure AI Foundry平台,这标志着微软与xAI的合作加深。Grok模型以追求基本真理为核心,强调透明度、安全性及物理现实基础,未来将在多个领域应用。

【AiBase提要:】

🚀 Grok3和Grok3迷你模型加入Azure AI Foundry,增强微软AI平台功能。

🔍 Grok模型基于物理现实推理,追求基本真理,确保结论接近事实。

🌐 马斯克展望Grok扩展至更多企业,开发者可参与并提出需求。

举报

  • 相关推荐
  • 美团AI编程工具NoCode”即将上线:让编程“像点外卖一样简单”

    美团正加速AI战略布局,即将推出名为"NoCode"的AI编程工具,主打对话式交互实现应用构建,让非技术人员也能轻松开发。该工具由美团研发团队打造,定位"氛围编程"赛道,支持数据分析、原型设计等场景。同时美团还开发了面向专业开发者的AI工具CatPaw,内部使用效果显著。这是美团"AI+工作"战略的重要落地,旨在将AI能力普及至更广泛用户群体。国内大厂纷纷布局AI编程赛道,行业竞争日趋激烈。

  • 火山引擎发布豆包·语音播客模型,秒级生成“真人对话”播客

    5月20日,火山引擎推出豆包·语音播客模型,实现文本秒转专业播客内容。该模型三大优势:1)自然流畅的双人对话效果,语音拟真度高;2)支持热点话题即时生成,5秒产出最新资讯播客;3)提供端到端创作链路,支持超长文本/网页链接转播客。相比传统AI播客,解决了内容重复、机械感强等问题。模型即将登陆豆包APP及PC端,6月11日将在火山引擎大会上展示更多功能。

  • 腾讯混元上线游戏工业级”视觉生成平台:效率最高提升数十倍!

    腾讯5月20日发布混元游戏视觉生成平台,该平台基于混元大模型打造,专为游戏行业内容生产设计。平台能快速生成高质量游戏素材和概念草图,支持多种主流游戏风格,实现创作闭环。通过AI技术,可将整套流程压缩至一个工作页面,用户只需输入提示词即可获得灵感参考图,并直接绘制草图和生成标准三视图及360度旋转演示视频,效率最高提升数十倍。平台还具备角色多视图自动生成能力,上传一张正面图即可自动生成标准三视图和360度展示视频,角色一致性最高达99%。腾讯表示,该平台将显著改善灵感迟滞、多视图缺失等常见问题。

  • AI日报:扣子空间开放测试;腾讯混元开源视频生成工具HunyuanCustom;阿里开源大模型搜索引擎ZeroSearch

    本文汇总了近期AI领域多项重要进展:1)扣子空间开放测试,无需邀请码即可体验AI协作平台;2)腾讯推出HunyuanCustom视频生成工具,实现音视频同步编辑;3)阿里巴巴ZeroSearch技术降低AI训练成本88%;4)OpenAI新增GitHub连接器,强化代码分析功能;5)联想发布天禧个人超级智能体,具备感知交互能力;6)OpenAI在亚洲推出数据驻留计划;7)Multiverse发布全球首款AI生成多人游戏;8)秘塔AI上线"讲题"功能辅助家长辅导;9)Genspark推出智能电子表格工具AI Sheets;10)Google Gemini API新增缓存功能可节省75%成本;11)PixVerse v4视频生成速度质量双提升;12)快手推出内容净化器KuaiMod;13)英伟达开源新一代OCR代码推理模型。这些创新覆盖AI应用、开发工具、成本优化等多个维度,展现了AI技术的快速发展和广泛应用。

  • AI日报: OpenAI推出gpt-image-1图像生成API;纳米AI发布MCP万能工具箱;中国占全球AI专利60%

    【AI日报】栏目聚焦人工智能领域最新动态:1) OpenAI推出ChatGPT图像生成API,开发者可轻松集成AI绘图功能,已生成超7亿张图片;2) 谷歌Gemini月活用户突破3.5亿,但仍落后于ChatGPT的6亿用户;3) OpenAI预测2029年收入将达1250亿美元,AI代理业务成主要增长点;4) Ostris发布8B参数扩散模型Flex.2-preview,优化ComfyUI工作流;5) 英伟达推出多模态LLM模型Describe Anything,支持指定区域生成详细描�

  • AI日报腾讯混元3D生成模型2.5版本发布;海螺推出图像人物参考功能;百度上线移动端超级智能体心响App

    本文介绍了多款AI领域的新产品和技术进展:1)Kortix-AI推出开源通用AI智能体平台Suna;2)腾讯混元3D生成模型升级至2.5版本;3)海螺AI推出基于单张图像生成多角度角色图像功能;4)百度发布"心响"App整合多智能体协作;5)Nari Labs开源媲美真人的对话语音模型Dia;6)Grok新增视觉处理和多语言支持;7)Genspark推出AI幻灯片工具;8)Character.AI发布让静态图片"说话"的AvatarFX模型;9)pad.ws结合白板和代码编辑器;10)OpenBMB开源社区推出长文本生成模型"卷姬";11)腾讯推出AI阅读助手"企鹅读伴";12)OpenAI有意收购Chrome浏览器;13)字节跳动调整AI产品线布局。这些创新展现了AI技术在自动化、3D生成、语音交互、内容创作等领域的快速发展。

  • AI日报:QQ浏览器升级为AI浏览器;OpenAI全新编程智能体Codex;B站团队推动漫视频生成模型AniSora

    本文介绍了AI领域多项最新进展:1)B站团队推出开源动漫视频生成模型AniSora,支持多种风格创作;2)OpenAI发布编程智能体Codex,提升开发效率;3)Google测试AI问答功能AI Mode;4)ChatGPT将整合MCP协议,支持第三方AI服务对接;5)阿里推出ZeroSearch框架,减少对搜索引擎的依赖;6)Stability AI与Arm合作推出手机端音频生成AI;7)Qwen发布WorldPM系列大模型;8)GPT-5将整合多款产品功能;9)ListenHub上线AI播客生成工具;10)QQ浏览器升级为AI浏览器;11)数学建模AI助手MathModelAgent面世;12)GenSpark推出全球首个智能下载代理;13)谷歌NotebookLM将推出视频摘要功能。这些创新展现了AI技术在各领域的快速发展和广泛应用。

  • OpenAI发布云端AI编程智能体Codex:代码准确率高达90%

    OpenAI于5月19日正式推出基于Codex-1模型的云端AI编程智能体Codex。该工具具备强大的代码生成与理解能力,支持Python、JavaScript、C等主流语言,覆盖前后端开发、算法实现等多个领域。测试显示其处理常规编程任务的速度远超人工,代码准确率达90%以上,能显著提升开发效率。Codex深度集成GitHub,支持智能代码补全和结构化代码自动生成,使开发者平均编码时间缩短30%。目前该服务已面向ChatGPT+Pro等高级用户开放,未来有望成为软件开发领域的标配工具,推动AI辅助编程进入新阶段。

  • AI日报:小米首个推理大模型开源Xiaomi MiMo;快手上线AI笔记工具“喵记多”;腾讯拆分AI团队

    本文汇总了AI领域最新动态:1)小米开源70亿参数大模型Xiaomi MiMo,在数学推理和代码竞赛中超越OpenAI和阿里模型;2)快手推出AI笔记工具"喵记多",简化笔记管理;3)Luma AI发布电影级镜头控制API,降低视频生成门槛;4)腾讯重组AI团队,加大语言模型研发投入;5)Anthropic为Claude引入新语音"Glassy";6)谷歌NotebookLM新增50+语言音频概述功能;7)xAI将发布Grok3.5模型;8)Meta推出独立AI助手应用挑战ChatGPT;9)OpenAI紧急修复GPT-4o"谄媚"问题;10)Mac本地AI助手Simular升级隐私保护;11)CameraBench项目帮助AI理解镜头运动;12)谷歌推出个性化语言学习AI工具。

  • 腾讯混元视频生成工具全新开源:人物不会“变脸” 物体不会“漂移”

    腾讯混元5月9日宣布推出开源的多模态定制化视频生成工具HunyuanCustom。该工具基于混元视频生成大模型打造,支持文本、图像、音频等多模态输入,能生成高质量定制视频。主要功能包括:单/多主体视频生成、视频配音、局部编辑等,在保持主体一致性的同时可灵活调整场景和动作。适用于广告、电商、影视等场景,如快速更换商品背景、制作数字人视频等。目前单主体生成功能已开源,其他功能将于5月陆续开放。用户只需上传图片和文字描述即可生成连贯自然的视频内容。

热文

  • 3 天
  • 7天