首页 > 原创 > 关键词  > 人工智能最新资讯  > 正文

AI日报:百度文心4.5 Turbo将于4月25日发布;谷歌推全新智能体开放协议A2A;视频号整治不当使用AI工具直播行为

2025-04-10 15:34 · 稿源:站长之家

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解:https://top.aibase.com/

1、百度官宣:文心大模型4.5Turbo将于4月25日发布

百度宣布将在4月25日的Create大会上发布文心大模型4.5Turbo,尽管具体细节尚未披露,但业界对此充满期待。文心大模型4.5及文心大模型X1已于上月发布并向用户免费开放,展现了百度在AI领域的深厚积累。文心大模型4.5在多模态理解能力上表现卓越,API调用价格极具竞争力,吸引了众多开发者和企业的关注。

QQ_1744270167389.png

【AiBase提要:】

🚀 文心大模型4.5Turbo将在4月25日的Create大会上发布,具体细节待揭晓。

💡 文心大模型4.5在多模态理解能力上表现出色,API调用价格仅为GPT4.5的1%。

🌟 百度创始人李彦宏表示,文心大模型4.5将是百度历史上最好的一款模型。

2、AI Agent巨变!谷歌重磅发布开源A2A协议,实现智能体间的自由“对话”

谷歌云推出全新的开源协议Agent2Agent(A2A),旨在促进不同AI智能体之间的协作与信息交换。这一协议通过标准化的通信方法,打破了智能体之间的壁垒,解决了信息孤岛的问题。A2A协议的设计原则包括支持长期任务、默认安全和模态无关等,确保了其在复杂AI应用中的适用性。

image.png

【AiBase提要:】

🚀 A2A协议促进不同厂商AI智能体之间的无缝协作与信息交换,打破信息孤岛。

🔒 该协议基于现有标准构建,支持企业级安全,简化集成过程。

🌐 超过50家技术合作伙伴支持A2A协议,推动AI在企业中的更广泛应用。

3、微信:视频号开展不当使用AI工具进行直播行为专项治理

微信视频创作安全中心近期发布公告,针对部分主播在直播中不当使用AI工具的行为展开专项治理。这些行为不仅误导观众,还侵犯了他人肖像权,违反了相关运营规范。平台将根据违规程度采取相应处罚措施,确保直播环境的健康与安全。同时,平台鼓励合理使用AI技术,提升工作效率,但坚决抵制不正当牟利行为。

image.png

【AiBase提要:】

🚫 部分主播在直播中不正当使用AI工具,误导观众并侵犯肖像权。

⚖️ 主播需申请直播资质,若使用AI工具改变面部形象将构成违规。

📢 用户可通过投诉功能举报违规行为,平台将及时处理。

4、字节跳动开源Multi-SWE-bench,推动大模型代码智能升级

字节跳动豆包大模型团队最近开源了Multi-SWE-bench,这是首个多语言代码修复基准数据集,旨在提升大模型在自动修Bug能力方面的评估。相较于以往的SWE-bench,Multi-SWE-bench不仅覆盖了Python,还新增了Java、TypeScript等六种语言,构建了1632个真实任务,并引入了难度分级机制。

【AiBase提要:】

🛠️ Multi-SWE-bench是首个多语言代码修复基准数据集,覆盖7种主流编程语言。

📊 数据集包含1632个真实任务,经过严格筛选和人工验证,确保质量可靠。

🤖 实验显示大语言模型在Python修复上表现尚可,但在其他语言的修复率低于10%。

5、京东零售推出首个自研十亿级时序大模型TimeHF 可预测商品销量

京东零售技术团队成功推出了自研的十亿级销量预测时序大模型TimeHF,该模型通过人类反馈的强化学习技术实现了销量预测的显著提升,准确度提高了10%以上。TimeHF在京东的自动化补货场景中表现卓越,并在多个公开数据集上超越了行业水平,成为时序预测的新标杆。

image.png

【AiBase提要:】

🛠️ TimeHF模型基于人类反馈的强化学习技术,预测准确度提升10%以上,显著降低需求预测不确定性。

📊 京东团队整合了15亿样本的高质量数据集,构建了前所未有的复杂数据集,为模型训练奠定了基础。

🚀 TimeHF在多个公开数据集上取得了SOTA效果,展现出更强的零样本性能和预测准确性,已在京东供应链系统中应用。

6、Google Firebase Studio横空出世:AI驱动的一站式开发平台震撼亮相

谷歌新推出的Firebase Studio是一款集成多种开发工具的云端开发平台,旨在通过AI技术简化开发流程。它提供了一站式开发体验,支持从创意到部署的全流程解决方案,尤其在移动开发领域表现突出。虽然目前处于预览阶段,但其强大的功能和免费试用政策使得开发者能够更轻松地进行项目开发,预示着未来编程生态的变革。

image.png

【AiBase提要:】

🛠️ Firebase Studio整合了多种开发工具,提供一站式开发体验,支持快速构建应用程序。

🌐 该平台内置手机模拟器,允许开发者在云端直接调试iOS和Android应用,提升了移动开发效率。

🔍 目前处于预览阶段,功能稳定性尚需提升,未来需平衡免费与付费服务的差异。

详情链接:https://top.aibase.com/tool/firebase-studio

7、从文本到复杂角色:最强SVG生成大模型OmniSVG出现了!

OmniSVG的发布标志着SVG生成技术的重大突破,结合了先进的视觉-语言模型和创新的SVG标记化器,极大提升了生成效率和质量。该模型不仅支持从文本和图像生成SVG,还能生成复杂的动漫角色,展现出极高的灵活性和质量。OmniSVG的出现为图形设计和网页开发领域带来了新的可能性,促进了AIGC社区的发展。

【AiBase提要:】

🌟 OmniSVG是由StepFun与复旦大学联合开发的先进SVG生成模型,具备卓越的多模态生成能力。

📊 新发布的MMSVG-2M数据集包含200万个SVG资源,并提供标准化评估协议,推动SVG生成技术发展。

🚀 OmniSVG生成的SVG不仅视觉效果出色,还具备可编辑性,适用于专业设计工作流程。

详情链接:https://omnisvg.github.io

8、谷歌开源智能体开发套件:ADK震撼发布,引领AI代理开发新浪潮

谷歌在2025年4月9日发布的Agent Development Kit(ADK)标志着AI智能体开发的重大进步。作为一款开源框架,ADK旨在简化多智能体系统的构建与管理,支持灵活的开发和部署。其模块化设计和多模态交互功能使开发者能够以更自然的方式创建智能体,同时与谷歌云服务的深度整合提升了企业级应用的效率。

QQ20250410-092009.png

【AiBase提要:】

🚀 ADK是谷歌推出的开源智能体开发框架,旨在简化多智能体系统的构建与管理。

🎤 支持多模态交互,具备双向音频和视频流功能,提升智能体的自然对话能力。

🌐 与谷歌云服务深度整合,支持快速原型设计和无缝部署,降低了技术门槛。

9、Veo2重磅登陆Gemini API:AI视频生成革命正式启航

谷歌旗下的Veo2视频生成模型通过Gemini API向开发者开放,标志着AI视频生成技术的新阶段。该模型以高保真视频生成和精准响应复杂指令而闻名,支持文本到视频和图像到视频的生成。开发者可灵活集成该API,探索商业与创意的广泛可能性。然而,内容真实性与版权归属的讨论也随之而来,谷歌在生成视频中嵌入了水印以降低误用风险。

【AiBase提要:】

🎥 Veo2通过Gemini API开放,支持文本到视频和图像到视频生成,推动AI视频生成技术发展。

💡 开发者可通过API灵活集成Veo2,探索个性化短视频和交互式故事体验的多样化应用。

⚖️ 高真实性输出引发内容真实性与版权讨论,谷歌嵌入水印以减少误用风险。

详情链接:https://ai.google.dev/gemini-api/docs/video

10、Anthropic 推出 Claude Max 高端订阅服务,月费最高达200美元

Anthropic 公司最近推出了 Claude Max 订阅计划,旨在满足高端用户对人工智能服务的需求。该计划提供两种定价选项,分别为每月100美元和200美元,使用限制显著提高,吸引了更多用户。虽然目前没有无限制使用的方案,但公司正在积极探索其他收入渠道,包括针对教育领域的“Claude for Education”项目。

image.png

【AiBase提要:】

🌟 Claude Max 订阅计划推出,月费最高200美元,专为高端用户设计。

📈 两种定价选项,使用限制显著提高,吸引更多用户。

🎓 探索“Claude for Education”项目,关注教育领域的AI需求。

11、OminiControl Art发布:将GPT-4o的吉卜力等艺术风格提炼至FLUX模型

2025年4月9日,OminiControl Art技术的发布标志着AI艺术创作领域的一次重大突破。该技术通过OminiControl框架,将OpenAI的GPT-4o艺术风格与FLUX.1模型相结合,为用户提供了一种高效且优雅的工具,能够生成高质量的艺术图像。其设计理念强调简洁性与实用性,使得普通用户也能轻松上手,推动了AI与艺术的进一步融合。

image.png

【AiBase提要:】

🖼️ OminiControl Art结合了GPT-4o的艺术风格与FLUX.1模型,开辟了AI艺术生成的新可能性。

⚙️ OminiControl框架通过增加少量参数,实现对扩散变换器模型的灵活控制,提升了艺术创作的效率。

🌟 该技术的发布反映了AI艺术工具从功能性向艺术性与可控性转变的趋势,未来可能催生更多创意项目。

详情链接:https://top.aibase.com/tool/ominicontrol-art

12、效仿 OpenAI,谷歌 Gemini 加入 MCP 阵营,加速 AI 代理互联互通

谷歌在 OpenAI 采纳 Anthropic 的模型上下文协议(MCP)后,宣布将其 Gemini 模型和软件开发工具包(SDK)中增加对 MCP 的支持。MCP 作为开放标准,允许 AI 模型从多种数据源提取信息,促进开发者与 AI 应用之间的双向连接。此举标志着 AI 代理互联互通的加速,吸引了多个公司集成 MCP,显示出行业对开放协议的重视与合作潜力。

【AiBase提要:】

🔗 谷歌 DeepMind CEO Demis Hassabis 宣布 Gemini 模型将支持 MCP 协议,推动 AI 代理互联互通。

🛠️ MCP 允许 AI 模型从多种数据源提取信息,支持开发者构建双向连接的应用。

🌐 自 Anthropic 开源 MCP 以来,多个公司如 Block 和 Replit 已在其平台中集成该协议。

13、Gradio5.24炸裂更新:AI图像编辑媲美Photoshop,开发者福音来了!

Gradio5.24版本的发布为开源AI界面框架带来了重大的更新,尤其是全新的ImageEditor组件,使得图像编辑功能达到了专业级别。新增的缩放、平移、透明度控制和自定义图层功能,极大提升了开发者在图像处理上的灵活性与效率。

image.png

【AiBase提要:】

🖼️ ImageEditor组件引入了类似Photoshop的缩放与平移操作,提升了图像编辑的灵活性和效率。

🎨 新增的透明度控制和自定义图层功能,允许开发者在单一界面内管理多个图像元素,增强了图像处理的深度。

🚀 此次更新被视为对开发者需求的精准回应,助力他们更好地展示AI技术成果。

详情链接:https://top.aibase.com/tool/gradio

14、WordPress.com 推出全新 AI 网站构建工具,快速打造美观网页

WordPress.com最近推出了一款全新的AI驱动网站构建器,旨在为用户提供更便捷的网站创建体验。通过聊天机器人,用户可以在几分钟内生成功能齐全且外观美观的WordPress网站。虽然试用期间无需绑定信用卡,但实际使用需购买托管计划。

image.png

【AiBase提要:】

🌐 新 AI 网站构建器可在几分钟内生成完整 WordPress 网页,用户体验更便捷。

💰 注册 WordPress.com 账号后,可免费试用,需购买托管计划才能实际使用。

🛠️ 工具支持通过聊天机器人生成网站内容,适用于新创建的 WordPress 实例。

详情链接:https://wordpress.com/blog/2025/04/09/ai-website-builder/

举报

  • 相关推荐
  • Create2025百度AI开发者大会举行 文心4.5 Turbo、X1 Turbo发布

    百度在武汉举办Create2025+AI开发者大会,李彦宏强调AI应用创造价值的关键。他指出当前AI模型迭代加速,MCP成为行业标准,但开发者担忧应用快速过时。李彦宏建议开发者选对场景和基础模型,并学习调优方法。百度发布文心大模型4.5 Turbo和X1 Turbo,价格大幅下降80%和50%,性能提升且成本更低,为开发者提供更实惠高效的工具选择。

  • Create2025百度AI开发者大会上热搜 4.5Turbo、X1Turbo发布

    百度在武汉举办2025AI开发者大会,正式发布文心大模型4.5Turbo和X1Turbo两大版本。4.5Turbo在多模态处理能力上实现突破,支持文本、图像、语音跨模态交互,调用成本较前代直降80%,仅为竞品价格的40%。X1Turbo强化深度推理能力,价格较上代降50%,成本仅占竞品的25%。两款产品围绕"多模态、强推理、低成本"三大特性展开,其中4.5Turbo提升逻辑推理与代码生成效率,X1Turbo支持多步骤复杂推理和跨工具调用能力。百度此次定价策略极具竞争力,4.5Turbo成本降至行业主流水平的1/5,瞄准中小企业及个人开发者;X1Turbo虽定位高端,但成本仅为竞品1/4,主要面向科研机构、金融分析等高要求领域。

  • AI日报百度大招!发布文心大模型X1TurboAI开放计划;OpenAI免费开放轻量版Deep Research;即梦视频3.0内测

    【AI日报】主要报道了AI领域的最新动态:1)百度发布文心大模型X1Turbo和4.5Turbo,性能价格优势显著;2)百度推出AI开放计划,降低开发者门槛;3)OpenAI免费开放轻量版Deep Research研究工具;4)即梦视频3.0内测展示流畅运镜和精准表情捕捉能力;5)百度发布全球首个内容操作系统"沧舟OS";6)百度文库与网盘联合推出GenFlow超能搭子和AI笔记工具;7)Pixverse推出MCP协议简化AI视频创作;8)Tavus发布突破性唇形同步模型Hummingbird-0;9)豆包1.5深度思考模型上线,提供免费额度;10)Adobe整合OpenAI和Google模型升级Firefly创意平台;11)ImageSlider2.0即将加入Gradio核心产品线;12)李彦宏谈DeepSeek现存痛点,强调多模态能力与降本需求。

  • 谷歌A2A协议怎么用?A2A智能体协议和MCP有什么不同?

    本文对比分析了谷歌A2A协议与Anthropic MCP协议在智能体交互领域的异同。MCP协议采用Client-Server架构,专注于标准化AI与外部工具的交互,包含资源、提示、工具和采样四大核心机制,适用于金融报告生成等复杂任务。A2A协议则侧重智能体间协作,支持跨平台任务分配,具备能力发现、协作协商等功能。两者虽理念不同但具互补性:MCP在技术实现上更复杂耦合度高,A2A则因开放设计更吸引开发者。未来,这两种协议将共同推动构建更智能高效的AI生态系统。

  • 真我Neo7 Turbo定档:将于5月29日发布

    真我realme宣布将于5月29日14:00发布新机Neo7 Turbo,主打2500元价位段最强性能。该机将搭载联发科天玑9400e旗舰芯片,性能超越骁龙8s Gen4,采用台积电4nm工艺。配备1.5K直屏、不低于7000mAh大电池及100W快充。特别推出透明版设计,在国内市场较为罕见。realme副总裁徐起透露,新机将挑战同价位段性能标杆,预计会吸引追求个性化的消费者关注。

  • AI日报:QQ浏览器升级为AI浏览器;OpenAI全新编程智能体Codex;B站团队推动漫视频生成模型AniSora

    本文介绍了AI领域多项最新进展:1)B站团队推出开源动漫视频生成模型AniSora,支持多种风格创作;2)OpenAI发布编程智能体Codex,提升开发效率;3)Google测试AI问答功能AI Mode;4)ChatGPT将整合MCP协议,支持第三方AI服务对接;5)阿里推出ZeroSearch框架,减少对搜索引擎的依赖;6)Stability AI与Arm合作推出手机端音频生成AI;7)Qwen发布WorldPM系列大模型;8)GPT-5将整合多款产品功能;9)ListenHub上线AI播客生成工具;10)QQ浏览器升级为AI浏览器;11)数学建模AI助手MathModelAgent面世;12)GenSpark推出全球首个智能下载代理;13)谷歌NotebookLM将推出视频摘要功能。这些创新展现了AI技术在各领域的快速发展和广泛应用。

  • AI日报:通义千问Qwen3重磅发布;抖音AI搜索能力开放;ChatGPT 搜索新增网购功能;Suno V4.5版本将发布

    本期AI日报重点内容: 1. 通义千问发布Qwen3大模型,在代码、数学和通用能力方面表现突出,支持两种思考模式并开源多个模型权重 2. 抖音开放AI搜索能力接口,为第三方应用提供丰富内容资源 3. ChatGPT新增网购功能,通过对话获取个性化商品推荐 4. Suno AI即将推出V4.5版本,提升音乐生成真实度 5. Simular AI登陆macOS,打造本地化智能助手 6. 暗月之面开源Kimi-VL模型,可处理文本、图像和视频 7. UCLA与Meta推出d1框架,提升大语言模型推理速度 8. 通义灵码上线Qwen3编程智能体 9. Gen-4References图像生成技术惊艳亮相 10. Hugging Face推出可编程机械臂SO-101 11. Windsurf推出全新品牌标志 12. Ollama全面支持Qwen3模型本地部署

  • AI日报:昆仑万维天工超级智能体发布;OpenAI核心API支持MCP;百度飞桨PaddleOCR 3.0开源

    【AI日报】汇总了近期AI领域重要动态:1)百度飞桨发布PaddleOCR3.0,提升文字识别精度13%;2)昆仑万维发布天工超级智能体,AI办公成本仅为OpenAI的40%;3)OpenAI API新增MCP支持简化开发流程;4)xAI推出实时网页搜索API;5)谷歌Sparkify可将问题秒变动画;6)Mistral发布高效代码模型Devstral;7)Video Ocean推出4K视频生成工具;8)谷歌推出AI内容识别工具SynthID;9)谷歌NotebookLM使用量半年增长56%;10)硅基流动升级128K长文本模型;11)DeepMind发布音乐生成模型Lyria2;12)多模态大模型MMaDA实现跨模态推理;13)微软发布网页智能体Magentic-UI;14)Framer推出AI建站套件。

  • AI日报谷歌推最强AI全家桶Google AI Ultra;腾讯混元宣布模型矩阵面升级;豆包·语音播客模型发布

    本文汇总了近期AI领域的重要动态:1)谷歌推出249.99美元/月的AI Ultra订阅计划,提供最强AI模型和高级功能;2)腾讯混元模型升级,新增视觉推理T1-Vision和语音对话模型;3)美图获阿里2.5亿美元投资,将在电商和AI领域合作;4)豆包推出语音播客模型,实现文本快速转音频;5)百度文心X1 Turbo获信通院最高评级;6)谷歌发布Flow AI剪辑工具,集成Veo3等三大模型;7)谷歌Veo3支持4K视频生成;8)Imagen4图像模型发布;9)Gemini2.5 Pro新增并行推理功能;10)谷歌推出虚拟试衣工具;11)公测AI编程助手Jules;12)苹果计划在iOS19开放AI模型;13)京东云推五大免费AI营销工具;14)字节开源多模态模型BAGEL;15)英伟达发布物理推理模型Cosmos-Reason1。

  • 极光受邀出席2025中国数谷·西湖论剑大会——AI智能体应用与安治理论坛

    5月10日,2025中国数谷·西湖论剑大会在杭州举行,主题为"数智无界 安全共生"。极光(Aurora Mobile)作为AI领域创新代表受邀参会。极光副总裁殷浩在"AI智能体应用与安全治理论坛"上分享观点,指出市场需要直达需求的智能体解决方案,而非工具本身。极光通过GPTBots.ai低代码平台已服务超5万客户,显著提升开发效率。殷浩提出未来3-5年三大发展方向:企业应用向高度定制化转型、软硬件深度融合、基于国产大模型的私有化部署方案。现场还展示了极光在客服、金融投资、教育辅助等场景的AI应用成果,如海外电商自动客服系统解决率达80%。极光强调在技术普惠的同时,将重点关注数据安全问题,通过私有化部署方案保护企业数据隐私。