首页 > 原创 > 关键词  > 人工智能最新资讯  > 正文

AI日报:百度文心4.5 Turbo将于4月25日发布;谷歌推全新智能体开放协议A2A;视频号整治不当使用AI工具直播行为

2025-04-10 15:34 · 稿源:站长之家

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解:https://top.aibase.com/

1、百度官宣:文心大模型4.5Turbo将于4月25日发布

百度宣布将在4月25日的Create大会上发布文心大模型4.5Turbo,尽管具体细节尚未披露,但业界对此充满期待。文心大模型4.5及文心大模型X1已于上月发布并向用户免费开放,展现了百度在AI领域的深厚积累。文心大模型4.5在多模态理解能力上表现卓越,API调用价格极具竞争力,吸引了众多开发者和企业的关注。

QQ_1744270167389.png

【AiBase提要:】

🚀 文心大模型4.5Turbo将在4月25日的Create大会上发布,具体细节待揭晓。

💡 文心大模型4.5在多模态理解能力上表现出色,API调用价格仅为GPT4.5的1%。

🌟 百度创始人李彦宏表示,文心大模型4.5将是百度历史上最好的一款模型。

2、AI Agent巨变!谷歌重磅发布开源A2A协议,实现智能体间的自由“对话”

谷歌云推出全新的开源协议Agent2Agent(A2A),旨在促进不同AI智能体之间的协作与信息交换。这一协议通过标准化的通信方法,打破了智能体之间的壁垒,解决了信息孤岛的问题。A2A协议的设计原则包括支持长期任务、默认安全和模态无关等,确保了其在复杂AI应用中的适用性。

image.png

【AiBase提要:】

🚀 A2A协议促进不同厂商AI智能体之间的无缝协作与信息交换,打破信息孤岛。

🔒 该协议基于现有标准构建,支持企业级安全,简化集成过程。

🌐 超过50家技术合作伙伴支持A2A协议,推动AI在企业中的更广泛应用。

3、微信:视频号开展不当使用AI工具进行直播行为专项治理

微信视频创作安全中心近期发布公告,针对部分主播在直播中不当使用AI工具的行为展开专项治理。这些行为不仅误导观众,还侵犯了他人肖像权,违反了相关运营规范。平台将根据违规程度采取相应处罚措施,确保直播环境的健康与安全。同时,平台鼓励合理使用AI技术,提升工作效率,但坚决抵制不正当牟利行为。

image.png

【AiBase提要:】

🚫 部分主播在直播中不正当使用AI工具,误导观众并侵犯肖像权。

⚖️ 主播需申请直播资质,若使用AI工具改变面部形象将构成违规。

📢 用户可通过投诉功能举报违规行为,平台将及时处理。

4、字节跳动开源Multi-SWE-bench,推动大模型代码智能升级

字节跳动豆包大模型团队最近开源了Multi-SWE-bench,这是首个多语言代码修复基准数据集,旨在提升大模型在自动修Bug能力方面的评估。相较于以往的SWE-bench,Multi-SWE-bench不仅覆盖了Python,还新增了Java、TypeScript等六种语言,构建了1632个真实任务,并引入了难度分级机制。

【AiBase提要:】

🛠️ Multi-SWE-bench是首个多语言代码修复基准数据集,覆盖7种主流编程语言。

📊 数据集包含1632个真实任务,经过严格筛选和人工验证,确保质量可靠。

🤖 实验显示大语言模型在Python修复上表现尚可,但在其他语言的修复率低于10%。

5、京东零售推出首个自研十亿级时序大模型TimeHF 可预测商品销量

京东零售技术团队成功推出了自研的十亿级销量预测时序大模型TimeHF,该模型通过人类反馈的强化学习技术实现了销量预测的显著提升,准确度提高了10%以上。TimeHF在京东的自动化补货场景中表现卓越,并在多个公开数据集上超越了行业水平,成为时序预测的新标杆。

image.png

【AiBase提要:】

🛠️ TimeHF模型基于人类反馈的强化学习技术,预测准确度提升10%以上,显著降低需求预测不确定性。

📊 京东团队整合了15亿样本的高质量数据集,构建了前所未有的复杂数据集,为模型训练奠定了基础。

🚀 TimeHF在多个公开数据集上取得了SOTA效果,展现出更强的零样本性能和预测准确性,已在京东供应链系统中应用。

6、Google Firebase Studio横空出世:AI驱动的一站式开发平台震撼亮相

谷歌新推出的Firebase Studio是一款集成多种开发工具的云端开发平台,旨在通过AI技术简化开发流程。它提供了一站式开发体验,支持从创意到部署的全流程解决方案,尤其在移动开发领域表现突出。虽然目前处于预览阶段,但其强大的功能和免费试用政策使得开发者能够更轻松地进行项目开发,预示着未来编程生态的变革。

image.png

【AiBase提要:】

🛠️ Firebase Studio整合了多种开发工具,提供一站式开发体验,支持快速构建应用程序。

🌐 该平台内置手机模拟器,允许开发者在云端直接调试iOS和Android应用,提升了移动开发效率。

🔍 目前处于预览阶段,功能稳定性尚需提升,未来需平衡免费与付费服务的差异。

详情链接:https://top.aibase.com/tool/firebase-studio

7、从文本到复杂角色:最强SVG生成大模型OmniSVG出现了!

OmniSVG的发布标志着SVG生成技术的重大突破,结合了先进的视觉-语言模型和创新的SVG标记化器,极大提升了生成效率和质量。该模型不仅支持从文本和图像生成SVG,还能生成复杂的动漫角色,展现出极高的灵活性和质量。OmniSVG的出现为图形设计和网页开发领域带来了新的可能性,促进了AIGC社区的发展。

【AiBase提要:】

🌟 OmniSVG是由StepFun与复旦大学联合开发的先进SVG生成模型,具备卓越的多模态生成能力。

📊 新发布的MMSVG-2M数据集包含200万个SVG资源,并提供标准化评估协议,推动SVG生成技术发展。

🚀 OmniSVG生成的SVG不仅视觉效果出色,还具备可编辑性,适用于专业设计工作流程。

详情链接:https://omnisvg.github.io

8、谷歌开源智能体开发套件:ADK震撼发布,引领AI代理开发新浪潮

谷歌在2025年4月9日发布的Agent Development Kit(ADK)标志着AI智能体开发的重大进步。作为一款开源框架,ADK旨在简化多智能体系统的构建与管理,支持灵活的开发和部署。其模块化设计和多模态交互功能使开发者能够以更自然的方式创建智能体,同时与谷歌云服务的深度整合提升了企业级应用的效率。

QQ20250410-092009.png

【AiBase提要:】

🚀 ADK是谷歌推出的开源智能体开发框架,旨在简化多智能体系统的构建与管理。

🎤 支持多模态交互,具备双向音频和视频流功能,提升智能体的自然对话能力。

🌐 与谷歌云服务深度整合,支持快速原型设计和无缝部署,降低了技术门槛。

9、Veo2重磅登陆Gemini API:AI视频生成革命正式启航

谷歌旗下的Veo2视频生成模型通过Gemini API向开发者开放,标志着AI视频生成技术的新阶段。该模型以高保真视频生成和精准响应复杂指令而闻名,支持文本到视频和图像到视频的生成。开发者可灵活集成该API,探索商业与创意的广泛可能性。然而,内容真实性与版权归属的讨论也随之而来,谷歌在生成视频中嵌入了水印以降低误用风险。

【AiBase提要:】

🎥 Veo2通过Gemini API开放,支持文本到视频和图像到视频生成,推动AI视频生成技术发展。

💡 开发者可通过API灵活集成Veo2,探索个性化短视频和交互式故事体验的多样化应用。

⚖️ 高真实性输出引发内容真实性与版权讨论,谷歌嵌入水印以减少误用风险。

详情链接:https://ai.google.dev/gemini-api/docs/video

10、Anthropic 推出 Claude Max 高端订阅服务,月费最高达200美元

Anthropic 公司最近推出了 Claude Max 订阅计划,旨在满足高端用户对人工智能服务的需求。该计划提供两种定价选项,分别为每月100美元和200美元,使用限制显著提高,吸引了更多用户。虽然目前没有无限制使用的方案,但公司正在积极探索其他收入渠道,包括针对教育领域的“Claude for Education”项目。

image.png

【AiBase提要:】

🌟 Claude Max 订阅计划推出,月费最高200美元,专为高端用户设计。

📈 两种定价选项,使用限制显著提高,吸引更多用户。

🎓 探索“Claude for Education”项目,关注教育领域的AI需求。

11、OminiControl Art发布:将GPT-4o的吉卜力等艺术风格提炼至FLUX模型

2025年4月9日,OminiControl Art技术的发布标志着AI艺术创作领域的一次重大突破。该技术通过OminiControl框架,将OpenAI的GPT-4o艺术风格与FLUX.1模型相结合,为用户提供了一种高效且优雅的工具,能够生成高质量的艺术图像。其设计理念强调简洁性与实用性,使得普通用户也能轻松上手,推动了AI与艺术的进一步融合。

image.png

【AiBase提要:】

🖼️ OminiControl Art结合了GPT-4o的艺术风格与FLUX.1模型,开辟了AI艺术生成的新可能性。

⚙️ OminiControl框架通过增加少量参数,实现对扩散变换器模型的灵活控制,提升了艺术创作的效率。

🌟 该技术的发布反映了AI艺术工具从功能性向艺术性与可控性转变的趋势,未来可能催生更多创意项目。

详情链接:https://top.aibase.com/tool/ominicontrol-art

12、效仿 OpenAI,谷歌 Gemini 加入 MCP 阵营,加速 AI 代理互联互通

谷歌在 OpenAI 采纳 Anthropic 的模型上下文协议(MCP)后,宣布将其 Gemini 模型和软件开发工具包(SDK)中增加对 MCP 的支持。MCP 作为开放标准,允许 AI 模型从多种数据源提取信息,促进开发者与 AI 应用之间的双向连接。此举标志着 AI 代理互联互通的加速,吸引了多个公司集成 MCP,显示出行业对开放协议的重视与合作潜力。

【AiBase提要:】

🔗 谷歌 DeepMind CEO Demis Hassabis 宣布 Gemini 模型将支持 MCP 协议,推动 AI 代理互联互通。

🛠️ MCP 允许 AI 模型从多种数据源提取信息,支持开发者构建双向连接的应用。

🌐 自 Anthropic 开源 MCP 以来,多个公司如 Block 和 Replit 已在其平台中集成该协议。

13、Gradio5.24炸裂更新:AI图像编辑媲美Photoshop,开发者福音来了!

Gradio5.24版本的发布为开源AI界面框架带来了重大的更新,尤其是全新的ImageEditor组件,使得图像编辑功能达到了专业级别。新增的缩放、平移、透明度控制和自定义图层功能,极大提升了开发者在图像处理上的灵活性与效率。

image.png

【AiBase提要:】

🖼️ ImageEditor组件引入了类似Photoshop的缩放与平移操作,提升了图像编辑的灵活性和效率。

🎨 新增的透明度控制和自定义图层功能,允许开发者在单一界面内管理多个图像元素,增强了图像处理的深度。

🚀 此次更新被视为对开发者需求的精准回应,助力他们更好地展示AI技术成果。

详情链接:https://top.aibase.com/tool/gradio

14、WordPress.com 推出全新 AI 网站构建工具,快速打造美观网页

WordPress.com最近推出了一款全新的AI驱动网站构建器,旨在为用户提供更便捷的网站创建体验。通过聊天机器人,用户可以在几分钟内生成功能齐全且外观美观的WordPress网站。虽然试用期间无需绑定信用卡,但实际使用需购买托管计划。

image.png

【AiBase提要:】

🌐 新 AI 网站构建器可在几分钟内生成完整 WordPress 网页,用户体验更便捷。

💰 注册 WordPress.com 账号后,可免费试用,需购买托管计划才能实际使用。

🛠️ 工具支持通过聊天机器人生成网站内容,适用于新创建的 WordPress 实例。

详情链接:https://wordpress.com/blog/2025/04/09/ai-website-builder/

举报

  • 相关推荐
  • 真我Neo7 Turbo定档:将于5月29日发布

    真我realme宣布将于5月29日14:00发布新机Neo7 Turbo,主打2500元价位段最强性能。该机将搭载联发科天玑9400e旗舰芯片,性能超越骁龙8s Gen4,采用台积电4nm工艺。配备1.5K直屏、不低于7000mAh大电池及100W快充。特别推出透明版设计,在国内市场较为罕见。realme副总裁徐起透露,新机将挑战同价位段性能标杆,预计会吸引追求个性化的消费者关注。

  • 真我Neo7 Turbo面升杯 将于5月29日发布

    据徐起介绍,真我Neo7Turbo在性能配置上实现了全面升级。从其公布的核心配置对比图来看,相较于Neo7,Neo7Turbo在性能、电池、快充、屏幕以及护眼等多方面均有显著提升。 性能方面,真我Neo7Turbo搭载了联发科天玑9400e旗舰芯片,为手机提供了强劲的动力支持。屏幕方面,该机正面配备了一块144Hz高刷电竞直屏,拥有1.3mm超窄边框,不仅视觉效果出色,还能带来流畅的操作体验�

  • AI日报:QQ浏览器升级为AI浏览器;OpenAI全新编程智能体Codex;B站团队推动漫视频生成模型AniSora

    本文介绍了AI领域多项最新进展:1)B站团队推出开源动漫视频生成模型AniSora,支持多种风格创作;2)OpenAI发布编程智能体Codex,提升开发效率;3)Google测试AI问答功能AI Mode;4)ChatGPT将整合MCP协议,支持第三方AI服务对接;5)阿里推出ZeroSearch框架,减少对搜索引擎的依赖;6)Stability AI与Arm合作推出手机端音频生成AI;7)Qwen发布WorldPM系列大模型;8)GPT-5将整合多款产品功能;9)ListenHub上线AI播客生成工具;10)QQ浏览器升级为AI浏览器;11)数学建模AI助手MathModelAgent面世;12)GenSpark推出全球首个智能下载代理;13)谷歌NotebookLM将推出视频摘要功能。这些创新展现了AI技术在各领域的快速发展和广泛应用。

  • AI日报:昆仑万维天工超级智能体发布;OpenAI核心API支持MCP;百度飞桨PaddleOCR 3.0开源

    【AI日报】汇总了近期AI领域重要动态:1)百度飞桨发布PaddleOCR3.0,提升文字识别精度13%;2)昆仑万维发布天工超级智能体,AI办公成本仅为OpenAI的40%;3)OpenAI API新增MCP支持简化开发流程;4)xAI推出实时网页搜索API;5)谷歌Sparkify可将问题秒变动画;6)Mistral发布高效代码模型Devstral;7)Video Ocean推出4K视频生成工具;8)谷歌推出AI内容识别工具SynthID;9)谷歌NotebookLM使用量半年增长56%;10)硅基流动升级128K长文本模型;11)DeepMind发布音乐生成模型Lyria2;12)多模态大模型MMaDA实现跨模态推理;13)微软发布网页智能体Magentic-UI;14)Framer推出AI建站套件。

  • AI日报谷歌推最强AI全家桶Google AI Ultra;腾讯混元宣布模型矩阵面升级;豆包·语音播客模型发布

    本文汇总了近期AI领域的重要动态:1)谷歌推出249.99美元/月的AI Ultra订阅计划,提供最强AI模型和高级功能;2)腾讯混元模型升级,新增视觉推理T1-Vision和语音对话模型;3)美图获阿里2.5亿美元投资,将在电商和AI领域合作;4)豆包推出语音播客模型,实现文本快速转音频;5)百度文心X1 Turbo获信通院最高评级;6)谷歌发布Flow AI剪辑工具,集成Veo3等三大模型;7)谷歌Veo3支持4K视频生成;8)Imagen4图像模型发布;9)Gemini2.5 Pro新增并行推理功能;10)谷歌推出虚拟试衣工具;11)公测AI编程助手Jules;12)苹果计划在iOS19开放AI模型;13)京东云推五大免费AI营销工具;14)字节开源多模态模型BAGEL;15)英伟达发布物理推理模型Cosmos-Reason1。

  • 极光受邀出席2025中国数谷·西湖论剑大会——AI智能体应用与安治理论坛

    5月10日,2025中国数谷·西湖论剑大会在杭州举行,主题为"数智无界 安全共生"。极光(Aurora Mobile)作为AI领域创新代表受邀参会。极光副总裁殷浩在"AI智能体应用与安全治理论坛"上分享观点,指出市场需要直达需求的智能体解决方案,而非工具本身。极光通过GPTBots.ai低代码平台已服务超5万客户,显著提升开发效率。殷浩提出未来3-5年三大发展方向:企业应用向高度定制化转型、软硬件深度融合、基于国产大模型的私有化部署方案。现场还展示了极光在客服、金融投资、教育辅助等场景的AI应用成果,如海外电商自动客服系统解决率达80%。极光强调在技术普惠的同时,将重点关注数据安全问题,通过私有化部署方案保护企业数据隐私。

  • AI日报:昆仑万维天工超级智能体APP上线;谷歌重磅发布三大Gemma模型变体;字节推出开源多模态模型BAGE

    本文介绍了AI领域最新动态:1)昆仑万维推出全球首款AI+Agent架构的Office智能体应用;2)研究显示ChatGPT能提升K12学生成绩近87%;3)谷歌视频生成工具Veo3扩展至更多地区;4)谷歌发布三款Gemma模型变体,覆盖医疗、手语翻译和海豚语言研究;5)VideoTutor实现一句话生成定制教学视频;6)字节跳动开源多模态模型BAGEL;7)Rork支持无代码开发iOS/Android应用;8)AingDesk降低AI助手开发门槛;9)Claude4登陆亚马逊Bedrock平台;10)Youware通过MCP协议提升网页生成能力。这些创新展示了AI技术在各领域的快速发展和应用潜力。

  • AI日报:阿里开源长文本深度思考模型QwenLong-L1;GPT-4o语音模式上线唱歌功能;秘塔AI搜索推出全新“极速”模型

    本文汇总了AI领域最新动态:1)中国信通院发布智能体开发标准,推动AI商业化进程;2)阿里推出QwenLong-L1-32B长文本推理模型,性能媲美Claude-3;3)GPT-4o语音模式升级,新增唱歌功能;4)秘塔AI搜索推出极速模型,响应速度达400tokens/秒;5)谷歌发布LMEval评估框架,统一大模型评测标准;6)Chrome浏览器集成Gemini AI助手;7)阿联酋全民免费使用ChatGPT Plus;8)苏州成立60亿元AI产业基金;9)法国Kyutai实验室推出10秒定制语音的Unmute系统;10)UAV-Flow项目实现无人机语音精准控制;11)Claude将升级支持百万字上下文和记忆功能;12)百度心响iOS版上线;13)夸克推出高考深度搜索功能;14)Chrome v137开发者工具升级;15)美团AI业务接近GPT-4o水平;16)Direct3D-S2实现3D生成速度提升10倍;17)OpenAI计划2026年推出首款AI硬件。

  • AI日报:Anthropic最强编码AI模型Claude4;苹果计划AI智能眼镜;QQ浏览器上线首个高考Agent

    【AI日报】今日AI领域重要动态:1)Anthropic发布Claude4系列AI模型,编程能力超越竞争对手;2)苹果计划2026年推出集成AI技术的智能眼镜;3)字节跳动与清华合作推出时序多模态大模型ChatTS;4)3DTown框架实现单张照片生成逼真3D场景;5)OpenAI秘密开发无屏幕AI设备;6)商汤科技推出儿童AI下棋机器人;7)微软记事本新增AI写作功能;8)深圳设立70亿元基金支持AI硬件初创企业;9)谷歌发布3D视频通信平台Beam;10)阿联酋推出"星际之门"计划,免费提供ChatGPT服务;11)法国Mistral推出开源模型Devstral;12)Anthropic API新增四大功能;13)美国众议院通过法案限制各州监管AI;14)QQ浏览器推出高考AI助手。

  • 谷歌推250 美元的 AI Ultra 套餐,重新定义“高端”

    谷歌或许想把 AI Ultra 打造成一个精英创作者工具包,但它也可能正在重新定义“高端”:只是贵而已……