首页 > 原创 > 关键词  > AI最新资讯  > 正文

AI日报:腾讯推音效生成工具AudioGenie;阿里推智能体WebWatcher;我国首个法律垂直大模型“小包公”发布

2025-08-18 15:48 · 稿源:站长之家

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解https://top.aibase.com/

1、腾讯AudioGenie横空出世!一键生成电影级音效,Claude与Gemini瑟瑟发抖!

腾讯AudioGenie凭借其强大的多模态音频生成能力和创新的无训练框架,正在重新定义AI音频生成的标准。面对国际巨头的竞争,AudioGenie展现了中国AI技术的硬核实力。

【AiBase提要:】

🎥 支持视频、文本和图像等多种模态输入,生成音效、语音、音乐等音频输出。

⚙️ 采用无训练多智能体框架,通过双层架构实现高效协同与自我纠错。

📈 在MA-Bench基准测试中表现优异,挑战Claude与Gemini的市场地位。

详情链接:https://audiogenie.github.io/

2、阿里推出多模态深度研究智能体WebWatcher

阿里巴巴自然语言处理团队推出了开源多模态深度研究智能体WebWatcher,旨在突破现有闭源系统和开源Agent在多模态深度研究领域的局限性。通过整合网页浏览、图像搜索、代码解释器和内部OCR等多种工具,WebWatcher能够像人类研究员一样处理复杂的多模态任务。

image.png

【AiBase提要:】

🌍 WebWatcher是一个开源的多模态深度研究智能体,能够处理复杂的多模态任务。

🧠 通过整合多种工具,如网页浏览、图像搜索等,实现强大的视觉理解与逻辑推理能力。

🚀 在多个评测中,WebWatcher的表现显著优于其他主流模型,展示了其卓越的能力。

详情链接:https://github.com/Alibaba-NLP/WebAgent

3、港大、哈工大、浙大联合推出可解耦 3D 模型技术OmniPart,重塑创意设计

港大、哈工大、浙大联合推出的OmniPart技术,为3D建模领域带来了重要突破,能够实现3D模型部件的独立性和结构清晰性,显著提升了3D建模的精确度和灵活性,适用于游戏开发、动画制作等多个创意领域。

image.png

【AiBase提要:】

🧠 OmniPart 技术实现了3D模型部件的独立性,使得创意设计更加灵活。

🔍 采用自回归模型与部件掩码的两阶段生成框架,提升3D建模的精确度。

🚀 创新机制如体素丢弃,增强了模型在复杂场景中的应用效果。

详情链接:https://omnipart.github.io/

4、Meta 发布 DINOv3,无需标注数据的通用图像处理 AI 新模型

Meta 推出的 DINOv3 是一种无需标注数据的通用图像处理 AI 模型,基于 17 亿张图像进行自监督学习训练,拥有 70 亿个参数。该模型在多个图像任务和领域中表现出色,尤其适用于卫星图像处理等专业领域。

image.png

【AiBase提要:】

🧠 DINOv3 基于 17 亿张图像进行自监督学习训练,无需标注数据。

🚀 拥有 70 亿个参数,可处理多种图像任务和领域,性能优于上一代模型 DINOv2。

🌐 Meta 在 GitHub 上开放了多个预训练模型变体及代码,允许商业使用。

详情链接:https://github.com/facebookresearch/dinov3

5、我国首个法律垂直大模型“小包公”发布:能溯源、可验证

我国首个法律垂直大模型“小包公”正式发布,标志着法律人工智能从学术探索迈向规模化应用。该模型通过整合大量法律数据和先进技术,提供可溯源、可验证的法律依据,有助于缓解法律服务资源分布不均的问题,并在多个重点领域展现示范效应。

【AiBase提要:】

⚖️ 我国首个法律领域垂直大模型“小包公”发布,标志着法律人工智能进入规模化应用阶段。

🔍 “小包公”整合了2亿份裁判文书和420余万部法律法规,具备精准排除“外行概念”的能力。

💡 法律AI有望缓解法律服务资源分布不均问题,推动行政复议、检察监督等领域的数字化和普惠化。

6、ChatGPT移动端收入突破20亿美元,碾压竞争对手创造30倍收入差距

ChatGPT移动应用在全球市场取得了惊人的收入表现,远超其他竞争对手。其收入增长迅速,用户下载量和消费水平均显著领先,显示出其在AI助手领域的主导地位。

【AiBase提要:】

(ChatGPT移动端应用收入达到20亿美元,是竞争对手总和的30倍)

(ChatGPT月收入增长高达673%,远超其他聊天机器人)

(ChatGPT全球下载量达6.9亿次,是Grok的17倍)

7、安卓手机集体抄作业灵动岛,新芯片算力翻倍推动AI功能全面爆发

文章指出,安卓厂商在系统设计上纷纷借鉴苹果的灵动岛交互方式,并结合自身特色进行优化。同时,新一代芯片算力提升为AI功能普及提供了硬件支持,各厂商在系统中集成AI功能,实现更智能的服务体验。

image.png

【AiBase提要:】

✨ 各安卓厂商推出类似苹果灵动岛的交互设计,提升用户体验。

⚡ 新一代芯片算力翻倍,为AI功能普及奠定基础。

🤖 厂商全量集成AI功能,提供一键订票、行程规划等智能服务。

8、欧洲AI创企发布鸡脑和蝇脑模型,94MB超小AI可离线运行苹果手表

欧洲AI初创公司Multiverse Computing发布了两款极小的AI模型,分别命名为SuperFly和ChickBrain。这些模型体积小巧,可以在物联网设备、智能手机、平板电脑和个人电脑上本地运行,无需互联网连接。它们在性能方面表现优异,甚至在一些基准测试中超越了原始模型。

【AiBase提要:】

✨ Multiverse Computing推出了两款超小型AI模型,适用于各种设备并支持本地运行。

🧠 SuperFly和ChickBrain模型分别以蝇脑和鸡脑命名,具备强大的功能和推理能力。

💰 公司通过融资1.89亿欧元进一步推动其量子启发的压缩技术发展,并与多家大公司合作。

9、Claude Code重大更新!新增编程导师模式,初学者也能享受一对一代码指导

Anthropic推出了Claude Code的重要功能更新,新增了针对编程初学者的个性化沟通风格设置。用户可以通过命令自定义交流方式,包括解释型和学习型两种风格,以满足不同学习需求。

【AiBase提要:】

🧠 解释型风格专注于深度教学,帮助开发者理解代码背后的原理。

👩‍🏫 学习型风格采用互动教学方式,提升用户的动手能力和独立解决问题技能。

🌐 新增的编程导师模式让初学者也能享受一对一代码指导,降低学习门槛。

10、AI技术被滥用成“退款神器”,商家无奈:假图太逼真,有苦说不出

文章指出,电商平台出现利用AI伪造商品损坏图片进行恶意退款的现象,严重损害了商家的利益。法律专家认为该行为涉嫌违法,呼吁加强监管和技术创新以应对这一问题。

image.png

【AiBase提要:】

🤖 AI工具被用于伪造商品损坏图片,骗取退款。

⚖️ 恶意退款行为可能构成民事欺诈或刑事诈骗。

🔒 商家需优化售后流程并保留证据以维护自身权益。

11、IDC报告:2024年中国AI公有云服务市场规模激增,阿里云蝉联中国市场第一

IDC报告显示,2024年中国AI公有云服务市场快速增长,主要得益于生成式AI应用的扩展和机器学习需求的上升。计算机视觉、对话式AI和自然语言处理等细分市场表现亮眼,同时技术提供商需关注AI治理和云架构优化以适应智能化时代的需求。

image.png

【AiBase提要:】

🧠 2024年中国AI公有云服务市场规模预计达到195.9亿元,同比增长55.3%。

🖼️ 计算机视觉和对话式AI市场表现突出,分别达到81.0亿元和20.9亿元。

🛠️ 技术提供商需重构云服务架构,加强AI治理以确保透明度与合规性。

举报

  • 相关推荐
  • 全球首个!OpenAI将推“AI版抖音”:禁止上传实拍内容 视频100%由AI生成

    国庆假期前夕,OpenAI发布了Sora 2,一款旗舰视频和音频生成模型。 据介绍,Sora 2可以完成以前的视频生成模型难以完成的事情,比如运动员的奥林匹克体动作、桨板上的后空翻,准确模拟浮力和刚度的动态等等,并擅长现实主义、电影和动漫风格。 一则来自《连线》杂志的重磅爆料更是指出,OpenAI的下一步棋,并非简单升级一个模型,而是要亲自下场,推出一个独立的AI影�

  • Reviews.ai 依托 DigitalOcean 高效实现 AI 业务扩展

    Reviews.ai是一个消费者反馈聚合平台,帮助品牌将客户评论转化为可执行的洞察。该平台专注于评论分析,通过AI驱动功能(如按需报告、主题分类和智能代理)提升产品与服务。近期从Review Monitor更名后,团队迁移至DigitalOcean云平台,解决了原有专用服务器架构的扩展瓶颈。迁移过程在合作伙伴Aquazeel支持下高效完成,仅用数周,成本降低近30%。新架构采用Droplets、托管数据库和负载均衡器,支持灵活扩展。未来计划利用GPU Droplets增强AI能力,进一步优化大型语言模型处理效率。

  • AI日报:腾讯重磅发布混元图像3.0;快手发布KAT系列Agentic Coding大模型;苹果悄然研发ChatGPT式应用

    快手发布KAT系列代码大模型,腾讯推出“混元图像3.0”实现多模态突破,苹果研发类ChatGPT应用升级Siri,谷歌更新Gemini 2.5 Flash Lite提升效率。苹果还推出Manzano图像模型,YouTube Music测试AI音乐主播功能,VideoFrom3D框架简化3D视频生成,Moondream 3.0在多项基准测试中超越GPT-5等顶尖模型,展现强大性能。

  • AI排名查询工具如何助力GEO优化?生成引擎优化中的关键词竞争力分析

    在AI搜索时代,传统SEO正被生成引擎优化(GEO)重塑。内容能否被AI“理解”并引用成为流量关键,而GEO策略需依赖专门的AI排名查询工具。文章指出,AI助手直接生成摘要而非链接列表,评估维度与SEO完全不同,需关注语义相关性、权威性和结构化程度。AIBase平台的GEO排名查询工具能模拟主流AI提问,检测内容曝光频率与上下文位置,支持竞品对比和中文场景优化。优化建议包�

  • 腾讯应用宝与高通(中国)基于骁龙平台共推端侧AI能力 发布AI智能启动台

    在2025骁龙峰会期间,腾讯应用宝与高通(中国)宣布合作,聚焦移动应用跨端引擎技术与端侧AI应用创新。双方推出针对搭载骁龙X系列计算平台的定制化解决方案,包括升级的跨端引擎和基于端侧AI能力的智能启动台,提升PC内容体验与生产力工具效率。跨端引擎实现安卓应用原生运行、续航超9小时、虚拟机启动仅5.5秒等性能突破,覆盖超1000款热门应用。智能启动台通过文件主题分类、本地搜索和AI服务(如发票助手)重构PC交互,降低AI调用成本并保护数据隐私。此次合作旨在完善跨端生态布局,推动端侧AI普惠化落地。

  • 腾讯云李力:坚持同源同构,为企业打造更贴近Agent的AI原生云

    9月17日,腾讯云在2025全球数字生态大会上宣布智算全面升级,推出“更贴近Agent的AI+Infra”解决方案,包括Agent+Runtime、云专家服务智能体Cloud Mate及全链路安全能力。腾讯云副总裁李力强调,“同源同构”是核心原则,确保产品服务一致性与全球化布局。方案旨在提升模型推理效率、工具集成灵活性和系统稳定性,助力AI从实验室走向生产级应用。腾讯云通过硬件多元支持、软件加速优化及智能运维服务,降低企业技术门槛,已服务国内90%大模型厂商及千行百业。

  • 既能读懂情绪,还能多模态交互!INDEMIND用空间智能重新定义陪伴机器人

    TCL与INDEMIND合作推出的陪伴机器人“Ai Me”通过空间智能技术实现突破,从传统2D感知升级为3D语义感知,赋予机器人动态语义建图、实时环境适应及多模态交互能力。该平台借助立体视觉与多传感器融合,让机器人精准构建三维地图,识别家居属性,实现主动避障与个性化服务。同时,结合低算力混合模型与情感交互功能,机器人可感知用户情绪、提供安全防护,并支持宠物看护等场景拓展,从“工具”升级为有温度的“家庭伙伴”,真正满足复杂家庭需求。

  • AI日报:Veo 3.1可生成1分钟视频;蚂蚁发布万亿参数语言模型 Ling-1T;Lovart可免费玩Sora2

    本期AI日报聚焦多项技术突破:Veo 3.1视频生成模型实现角色一致性与多场景叙事升级;蚂蚁发布万亿参数Ling-1T语言模型,推理能力领跑行业;xAI推出电影级视频生成模型Imagine v0.9;软银斥资53.75亿美元收购ABB机器人业务布局物理AI;Vercel v0新增图像编辑功能简化设计流程;OpenAI Sora2首日安装量飙升至应用商店第三,同时引发深度伪造伦理担忧;Lovart平台限时免费开放Sora2无水印视频生成;ChatGPT推出应用生态,正式升级为多功能服务平台。

  • AI日报:接入MJ!夸克发布造点AI;Wan2.5-Preview发布;可灵推最新视频生成模型可灵2.5Turbo

    近日AI领域迎来多项重要更新:阿里夸克发布AI创作平台“造点”,整合通义万相Wan2.5与Midjourney V7,支持音画同步视频生成;Wan2.5-Preview实现多模态输入与电影级视频同步生成,提升视觉创作能力;可灵AI推出视频生成模型2.5Turbo并降价30%,降低使用门槛;阿里通义推出Qwen3-ASR-Toolkit,实现小时级音视频转录;谷歌相册AI编辑功能扩展至安卓用户,支持语音修图;谷歌Mixboard工具助力创意设计,生成情绪板;Qwen发布Qwen3-Max模型,在代码生成与智能体能力表现突出;Figma推出MCP服务器,实现设计到代码的一键转换,提升开发效率。

  • AI排名监控工具实战必备:掌握GEO优化效果,提升品牌AI搜索排名

    随着AI大模型和智能搜索的快速发展,用户搜索习惯正从传统搜索引擎转向直接向AI平台提问。品牌能否被AI“推荐”已成为新的竞争力。AIBase推出的GEO排名查询工具,专为监测品牌在AI对话中的曝光率、推荐次数及呈现方式而设计。它支持多平台同步检测,提供可视化数据分析和历史记录对比,帮助团队优化AI搜索排名。该工具不仅统计曝光量,还能还原AI对话细节,为品牌形象提升提供数据支持,是布局AI流量的重要利器。

今日大家都在搜的词: