首页 > AI头条  > 正文

AI日报:腾讯语音数字人模型HunyuanVideo-Avatar;Trae国际版开启付费订阅模式;Claude网页搜索功能全面开放

2025-05-28 16:31 · 来源: AIbase基地

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解:https://top.aibase.com/

1:腾讯混元开源语音数字人模型 HunyuanVideo - Avatar: 图 + 音频,让图中的主角说话唱

腾讯发布的 HunyuanVideo-Avatar 模型可依据人物图像与音频生成自然数字人视频,适用于短视频创作、电商广告等领域,支持多种风格场景。

【AiBase 提要】

💻 创新性依据图像音频生成自然数字人视频,处于业内顶尖水平。

📱 适用于短视频创作、电商广告等多领域,降低视频制作时间和成本。

🎨 支持多种风格物种多人场景,精准驱动角色与音频完美同步。

体验入口:https://hunyuan.tencent.com/modelSquare/home/play?modelId=126

2:Trae 国际版开启付费订阅模式,首月 Pro 订阅仅3美元,Claude4加持

Trae 推出付费订阅,首月 Pro 订阅3美元,后续每月10美元或年付每月7.5美元,支持支付宝支付,提升服务稳定性并增强代码生成等能力。

image.png

【AiBase 提要】

💰 推出付费订阅模式,首月仅3美元,性价比高。

🚀 支持 Claude4和 Gemini2.5Pro 等先进 AI 模型,优化 AI 上下文理解能力。

🏆 基于 VS Code 架构,支持无缝迁移插件和设置,多语言且界面直观。

3:Claude 网页搜索功能全面开放,免费用户可享实时信息

Anthropic 宣布 Claude 网页搜索功能向免费用户开放,可获取实时网络信息并提供内联引用,提升信息查询能力。

【AiBase 提要】

🌐 Claude 网页搜索功能免费开放,用户可获取实时网络信息。

📚 适用于多种场景,如销售分析、文献检索、产品比较等。

🔒 通过 Brave Search 提供结果,确保引用透明可靠。

4:印度程序员冒充 AI 的初创公司 Builder.ai 破产,损失超5亿美元

Builder.ai 因财务问题破产,烧光超5亿美元投资,背负巨额债务,其声称的 AI 开发实际依赖大量低成本程序员。

【AiBase 提要】

⚠️ Builder.ai 宣布破产,曾获微软等巨头支持,烧光超5亿美元。

✗ 实际操作依赖大量人力,未实现 AI 驱动开发,开发工具效率低下。

📢 事件引发对 AI 在软件开发中真实应用的反思。

5:腾讯元宝再进化 :AI 直通微信读书、起点读书平台

腾讯元宝实现与微信读书、起点读书无缝连接,用户可直接跳转阅读,提升获取和阅读体验。

3e3e102cgy1i1uypjzrvgj20zu25odwf.jpg

【AiBase 提要】

💡 腾讯元宝与微信读书、起点读书无缝连接,便捷搜索跳转。

📚 推荐优质书籍,支持一键跳转,免去额外查找步骤。

💡 推动 AI 应用与内容生态融合,向多模态、可行动 AI 助手演化。

6:快手 CFO:预计加大 AI 开发支出将影响利润率

内容总结:快手计划加大 AI 投资,虽可灵 AI 收入增长,但 AI 支出预计将导致集团整体利润率下降约1% 至2%。

【AiBase 提要】

📈 快手加大 AI 开发支出,旨在提升工具变现能力。

💰 可灵 AI 第一季度收入超1.5亿元,总收入同比增长11%。

⚠️ AI 投资对利润增长造成压力,需平衡投资与盈利。

7:Mistral 推出全新 Agents API:助力开发者构建智能 AI 代理

Mistral 推出 Agents API,集成代码执行、图像生成等功能,支持代理协作,适用于多领域提升工作效率。

image.png

【AiBase 提要】

🤖 Agents API 推出,简化 AI 代理创建,集成多种功能。

🎨 支持代码执行、图像生成、实时搜索和持久记忆。

🏆 适用于软件开发、项目管理、财务分析等多个领域。

官方博客:https://mistral.ai/news/agents-api

8:Claude 移动端语音对话功能测试版上线,支持日程查询与文档搜索

Claude 推出移动端语音对话测试版,支持通过语音指令查询日程、搜索文档等操作,提升移动端生产力。

【AiBase 提要】

📱 Claude 移动端语音对话功能上线,支持多种操作。

💬 采用 “push-to-talk” 机制,暂不支持实时打断。

📚 支持网页搜索和文件上传,免费用户也将逐步获得该功能。

9:报道称 OpenAI 计划推出 “使用 ChatGPT 登录” 第三方应用功能

OpenAI 探索使用 ChatGPT 账号登录第三方应用,已推出开发者预览,旨在与科技巨头竞争拓展业务。

【AiBase 提要】

🤖 OpenAI 计划推出 “使用 ChatGPT 登录” 功能,拓展业务。

📋 征集开发者兴趣,要求说明应用用户基础等信息。

🏆 帮助 OpenAI 与其他科技巨头竞争,增加用户粘性。

10:掘金发布 MCP,AI 生成前端项目一键部署

掘金推出 MCP 功能,开发者可一键将 AI 生成的前端项目部署至掘金平台,简化流程并节省服务器成本。

image.png

【AiBase 提要】

💻 掘金发布 MCP,实现 AI 生成前端项目一键部署。

🚀 通过简单 Token 配置,一行命令完成项目部署。

📚 提供免费存储空间,支持项目审核,增强社区生态。

11:多模态大模型视觉推理能力评估:o3仅得25.8% 分数  

近日发布的 RBench-V 基准测试显示,多模态大模型在视觉推理能力上表现不足,准确率远低于人类专家。

image.png

【AiBase 提要:】  

🔍 RBench-V 基准测试评估多模态模型视觉推理能力。  

📉 o3模型准确率仅25.8%,低于人类82.3%。  

🧩 当前模型缺乏深层理解,需改进推理方式。  

[项目主页](https://evalmodels.github.io/rbenchv/)

12:中国石油发布3000亿参数昆仑大模型,助力智能化油气全产业链  

中国石油在北京发布3000亿参数的昆仑大模型,推动油气全产业链的智能化进程,标志着 AI 技术的重大进展。

【AiBase 提要:】  

🌟 昆仑大模型参数显著提升,语言、视觉、多模态领域均有进展。  

🔍 应用于油气勘探、炼油化工及销售等多个环节。  

💡 中国石油与多家企业合作,加速数字化转型进程。

  • 相关推荐
  • AI日报:百度发布“绘想”平台与MuseSteamer;阿里音频驱动全身数字人模型OmniAvatar

    【AI日报】今日AI领域重要动态:1.开源语音大模型Step-Audio-AQAA发布,实现音频到语音的端到端自然转换;2.百度推出"绘想"平台与MuseSteamer,通过AI一键生成专业级视频;3.浙大与阿里联合发布OmniAvatar,音频驱动数字人技术取得突破;4.百度搜索迎十年来最大改版,新增智能框、百看和AI助手功能;5.xAI开发者控制台新增Grok4及Grok4Code引用,预示新一代AI模型即将发布;6.Gemin

  • AI日报:字节将发布AI编程工具TRAE2.0版本;Mistral重磅推出音频模型Voxtral;月之暗面回应Kimi K2 API速度慢

    AI日报栏目聚焦AI领域最新动态:1)字节跳动将发布TRAE 2.0编程工具,新增语音交互功能;2)Mistral推出开源音频模型Voxtral,支持多语言;3)月之暗面回应Kimi K2API速度慢问题,正在优化系统;4)昆仑万维发布AgentOrchestra框架,实现多智能体协作;5)OpenAI前CTO创立的Thinking Machines Lab获20亿美元融资;6)Kimi-2上线,性能超越GPT-4.1;7)TRAE推出Kimi-K2模型服务,国际版支持Grok-4;8)字节跳动Seed�

  • AI日报:智谱上线PPT生成功能AI Slides;可灵 AI 发布可图2.1模型

    本文介绍了AI日报栏目及近期AI领域多项突破性进展:1)智谱推出免费AI Slides工具,基于GLM模型快速生成高质量PPT;2)可灵AI发布可图2.1模型,支持180多种风格图像生成;3)NVIDIA推出DiffusionRenderer技术,实现视频到可编辑3D场景转换;4)墨刀AI新增30秒生成高保真原型功能;5)Higgsfield推出Soul ID工具,10张照片即可生成虚拟形象;6)谷歌DeepMind开源GenAI Processors工具库;7)谷歌Veo新增图像转视频功能;8)Mistral AI发布专为代码建模的Devstral2507系列模型。这些创新展示了AI在内容生成、3D建模、产品设计等领域的快速发展。

  • AI日报:12306 MCP Server上线;百度推AI搜索助手Tizzy.ai;ChatGPT录音模式面向Plus用户开放

    【AI日报】今日AI领域重要动态:1)百度推出无广告智能搜索助手Tizzy.ai,整合影视资源与深度思考功能;2)12306开源火车票查询引擎上线,采用FastAPI架构实现秒级响应;3)ChatGPT向Plus用户全面开放录音功能,支持实时记录与内容总结;4)开源SaaS模板FireGEO助力快速构建现代化Web应用;5)国产工具ReadMeX可一键生成高质量GitHub文档;6)百度AI助手新增视频通话功能,支持方言识别;7)Jacky

  • 腾讯重磅升级!《英雄联盟》8月14日起全面开放微信登录功能

    据《英雄联盟》官网介绍,《英雄联盟》预期在15.16版本(8月14日)更新后全面开放微信登录功能,微信账号无需再绑定QQ账号,即可申请《英雄联盟》游戏账号。 同时,微信账号和QQ账号可分别申请2个不同的《英雄联盟》游戏账号。 微信账号的权益等同QQ账号权益,可以独立申请游戏账号,参与游戏活动,进行点券充值消费,以微信账号进行客服咨询等。

  • A日报:Stability AI发布实时重建模型SPAR3D;火山引擎“奇美拉”数字人平台启动封测;京东重磅开源JoyAgent-JDGenie

    AI日报栏目精选了人工智能领域最新动态:1)Stability AI推出0.7秒单图3D重建模型SPAR3D;2)GitHub热门开源AI协作框架CrewAI获3.4万星;3)马斯克发布儿童AI聊天机器人Baby Grok引发安全争议;4)ComfyUI-C opilot工具简化AI工作流创建;5)CNNIC报告显示我国346款生成式AI完成备案;6)提示词管理工具AI Gist上线;7)开源语言学习工具WordPecker支持多语言学习;8)斯坦福推出多工具协作AI Agent OctoTools;9)Ope

  • 闪剪AI有多香?定制数字人+方言语音克隆+智能成片,这功能真的太懂小白了

    文章介绍了"闪剪AI"这款智能视频生成工具如何帮助实体商家解决线上获客难题。该工具具有三大核心功能:1)30秒视频即可1:1复制用户形象和声音的数字人功能;2)自动生成符合本地化需求的实体店营销文案;3)智能成片功能,无需剪辑就能制作高质量短视频。此外还支持多方言配音、直播切片等特色功能,大幅降低内容创作门槛。作者作为技术小白亲身验证,该工�

  • 腾讯云自研操作系统TencentOS与中国金融认证中心达成合作,全面支持安全启动

    腾讯云操作系统TencentOS Server V4全面支持安全启动(Secure Boot)功能,通过与微软和中国金融认证中心(CFCA)合作,实现双轨并行的安全启动方案。该系统不仅获得微软签名认证,还基于CFCA国产根证书体系完成适配,构建从固件到操作系统的完整信任链。TencentOS团队严格遵循安全规范,对密钥实施严格保护,确保系统启动各环节安全验证,有效防御底层恶意软件攻击。该方案支持"开箱即用",无需额外配置即可在主流服务器和虚拟化平台运行,大幅提升部署效率与安全防护水平。

  • A日报:Kimi开放平台上线Kimi Playground;OpenAI重磅发布ChatGPT Agent;Suno推人声替换功能

    【AI日报】汇总了近期AI领域重要进展:1)月之暗面推出Kimi Playground平台,实现从对话助手到智能助理的转变;2)OpenAI发布ChatGPT Agent,支持自主执行浏览、购物等任务;3)Suno发布v4.5+版本,新增人声替换等音乐创作功能;4)谷歌Veo3视频生成模型上线,支持文本转视频;5)全球首个直播流扩散模型MirageLSD发布,实现实时视频转换;6)VSCode编程助手Traycer提升大型代码库处理效率;7)ART框架支持Python一键训练AI Agent;8)NVIDIA语音识别模型Canary-Qwen-2.5B词错率创新低;9)Mistral AI推出Le Chat挑战ChatGPT;10)百度小度上线首个支持物理交互的MCP Server;11)Lightricks的LTXV模型实现60秒高质量视频生成;12)开源模型LTX-Video13B支持30倍速高清视频生成。

  • 字节跳动TRAE2.0真的好用吗?同类型AI产品上哪找?

    字节跳动TRAE2.0 AI编程工具升级亮点:1)新增语音交互功能,支持中英文混合输入,实现"说话写代码";2)Builder模式迭代后项目生成成功率提升至92%,复杂需求可一次性跑通;3)免费版每月100次调用额度,支持GPT-4o和Claude-3.5模型;4)五大隐藏技巧:语音调试、图片生成代码、API批量测试等可提升300%效率;5)针对中文开发者优化,支持阿里云/腾讯云SDK调用。实测3分钟

今日大家都在搜的词: