首页 > 原创 > 关键词  > 人工智能最新资讯  > 正文

AI日报:腾讯语音数字人模型HunyuanVideo-Avatar;Trae国际版开启付费订阅模式;Claude网页搜索功能全面开放

2025-05-28 16:32 · 稿源:站长之家

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解:https://top.aibase.com/

1:腾讯混元开源语音数字人模型 HunyuanVideo - Avatar: 图 + 音频,让图中的主角说话唱

腾讯发布的 HunyuanVideo-Avatar 模型可依据人物图像与音频生成自然数字人视频,适用于短视频创作、电商广告等领域,支持多种风格场景。

【AiBase 提要】

💻 创新性依据图像音频生成自然数字人视频,处于业内顶尖水平。

📱 适用于短视频创作、电商广告等多领域,降低视频制作时间和成本。

🎨 支持多种风格物种多人场景,精准驱动角色与音频完美同步。

体验入口:https://hunyuan.tencent.com/modelSquare/home/play?modelId=126

2:Trae 国际版开启付费订阅模式,首月 Pro 订阅仅3美元,Claude4加持

Trae 推出付费订阅,首月 Pro 订阅3美元,后续每月10美元或年付每月7.5美元,支持支付宝支付,提升服务稳定性并增强代码生成等能力。

image.png

【AiBase 提要】

💰 推出付费订阅模式,首月仅3美元,性价比高。

🚀 支持 Claude4和 Gemini2.5Pro 等先进 AI 模型,优化 AI 上下文理解能力。

🏆 基于 VS Code 架构,支持无缝迁移插件和设置,多语言且界面直观。

3:Claude 网页搜索功能全面开放,免费用户可享实时信息

Anthropic 宣布 Claude 网页搜索功能向免费用户开放,可获取实时网络信息并提供内联引用,提升信息查询能力。

【AiBase 提要】

🌐 Claude 网页搜索功能免费开放,用户可获取实时网络信息。

📚 适用于多种场景,如销售分析、文献检索、产品比较等。

🔒 通过 Brave Search 提供结果,确保引用透明可靠。

4:印度程序员冒充 AI 的初创公司 Builder.ai 破产,损失超5亿美元

Builder.ai 因财务问题破产,烧光超5亿美元投资,背负巨额债务,其声称的 AI 开发实际依赖大量低成本程序员。

【AiBase 提要】

⚠️ Builder.ai 宣布破产,曾获微软等巨头支持,烧光超5亿美元。

✗ 实际操作依赖大量人力,未实现 AI 驱动开发,开发工具效率低下。

📢 事件引发对 AI 在软件开发中真实应用的反思。

5:腾讯元宝再进化 :AI 直通微信读书、起点读书平台

腾讯元宝实现与微信读书、起点读书无缝连接,用户可直接跳转阅读,提升获取和阅读体验。

3e3e102cgy1i1uypjzrvgj20zu25odwf.jpg

【AiBase 提要】

💡 腾讯元宝与微信读书、起点读书无缝连接,便捷搜索跳转。

📚 推荐优质书籍,支持一键跳转,免去额外查找步骤。

💡 推动 AI 应用与内容生态融合,向多模态、可行动 AI 助手演化。

6:快手 CFO:预计加大 AI 开发支出将影响利润率

内容总结:快手计划加大 AI 投资,虽可灵 AI 收入增长,但 AI 支出预计将导致集团整体利润率下降约1% 至2%。

【AiBase 提要】

📈 快手加大 AI 开发支出,旨在提升工具变现能力。

💰 可灵 AI 第一季度收入超1.5亿元,总收入同比增长11%。

⚠️ AI 投资对利润增长造成压力,需平衡投资与盈利。

7:Mistral 推出全新 Agents API:助力开发者构建智能 AI 代理

Mistral 推出 Agents API,集成代码执行、图像生成等功能,支持代理协作,适用于多领域提升工作效率。

image.png

【AiBase 提要】

🤖 Agents API 推出,简化 AI 代理创建,集成多种功能。

🎨 支持代码执行、图像生成、实时搜索和持久记忆。

🏆 适用于软件开发、项目管理、财务分析等多个领域。

官方博客:https://mistral.ai/news/agents-api

8:Claude 移动端语音对话功能测试版上线,支持日程查询与文档搜索

Claude 推出移动端语音对话测试版,支持通过语音指令查询日程、搜索文档等操作,提升移动端生产力。

【AiBase 提要】

📱 Claude 移动端语音对话功能上线,支持多种操作。

💬 采用 “push-to-talk” 机制,暂不支持实时打断。

📚 支持网页搜索和文件上传,免费用户也将逐步获得该功能。

9:报道称 OpenAI 计划推出 “使用 ChatGPT 登录” 第三方应用功能

OpenAI 探索使用 ChatGPT 账号登录第三方应用,已推出开发者预览,旨在与科技巨头竞争拓展业务。

【AiBase 提要】

🤖 OpenAI 计划推出 “使用 ChatGPT 登录” 功能,拓展业务。

📋 征集开发者兴趣,要求说明应用用户基础等信息。

🏆 帮助 OpenAI 与其他科技巨头竞争,增加用户粘性。

10:掘金发布 MCP,AI 生成前端项目一键部署

掘金推出 MCP 功能,开发者可一键将 AI 生成的前端项目部署至掘金平台,简化流程并节省服务器成本。

image.png

【AiBase 提要】

💻 掘金发布 MCP,实现 AI 生成前端项目一键部署。

🚀 通过简单 Token 配置,一行命令完成项目部署。

📚 提供免费存储空间,支持项目审核,增强社区生态。

11:多模态大模型视觉推理能力评估:o3仅得25.8% 分数

近日发布的 RBench-V 基准测试显示,多模态大模型在视觉推理能力上表现不足,准确率远低于人类专家。

image.png

【AiBase 提要:】

🔍 RBench-V 基准测试评估多模态模型视觉推理能力。

📉 o3模型准确率仅25.8%,低于人类82.3%。

🧩 当前模型缺乏深层理解,需改进推理方式。

[项目主页](https://evalmodels.github.io/rbenchv/)

12:中国石油发布3000亿参数昆仑大模型,助力智能化油气全产业链

中国石油在北京发布3000亿参数的昆仑大模型,推动油气全产业链的智能化进程,标志着 AI 技术的重大进展。

【AiBase 提要:】

🌟 昆仑大模型参数显著提升,语言、视觉、多模态领域均有进展。

🔍 应用于油气勘探、炼油化工及销售等多个环节。

💡 中国石油与多家企业合作,加速数字化转型进程。

举报

  • 相关推荐
  • 北电数智亮相世界人工智能大会,“四链融合”推动AI产业落地

    2025世界人工智能大会“人工智能+”战略领军人才与创新发展论坛圆满落幕。论坛聚焦“人才领航智启未来”主题,汇聚中科院、社科院专家及中国联通、腾讯云等机构代表,围绕“人工智能+”行动分享经验,为AI高质量发展筑牢人才根基、激发创新动能。北电数智CMO杨震出席并发表演讲,分享AI行业落地实践,强调紧跟国家战略,推进产业、创新、人才、资本四链融合,打造面向不同场景的AI解决方案,全方位助力AI产业发展。

  • 微算法科技(NASDAQ:MLGO)基于人工智能优化构建混合ARIMA模型,提高比特币价格预测准确性

    随着数字资产市场兴起,比特币等加密货币价格预测成为焦点。传统模型难以准确捕捉其非线性波动,微算法科技引入AI技术优化ARIMA模型,结合LSTM网络构建混合模型,提升预测准确性。通过AI算法自动处理数据缺失、异常值检测及参数优化,实现更可靠的比特币价格预测,为投资者提供决策支持。

  • 海尔冰箱唯一获批“制冷家电人工智能技术山东省工程研究中心”

    海尔冰箱在人工智能领域取得新突破,主导建设的"制冷家电人工智能技术山东省工程研究中心"成为2025年山东省工程研究中心认定名单中唯一入选的冰箱品牌。该中心聚焦人工智能、物联网、大数据等技术方向,开发了全空间智慧保鲜舱冰箱等140多项行业首创产品,近三年获授权发明专利803件。海尔冰箱还推出行业首款接入DeepSeek的AI全空间保鲜冰箱,具备方言识别、降噪技术等功能,显著提升用户体验。市场数据显示,2023年1-7月海尔冰箱以47%市场份额稳居行业第一。通过AI技术赋能,海尔冰箱正引领行业向精准、智能保鲜时代跨越。

  • 阿里Wan2.2-S2V正式发布:一张图+一段音频 即可生成人物动态视频

    今晚,阿里云正式发布全新多模态视频生成模型通义万相Wan2.2-S2V,并宣布开源。 Wan2.2-S2V极大地简化了视频制作过程,仅需提供一张静态图片和一段音频,模型便能生成面部表情自然、口型与音频高度一致、肢体动作流畅丝滑的电影级数字人视频。 支持分钟级长视频稳定生成,不止嘴动,手势、表情、姿态都能动。

  • 大模型技术赋能声音创作:逗哥配音引领AI语音合成新浪潮‌

    逗哥配音作为国内领先的AI配音平台,凭借自主研发的语音合成大模型技术,已服务超千万创作者,累计生成音频量突破270亿次。其核心技术突破包括:1)支持40种语言,语音质量MOS分提升0.25,拟人度超83%;2)首创"AI分角功能",将多角色配音效率提升90%以上;3)建成覆盖近千款发音人的全球声库,包含方言、外语及影视角色音;4)创新"真人声纹+AI增强"模式,

  • 下一个爆款在哪儿?2025英特尔人工智能创新应用大赛获奖名单揭晓

    8月16日,2025英特尔人工智能创新应用大赛总决赛在深圳落幕。40支优秀团队从2817支队伍中脱颖而出,围绕工业、教育、心理健康、游戏等领域展开对决。大赛展示了AI从云端走向边缘的趋势,依托酷睿Ultra处理器和低代码开发工具,推动AI应用本地化落地。获奖作品包括动力电池机器人协作拆卸系统和AI生成PPT服务,体现AI与产业需求的深度融合。英特尔与联想、惠普等合作伙伴共同为开发者提供全栈支持,加速AI技术普及和商业化进程。

  • 降低创作门槛!爱诗科技新一代生成式大模型加速AI视频大众化

    爱诗科技8月27日发布新一代AI视频生成模型PixVerse V5,实现秒级高质量视频生成,支持360P至1080P分辨率。新模型在真实度、灵活性及生成速度上显著提升,覆盖人物、二次元、商业广告等多场景创作。同步上线Agent创作助手,降低使用门槛,用户无需专业技巧即可一键生成专业级视频。该技术推动AI视频从专业工具走向大众化应用,加速行业落地。

  • ISC.AI 2025 人工智能安全治理与创新实践论坛圆满召开

    ISC.AI2025人工智能安全论坛在北京召开,聚焦AI安全治理与创新实践。论坛汇集顶尖专家,探讨大模型安全评估与防护、智能体安全、AI治理等前沿议题。360集团张向征指出,随着Agent技术爆发式应用,AI安全已成为产业核心焦点。专家们强调需构建AI安全防护体系,应对大模型直接访问核心系统带来的全新挑战。中国电子院彭健提出企业合规建设需关注九大要素,清华大学苏航揭示智能体安全风险远超传统AI。华为云范建军倡导端到端大模型安全防护,中国信通院杨哲超呼吁构建协同治理框架。论坛为构建安全、普惠、负责任的人工智能未来贡献智慧。

  • AI日报:字节视频模型Waver 1.0发布;百度AI搜索APP“梯子AI”发布;谷歌推全新Gemini 2.5 Flash图像编辑模型

    本文汇总了AI领域最新动态:谷歌推出Gemini 2.5 Flash图像编辑模型,字节发布Waver 1.0视频生成工具;百度“梯子AI”提供无广告搜索;文心快码新增终端编码功能;腾讯游戏VISVISE工具集提升动画制作效率;自动驾驶配送机器人RM5进军外卖行业;DeepSeek V3.1出现字符Bug已修复;谷歌翻译升级实时同传和AI陪练;全球首现AI勒索软件PromptLock威胁网络安全;Anthropic推出Chrome浏览器AI助手Claude。

  • 千匠数字化园区解决方案:以“技术+生态”,构建园区数字化新生态

    在数字经济浪潮下,数字化升级成为产业园区突破传统发展模式、构建新型竞争优势的关键路径。通过搭建数字化平台整合产业图谱、政策资源及企业服务,实现精准招商与客户匹配;引入上下游关键企业形成“链主企业+配套企业”协同发展格局,显著提升产业集聚效应。平台促进技术、人才、资本高效流动,基于数据洞察优化产业布局,推动区域经济从规模扩张向价值跃升转型。精细化管理和业务流程数字化使管理效率提升20%以上,运营成本降低15%,助力企业拓展市场边界,强化核心竞争力。政府通过平台获取核心数据,构建区域经济“数字画像”,为科学决策提供依据,引领高质量发展。

今日大家都在搜的词: