首页 > 原创 > 关键词  > 腾讯最新资讯  > 正文

「6月27日AI日报」腾讯开源轻量级混元-A13B模型;可灵AI推“视频音效”功能

2025-06-27 16:32 · 稿源:站长之家

欢迎来到AIbase【AI日报】栏目!

每天三分钟了解当日AI大事件,助你洞悉AI行业趋势、创新AI产品应用。

更多AI资讯访问:https://www.aibase.com/zh

1、腾讯开源轻量级混元-A13B模型1张中低端GPU卡即可部署

微信截图_20250627155201.png

腾讯发布混元大模型家族的新成员混元-A13B模型,采用专家混合(MoE)架构,总参数规模达800亿,激活参数为130亿,大幅降低推理延迟与计算开销,为个人开发者和中小企业提供更具性价比的AI解决方案。该模型在数学、科学和逻辑推理任务中表现出色,支持调用工具生成复杂指令响应。

体验入口:https://hunyuan.tencent.com/

开源地址:https://github.com/Tencent-Hunyuan。

2、可灵AI推出“视频音效”功能,实现“所见即所听”沉浸体验

QQ20250627-154533.png

可灵AI全系列视频模型上线“视频音效”功能,用户生成视频时可同步生成立体声音效,实现“所见即所听”。升级的“音效生成”功能新增“视频生音效”模块,基于自研多模态视频生音效模型Kling-Foley,实现音画帧级对齐。该功能已向所有用户限时免费开放。

3、Black Forest震撼开源FLUX.1Kontext [dev]:媲美GPT-4o的图像编辑

image.png

Black Forest Labs开源图像编辑模型FLUX.1Kontext [dev],基于12亿参数的流匹配变换器架构,支持消费级硬件运行。其核心功能是上下文感知与精准编辑,能理解文本和图像输入,实现真正上下文生成与编辑,支持多次迭代编辑。

开源地址:https://huggingface.co/black-forest-labs/FLUX.1-Kontext-dev

Github:https://github.com/black-forest-labs/flux。

4、OpenAI发布Deep Research API新模型:o3/o4-mini-deep research

image.png

OpenAI推出两款Deep Research API新模型o3-deep-research和o4-mini-deep-research,专为高阶分析和深度信息合成设计,支持自动化网页搜索、数据分析、代码执行等功能。定价方面,o3模型每1000次调用价格为10至40美元,o4-mini价格更低,为2至8美元。

5、1999元起!小米AI眼镜颠覆智能穿戴,拍摄、支付、音乐一镜全能!

image.png

小米推出首款人工智能穿戴产品小米AI眼镜,具备第一人称拍摄、语音助手和开放式耳机功能,通过电致变色技术为用户带来个性化体验。眼镜采用轻量化设计,重量仅为40克,配备1200万像素前置摄像头,支持2K30帧每秒视频录制和直播功能。

6、迅雷发布下载MCP服务 一句话让Al自动下载

搜狗高速浏览器截图20250626192546.png

迅雷推出下载MCP服务,用户只需“一句话”就能让AI自动完成下载任务。该服务适配PC版迅雷和NAS迅雷,目前所有用户均可免费使用迅。雷MCP具备在国内外多个主流大模型应用接入的能力,如纳米AI、扣子空间、Cursor、Cherry Studio等。

7、一键生成爆款视频!HeyGen AI视频Agent席卷内容创作界!

HeyGen推出AI视频Agent,通过简单素材上传,自动完成从故事规划、脚本编写到镜头选择的整个视频制作流程,几分钟内即可获得可直接发布的专业级视频内容。支持多种视频类型,操作流程简便,无需专业视频编辑技能,智能化提示引导用户轻松上传素材并设定创作需求,AI完成从脚本到成片的全部工作。

8、重磅!谷歌开源Gemma3n多模态模型,手机也能跑出云端AI性能

QQ20250627-101207.png

谷歌发布并开源端侧多模态大模型Gemma3n,为手机、平板、笔记本等端侧设备带来强大多模态功能。提供E2B和E4B两个版本,原始参数量分别为5B和8B,但内存占用仅相当于传统2B和4B模型,分别只需2GB和3GB内存即可运行。原生支持图像、音频、视频和文本的多模态输入处理,支持140种文本语言和35种语言的多模态理解。

开源地址:https://huggingface.co/collections/google/gemma-3n-685065323f5984ef315c93f4

举报

  • 相关推荐
  • 同比增长17%!腾讯Q2研发投入202.5亿元 混元3D大模型接连突破

    腾讯控股今日发布了截至6月30日的2025年第二季度财报。营收为1845亿元,同比增长15%,经营利润(Non-IFRS)692.5亿元,同比增18%。 财报显示,当季腾讯研发投入达202.5亿元,同比增长17%;资本开支 191.1亿元,同比增幅达119%。在持续加码AI战略的推动下,AI技术带来的效益正在加速显现。 AI高投入背景下,腾讯通过数据增强与合成技术,提升了数据的质量与多样性,并通过更有效�

  • AI日报:腾讯混元开源Hunyuan-GameCraft;最强图像编辑器nano-banana发布;字节开源Agent专用模型 M3-Agent-Control

    本文介绍了AI领域最新动态:1)腾讯开源Hunyuan-GameCraft框架,可快速生成高质量游戏视频;2)Nano-Banana模型在图像编辑领域超越FLUX+Kontext;3)字节开源基于Qwen 3 32B的328亿参数M3-Agent-Control模型;4)Kimi将推出PPT生成功能;5)阿里1688将上线"诚信通AI版"会员服务;6)苹果智能家居中心推迟至2026年发布;7)万兴科技接入GPT-5;8)全球AI独角兽达498家,总估值2.7万亿美元;9)谷歌为Slides和

  • AI大模型计费器如何精准比价?38款模型隐藏费用一键预警,三步告别超支

    文章揭示了AI项目成本失控的三大痛点:1)计费维度分裂,如输入/输出token分开计价;2)参数迷雾,如文心一言4.0增强模式成本是基础版3.2倍;3)汇率陷阱,海外模型美元报价波动导致实际成本偏差超15%。通过AIbase费用计算器可精准测算:支持38个主流API对比,包含隐藏费用提醒,提供四大维度的决策矩阵(百万token成本/长文本溢价/月度总价/性价比评分)。案例显示某团队发现自研模型成本比通义千问高27%后及时调整采购策略。该工具能帮助开发者避免"成本黑箱",实现零成本预算推演。

  • 百川开源最新医疗大模型,中国力量领跑医疗AI赛道

    专注医疗后,百川智能交出第一份答卷! 8月11日,百川智能发布第二款开源医疗增强推理大模型Baichuan-M2,其以32B的参数量,在OpenAI的Healthbench评测集上,超越其刚刚发布5天的开源模型gpt-oss-120b。

  • AI日报:混元推四款小尺寸开源模型;昆仑万维发布新推理大模型MindLink;谷歌Gemini 2.5 Deep Think发布

    【AI日报】汇总了最新AI领域动态:1)腾讯开源混元系列小尺寸模型,适用于消费级显卡;2)昆仑万维发布推理大模型MindLink,提升回答透明度;3)B站推出AI原声翻译功能,保留UP主音色;4)谷歌Gemini 2.5在数学奥赛夺金,展现强大推理能力;5)OpenAI展示GPT-5网络信息整合特性;6)苹果组建AI团队挑战ChatGPT;7)高德地图推出全球首个AI原生地图应用;8)Adobe推出AI图像合成工具Harmonize;9)NVIDIA发布革命性视频渲染技术;10)谷歌推出Android Studio免费AI编程助手;11)开源结构化信息提取工具LangExtract;12)Figma开发者模式升级提升设计转代码效率。

  • 腾讯混元3D世界模型在魔搭社区开源首发

    7月27日,腾讯混元3D世界模型1.0在魔搭社区开源首发。这是业界首个开源的沉浸式3D世界生成模型,支持文字/图片输入快速生成完整3D场景,将原本需要数周的建模时间缩短至几分钟。该模型显著提升了游戏开发、VR、数字内容等领域的创作效率,开发者可免费下载体验,还能通过魔搭社区提供的4000+MCP服务和调试工具进行优化训练。作为中国最大AI开源社区,魔搭已汇聚500+机构、7万+模型,覆盖36个国家1600万开发者。此前腾讯开源的混元MoE模型Hunyuan-A13B也在该社区首发。

  • AI日报:B站测试AI视频工具花生AI;腾讯发布多模态模型Large-Vision;昆仑万维开源Skywork UniPic 2.0

    【AI日报】主要内容: 1. B站测试"花生AI"视频工具,3分钟可成片,同时推进自研大模型和多语言翻译功能 2. 昆仑万维开源多模态模型Skywork UniPic 2.0,实现高效统一的多模态生成能力 3. 马斯克指责苹果偏袒OpenAI,苹果回应称平台设计公平公正 4. 腾讯混元发布52B参数多模态理解模型Large-Vision,支持任意分辨率输入 5. DeepSeek官方否认8月发布R2模型的传闻 6. OpenAI推出超值ChatGPT Go套餐,仅399卢比降低使用门槛 7. AI新贵Perplexity豪掷345亿美元收购谷歌Chrome 8. Anthropic的Claude Sonnet 4模型支持100万token上下文 9. ChatGPT重大更新:恢复GPT-4o默认模式,为GPT-5引入多模式选择,优化交互体验

  • AI 大模型选型指南:如何在众多模型中找到最适合你的那一个?

    本文探讨了如何从众多AI大模型中选择最适合自身需求的模型。文章提出应从四个核心维度进行评估:1)核心能力对比,包括通用任务表现和特定领域专长;2)成本与效率,考量API调用成本和响应速度;3)本地化与数据安全,满足合规要求;4)生态与社区支持,关注开发者活跃度和文档完善度。为解决模型对比难题,推荐使用专业平台如AIbase模型广场,可一站式对比主流模型的多维参数和评测数据。通过系统化评估,开发者能更高效地选择契合业务需求的AI模型。

  • AI日报:可灵2.1推出全新首尾帧功能;昆仑万维上线AI音乐模型Mureka V7.5;腾讯云推出AI开发工具CloudBase AI CLI

    本文介绍了AI领域最新动态:1)快手可灵2.1推出首尾帧功能,提升视频生成效果;2)昆仑万维发布Mureka V7.5音乐模型,优化人声表现;3)腾讯云推出AI开发工具CloudBase AI CLI,可减少80%编码量;4)海外新品MuleRun通过虚拟机和AI Agent带来创新游戏体验;5)Meta开源DINOv3视觉模型,无需标注即可实现卓越性能;6)宇树科技人形机器人H1获1500米赛跑金牌;7)谷歌Gemini新增记忆功能和隐私聊天模式;8)香港大学开源OpenCUA框架,打造个性化电脑助手;9)OpenAI考虑在ChatGPT引入广告;10)谷歌发布超小型开源模型Gemma 3 270M,支持手机端运行。

  • WAIC:卓世科技荣膺2025中国AI大模型企业商业落地TOP20

    2025世界人工智能大会(WAIC2025)在上海圆满落幕。卓世科技携"璇玑玉衡"大模型家族及全链路AI解决方案亮相,展示其在智慧工业、健康养老、文教传媒、政企服务等领域的标杆成果。会上发布《2025中国AI商业落地应用研究报告》及大模型TOP20榜单,卓世科技凭借垂直行业大模型的深度落地能力入选。其创新的"行业大模型+场景Agent+可持续运营"三位一体模式,为AI普惠提供了可复制的中国方案。卓世科技还首次全景展示基于MOE架构的"璇玑玉衡"大模型矩阵,实现从通用大模型到行业专属模型的精准跃迁,并带来全栈产品矩阵,打通大模型落地"最后一公里"。

今日大家都在搜的词: