首页 > 原创 > 关键词  > 腾讯最新资讯  > 正文

「6月27日AI日报」腾讯开源轻量级混元-A13B模型;可灵AI推“视频音效”功能

2025-06-27 16:32 · 稿源:站长之家

欢迎来到AIbase【AI日报】栏目!

每天三分钟了解当日AI大事件,助你洞悉AI行业趋势、创新AI产品应用。

更多AI资讯访问:https://www.aibase.com/zh

1、腾讯开源轻量级混元-A13B模型1张中低端GPU卡即可部署

微信截图_20250627155201.png

腾讯发布混元大模型家族的新成员混元-A13B模型,采用专家混合(MoE)架构,总参数规模达800亿,激活参数为130亿,大幅降低推理延迟与计算开销,为个人开发者和中小企业提供更具性价比的AI解决方案。该模型在数学、科学和逻辑推理任务中表现出色,支持调用工具生成复杂指令响应。

体验入口:https://hunyuan.tencent.com/

开源地址:https://github.com/Tencent-Hunyuan。

2、可灵AI推出“视频音效”功能,实现“所见即所听”沉浸体验

QQ20250627-154533.png

可灵AI全系列视频模型上线“视频音效”功能,用户生成视频时可同步生成立体声音效,实现“所见即所听”。升级的“音效生成”功能新增“视频生音效”模块,基于自研多模态视频生音效模型Kling-Foley,实现音画帧级对齐。该功能已向所有用户限时免费开放。

3、Black Forest震撼开源FLUX.1Kontext [dev]:媲美GPT-4o的图像编辑

image.png

Black Forest Labs开源图像编辑模型FLUX.1Kontext [dev],基于12亿参数的流匹配变换器架构,支持消费级硬件运行。其核心功能是上下文感知与精准编辑,能理解文本和图像输入,实现真正上下文生成与编辑,支持多次迭代编辑。

开源地址:https://huggingface.co/black-forest-labs/FLUX.1-Kontext-dev

Github:https://github.com/black-forest-labs/flux。

4、OpenAI发布Deep Research API新模型:o3/o4-mini-deep research

image.png

OpenAI推出两款Deep Research API新模型o3-deep-research和o4-mini-deep-research,专为高阶分析和深度信息合成设计,支持自动化网页搜索、数据分析、代码执行等功能。定价方面,o3模型每1000次调用价格为10至40美元,o4-mini价格更低,为2至8美元。

5、1999元起!小米AI眼镜颠覆智能穿戴,拍摄、支付、音乐一镜全能!

image.png

小米推出首款人工智能穿戴产品小米AI眼镜,具备第一人称拍摄、语音助手和开放式耳机功能,通过电致变色技术为用户带来个性化体验。眼镜采用轻量化设计,重量仅为40克,配备1200万像素前置摄像头,支持2K30帧每秒视频录制和直播功能。

6、迅雷发布下载MCP服务 一句话让Al自动下载

搜狗高速浏览器截图20250626192546.png

迅雷推出下载MCP服务,用户只需“一句话”就能让AI自动完成下载任务。该服务适配PC版迅雷和NAS迅雷,目前所有用户均可免费使用迅。雷MCP具备在国内外多个主流大模型应用接入的能力,如纳米AI、扣子空间、Cursor、Cherry Studio等。

7、一键生成爆款视频!HeyGen AI视频Agent席卷内容创作界!

HeyGen推出AI视频Agent,通过简单素材上传,自动完成从故事规划、脚本编写到镜头选择的整个视频制作流程,几分钟内即可获得可直接发布的专业级视频内容。支持多种视频类型,操作流程简便,无需专业视频编辑技能,智能化提示引导用户轻松上传素材并设定创作需求,AI完成从脚本到成片的全部工作。

8、重磅!谷歌开源Gemma3n多模态模型,手机也能跑出云端AI性能

QQ20250627-101207.png

谷歌发布并开源端侧多模态大模型Gemma3n,为手机、平板、笔记本等端侧设备带来强大多模态功能。提供E2B和E4B两个版本,原始参数量分别为5B和8B,但内存占用仅相当于传统2B和4B模型,分别只需2GB和3GB内存即可运行。原生支持图像、音频、视频和文本的多模态输入处理,支持140种文本语言和35种语言的多模态理解。

开源地址:https://huggingface.co/collections/google/gemma-3n-685065323f5984ef315c93f4

举报

  • 相关推荐
  • 北京亦庄设立大模型生态服务站 助力AI产业合规发展

    2026年4月,经北京市网信办认定,亦庄模数世界大模型生态服务站正式成立,为企业提供公益大模型备案辅导、产业生态对接等一站式服务。该站由市网信办授权、经开区信息技术产业局指导、北京国际算力服务公司运营,采用“1对1精准陪跑+集中培训”模式,可将备案周期压缩50%以上,解决企业合规认知不足等行业痛点。同时,经开区对完成备案的优质大模型企业给予100万元专项奖励及1亿元算力、模型、数据券等支持,常态化开展合规培训与产业对接,助力北京经开区加快构建全域人工智能之城。

  • 大神姚顺雨出手 腾讯混元3.0大模型免费上线:AI性能猛增40%

    国内的互联网巨头中腾讯在AI大模型上此前动作是比较慢的,但去年亿元年薪挖走大神姚顺雨之后,腾讯新一代大模型混元3.0就要来了,现已经在openrouter免费上线使用。 腾讯的混元3.0英文缩写为Hy3,目前以Hy3 preview的名义免费使用,也是MoE混合专家类型,有三个推理级别,上下文长度262K,速度23Token/s,不过其他信息不多。

  • 模型即审美:生图模型们正建起自己的“视觉方言”

    ​最近在测试各种AI生图模型的时候,我们发现了一个现象:同样一个提示词,丢给不同的模型,出来的图片风格差异大到像是出自不同摄影流派。 Image-2生成的图就像我昨天随手拍的,但Nano Banana生成的图感觉像某个家居品牌的广告大片。有些模型执着于捕捉现实的每一丝瑕疵,有些则痴迷于把日常场景变成精致的艺术品。这背后反映的不是能力差别,而是每个模型对"什么

  • 改写语音交互行规,豆包大模型更稳了

    豆包大模型,又上新了。 2026年4月9日,原生全双工语音大模型Seeduplex正式发布,相比上一代半双工豆包端到端语音模型,新模型基于“边听边说”的全新框架设计,交互体验的自然感、顺畅度大幅提升,目前已在豆包App全量上线。 这意味着,前沿的全双工语音技术,第一次实现商业规模化落地。 而依托全双工语音技术,豆包的语音交互不再是机械式的一问一答,而是收放�

  • iOS 27重磅更新:苹果允许用户自选第三方AI模型

    苹果计划在今年秋季推出的iOS 27、iPadOS 27、macOS 27中,开放Apple Intelligence底层AI模型选择权,允许用户自主选用第三方AI服务,覆盖Siri、写作工具、图像生成等核心功能。 此前,苹果在2024年推出Apple Intelligence平台,仅接入ChatGPT作为唯一第三方AI模型。 iOS 27将通过名为Extensions(扩展)的机制,打破这一独占格局,用户可在设置中选择已安装并适配的AI模型服务商,系统会提示�

  • 告别价格战,大模型共迎通胀时代

    眼下,涨价成为大模型的关键词。 迈入2026年,大模型不再是优惠缩水,而是毫不掩饰地开启了涨价模式,大大小小的厂商纷纷入局,智普甚至在短短三个月之内两次提价。 以至于,国产大模型定价首次与海外头部厂商对齐。 大模型涨价,是昙花一现还是旷日持久?降价争夺市场的打法,是否走到了尽头?价值战会成为未来竞争的核心叙事吗?

  • 凡科网获评“专精特新中小企业”,以专利技术筑牢创新根基

    广州凡科互联网科技股份有限公司凭借在中小企业数字化服务领域的专业化布局、持续技术创新及行业贡献,成功获评2025年广东省“专精特新”中小企业。自2010年创立以来,凡科始终聚焦中小企业数字化经营升级需求,构建了覆盖全场景营销、智慧电商零售、数字化门店等多元场景的服务体系,累计服务超3100万用户。公司坚持自主创新,深耕核心技术领域,拥有多项覆盖分布式系统架构、高并发处理、数据增量备份等方向的专利,并将创新成果转化为凡科建站、凡科商城等十余款自主产品,形成一站式数字化服务矩阵。未来,凡科将继续加大研发投入,深化技术应用与产业协同,助力更多中小企业实现高质量发展。

  • AI日报:千问PC端上线AI语音输入;字节发布全模态大模型Doubao-Seed-2.0-lite;谷歌更新AI搜索功能

    本期AI日报涵盖多项重要进展:千问PC端上线AI语音输入,提升办公效率;字节跳动发布全模态大模型Doubao-Seed-2.0-lite,实现视频、图像、音频与文本统一理解;腾讯联合多所高校推出开源多模态深度搜索智能体方案OpenSearch-VL;月之暗面申请“KimiClaw”商标,或涉硬件领域;Mininglamp开源Cider和Mano-P,打造本地AI工作站;OpenAI携手硬件巨头发布MRC协议,解决GPU闲置浪费;谷歌升级AI搜索功能,整合Reddit等社交观点;xAI推出Grok Imagine API质量模式,提升图像生成写实度。

  • 腾讯混元最新数据:Hy3 preview上线两周Token调用量激增 超上版本10倍

    今日,腾讯混元官方发文称,自Hy3 preview上线以来,其Token调用量持续增加,目前总量已经是上一代版本模型Hy2的10倍之多。 尤其是代码和智能体类场景的Token调用量增明显,在腾讯的WorkBuddy/Codebuddy以及Qclaw类应用中,增长幅度超过16.5倍。 此外,来自OpenRouter的公开数据显示,Hy3 preview在过去一周以3.66万亿Token的调用量拿到周榜总榜以及市场占有率双第一”,并且在编程和工具�

  • AI日报:OpenAI发布三款实时语音模型;苹果首款AI硬件曝光;美团入局AI社交赛道

    今日AI热点:OpenAI发布三款实时语音模型,覆盖推理对话、翻译和转录场景;苹果首款AI硬件AirPods进入DVT阶段,内置摄像头;宇树科技UniStore平台开放,开启人形机器人应用商店时代;阶跃星辰完成25亿美元融资,冲刺香港IPO;美团推出首个数字生命共生社区“鲸游”公测;OpenAI推出GPT-5.5-Cyber预览版,专攻网络安全;Mozilla借助AI发现Firefox 271个安全漏洞;OpenAI发布Codex Chrome扩展,优化浏览器工作流。

今日大家都在搜的词: