首页 > 原创 > 关键词  > 腾讯最新资讯  > 正文

「6月27日AI日报」腾讯开源轻量级混元-A13B模型;可灵AI推“视频音效”功能

2025-06-27 16:32 · 稿源:站长之家

欢迎来到AIbase【AI日报】栏目!

每天三分钟了解当日AI大事件,助你洞悉AI行业趋势、创新AI产品应用。

更多AI资讯访问:https://www.aibase.com/zh

1、腾讯开源轻量级混元-A13B模型1张中低端GPU卡即可部署

微信截图_20250627155201.png

腾讯发布混元大模型家族的新成员混元-A13B模型,采用专家混合(MoE)架构,总参数规模达800亿,激活参数为130亿,大幅降低推理延迟与计算开销,为个人开发者和中小企业提供更具性价比的AI解决方案。该模型在数学、科学和逻辑推理任务中表现出色,支持调用工具生成复杂指令响应。

体验入口:https://hunyuan.tencent.com/

开源地址:https://github.com/Tencent-Hunyuan。

2、可灵AI推出“视频音效”功能,实现“所见即所听”沉浸体验

QQ20250627-154533.png

可灵AI全系列视频模型上线“视频音效”功能,用户生成视频时可同步生成立体声音效,实现“所见即所听”。升级的“音效生成”功能新增“视频生音效”模块,基于自研多模态视频生音效模型Kling-Foley,实现音画帧级对齐。该功能已向所有用户限时免费开放。

3、Black Forest震撼开源FLUX.1Kontext [dev]:媲美GPT-4o的图像编辑

image.png

Black Forest Labs开源图像编辑模型FLUX.1Kontext [dev],基于12亿参数的流匹配变换器架构,支持消费级硬件运行。其核心功能是上下文感知与精准编辑,能理解文本和图像输入,实现真正上下文生成与编辑,支持多次迭代编辑。

开源地址:https://huggingface.co/black-forest-labs/FLUX.1-Kontext-dev

Github:https://github.com/black-forest-labs/flux。

4、OpenAI发布Deep Research API新模型:o3/o4-mini-deep research

image.png

OpenAI推出两款Deep Research API新模型o3-deep-research和o4-mini-deep-research,专为高阶分析和深度信息合成设计,支持自动化网页搜索、数据分析、代码执行等功能。定价方面,o3模型每1000次调用价格为10至40美元,o4-mini价格更低,为2至8美元。

5、1999元起!小米AI眼镜颠覆智能穿戴,拍摄、支付、音乐一镜全能!

image.png

小米推出首款人工智能穿戴产品小米AI眼镜,具备第一人称拍摄、语音助手和开放式耳机功能,通过电致变色技术为用户带来个性化体验。眼镜采用轻量化设计,重量仅为40克,配备1200万像素前置摄像头,支持2K30帧每秒视频录制和直播功能。

6、迅雷发布下载MCP服务 一句话让Al自动下载

搜狗高速浏览器截图20250626192546.png

迅雷推出下载MCP服务,用户只需“一句话”就能让AI自动完成下载任务。该服务适配PC版迅雷和NAS迅雷,目前所有用户均可免费使用迅。雷MCP具备在国内外多个主流大模型应用接入的能力,如纳米AI、扣子空间、Cursor、Cherry Studio等。

7、一键生成爆款视频!HeyGen AI视频Agent席卷内容创作界!

HeyGen推出AI视频Agent,通过简单素材上传,自动完成从故事规划、脚本编写到镜头选择的整个视频制作流程,几分钟内即可获得可直接发布的专业级视频内容。支持多种视频类型,操作流程简便,无需专业视频编辑技能,智能化提示引导用户轻松上传素材并设定创作需求,AI完成从脚本到成片的全部工作。

8、重磅!谷歌开源Gemma3n多模态模型,手机也能跑出云端AI性能

QQ20250627-101207.png

谷歌发布并开源端侧多模态大模型Gemma3n,为手机、平板、笔记本等端侧设备带来强大多模态功能。提供E2B和E4B两个版本,原始参数量分别为5B和8B,但内存占用仅相当于传统2B和4B模型,分别只需2GB和3GB内存即可运行。原生支持图像、音频、视频和文本的多模态输入处理,支持140种文本语言和35种语言的多模态理解。

开源地址:https://huggingface.co/collections/google/gemma-3n-685065323f5984ef315c93f4

举报

  • 相关推荐
  • 「6月26日AI日报」可灵AI推全球首部AIGC单元剧;谷歌开源AI智能体Gemini CLI

    AI行业近期动态汇总:1)豆包AI编程升级为"应用创作1.0",支持可视化编辑和实时预览,降低开发门槛;2)谷歌开源Gemini CLI工具,集成Gemini 2.5 Pro模型,提供免费编程助手;3)Anthropic推出"Artifacts"功能,用户无需编程即可在Claude中创建AI应用;4)出门问问发布TicNote+硬件产品,内置Shadow AI技术;5)OpenAI将Codex CLI重构为Rust语言以提升性能;6)谷歌发布Imagen4文生图模型,突�

  • AI日报:腾讯混元3D 2.1大模型开源;字节跳动AI Lab负责人李航卸任;OpenAI Codex 全新升级

    本文介绍了AI领域最新动态:1)腾讯开源混元3D2.1大模型,提升3D生成质量;2)OpenAI Codex升级,优化代码生成功能;3)字节跳动AI Lab负责人李航卸任;4)微软发布700个AI应用案例;5)微软推出Code Researcher工具,解决58%系统崩溃问题;6)Observer AI实现屏幕操作自动化;7)Genspark发布AI浏览器;8)麻省理工用AI技术3.5小时修复15世纪名画;9)蚂蚁集团推出开源多模态GPT-4o模型Ming-Omni;10)MagicTryOn视频换衣框架;11)字节跳动发布实时互动AI视频生成模型Seaweed APT2;12)ChatGPT搜索功能升级;13)字节跳动与老凤祥合作开发AI智能眼镜。

  • 「6月25日AI日报」支付宝推 “AI 打赏” 服务;QQ浏览器上线高考志愿报告功能

    AI日报精选:1)Claudia开源图形界面工具发布,简化Claude Code编程体验;2)QQ浏览器推出"AI高考通"志愿填报功能;3)秘塔AI搜索新增"听讲解"语音功能;4)iOS26将升级图乐园AI图像生成功能;5)支付宝推出国内首个"AI打赏"服务;6)小米AI眼镜即将发布,支持物品识别和语音交互;7)奥比中光发布天工Pro机器人,搭载深度相机;8)DeepMind推出新一代机器人AI模型Gemini Robotics;9)字节跳动推出ProtoReasoning框架提升大模型逻辑推理能力;10)Clikka AI革新产品摄影,一键生成专业级效果图。

  • 快手可灵AI上线2.1系列模型:生成5秒视频不到1分钟

    快手旗下可灵AI发布2.1系列模型,包含720p标准版和1080p高品质版,在性价比、生成速度和质量三大维度实现突破。新模型生成5秒视频仅需20-35灵感值,与上代保持相同成本;1080p视频生成时间不到1分钟,快于行业同级产品2-3倍。模型在动态表现、物理模拟和语义理解方面均有优化,人物动作更真实自然。可灵AI自发布以来发展迅猛,全球用户突破2200万,月活增长25倍,累计生成1.68亿视频和3.44亿图片。商业化进程加速,2025年Q1营收超1.5亿元人民币,展现强劲市场潜力。

  • 可灵AI离营收单月破亿,还有多远?

    虽然嘴上没明说,但快手显然也不想在AI时代仍甘当短视频老二。 因此,如今快手的财报会议上,AI占据了越来越多的篇幅,当然关键还是可灵AI的确争气。 根据快手2025年一季度财报显示,可灵AI营收超过1.5亿元人民币。从2024年9月的单月千万流水,到2025年第一季度的季度1.5亿营收,换言之,7个月时间里可灵AI实现15倍的营收增长。

  • AI日报:通义千问开源Qwen3向量模型;字节跳动图像编辑模型SeedEdit 3.0;ElevenLabs推v3语音模型

    本文汇总了近期AI领域的重要动态:1)通义千问发布Qwen3-Embedding系列模型,在多语言文本处理表现优异;2)字节跳动推出图像编辑模型SeedEdit3.0,提升细节保持能力;3)ElevenLabs发布情感语音合成系统Eleven v3 Alpha;4)Anthropic推出面向国家安全的Claude Gov模型;5)可灵AI月收入连续两月超1亿元;6)Meta公布智能眼镜Aria Gen2技术细节;7)爱诗科技上线AI视频工具"拍我AI";8)富国银行预测2030年ChatGPT广告收入将达千亿美元。

  • AI日报:DeepSeek开源新版R1-0528;字节发布图像Agent小云雀AI;可灵2.1重磅上线

    本期AI日报聚焦多项AI领域突破:1)DeepSeek发布R1-0528模型,支持128K上下文且性能媲美GPT-4;2)字节推出"小云雀AI"图像创作工具;3)可画2.1版本价格降65%性能提升;4)Opera发布全球首款AI浏览器Neon;5)Meta推出多模态空间理解模型;6)北大团队研发ZeroSearch框架降低大模型训练成本88%;7)字节推出AI视频剪辑应用"剪小映";8)MotionPro实现40ms/帧精准视频控制;9)xAI与Telegram达成3亿美元合作部署Grok聊天机器人;10)OpenAI重组架构为IPO铺路;11)像素蛋糕"方糖大模型"获国内首个影像行业备案;12)Paper2Poster实现论文自动转海报;13)Resemble AI开源TTS模型性能比肩ElevenLabs;14)蚂蚁集团开源对标GPT-4o的多模态模型Ming-lite-omni。

  • AI日报:MiniMax发布视频智能体Hailuo Agent;昆仑万维开源 Skywork-SWE-32B;B站接入Qwen 3等模型

    本期AI日报聚焦多项AI领域创新:1)MiniMax推出视频Agent工具,支持文本生成高清视频及人脸驱动;2)昆仑万维开源Skywork-SWE-32B模型,提升软件工程任务表现;3)B站接入通义千问模型,推出数据分析智能体InsightAgent;4)ChatGPT深度整合Gmail与日历功能;5)腾讯云发布全链路AI开发平台"AI Builder";6)HeyGen推出UGC广告数字人功能;7)研究显示过度依赖AI或削弱批判性思维。此外还涵盖AI音乐生成、内容检测工具停运等动态,展现AI技术快速发展的多元应用与潜在影响。

  • AI日报:MiniMax-M1开源;阿里Qwen3升级版适配苹果MLX架构;月之暗面发布新模型Kimi-Dev-72B

    《AI日报》汇总了近期AI领域多项重要进展:1)月之暗面推出开源编程模型Kimi-Dev-72B,在软件工程任务测试中创下新纪录;2)MiniMax开源M1模型,支持超长上下文推理且训练成本低;3)腾讯发布AI音乐模型LeVo,支持音色克隆和分轨生成;4)阿里云Qwen3升级版适配苹果MLX架构;5)豆包推出"AI播客"功能,可将PDF转为对话播客;6)夸克App上线个性化AI家教"夸克老师";7)松下发布多模态大模型OmniFlow,实现文本/图像/音频自由切换;8)TikTok推出三款AI视频创作工具;9)极氪与火山引擎合作,将豆包大模型接入智能座舱系统;10)Meta的Llama3.1模型在文本记忆方面表现突出;11)Grok上线定时追踪X热门话题功能;12)Gemini2.5Pro即将更新Deep Think功能;13)谷歌地图引入AI技术升级导航和个性化推荐功能。

  • AI日报:即梦灰测图片3.1模型;ElevenLabs推出AI语音助理11ai;百度发布多智能体协同AI IDE

    本文介绍了AI领域多项最新进展:1)即梦灰测图片3.1模型增强电影感和艺术风格;2)ElevenLabs推出语音助手11ai;3)文心快码发布多模态AI开发工具Comate AI IDE;4)苹果采用"归一化流"技术开发新型AI生图模型;5)Grok将推出整合多类型文件管理功能;6)OmniGen2开源多模态模型重塑AI应用场景;7)ScholAI革新学术研究工具;8)豆包推出可视化AI编程功能;9)饿了么推出骑手AI助手"小饿";10)张雪峰认为AI可替代部分教育工作;11)微软发布3.3亿参数小模型Mu。这些创新展示了AI技术在各领域的快速发展和应用潜力。