首页 > 原创 > 关键词  > Gemini最新资讯  > 正文

AI日报:豆包大模型1.8、Seedance 1.5 Pro发布;Gemini 3 Flash正式上线;MiniMax通过港交所上市聆讯

2025-12-18 16:06 · 稿源:站长之家

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解https://app.aibase.com/zh

1、Gemini 3 Flash登场:免费、极速、智力反超Pro,谷歌AI全面进入“零延迟”时代

谷歌发布新一代轻量级模型Gemini3Flash,其响应速度达到前代三倍、近乎‘零延迟’,并在多项高难度基准测试中反超同代旗舰Gemini3Pro,成为史上首个在同期对比中‘小弟干翻大哥’的Flash模型。

image.png

【AiBase提要:】

🧪 在代码修复权威榜单SWE-bench上,Gemini3Flash以78%得分小幅领先Gemini3Pro(76.2%)

🧠 在博士级推理测试GPQA Diamond中拿下90.4%高分

⚡ 在极难综合评估Humanity’s Last Exam中取得33.7%成绩,显著优于前代旗舰Gemini2.5Pro

2、火山引擎FORCE大会亮剑:豆包大模型1.8+Seedance 1.5 Pro发布,日均50万亿Tokens登顶中国第一

火山引擎FORCE大会发布了豆包大模型1.8和视频生成模型Seedance 1.5 Pro,并推出“AI节省计划”,旨在降低企业使用大模型的成本门槛。豆包大模型1.8在多个关键维度有显著提升,而Seedance 1.5 Pro则提升了视频生成质量与一致性。此外,豆包大模型日均Tokens使用量已突破50万亿,稳居中国第一、全球第三,标志着其从技术产品走向大规模产业应用。

image.png

【AiBase提要:】

🧠 豆包大模型1.8在推理、多语言、代码生成与工具调用等关键维度实现显著提升。

🎥 Seedance 1.5 Pro支持更长时长、更高帧率的可控视频内容创作,为短视频、广告、游戏等领域提供工业化级视觉生成能力。

💰 “AI节省计划”通过模型压缩、推理优化、资源调度等技术手段,降低企业使用大模型的成本门槛。

3、苹果开源 SHARP 模型:告别漫长等待,1秒让平面照片跃升3D 空间

苹果公司近日开源了名为 SHARP 的新型 AI 模型,该模型能够将一张普通的2D照片转化为具有真实物理比例的3D场景,仅需不到一秒钟。SHARP的核心技术是“3D高斯泼溅”技术,它通过深度训练掌握了通用的空间几何规律,只需一次快速扫描就能预测出数百万个带有光影信息的“高斯球”位置。SHARP的成像质量领先于业内最强模型,支持真实的相机移动模拟。目前,苹果已将SHARP的完整代码及资源发布在GitHub平台供全球开发者下载。

【AiBase提要:】

⚡ 速度实现量级突破 : SHARP 模型将2D 转3D 的处理速度提升了三个数量级,实现了不到一秒的近乎实时转换体验。

🌐 领先的3D 生成技术 :基于3D 高斯泼溅技术,模型通过单次神经网络前馈即可预测数百万个3D 点位,精准还原真实物理比例。

🔓 全面开源生态 :苹果已在 GitHub 开源 SHARP 的代码与资源,旨在加速全球开发者在空间计算和3D 内容领域的创新。

4、Meta发布SAM Audio:全球首个支持“点击分离声音”的多模态音频模型,一键提取吉他声、人声或狗叫

Meta发布了SAM Audio,这是全球首个支持多模态音频分离的模型,能够通过文本、视觉和时间片段提示,一键提取目标声音,如吉他声、人声或狗叫。该技术首次将人类自然感知声音的方式复刻到AI系统中,具有革命性的意义。

111.jpg

【AiBase提要:】

🎧 文本提示:通过语义描述提取对应声源。

👁️ 视觉提示:点击视频中的发声物体分离音频。

⏱️ 时间片段提示:标记时间区间自动处理同类声音。

详情链接:https://ai.meta.com/samaudio/ https://github.com/facebookresearch/sam-audio

5、MiniMax通过港交所上市聆讯,国产大模型“第一股”或将花落上海

MiniMax通过港交所上市聆讯,有望成为首家登陆资本市场的国产大模型公司,其核心资产为大语言模型与多模态生成技术,这标志着资本市场对大模型商业化路径的认可度提升,并可能为后续AI公司IPO开辟通道。

【AiBase提要:】

🚀 MiniMax通过港交所上市聆讯,成为首家登陆资本市场的国产大模型公司。

💼 其核心资产为大语言模型与多模态生成技术,不同于传统计算机视觉企业。

📈 若成功上市,将验证资本市场对大模型商业化路径的认可度,并可能为后续AI公司IPO开辟通道。

6、OpenAI 正式官宣:开发者可向ChatGPT提交应用程序

OpenAI 向全球开发者开放 ChatGPT 应用提交权限,标志着 ChatGPT 进阶为 AI 原生应用平台。开发者可通过最新指南提交作品,通过审核后将出现在 ChatGPT 应用目录中,赋予 ChatGPT 实操能力。

image.png

【AiBase提要:】

🚀 生态大门开启:OpenAI 开放应用提交,开发者可将功能整合进 ChatGPT 供全球用户发现。

🛒 应用目录上线:用户可通过工具菜单或访问 chatgpt.com/apps 搜索和浏览精选 AI 应用。

💰 盈利前景明确:支持链接外部网站交易实体商品,并计划探索数字商品变现模式。

7、千问 App 接入高德:阿里 AI 走入现实世界

千问 App 接入高德地图,标志着其具备了物理世界的理解与行动能力,能够处理复杂的现实场景需求,并计划进一步接入更多核心场景,打造一个强大的超级入口。

image.png

【AiBase提要:】

🚀 千问 App 接入高德地图,实现从回答问题到地理空间推理的跨越。

🧭 千问能生成可视化决策卡片,直接唤起导航或打车服务。

🛍️ 阿里计划将千问打造为能调用现实履约网络的超级入口。

8、微软开源 TRELLIS.2:一键将图片转为高精度 3D 模型

微软开源了TRELLIS.2,这是一款高效的图像到3D模型生成工具,能够快速生成高质量的3D模型,并且支持多种平台使用。TRELLIS.2在NVIDIA H100显卡的支持下表现出色,能够在极短时间内完成高分辨率模型的生成。此外,它还提供了PBR四件套贴图,非常适合电商场景的应用。

image.png

【AiBase提要:】

🌟 TRELLIS.2是一款微软开源的图像到3D模型生成工具,能迅速生成高质量3D模型。

⏱️ 该工具在NVIDIA H100显卡上生成512³分辨率模型仅需3秒,效率极高

🛒 附带PBR四件套贴图,方便电商用户快速将产品转为3D展示。

详情链接:https://huggingface.co/microsoft/TRELLIS.2-4B

9、xAI 推最快语音代理 API,支持中文实时搜索与情绪控制

xAI 发布的 Grok 语音代理 API 在实时语音 AI 领域展现出卓越性能和极具竞争力的价格。该模型在音频推理基准测试中表现优异,响应速度远超竞品,并支持多语言自动检测、实时网页搜索与情绪控制等功能,为开发者提供了强大的工具。

【AiBase提要:】

🔥 Grok 语音代理 API 以每分钟 0.05 美元的价格推出,性价比极高

🌐 支持包括中文在内的多种语言自动检测与自由切换,适应全球用户需求。

🧠 深度集成实时网页搜索与推理能力,确保回复内容紧跟最新资讯。

10、豆包AI眼镜明年上市!联合润欣科技、老凤祥打造 2000 元内智能穿戴新品

豆包AI眼镜即将在 2025 年初上市,由火山引擎提供技术支持,润欣科技负责硬件设计,并与老凤祥合作打造时尚外观。该产品定价 2000 元以内,支持实时语音助手、环境感知等场景化功能,标志着字节跳动以“大模型+硬件+渠道”策略抢占下一代人机交互入口。

【AiBase提要:】

🧠 豆包AI眼镜依托火山引擎的RTC技术,实现低延迟语音交互与云端协同。

💼 联合润欣科技和老凤祥,打造融合大模型能力的亲民级AI眼镜。

🛒 定价 2000 元以内,预计 2025 年初上市,推动智能穿戴走向生活刚需。

举报

  • 相关推荐
  • 性能对标Gemini 2.5 Pro!蚂蚁开源新一代全模态大模型Ming-Flash-Omni 2.0

    今日,蚂蚁集团开源发布全模态大模型 Ming-Flash-Omni 2.0。 在多项公开基准测试中,该模型在视觉语言理解、语音可控生成、图像生成与编辑等关键能力表现突出,部分指标超越 Gemini 2.5 Pro,成为开源全模态大模型性能新标杆。 Ming-Flash-Omni 2.0 也是业界首个全场景音频统一生成模型,可在同一条音轨中同时生成语音、环境音效与音乐。 用户只需用自然语言下指令,即可对音色�

  • 被大量提问内部逻辑 谷歌Gemini遭蒸馏攻击

    近日,谷歌官方披露其旗舰AI模型Gemini正遭遇商业化驱动的大规模蒸馏攻击通过重复提问诱导聊天机器人泄露内部机制。攻击者通过系统地、反复地向模型发送精心设计的提示词,试图逆向工程Gemini的内部推理逻辑与决策机制,以实现模型克隆或强化自身AI系统的目的。此类蒸馏攻击属于知识产权盗窃,尽管各大厂商已部署能够识别与阻断蒸馏攻击的机制,但由于主流大模型服务面向所有人开放,所以其本质上仍易受攻击。

  • AI日报:蚂蚁开源大模型Ming-flash-omni 2.0;智谱GLM-5意外泄露;京东正式入局AI支付

    本文汇总了AI领域最新动态:蚂蚁集团开源全模态大模型Ming-flash-omni 2.0,在多模态理解与生成方面表现优异;智谱AI的GLM-5模型引发关注,股价飙升;科大讯飞发布星火X2大模型,基于国产算力深耕专业场景;京东推出“AI付”语音支付产品,提升便捷与安全;DuckDuckGo上线注重隐私的免费AI语音聊天功能;阿维塔车载系统升级,融合大模型与华为智驾;ChatGPT上线保险比价应用,冲击传统中介;OpenAI升级研究工具,引入GPT-5.2驱动并新增全屏报告交互体验。

  • AI日报:MiniMax Music 2.5 发布;蚂蚁灵波开源世界模型LingBot-World;谷歌 Gemini 3.5 泄露

    本期AI日报聚焦多项AI技术突破:MiniMax Music 2.5发布,提升AI音乐可控性与真实度;蚂蚁灵波开源世界模型LingBot-World,为具身智能等提供高保真数字环境;谷歌Gemini 3.5泄露,单次提示可生成三千行代码;Kimi K2.5 Agent升级,高效处理Excel、Word等办公文档;蘑菇物联“灵知”垂直大模型通过备案,专注工业辅助与能源领域;昆仑万维SkyReels-V3开源,实现多模态视频生成;昆仑天工发布音乐大模型Mureka V8,推动AI音乐迈向“可发布”级别;三星宣布下一代AR眼镜将于2026年发布,主打多模态AI体验。

  • AI日报:豆包2.0将于情人节发布;MiniMax M2.5 正式发布;小米开源首代机器人 VLA 大模型

    本期AI日报聚焦多项技术进展:字节跳动火山引擎发布“豆包”系列2.0版本,旨在降低专业内容生产门槛;MiniMAX M2.5模型开启海外内测,加速全球化布局;小米开源首款机器人VLA大模型,突破物理智能延迟瓶颈;百度千帆推出集成主流大模型的AI编码订阅服务Coding Plan;智谱发布GLM-5,迈向工程构建的Agentic Ready时代;DeepSeek上下文长度跃升至1M,处理能力大幅提升;Rokid眼镜新增�

  • 别傻傻买Mac Mini跑OpenClaw了!玩转AI代理,拼的不是显卡,是Token

    OpenClaw作为代理式AI开源框架,让AI从被动应答转向主动规划、调用工具、串联多步操作,成为数字世界的“全能助理”。其GitHub星标数已达14.3万,增长迅猛。然而,其自主决策特性也带来安全风险,如权限滥用、数据误删等。同时,OpenClaw的火爆推动了Agent普及,带来三大产业机会:一是云服务成为个人与中小企业入局的最低门槛;二是Token消耗迈入指数级增长阶段;三是Agent�

  • 高端电视大拆解:一文看懂为何RGB-Mini LED是全球公认的最新一代显示技术

    当前高端电视市场的竞争,早已跳出单纯的尺寸比拼,转向核心技术实力的较量。随着消费者对电视的需求从基础显示,升级为全场景高画质、绿色节能与健康护眼的多重诉求,传统显示技术的局限日益凸显,行业正迫切需要一场底层技术革新来打破这一瓶颈。值得关注的是,海信RGB-Mini LED电视近期被央视《消费主张》重点报道,其技术实力获得了专业认可:经中国电子技术标�

  • RGB-Mini LED技术破局!海信电视重构百吋大屏画质新高度

    文章探讨了中国电视屏幕尺寸的演变,指出百吋电视正从“小众可选”变为“家庭换新刚需”。然而行业陷入“内卷式困局”:价格战激烈、参数堆叠导致边际效益递减。海信以RGB技术为核心,将竞争逻辑从价格维度提升至价值维度。其RGB-Mini LED技术实现“三原色直出”,相比主流QD-Mini LED色彩更纯正。新一代技术引入第四颗青色发光芯片,解决了串色、光晕与偏色问题,BT.2020色域覆盖率达110%。配合自研画质芯片与算法,实现了亮度与色彩的完美同步,并有效过滤有害蓝光。文章认为,海信通过技术破局,在行业普遍陷入价格内卷时,重新定义了价值坐标,提供了更接近真实的视觉体验。

  • 海信RGB-Mini LED电视“刷屏”央视 一文读懂它为何是高端首选

    海信RGB-Mini LED电视凭借“三维光色同控”技术,在高端市场脱颖而出。相比传统SQD-Mini LED的二维控光,海信实现了对红、绿、蓝三原色的独立精准控制,从光源端直接混色,避免了光晕、串色和色彩衰减问题。其搭载自研信芯AI画质芯片H7,支持超高分区控光,色彩表现更纯净,寿命更长,能效更高。选购时需认准真RGB方案,海信新品E8S是全能旗舰之选。

  • 新款RGB-Mini LED哪款值得买?大品牌更放心,4款口碑机型是首选

    春节是电视消费高峰期,高端机型尤其受欢迎。央视《消费主张》栏目推荐海信RGB-Mini LED电视,该技术采用红绿蓝三色背光直显,具备超高色域、色准和亮度,画质、能效和舒适度俱佳。相比传统单色背光方案,RGB-Mini LED色彩表现更优。选购时需注意真假辨别,符合“RGB真彩背光+光色同控算法”标准方为真品。海信已推出多款机型,覆盖不同场景需求,是春节换新的可靠选择。

今日大家都在搜的词: