首页 > 原创 > 关键词  > 人工智能最新资讯  > 正文

AI日报:混元推四款小尺寸开源模型;昆仑万维发布新推理大模型MindLink;谷歌Gemini 2.5 Deep Think发布

2025-08-04 16:01 · 稿源:站长之家

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解https://top.aibase.com/

1、腾讯混元开源并发布 0.5B、1.8B、4B、7B模型

腾讯混元团队推出四款小尺寸开源模型,适用于消费级显卡和低功耗场景,支持垂直领域的低成本微调。这些模型在推理速度、性价比和长文处理能力上表现出色,并已在多个开源平台上线。

image.png

【AiBase提要:】

✨ 四款小尺寸模型专为消费级设备设计,适合多种低功耗场景。

🚀 模型具备快速推理和长文处理能力,可一次性处理超长内容。

🔧 支持多种部署方式,适用于端侧到云端的多样化需求。

详情链接:https://hunyuan.tencent.com/modelSquare/home/list

2、昆仑万维发布并开源全新推理大模型 MindLink

昆仑万维发布并开源了最新推理大模型Skywork MindLink,该模型通过创新性推理框架实现动态路径选择,提升答案透明度与效率,并在多项评测中取得卓越成绩。

image.png

【AiBase提要:】

🧠 Skywork MindLink采用Plan-based Reasoning新范式,优化多轮对话体验。

🏆 在多项基准测试中表现优异,斩获多个数学竞赛金牌。

🔧 内置自适应推理系统,可根据任务难度自动调整生成策略。

详情链接:https://github.com/SkyworkAI/MindLink

3、B站推出AI原声翻译功能:保留UP主声线音色,破解二次元文化出海难题

B站推出了自主研发的AI原声翻译功能,旨在解决国际版与国内版合并后的内容互通问题。该技术能够保留UP主的原始声线、音色特征和说话习惯,为海外用户提供更自然的中文内容体验。

image.png

【AiBase提要:】

✅ B站推出AI原声翻译功能,支持英语翻译,保留UP主原始声线和音色。

🔄 采用对抗式强化学习和Deep Research技术,确保翻译精准并保留文化韵味。

🌐 未来将扩展日语等更多语言支持,助力B站国际化战略发展。

4、谷歌Gemini 2.5 Deep Think发布!IMO金牌加持,AI新王者能否重塑未来?

谷歌DeepMind推出的Gemini 2.5 Deep Think模型在多个领域展现出卓越的推理能力,尤其在2025年国际数学奥林匹克竞赛中获得金牌。该模型引入了并行思考和强化学习技术,提升了复杂任务处理能力,并在编码、跨领域知识测试中表现优异。

QQ20250804-110503.jpg

【AiBase提要:】

🧠 引入并行思考机制,提升复杂问题解决能力。

🏆 在IMO竞赛中取得金牌,展现顶尖数学推理实力。

🚀 支持多模态与长上下文,适用于多种场景。

5、OpenAI CEO展示 GPT-5 新特性,能高效整合网络信息

OpenAI首席执行官萨姆・奥尔特曼在社交媒体上分享了GPT-5的聊天记录截图,展示了其强大的信息整合能力。GPT-5对科幻动画《Pantheon》给出了积极评价,并提到该剧在烂番茄上获得了100%好评。这一事件标志着GPT-5的首次公开亮相,引发了科技界的广泛关注。

【AiBase提要:】

🌟 GPT-5首次公开亮相,展示了其强大的信息整合能力。

📺 OpenAI CEO推荐科幻动画《Pantheon》,并分享了模型的积极评价。

🔍 GPT-5在烂番茄网站上的评价为“100% 影评人好评”,引起广泛关注。

6、苹果组建AI答案引擎团队:挑战ChatGPT,或将重塑Siri和Safari搜索体验

苹果公司成立了一个专门团队,致力于开发类似ChatGPT的AI应用程序,旨在提升其核心产品的搜索和交互体验。该团队名为Answers, Knowledge, and Information,专注于构建一个能够利用全网信息回答用户问题的答案引擎。

【AiBase提要:】

🍎 苹果成立新团队开发类似ChatGPT的AI应用,以提升搜索和交互体验。

🔍 答案引擎可能作为独立应用或整合到Siri、Safari等产品中,提供更智能的搜索功能。

🌐 苹果希望减少对第三方AI服务的依赖,并应对谷歌反垄断案件带来的影响。

7、高德地图宣布全面AI化,上线全球首个AI原生地图应用“高德地图2025”

高德地图正式推出全球首个AI原生地图应用——高德地图2025,标志着其在技术领域的重大飞跃。该应用结合空间智能技术,通过多模态信息感知提升地图的智能化程度,并将在多个领域产生积极影响。

【AiBase提要:】

🚀 高德地图推出全球首个AI原生地图应用,实现技术突破。

🧠 空间智能技术提升地图的多模态信息感知能力。

🚗 应用将拓展至智能汽车、智能眼镜等多个领域,提升出行效率。

8、Adobe Photoshop 推出“Harmonize”:用 AI 自动匹配光影,实现无缝图像合成

Adobe 通过一系列生成式 AI 工具,如 "Harmonize",简化了复杂的图像编辑过程,提升了图像合成与修饰的效率,并引入了内容凭证以保障图像真实性。

image.png

【AiBase提要:】

🖼️ "Harmonize" 工具可自动匹配图像元素的光照、颜色和阴影,实现无缝合成。

🔍 AI 驱动的图像升级功能可将分辨率提升至高达800万像素,同时不损失画质。

🔒 内容凭证功能为图像编辑历史提供可信追踪链,确保数字内容的真实性。

9、NVIDIA 发布 Cosmos DiffusionRenderer:革命性视频渲染技术

NVIDIA 推出了 Cosmos DiffusionRenderer,这是一个用于高质量图像和视频重光源及去光源的新型视频扩散框架。该技术是原有 DiffusionRenderer 的重大升级,通过改进的数据策划流程提升了渲染质量。

image.png

【AiBase提要:】

🌟 技术是 NVIDIA 原有 DiffusionRenderer 的重大升级,提供更高质量的图像和视频渲染。

💻 用户需安装 Python3.10 和至少 16GB 显存的 NVIDIA GPU,并创建相关的 conda 环境。

🎥 支持对图像和视频进行去光源及重光源处理,并能使用多种环境光照地图进行渲染。

详情链接:https://github.com/nv-tlabs/cosmos1-diffusion-renderer

10、安卓开发革命!谷歌Android Studio免费Agent模式上线,完爆苹果生态?

谷歌在Google I/O2025大会上宣布推出Android Studio的免费Agent模式,该模式基于Gemini2.5Pro,通过自然语言交互提升开发效率,支持跨文件任务处理、UI代码修改和自定义规则。其功能不仅挑战了苹果的Xcode生态,还为开发者提供了更高效的工具。

QQ20250804-140505.jpg

【AiBase提要:】

🤖 Agent模式:基于Gemini2.5Pro,通过自然语言交互完成复杂开发任务。

🔍 核心功能:支持UI代码快速修改、自定义规则设置以及百万Token上下文窗口。

🚀 竞争优势:免费开放Agent模式,对苹果Xcode生态形成直接挑战。

11、谷歌开源结构化信息提取工具 langextract,可提供精确来源定位

谷歌开源了 LangExtract 工具,能够高效从非结构化文本中提取结构化信息,适用于医疗、文学和商业等多个领域,为开发者提供了强大的解决方案。

image.png

【AiBase提要:】

🧠 精准溯源:提取结果可映射到源文本的具体位置,便于验证和追溯数据准确性。

🧩 可靠结构化输出:通过少量示例定义输出格式,确保符合用户预设的 JSON 模式。

📊 交互式可视化:一键生成 HTML 报告,直观查看提取结果,提升审核效率。

详情链接:https://github.com/google/langextract

12、Figma开发者模式重磅更新:彩色批注与MCP协议双重升级,设计转代码效率暴增

Figma近期对开发者模式进行了全面升级,推出了彩色交互式批注系统和Model Context Protocol(MCP)协议的重大改进。这些更新显著提升了设计与开发协作的效率,为行业树立了新的标杆。

image.png

【AiBase提要:】

🎨 彩色交互式批注系统让设计师能够通过不同颜色标记信息,提高开发理解效率。

🔄 MCP协议升级支持传输结构化数据,使AI工具生成的代码更贴合实际需求。

🚀 新功能如Ready for Dev视图简化设计交接流程,提升团队协作效率。

举报

  • 相关推荐
  • 腾讯混元3D世界模型在魔搭社区开源首发

    7月27日,腾讯混元3D世界模型1.0在魔搭社区开源首发。这是业界首个开源的沉浸式3D世界生成模型,支持文字/图片输入快速生成完整3D场景,将原本需要数周的建模时间缩短至几分钟。该模型显著提升了游戏开发、VR、数字内容等领域的创作效率,开发者可免费下载体验,还能通过魔搭社区提供的4000+MCP服务和调试工具进行优化训练。作为中国最大AI开源社区,魔搭已汇聚500+机构、7万+模型,覆盖36个国家1600万开发者。此前腾讯开源的混元MoE模型Hunyuan-A13B也在该社区首发。

  • 星辰聚智·才启未来:2025世界人工智能大会中国电信发布系列前沿能力及AI产品

    7月27日,TeleAI科技前沿论坛在上海模速空间举办,主题为"星辰聚智·才启未来"。论坛汇聚全球行业专家、青年学者及企业家,探讨AI创新趋势。中国电信发布多项AI成果:1)TeleAI研究院凭借大模型创新获2025SAIL之星奖;2)提出"智传网"三大定律(信容律、同源律、集成律)及生成式智能传输等创新技术;3)发布"星小辰"智能终端,整合高德地图、航旅纵横等服务;4)推出首款智能眼镜"天翼AI智镜",具备物体识别、实时翻译等功能;5)启动"青年智算计划",投入超600P算力支持AI创新。论坛展示AI在终端、机器人等领域的深度应用,体现中国电信"云改数转智惠"战略布局。

  • 润和软件携丰富金融行业实践成果亮相2025世界人工智能大会

    润和软件在2025世界人工智能大会(WAIC2025)上展示了JettoAI+智能助手平台等系列智慧金融解决方案,包括测试智能助手、消保助手、研报助手等创新产品。作为金融科技领域领先企业,润和软件深耕AI与金融业务融合,已服务6大国有银行、12家股份制银行及超280家中小金融机构。报告显示中国金融科技市场预计将以13.3%复合增长率高速增长,2028年科技投入或突破6500亿元。润和软件�

  • 加佳科技亮相世界人工智能大会,参与浦东重点项目签约并发布创新技术成果

    2025世界人工智能大会(WAIC)7月26日在上海开幕。加佳智云的"曦源一号"项目入选浦东新区人工智能重点项目并签约合作协议。加佳科技首次发布"数字商务智能体训练场"创新技术平台,与多家企业达成战略合作。浦东新区人工智能产业规模超1600亿元,占全市40%。加佳科技通过"曦源一号"训练场基础底座平台,为行业提供"硬件+软件+产业解决方案"一体化服务,推动AI与产业深度融合。大会期间,加佳科技展示其核心成果"数字商务智能体训练场"平台,该平台依托国产替代算力,提供全生命周期开发运营服务,降低企业AI应用门槛。加佳科技还与多家企业达成合作,加速构建开放共生的AI产业生态。

  • 智慧养老预告| 让养老更有AI!作为科技邀您共赴WAIC 2025世界人工智能大会

    2025世界人工智能大会(WAIC2025)将于7月26-28日在上海举办,主题为"智能时代 同球共济"。本届大会展览面积首次突破7万平方米,吸引800余家企业参展,展示3000余项前沿展品,涵盖40余款大模型、50余款AI终端、60余款智能机器人及80余款"全球首发"新品。12位诺贝尔奖与图灵奖得主、80余位中外院士、30余国1200位重磅嘉宾将齐聚申城,围绕大模型革命、算力新基建等十大方向展开对话。大会首次将"AI+医疗"列为核心议题,中国主导制定的全球养老机器人国际标准将在会上发布。面对中国3亿老年人口(其中失能半失能老人超4500万)的养老需求痛点,大会将探讨AI赋能智慧养老解决方案,推动"全域数据贯通→精准需求洞察→资源动态调度"闭环,重塑养老产业生态。

  • 零门槛数字IP上线,邦彦Nuwaai掀起世界人工智能大会(WAIC)互动体验热潮​

    邦彦技术在2025世界人工智能大会发布Nuwaai数字人平台,主打"3分钟创建AI数字IP"概念。该平台通过三大核心模块(形象塑造、才艺赋能、个性养成)实现数字人全流程创作,支持古风、职业装等多种风格定制,并能加载营销、直播等专业技能。相比传统方案,Nuwaai将开发成本降至8元起,交付周期缩短至3分钟,支持按需加载功能。平台定位"数字人生产力工具",覆盖营销、社交、娱乐等多场景应用,旨在推动数字人技术从概念探索迈向实用化。目前官网已开放注册,面向个人创作者和企业用户提供低成本数字IP解决方案。

  • Checkout.com项尧受邀参与 WAIC2025 共话人工智能时代跨境支付新机遇

    2025世界人工智能大会(WAIC)于7月26-28日在上海举办,全球领先支付解决方案提供商Checkout.com受邀参与"无界人工智能:深化中英合作"主题论坛。其大中华区总经理项尧与行业专家探讨AI赋能跨境商业生态的创新实践,重点分享公司在代理电商平台(Agentic Commerce)领域的支付技术创新,包括与Mastercard、Visa合作构建支持AI代理交易的技术框架。作为支付行业领军者,Checkout.com通过智能支付网络帮助电商平台优化交易管理,支持多币种支付,每年为客户解锁数亿美元收入潜力。本届WAIC展览面积首次突破7万平方米,吸引800余家企业参展,涵盖40余款大模型及60余款智能机器人。

  • 猿辅导AI大模型:技术深融与场景革新,重构学习体验

    2025年教育科技领域迎来智能化新浪潮。猿辅导集团通过自主研发的"猿力大模型"与开源推理大模型DeepSeek深度融合,构建覆盖"数据-场景-交互"全链路的AI教育生态。其技术方案已获信通院"模型开发5级"认证,成为教育行业首个获此最高评级的大模型。硬件方面推出"小猿学练机"和"小猿AI学习机",实现学习平板与智能基座结合,支持打印、情感交互等功能。校园端覆盖25省市超1000所学校,通过"AI安全驾驶模拟"等项目培养学生计算思维。编程教育领域推出支持代码实时监测的AI-Agent工具。凭借300亿条学情数据和15亿题库构建的高质量素材库,显著降低"幻觉"风险68%。目前旗下出海产品已服务100多个国家,推动中国教育科技走向国际。

  • 加速AI场景落地和产业赋能 云谷“论数”之人工智能产业应用大会圆满举办

    7月16日,云谷"论数"之"AI·场景落地+产业崛起 就在浙里"人工智能产业应用大会在杭州举行。活动由浙江省工程师学会等多家单位联合主办,聚焦AI规模化落地与科技成果转化。与会专家指出,2025年是AI发展关键年,浙江将深化场景落地实践,打造"应用实践-技术优化-价值创造"闭环。企业代表分享了AI在智能制造、智慧交通等领域的应用案例,强调技术需扎根产业需求。活动还成立了大数据与人工智能专委会,未来将促进产学研协同创新,推动AI在千行百业规模化应用,助力浙江打造全球AI创新高地。

  • 腾讯公司副总裁蔡光忠:从好技术到好产品,AI进入场景突破关键期

    腾讯副总裁蔡光忠在2025世界人工智能大会上表示,AI发展正从"能用"向"好用"转变,未来竞争焦点将从模型规模转向实际应用价值。腾讯通过混元大模型等技术底座,构建了面向不同用户的智能平台体系,包括面向开发者的腾讯云智能平台、面向个人用户的元器平台等。目前腾讯AI已在政务、金融、教育等多个行业落地应用,形成可复制的标杆案例。蔡光忠强调,