首页 > 原创 > 关键词  > 人工智能最新资讯  > 正文

AI日报:阿里推全新图片模型Qwen-Image;小米全量开源MiDashengLM-7B;智谱Zread.ai搭载 GLM-4.5

2025-08-05 16:16 · 稿源:站长之家

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用

新鲜AI产品点击了解https://top.aibase.com/

1、小米全量开源MiDashengLM-7B:音频理解性能刷新SOTA,推理速度暴增 20 倍

小米正式发布并全量开源了MiDashengLM-7B多模态大模型,该模型在音频理解领域实现了性能和效率的双重突破。其在 22 个公开评测集上取得最佳成绩,并且在推理效率方面表现出色,单样本首Token延迟仅为业界先进模型的四分之一,数据吞吐效率高出 20 倍以上。

image.png

【AiBase提要:】

🧠 双核心架构设计,融合专业音频处理与语言理解能力。

🎧 实现语音、环境声音和音乐的统一理解,提升跨域音频识别精度。

🚀 推理效率显著提升,支持终端离线部署,降低使用成本。

2、腾讯旗下AI工作台ima 推出全新功能,支持 AI 播客和文件夹导入等多项实用工具

腾讯旗下AI知识管理工具ima推出了多项新功能,包括AI播客生成、文件夹一键导入、Xmind脑图导入及知识库内容置顶,旨在提升用户的知识获取和管理体验。

image.png

【AiBase提要:】

🧠 支持AI播客生成,帮助用户更轻松地消化长篇文章或报告。

📁 提供一键导入文件夹功能,简化文档管理流程。

📌 可将重要文档置顶,提升信息检索效率。

3、阿里通义千问开源全新文生图模型Qwen-Image

阿里通义千问开源了全新的文生图模型Qwen-Image,该模型在文本渲染和图像编辑方面表现出色,并在多个基准测试中取得领先性能,成为图像生成与编辑领域的重要突破。

image.png

【AiBase提要:】

🖼️ Qwen-Image支持多行布局、段落级文本生成及细粒度细节呈现,能精准渲染宫崎骏风格动漫场景和中文对联书法效果。

🎨 在图像编辑方面,Qwen-Image具备风格迁移、物体增减、细节增强等能力,使普通用户也能轻松实现专业级图像编辑。

📈 Qwen-Image在多个公开基准测试中表现卓越,尤其在中文文本渲染上大幅领先现有先进模型,展现了全面优势。

详情链接:https://modelscope.cn/models/Qwen/Qwen-Image

4、ChatGPT用户数暴涨至 7 亿创纪录新高,OpenAI年化收入飙升至 120 亿美元

文章详细介绍了ChatGPT的用户增长、商业化进展以及OpenAI的财务表现。同时提到GPT- 5 可能即将发布,以及与谷歌AI产品的竞争情况。此外,还强调了产品优化和对用户健康的关注。

【AiBase提要:】

🔥 ChatGPT周活跃用户达到 7 亿,同比增长超四倍。

💰 OpenAI年化收入达到 120 亿美元,远超预期。

💡 新增休息提醒功能,关注用户健康与体验提升。

5、Anthropic疑似开始内测Claude Opus 4.1:代号leopard暗示推理能力重大升级

文章指出,Anthropic正在对其下一代大语言模型Claude Opus 4. 1 进行内部测试,其内部代号为claude-leopard-v2-02-prod。新模型的宣传语强调了问题解决能力的显著提升,表明其在逻辑推理和复杂任务处理方面有重大突破。同时,该模型可能接近正式发布阶段,预计将在激烈的AI市场竞争中保持技术领先。

【AiBase提要:】

🧠 新模型Claude Opus 4. 1 主打问题解决能力,强化逻辑推理与复杂任务处理。

豹子命名暗示模型具备更快响应速度和精准分析能力,预示架构创新。

内测版本v2-02-prod表明模型已进入生产环境测试阶段,接近正式发布。

6、搭载 GLM-4.5!智谱推出 Zread.ai 开发效率工具,更快理解代码与生成文档

Zread.ai 是一款基于大语言模型的开发效率工具,旨在帮助开发者快速掌握项目结构、生成技术文档,并提升团队协作效率。其核心功能包括代码理解、知识生成和团队协作,利用 GLM-4.5 模型实现高效的代码分析和文档生成。

image.png

【AiBase提要:】

💡 Zread.ai 提供一站式代码理解与文档生成服务,帮助开发者快速掌握项目结构。

📚 自动生成项目导读,涵盖架构解析、模块说明等内容,提升文档撰写效率。

🔍 背后采用 GLM-4.5 模型,具有出色的代码理解能力和低误判率,支持深入技术问答。

7、xAI 发布 Grok Imagine4:支持文生图与视频生成,开放 NSFW 内容创作

xAI推出的Grok Imagine4 在文生图和图生视频方面表现出色,尤其以快速的生成速度和原生支持NSFW内容为亮点,但视频效果仍有提升空间。

image.png

【AiBase提要:】

🎨 文生图功能生成速度快,接近实时浏览体验。

🎬 图生视频效率高,但画面细节和流畅性有待优化。

🌶️ 原生支持NSFW内容生成,引发伦理讨论。

8、阿里巴巴与南开大学携手推出视频大模型新型压缩技术LLaVA-Scissor

LLaVA-Scissor 是一种创新的视频大模型压缩方法,由阿里巴巴通义实验室与南开大学计算机科学学院联合开发。该技术通过基于图论的SCC算法有效减少token数量,同时保留关键语义信息,显著提升了视频处理效率,并在多个视频理解基准测试中表现出色。

image.png

【AiBase提要:】

🌟 LLaVA-Scissor 是一种新型视频大模型压缩技术,旨在解决传统方法中token数量激增的问题。

🔍 SCC 方法通过计算token相似性,构建图并识别连通分量,从而减少token数量并保留关键语义信息。

🏆 LLaVA-Scissor 在低token保留率下展现出显著性能优势,尤其在视频问答和长视频理解任务中表现优异。

9、北京团队突破!全球首个人形机器人3D视觉系统诞生,多传感器融合技术领跑世界

文章介绍了北京人形机器人创新中心推出的Humanoid Occupancy视觉感知系统,该系统通过语义占用表征技术实现了对三维空间的精准建模和多传感器数据的高效融合,解决了人形机器人在复杂环境中的感知难题。

image.png

【AiBase提要:】

🌍 引入语义占用表征技术,实现对三维空间的精细化建模。

🔄 支持多模态传感器协同工作,提升环境信息整合能力。

📊 构建大规模数据集,为研究提供宝贵资源支持。

详情链接:https://arxiv.org/pdf/2507.20217

10、OpenMind推出机器人操作系统OM1:打造机器人领域的安卓,FABRIC协议实现机器人互联互通

OpenMind通过开发名为OM1 的机器人操作系统,致力于成为机器人领域的Android。其创新的FABRIC协议使机器人能够验证身份并共享信息,推动机器人间的协作与学习。

【AiBase提要:】

🤖 OpenMind专注于机器人软件生态,开发了OM1 操作系统,旨在成为机器人领域的Android。

🔗 FABRIC协议为机器人构建了一个信任和协作网络,提升群体智能的进化速度。

🏠 OpenMind选择家庭场景作为切入点,以满足对人性化交互的需求。

举报

  • 相关推荐
  • Razer(雷蛇)在新加坡设立AI CENTER OF EXCELLENCE,加速人工智能投资布局

    雷蛇宣布在新加坡设立全球AI卓越中心,并计划在欧洲和美国建立类似机构,推动游戏与开发者工具领域的创新。新加坡中心将招聘150名AI工程师,专注于下一代AI游戏技术研发。雷蛇还推出AI工具套件,包括Game Co-AI和QA Co-AI,帮助开发者提升游戏质量和开发效率。该战略布局正值全球游戏市场快速增长期,预计2033年AI游戏市场规模将达280亿美元。新加坡数字产业发展局表示,此举将巩固该国作为区域AI创新中心的地位。

  • 加佳科技亮相世界人工智能大会,参与浦东重点项目签约并发布创新技术成果

    2025世界人工智能大会(WAIC)7月26日在上海开幕。加佳智云的"曦源一号"项目入选浦东新区人工智能重点项目并签约合作协议。加佳科技首次发布"数字商务智能体训练场"创新技术平台,与多家企业达成战略合作。浦东新区人工智能产业规模超1600亿元,占全市40%。加佳科技通过"曦源一号"训练场基础底座平台,为行业提供"硬件+软件+产业解决方案"一体化服务,推动AI与产业深度融合。大会期间,加佳科技展示其核心成果"数字商务智能体训练场"平台,该平台依托国产替代算力,提供全生命周期开发运营服务,降低企业AI应用门槛。加佳科技还与多家企业达成合作,加速构建开放共生的AI产业生态。

  • 星辰聚智·才启未来:2025世界人工智能大会中国电信发布系列前沿能力及AI产品

    7月27日,TeleAI科技前沿论坛在上海模速空间举办,主题为"星辰聚智·才启未来"。论坛汇聚全球行业专家、青年学者及企业家,探讨AI创新趋势。中国电信发布多项AI成果:1)TeleAI研究院凭借大模型创新获2025SAIL之星奖;2)提出"智传网"三大定律(信容律、同源律、集成律)及生成式智能传输等创新技术;3)发布"星小辰"智能终端,整合高德地图、航旅纵横等服务;4)推出首款智能眼镜"天翼AI智镜",具备物体识别、实时翻译等功能;5)启动"青年智算计划",投入超600P算力支持AI创新。论坛展示AI在终端、机器人等领域的深度应用,体现中国电信"云改数转智惠"战略布局。

  • 润和软件携丰富金融行业实践成果亮相2025世界人工智能大会

    润和软件在2025世界人工智能大会(WAIC2025)上展示了JettoAI+智能助手平台等系列智慧金融解决方案,包括测试智能助手、消保助手、研报助手等创新产品。作为金融科技领域领先企业,润和软件深耕AI与金融业务融合,已服务6大国有银行、12家股份制银行及超280家中小金融机构。报告显示中国金融科技市场预计将以13.3%复合增长率高速增长,2028年科技投入或突破6500亿元。润和软件�

  • 零门槛数字IP上线,邦彦Nuwaai掀起世界人工智能大会(WAIC)互动体验热潮​

    邦彦技术在2025世界人工智能大会发布Nuwaai数字人平台,主打"3分钟创建AI数字IP"概念。该平台通过三大核心模块(形象塑造、才艺赋能、个性养成)实现数字人全流程创作,支持古风、职业装等多种风格定制,并能加载营销、直播等专业技能。相比传统方案,Nuwaai将开发成本降至8元起,交付周期缩短至3分钟,支持按需加载功能。平台定位"数字人生产力工具",覆盖营销、社交、娱乐等多场景应用,旨在推动数字人技术从概念探索迈向实用化。目前官网已开放注册,面向个人创作者和企业用户提供低成本数字IP解决方案。

  • Checkout.com项尧受邀参与 WAIC2025 共话人工智能时代跨境支付新机遇

    2025世界人工智能大会(WAIC)于7月26-28日在上海举办,全球领先支付解决方案提供商Checkout.com受邀参与"无界人工智能:深化中英合作"主题论坛。其大中华区总经理项尧与行业专家探讨AI赋能跨境商业生态的创新实践,重点分享公司在代理电商平台(Agentic Commerce)领域的支付技术创新,包括与Mastercard、Visa合作构建支持AI代理交易的技术框架。作为支付行业领军者,Checkout.com通过智能支付网络帮助电商平台优化交易管理,支持多币种支付,每年为客户解锁数亿美元收入潜力。本届WAIC展览面积首次突破7万平方米,吸引800余家企业参展,涵盖40余款大模型及60余款智能机器人。

  • 加速AI场景落地和产业赋能 云谷“论数”之人工智能产业应用大会圆满举办

    7月16日,云谷"论数"之"AI·场景落地+产业崛起 就在浙里"人工智能产业应用大会在杭州举行。活动由浙江省工程师学会等多家单位联合主办,聚焦AI规模化落地与科技成果转化。与会专家指出,2025年是AI发展关键年,浙江将深化场景落地实践,打造"应用实践-技术优化-价值创造"闭环。企业代表分享了AI在智能制造、智慧交通等领域的应用案例,强调技术需扎根产业需求。活动还成立了大数据与人工智能专委会,未来将促进产学研协同创新,推动AI在千行百业规模化应用,助力浙江打造全球AI创新高地。

  • 谷歌Pixel 10 Pro XL渲染图曝光:两大配色 8月20日发布

    谷歌Pixel 10 Pro XL的官方宣传渲染图近日曝光,新机将于8月20日发布,还剩不到2周的时间。 此次谷歌Pixel 10 Pro XL提供了月石”(Moonstone)和黑曜石”(Obsidian)两种配色,分别呈现柔和的浅灰蓝色调和经典的暗灰配金属高光边框设计。 机身右侧依旧是电源键与音量键组合,背部为横向延展的胶囊形三摄模组,内含闪光灯及红外温度传感器,整体厚度与重量与上代基本一致。 �

  • 智慧养老预告| 让养老更有AI!作为科技邀您共赴WAIC 2025世界人工智能大会

    2025世界人工智能大会(WAIC2025)将于7月26-28日在上海举办,主题为"智能时代 同球共济"。本届大会展览面积首次突破7万平方米,吸引800余家企业参展,展示3000余项前沿展品,涵盖40余款大模型、50余款AI终端、60余款智能机器人及80余款"全球首发"新品。12位诺贝尔奖与图灵奖得主、80余位中外院士、30余国1200位重磅嘉宾将齐聚申城,围绕大模型革命、算力新基建等十大方向展开对话。大会首次将"AI+医疗"列为核心议题,中国主导制定的全球养老机器人国际标准将在会上发布。面对中国3亿老年人口(其中失能半失能老人超4500万)的养老需求痛点,大会将探讨AI赋能智慧养老解决方案,推动"全域数据贯通→精准需求洞察→资源动态调度"闭环,重塑养老产业生态。

  • 图书馆回应少儿阅读区情侣搂抱亲热:将加强管理

    8 月 4 日,一则“情侣在图书馆少儿阅读区躺地搂抱超 10 分钟”的爆料在社交平台引发热议。 据网友李女士(化名)描述, 8 月 3 日下午,她带女儿在长沙岳麓图书馆少儿阅读区找书时,发现一对情侣躺在地上亲密相拥,手机外放视频声音,整个过程持续十余分钟。更令她震惊的是,现场虽有志愿者在岗,却未对这一不文明行为进行劝阻。

热文

  • 3 天
  • 7天