首页 > 原创 > 关键词  > AI最新资讯  > 正文

AI日报:生数科技推出Vidu Q2;火山引擎推出炉米Lumi;通义千问开源300+模型

2025-09-25 15:51 · 稿源:站长之家

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解https://app.aibase.com/zh

1、生数科技推出 Vidu Q2细微表情生成让AI演绎更真实!

生数科技推出的Vidu Q2模型在图生视频领域实现了重大突破,尤其在细微表情生成方面表现出色,为AI演绎提供了更加真实和生动的视觉体验。

image.png

【AiBase提要:】

🎭 Vidu Q2能够精准捕捉细微表情变化,提升视频生成的自然度和情感表达。

🎥 支持多种视频模式选择,包括图生视频、首尾帧视频以及可调时长选项,满足多样化需求。

💡 生数科技致力于通过AI技术推动创意产业发展,为用户带来更高质量的影像创作体验。

2、火山引擎推出炉米 Lumi 平台 支持视觉模型 Lora 微调

火山引擎推出的炉米 Lumi 平台,首次支持豆包、即梦等同款视觉模型的 Lora 微调功能,旨在帮助企业高效定制独特的视觉风格,满足市场需求。

image.png

【AiBase提要:】

🧠 炉米 Lumi 平台支持视觉模型的 Lora 微调功能,帮助企业定制独特的视觉风格。

🚀 该平台提供从图片生成到视频生成的全流程服务,满足企业专业场景的 AIGC 需求。

💡 炉米 Lumi 平台助力企业高效构建定制化 AIGC 生产能力,提升用户体验。

3、阿里云CTO透露:通义千问开源300+模型 下载量破6亿大关

阿里云在2025云栖大会上展示了通义千问项目的显著成就,包括开源超过300个模型和下载量突破6亿次。这表明了阿里云在AI领域的强大影响力和技术实力,并且通过开源模型推动技术创新和应用落地。

【AiBase提要:】

🚀 通义千问项目已开源300多个模型,展示出强大的技术实力。

📊 下载总量突破6亿次,体现了用户对阿里云AI技术的高度认可。

🖼️ 通义万象生成超3.9亿张图片和7000多万视频,彰显数字内容生成能力。

4、百度 Qianfan-VL 开源发布,昆仑芯助力多模态 AI 新突破

百度正式开源了其最新视觉理解模型 Qianfan-VL,包含3B、8B和70B三个版本,适用于不同场景。该模型具备强大的多模态能力,尤其在OCR和教育领域表现突出,并且训练依赖于自研的昆仑芯P800芯片。

【AiBase提要:】

🧠 Qianfan-VL 是一个强大的多模态大模型,能够同时处理图像和文本信息。

💡 昆仑芯 P800 芯片支撑模型训练,功耗低且效率高,优化大规模计算性能。

🚀 Qianfan-VL 系列已在 GitHub 和 Hugging Face 上开源,供开发者自由使用。

详情链接:https://github.com/baidubce/Qianfan-VL

5、微软引入 Anthropic AI 模型,拓展 Copilot Assistant 功能

微软宣布在 Copilot 助手中引入 Anthropic 的 AI 模型,标志着其在生成式人工智能领域的多元化战略迈出新一步。尽管与 OpenAI 的合作依然密切,微软开始引入 Anthropic 的技术以满足商业客户的需求。企业用户现在可以使用 Anthropic 的模型构建 AI 代理,并且这些模型将在亚马逊和谷歌云中运行。

image.png

【AiBase提要:】

🤖 微软在 Copilot 助手中引入 Anthropic 的 AI 模型,推动产品多元化。

🔄 Microsoft 与 OpenAI 的关系虽然仍然紧密,但逐渐使用 Anthropic 技术。

🚀 企业用户可选择 Anthropic 模型构建 AI 代理,需管理员启用后使用。

6、OpenAI 在美国新建五个数据中心,推动 Stargate 项目快速发展

OpenAI 宣布将在美国新建五个数据中心,以提升 Stargate 项目的计算能力。该项目由多家公司共同发起,总投资额高达5000亿美元,旨在推动生成式人工智能的发展。

【AiBase提要:】

🌐 OpenAI 将在美国新建五个数据中心,Stargate 项目总计算能力将达到近7GW。

💼 Oracle 将负责三个新数据中心的建设,阿比林数据中心将扩建并增加600MW 计算能力。

🚀 OpenAI 计划未来每周增加1GW 的人工智能基础设施,以推动 AI 技术的进一步发展。

7、英伟达开源 Audio2Face 模型,AI 助力实时面部动画生成

英伟达开源了其生成式 AI 面部动画模型 Audio2Face,提供了 SDK 和训练框架,支持离线和实时处理,适用于游戏、影视等多个领域。该技术已被多家游戏开发商采用,提升了角色的真实感和沉浸体验。

image.png

【AiBase提要:】

🔊 英伟达开源 Audio2Face 模型,提升虚拟角色的面部动画生成技术。

🎮 支持离线渲染和实时流式处理,适用于多种场景。

🌟 已被多个游戏开发商采用,简化制作流程并提升角色真实感。

详情链接:https://build.nvidia.com/nvidia/audio2face-3d

8、Meta 发布代码世界模型 CWM:具备沙箱推演能力的32B AI

Meta 推出的 Code World Model (CWM) 是一个拥有 32B 参数 的 AI 系统,能够通过沙箱环境进行代码模拟和推演,从而减少错误并提高调试效率。该模型对硬件要求极高,需要双 H100 GPU 和 RDMA 技术支持。

image.png

【AiBase提要:】

🧠 CWM 在生成代码前会进行沙箱模拟,预测代码运行后果。

🔍 能快速定位代码错误,提升调试效率。

🚨 可在执行命令前预警潜在风险,增强安全性。

详情链接:https://github.com/facebookresearch/cwm

举报

  • 相关推荐
  • 响应国家AI+号召,开放微表情SDK

    近日,上海步施网络科技宣布对外开放微表情识别SDK,响应国家推动人工智能与实体经济深度融合的号召。该技术原仅用于内部项目,现面向各行业开放,助力产业智能化升级。微表情识别可捕捉人类瞬间流露的真实情绪,在医疗、教育、安防、商业等领域具有广泛应用前景。公司提供多种合作模式,支持本地化部署,确保数据安全。此举将促进AI技术创新,推动行业智能化发展。

  • AI日报:接入MJ!夸克发布造点AI;Wan2.5-Preview发布;可灵推最新视频生成模型可灵2.5Turbo

    近日AI领域迎来多项重要更新:阿里夸克发布AI创作平台“造点”,整合通义万相Wan2.5与Midjourney V7,支持音画同步视频生成;Wan2.5-Preview实现多模态输入与电影级视频同步生成,提升视觉创作能力;可灵AI推出视频生成模型2.5Turbo并降价30%,降低使用门槛;阿里通义推出Qwen3-ASR-Toolkit,实现小时级音视频转录;谷歌相册AI编辑功能扩展至安卓用户,支持语音修图;谷歌Mixboard工具助力创意设计,生成情绪板;Qwen发布Qwen3-Max模型,在代码生成与智能体能力表现突出;Figma推出MCP服务器,实现设计到代码的一键转换,提升开发效率。

  • 拿下Q2新品畅销榜Top 1,终于又有国内厂商把混休跑出千万月流水

    仔细观察近两年跑出大流水的混休游戏就能发现,不少头部产品采用的思路是“现实生活题材+平缓难度曲线”。前者即把常见的生活场景转化成谜题负责吸量,后者则是用循序渐进的难度变化来保证留存和变现。从最早「Twisted Tangle」的解绳子再到后面跑出的各种拧螺丝产品,都遵循了这一套路。

  • 六小龄童回应“烦死了”表情包:大家能一乐挺好

    9月16日,六小龄童现身杭州,回应“烦死了”表情包走红网络一事。他表示现代科技能让《西游记》更好,经典台词“烦死了”成为微信常用表情。86版《西游记》凭借奇幻剧情和鲜活角色成为一代经典,六小龄童塑造的孙悟空形象跨越数十年时光,至今仍在大众心中占据不可撼动的地位,是无数人的童年启蒙偶像。

  • 免费生成10秒高清视频!通义App接入通义万相2.5

    在2025云栖大会上,阿里发布通义万相Wan2.5 Preview系列模型,覆盖文生视频、图生视频、文生图和图像编辑四大功能。其视频生成模型首次实现音画同步,可生成匹配画面的人声、音效和BGM,时长从5秒提升至10秒,支持24帧/秒的1080P高清输出,降低影视级创作门槛。模型指令遵循能力增强,支持运镜等复杂连续变化控制。用户通过通义App输入指令即可自动生成10秒高清视频,每日免费使用15次,支持导出无水印视频。同时,图像生成能力全面升级,可生成中英文字符和图表,支持图像编辑功能,一句话即可完成P图。

  • 小米17 Pro Max“背屏”功能首发展示!遭网友P图神评 卢伟冰连回三个“允悲”表情

    小米17系列将配备"妙享背屏"功能,Pro及Pro+版本支持,标准版不支持。背屏尺寸较大,可显示时间主题、动态壁纸、卡通人物等,支持无限屏模式。预计还将集成音乐播放、自拍预览、通知显示、车辆控制等功能,并可能与妙享中心联动。小米总裁卢伟冰在微博发起创意征集,网友反响热烈。该系列预计十一前发布,更多功能玩法将陆续曝光。

  • 爱诗科技,一家AI视频创业公司的生存哲学

    “你还是回去吧,大模型在中国没有机会。” 2023年刚创业,爱诗科技创始人兼CEO王长虎收到了天使投资人朱啸虎的“劝退”。 但两年时间过去,两个节点颠覆了投资人对AI视频生成赛道的固有印象。先是

  • 基于通义万相 美图多款APP上线全新动漫特效、AI变身等视频生成功能

    今日,美图公司旗下美图秀秀、RoboNeo、Wink和开拍等多款产品,推出全新动漫特效、AI变身等视频生成功能。 据悉,新功能基于通义万相系列模型进行深度开发与训练,为美图的全球用户提供全新的创作体验。 近年来,美图加速布局生产力场景,不仅推出面向企业的AI算法服务和解决方案,旗下消费级产品也在快速集成大模型。 去年6月,美图就开始和阿里展开大模型合作。

  • 腾讯云联合IDC发布AI Infra报告:定义Gen Al时代智算新范式

    2025年腾讯全球数字生态大会于9月16-17日在深圳召开。在Infra+Agent专场,腾讯云与IDC联合发布《AI+Infra:加速智能体落地的基础架构、发展趋势与产业实践》报告。报告指出,随着AI应用规模化落地,AI云基础设施正向核心智算设施演进,涵盖分布式底座、异构硬件、高性能软件和场景化方案四大维度。报告还提出六大演进趋势:架构重构、行业垂直化、算力智能化、安全能力提升、研发范式创新和服务化转型,并解析了腾讯云在交通、制造、医疗等领域的落地案例,为企业智能化转型提供实践指南。

  • 店长连续工作超8小时 因闭眼2秒视频遭解雇 法院判了

    9月26日,广州市中级人民法院、广州市人力资源和社会保障局、广州市总工会联合发布了新一批劳动争议典型案例。 其中,有一则案例引发广泛关注:一位零售店店长竟因闭眼休息、上厕所等看似平常的行为被公司解雇。 2021年3月,余某入职某零售公司,担任该公司位于某商场门店的店长一职,全面负责门店的日常管理工作。 然而,2024年9月26日,某零售公司却以余某工作�

今日大家都在搜的词: