拖拽下图像就能生成视频，中科大、微软等DragNUWA属实惊艳

2023-08-21 16:00 · 稿源：机器之心公众号

随着 ChatGPT、GPT-4、LLaMa 等模型的问世，人们越来越关注生成式模型的发展。相比于日渐成熟的文本生成和图像生成，视频、语音等模态的 AI 生成还面临着较大的挑战。现有可控视频生成工作主要存在两个问题:首先，大多数现有工作基于文本、图像或轨迹来控制视频的生成，无法实现视

......

本文由站长之家合作伙伴自媒体作者“机器之心公众号”授权发布于站长之家平台，本平台仅提供信息索引服务。由于内容发布时间超过平台更新维护时间，为了保证文章信息的及时性，内容观点的准确性，平台将不提供完全的内容展现，本页面内容仅为平台搜索索引使用。需阅读完整内容的用户，请查看原文，获取内容详情。

即将跳转到外部网站

安全性未知，是否继续

继续前往

（举报）

相关推荐

关键词：

科普 | 读懂HBM和DRAM，才懂AI算力未来

在AI算力需求激增的背景下，存储芯片成为决定计算性能的关键。文章重点分析了三大易失性存储技术：SRAM凭借高速读写特性在CPU缓存中不可替代；DRAM作为数字世界的“主内存”，在容量与速度间实现平衡；HBM则通过3D堆叠架构革命性提升带宽，突破AI训练中的“内存墙”瓶颈。当前HBM需求爆发式增长，预计2025年市场规模将达340亿美元。中国企业在DRAM领域逐步突破，并开始布局HBM技术，正通过持续技术积累提升在全球半导体生态中的地位。

存储芯片 DRAM HBM
全球DRAM价格飙升长鑫LPDDR5X量产成市场“稳定器”

DRAM合约价近期暴涨，三星、SK海力士和美光暂停DDR5报价，导致供应链紧张，现货价格一周内飙升25%。机构预测四季度DRAM价格将上涨18%-28%，NAND闪存合约价也将全面上涨5%-10%。与此同时，长鑫存储已量产LPDDR5X产品，覆盖多种容量和速率，技术达国际一流水平。全球内存市场格局正从“三足鼎立”向“四方争霸”演变，下游客户纷纷签署长期协议以确保供应稳定。

DRAM合约价 DDR5价格存储市场
科大讯飞“AI+文旅”产品全新升级

在2025科大讯飞全球1024开发者节期间，"AI+文旅"产品升级发布，展示AI如何让文旅体验从"到此一游"升级为"深度体验"。重点包括：数字人技术让李白"讲解"庐山瀑布，虚拟人交互平台支持一键定制景区专属形象；讯飞翻译机2.0支持80种外语实时对话；AI伴游APP可生成个性化行程。同时，AI开发者大赛优秀团队展示了三维重建、互动短剧、MR博物馆等创新实践，体现AI在智慧文旅全流程的应用潜力。

AI+文旅数字人技术虚拟人交互平台
OpenAI和微软的关系没那么糟，跟英伟达也没那么好

OpenAI的动作比所有人想象的都要快。上周二，OpenAI完成重组。其中一个重要变化是:彻底取消了与微软的排他性协议，结束了Azure长达六年的云服务独占模式。此前，OpenAI所有模型的训练、推理与部署都必须优先选择Azure，微软还享有优先购买权。宣布与Azure“分手”后不到一周，OpenAI便火速宣布了与AWS的战略合作——双方达成一项价值380亿美元的云计算协议，OpenAI将全面接入

OpenAI 云计算战略合作
科大讯飞发布讯飞星火X1.5及系列AI软硬一体方案

在第八届世界声博会暨2025科大讯飞全球1024开发者节上，科大讯飞以“更懂你的AI”为主题，发布星火大模型最新升级及系列产品。董事长刘庆峰指出，AI红利兑现需攻克自主可控、软硬一体、行业纵深和个性化四大核心，并展示了在300多个“开箱即用”智能体中涌现的优秀“AI员工”。星火X1.5采用MoE架构，推理效率提升100%，多语言能力覆盖超130语种，整体性能达GPT-5的95%以上。同时发布软硬一体解决方案，包括AI麦克风阵列、翻译机等，实现高精度降噪与识别。此外，推出个性化记忆与语音复刻技术，定义多模态交互八大能力，并展示AI在教育、医疗、汽车、办公及情感陪伴等领域的深度应用，启动“星火点亮全球”计划，共建繁荣AI生态。

AI 科大讯飞讯飞星火
荐AI日报：HeyGen发布AI视频翻译引擎；科大讯飞推星火 X1.5；QQ浏览器推出AI+小窗

本期AI日报聚焦多项技术突破：HeyGen推出精准唇形同步的视频翻译引擎；科大讯飞发布星火X1.5大模型，提升多语言处理能力；QQ浏览器新增AI助手浮窗；科大讯飞推出软硬一体方案，实现高噪声环境精准识别；谷歌Gemini 3 Pro预览版支持百万级上下文窗口；Comfy Cloud让Stable Diffusion实现零门槛创作；谷歌Gemini新增深度研究功能，可整合邮件生成智能报告；上海AgiBot机器人10分钟完成复杂制造任务，重塑生产效率。

AI视频翻译唇形同步跨语言本地化
华为WATCH Ultimate 2非凡探索版明日开启预售

华为正式宣布旗舰智能手表WATCH Ultimate 2非凡探索将于11月7日开启预售。这款“全能表王”支持150米潜水与音频功能，具备海豚声呐通信技术，可在水下30米实现手表间信息传输，60米内一键SOS求救。同时搭载北斗卫星语音消息功能，无网络环境下可通过卫星发送语音信息。硬件上配备1.5英寸OLED屏幕，峰值亮度达3500nit，支持20ATM防水与IP68/9防尘。省电模式下续航达11天，常规使用达4.5天。该手表海外售价799英镑（约7443元人民币），国内价格尚未公布。

华为WATCH Ultimate2 智能手表
vivo WATCH GT 2已支持开通移动/联通eSIM服务

vivo WATCH GT2智能手表正式支持中国移动与联通的eSIM服务，提供一号双终端和独立终端两种模式，售价699元。配备2.07英寸大屏、2400nits峰值亮度，续航达33天。支持全天心率、血氧、睡眠监测及多种运动模式，搭载自研蓝河操作系统3.0与智能助手，可跨设备连接vivo和iPhone，实现双机通知同步。

vivo WATCH GT2
美股4万亿美元市值上市公司已达3家苹果、微软、英伟达组成三巨头

10月28日，苹果与微软股价同步上涨，双双突破4万亿美元市值大关，与超4.6万亿美元的英伟达共同构成全球市值最高的“三巨头”格局。微软因与OpenAI资本重组推动股价涨超3%，持有后者价值1350亿美元股权；苹果则凭借新一代iPhone强劲需求实现股价逆袭，年内首度由跌转升。英伟达仍以最高市值稳居全球第一，凸显全球科技产业对算力需求的爆发式增长。

科技股苹果微软市值突破
科大讯飞1024发布：讯飞翻译APP迭代焕新，同声传译+音视频翻译重构沟通体验

在2025科大讯飞全球1024开发者节期间，讯飞翻译APP迎来关键升级，重点强化同声传译功能。通过搭载全新语音同传大模型，实现翻译更准、响应更快；新增实时分享、记录留存、悬浮字幕等特性，支持跨场景高效应用。该产品已在东盟博览会等国际场合验证实用性，结合IDC报告八大维度第一的权威背书，彰显了AI翻译技术从研发到落地的全链条优势，为跨语言沟通提供简单如母语的体验。

科大讯飞 AI翻译大模型

今日大家都在搜的词：

热文

3 天
7天

拖拽下图像就能生成视频，中科大、微软等DragNUWA属实惊艳

科普 | 读懂HBM和DRAM，才懂AI算力未来

全球DRAM价格飙升长鑫LPDDR5X量产成市场“稳定器”

科大讯飞“AI+文旅”产品全新升级

OpenAI和微软的关系没那么糟，跟英伟达也没那么好

科大讯飞发布讯飞星火X1.5及系列AI软硬一体方案

荐AI日报：HeyGen发布AI视频翻译引擎；科大讯飞推星火 X1.5；QQ浏览器推出AI+小窗

华为WATCH Ultimate 2非凡探索版明日开启预售

vivo WATCH GT 2已支持开通移动/联通eSIM服务

美股4万亿美元市值上市公司已达3家苹果、微软、英伟达组成三巨头

科大讯飞1024发布：讯飞翻译APP迭代焕新，同声传译+音视频翻译重构沟通体验

今日大家都在搜的词：

热文

iPhone 18 Pro或缩小灵动岛苹果正测试特殊挖孔方案

AI日报：上海首例涉AI提示词著作权案宣判；Kimi K2 Thinking发

OPPO Reno15系列官宣11月10日发布

曝折叠屏iPhone配2400万屏下摄像头预计2026年秋亮相

华为鸿蒙智行新款享界S9开启预订：预售价31.8万起

特斯拉股东批准马斯克万亿美元薪酬包

OPPO Find X9 Pro卫星通信版开启预售：6999元

何小鹏再回应机器人里藏真人质疑：现场展示内部结构

小鹏机器人会走猫步太像人了！小鹏发布新一代人形机器人IRON

女性人形机器人里藏真人？何小鹏回应：并亲自证清白

iPhone 18 Pro或缩小灵动岛苹果正测试特殊挖孔方案

阿里回应饿了么更名：正处于灰度测试阶段

马斯克称若发现外星人证据就公开

AI日报：昆仑万维SkyReels V3模型上线；月之暗面推Kimi Linear

小米YU7全网首拆上热搜雷军回应：欢迎同行和专家指点

AI日报：Sora正式登陆Android；网易云音乐推AI调音大师；谷歌将

vivo Y500 Pro官宣11月10日发布：同档首发2亿HP5主摄

华为Mate70 Air官宣今日开启预售

站长商机