首页 > 业界 > 关键词  > DragNUWA最新资讯  > 正文

拖拽下图像就能生成视频,中科大、微软等DragNUWA属实惊艳

2023-08-21 16:00 · 稿源: 机器之心公众号

随着 ChatGPT、GPT-4、LLaMa 等模型的问世,人们越来越关注生成式模型的发展。相比于日渐成熟的文本生成和图像生成,视频、语音等模态的 AI 生成还面临着较大的挑战。现有可控视频生成工作主要存在两个问题:首先,大多数现有工作基于文本、图像或轨迹来控制视频的生成,无法实现视

......

本文由站长之家合作伙伴自媒体作者“机器之心公众号”授权发布于站长之家平台,本平台仅提供信息索引服务。由于内容发布时间超过平台更新维护时间,为了保证文章信息的及时性,内容观点的准确性,平台将不提供完全的内容展现,本页面内容仅为平台搜索索引使用。需阅读完整内容的用户,请查看原文,获取内容详情。

举报

  • 相关推荐
  • 科普 | 读懂HBM和DRAM,才懂AI算力未来

    在AI算力需求激增的背景下,存储芯片成为决定计算性能的关键。文章重点分析了三大易失性存储技术:SRAM凭借高速读写特性在CPU缓存中不可替代;DRAM作为数字世界的“主内存”,在容量与速度间实现平衡;HBM则通过3D堆叠架构革命性提升带宽,突破AI训练中的“内存墙”瓶颈。当前HBM需求爆发式增长,预计2025年市场规模将达340亿美元。中国企业在DRAM领域逐步突破,并开始布局HBM技术,正通过持续技术积累提升在全球半导体生态中的地位。

  • 全球DRAM价格飙升 长鑫LPDDR5X量产成市场“稳定器”

    DRAM合约价近期暴涨,三星、SK海力士和美光暂停DDR5报价,导致供应链紧张,现货价格一周内飙升25%。机构预测四季度DRAM价格将上涨18%-28%,NAND闪存合约价也将全面上涨5%-10%。与此同时,长鑫存储已量产LPDDR5X产品,覆盖多种容量和速率,技术达国际一流水平。全球内存市场格局正从“三足鼎立”向“四方争霸”演变,下游客户纷纷签署长期协议以确保供应稳定。

  • 科大讯飞“AI+文旅”产品全新升级

    在2025科大讯飞全球1024开发者节期间,"AI+文旅"产品升级发布,展示AI如何让文旅体验从"到此一游"升级为"深度体验"。重点包括:数字人技术让李白"讲解"庐山瀑布,虚拟人交互平台支持一键定制景区专属形象;讯飞翻译机2.0支持80种外语实时对话;AI伴游APP可生成个性化行程。同时,AI开发者大赛优秀团队展示了三维重建、互动短剧、MR博物馆等创新实践,体现AI在智慧文旅全流程的应用潜力。

  • OpenAI和微软的关系没那么糟,跟英伟达也没那么好

    OpenAI的动作比所有人想象的都要快。 上周二,OpenAI完成重组。其中一个重要变化是:彻底取消了与微软的排他性协议,结束了Azure长达六年的云服务独占模式。此前,OpenAI所有模型的训练、推理与部署都必须优先选择Azure,微软还享有优先购买权。 宣布与Azure“分手”后不到一周,OpenAI便火速宣布了与AWS的战略合作——双方达成一项价值380亿美元的云计算协议,OpenAI将全面接入

  • 科大讯飞发布讯飞星火X1.5及系列AI软硬一体方案

    在第八届世界声博会暨2025科大讯飞全球1024开发者节上,科大讯飞以“更懂你的AI”为主题,发布星火大模型最新升级及系列产品。董事长刘庆峰指出,AI红利兑现需攻克自主可控、软硬一体、行业纵深和个性化四大核心,并展示了在300多个“开箱即用”智能体中涌现的优秀“AI员工”。星火X1.5采用MoE架构,推理效率提升100%,多语言能力覆盖超130语种,整体性能达GPT-5的95%以上。同时发布软硬一体解决方案,包括AI麦克风阵列、翻译机等,实现高精度降噪与识别。此外,推出个性化记忆与语音复刻技术,定义多模态交互八大能力,并展示AI在教育、医疗、汽车、办公及情感陪伴等领域的深度应用,启动“星火点亮全球”计划,共建繁荣AI生态。

  • AI日报:HeyGen发布AI视频翻译引擎;科大讯飞推星火 X1.5;QQ浏览器推出AI+小窗

    本期AI日报聚焦多项技术突破:HeyGen推出精准唇形同步的视频翻译引擎;科大讯飞发布星火X1.5大模型,提升多语言处理能力;QQ浏览器新增AI助手浮窗;科大讯飞推出软硬一体方案,实现高噪声环境精准识别;谷歌Gemini 3 Pro预览版支持百万级上下文窗口;Comfy Cloud让Stable Diffusion实现零门槛创作;谷歌Gemini新增深度研究功能,可整合邮件生成智能报告;上海AgiBot机器人10分钟完成复杂制造任务,重塑生产效率。

  • 华为WATCH Ultimate 2非凡探索版明日开启预售

    华为正式宣布旗舰智能手表WATCH Ultimate 2非凡探索将于11月7日开启预售。这款“全能表王”支持150米潜水与音频功能,具备海豚声呐通信技术,可在水下30米实现手表间信息传输,60米内一键SOS求救。同时搭载北斗卫星语音消息功能,无网络环境下可通过卫星发送语音信息。硬件上配备1.5英寸OLED屏幕,峰值亮度达3500nit,支持20ATM防水与IP68/9防尘。省电模式下续航达11天,常规使用达4.5天。该手表海外售价799英镑(约7443元人民币),国内价格尚未公布。

  • vivo WATCH GT 2已支持开通移动/联通eSIM服务

    vivo WATCH GT2智能手表正式支持中国移动与联通的eSIM服务,提供一号双终端和独立终端两种模式,售价699元。配备2.07英寸大屏、2400nits峰值亮度,续航达33天。支持全天心率、血氧、睡眠监测及多种运动模式,搭载自研蓝河操作系统3.0与智能助手,可跨设备连接vivo和iPhone,实现双机通知同步。

  • 美股4万亿美元市值上市公司已达3家 苹果、微软、英伟达组成三巨头

    10月28日,苹果与微软股价同步上涨,双双突破4万亿美元市值大关,与超4.6万亿美元的英伟达共同构成全球市值最高的“三巨头”格局。微软因与OpenAI资本重组推动股价涨超3%,持有后者价值1350亿美元股权;苹果则凭借新一代iPhone强劲需求实现股价逆袭,年内首度由跌转升。英伟达仍以最高市值稳居全球第一,凸显全球科技产业对算力需求的爆发式增长。

  • 科大讯飞1024发布:讯飞翻译APP迭代焕新,同声传译+音视频翻译重构沟通体验

    在2025科大讯飞全球1024开发者节期间,讯飞翻译APP迎来关键升级,重点强化同声传译功能。通过搭载全新语音同传大模型,实现翻译更准、响应更快;新增实时分享、记录留存、悬浮字幕等特性,支持跨场景高效应用。该产品已在东盟博览会等国际场合验证实用性,结合IDC报告八大维度第一的权威背书,彰显了AI翻译技术从研发到落地的全链条优势,为跨语言沟通提供简单如母语的体验。

今日大家都在搜的词: