首页 > 业界 > 关键词  > 正文

Deep Nostalgia:通过AI技术让老照片动起来

2023-08-01 11:08 · 稿源:站长之家

站长之家(ChinaZ.com)8月1日 消息:Deep Nostalgia是一项使用机器学习来动画静态图像的技术。它可以通过给静态照片中的人脸添加动画效果,让你的家族历史变得更加生动。

你只需要上传照片,Deep Nostalgia会将预设的动作模板应用到人脸上,创建出高质量、逼真的视频。这些视频能够让你看到你的祖先笑、眨眼和转头,为你的照片增添活力。

image.png

地址:https://www.myheritage.ro/deep-nostalgia?ref=theresanaiforthat

核心功能:

- 给家族照片中的人脸添加动画效果

- 应用预设的动作模板,让人脸动起来

- 创建高质量、逼真的视频

- 让你的祖先在照片中笑、眨眼和转头

目前,该工具已经完成了超过1.06亿个动画,并且还在不断增加。这项照片动画技术由 MyHeritage 从 D-ID 获得许可,D-ID 是一家使用深度学习进行视频重演的公司。

Deep Nostalgia可以准确地将驱动程序应用于静态照片中的面部,创建一个可以与朋友和家人分享的短视频。MyHeritage 专注于研究使用深度学习进行视频重现,可以对静态照片中的面孔进行动画处理,并创建高质量、逼真的视频片段。系统通过预先确定的一系列动作和手势来激活面部图像,完全自动化。

在训练过程中,MyHeritage 使用预先录制的模型视频来示范人物的动作摆姿势。同时,程序还会根据脸部的朝向自动选择适合的驱动程序,并将其无缝应用于照片。最终生成一个简短、高质量的视频动画,可以表现微笑、眨眼和移动等动作。在对照片进行动画处理之前,还会对其进行增强处理,提高模糊和低分辨率的面部的分辨率。

举报

  • 相关推荐
  • 品牌在deepseek、豆包里排第几?免费GEO排名查询工具帮你一键看清

    随着AI搜索普及,传统SEO正被GEO(生成式引擎优化)取代。GEO核心是提升品牌在AI生成答案中的可见度,而非获取点击流量。数据显示超60%用户已使用AI搜索,若品牌未被AI提及将失去流量入口。文章推荐免费工具AIBase,支持多平台一键检测品牌在主流AI助手的曝光排名、竞品对比及可视化报告,并提供内容权威性、语义化表达等GEO优化策略,帮助品牌在AI时代建立竞争优势。

  • 百度智能云这项开源,让 DeepSeek-V3.2 推理服务吞吐提升 2 倍

    10月28日,百度智能云联合SGLang社区开源针对DeepSeek-V3.2优化的多token预测(MTP)技术代码。该技术通过批量生成和集中验证机制,使模型解码吞吐量提升超2倍,突破传统自回归解码的序列化瓶颈。此次开源的MTP方案已完成与DeepSeek-V3.2稀疏注意力架构的深度适配,并经过百度内部业务验证,开发者可"开箱即用"获得稳定可靠的推理加速能力。

  • 全新开源的DeepSeek-OCR,可能是最近最惊喜的模型。

    ​AI圈虽然天天卷,但是很多的模型,真的越来越无聊了。 每天就是跑分又多了几个点。 直到昨天,DeepSeek久违的发了一个新模型。 DeepSeek-OCR。 这玩意,是真的有点酷。

  • 中国AI算力突围:东方超算Deep X算力盒子超国际竞品82%,重新定义行业标准

    中国公司东方超算发布Deep X G20系列AI工作站,在MLPerf测试中性能超越NVIDIA DGX Spark达82%,价格持平,实现性能与性价比"双超越"。产品搭载Intel Ultra 9285处理器和NVIDIA RTX PRO 5000显卡,AI算力达1824 TOPS,体积仅2.7L。通过三大技术创新实现突破:智能异构计算引擎提升资源利用率40%;统一推理运行时支持多框架;深度硬件优化提升关键算子性能50-200%。该产品打破国际巨头垄断,已在量化金融、医疗影像等领域实现显著投资回报,标志着中国AI硬件实现重要突破。

  • DeepSeek开源3B OCR模型:长文本识别达97%精度

    DeepSeek在GitHub开源新一代OCR模型,采用创新光学二维映射压缩技术,在长文本识别场景实现97%准确率。模型通过动态压缩生成最优视觉特征令牌,较传统方法减少60%计算冗余。实验显示在1:20压缩率下仍保持60%以上准确率,显著优于同类模型。该技术路径为OCR系统小型化提供解决方案,其动态压缩策略对大型语言模型的记忆管理机制具有重要启示。

  • 苹果悄然在iOS 26.1中引入新功能:第三方App可以后台备份照片了!

    苹果在iOS 26.1中引入用户期待已久的后台自动备份照片功能,允许第三方应用在后台自动上传图像。此前,Google相册、OneDrive等应用因系统限制只能在应用活动时上传,导致备份中断、体验糟糕。新功能通过PhotoKit框架支持,引入后台资源上传扩展协议,确保应用未活动或设备锁定时也能持续上传。系统会控制功耗和网络访问以保障备份一致性和电池效率。开发者需完成配置扩展目标、处理上传任务等步骤来集成此功能,部分操作需用户明确同意。

  • 科杰科技&甲子光年:2025中国Data&AI数据基础设施白皮书

    当前全球正经历地缘政治重塑与人工智能革命驱动的深刻变革。全球化向区域化演进,供应链加速本土化,AI从前沿技术跃升为核心生产力。麦肯锡研究显示,生成式AI有望为全球经济贡献7万亿美元,中国预计占2万亿美元,接近全球总量三分之一。传统数据系统难以满足AI对实时性、多模态处理和高弹性算力的需求,企业需构建新一代数据基础设施,实现数据生产、治理与AI应用的动态融合,突破"数据烟囱",支持跨场景智能部署。Data&AI一体化将推动数据价值从效率提升向产业协同跃升,成为智能社会的核心引擎。

  • VITA平台赋能AI办公,沸蛇AI语音鼠标提升办公效率

    云决科技推出VITA一站式AI办公平台,结合自研AI语音鼠标,通过软硬件协同创新提升企业效率。该平台集成DeepSeek等大模型,用户无需切换工具,语音即可调用文字处理、数据分析、创意设计等多元功能,实现会议纪要生成、PPT自动制作、视频一键合成等操作,节省80%工作时间。针对教育、IT、行政等不同行业提供专属解决方案,整合100多个AI应用场景和200多种模板,持续优化产品功能,致力于成为职场人士提升效率的智能助手。

  • 重磅预告:全链路自主进化 AI 数据分析师 TabTab 将于10月24日上线

    灵快科技推出的AI数据分析师TabTab将于10月24日上线。该产品通过Multi-Agent系统实现全链路自动化数据分析,覆盖数据获取、建模到可视化全流程。用户可用自然语言交互,系统自主规划任务并输出可维护结果,支持Excel、PPT等多种报告格式。核心定位为智能数据分析助手,旨在降低分析门槛,助力企业高效挖掘数据价值,适用于数据分析师、营销人员等各类用户。

  • 数据智能体 TabTabAI 正式上线,零门槛上手,让 “数据分析” 人人可用

    AI数据智能体TabTabAI正式上线,以“零门槛交互+全流程自主处理”为核心优势,打破数据分析技术壁垒。该工具通过自然语言对话,支持多源数据采集、智能处理、深度洞察与可视化,让普通职场人无需编程背景即可完成复杂分析任务。其多智能体协同架构与自动化能力,覆盖从数据收集到决策建议的全链路,助力用户将原始数据高效转化为精准决策依据,真正实现“人人都是数据分析师”。

今日大家都在搜的词: