首页 > 业界 > 关键词  > Snap最新资讯  > 正文

Snap 发布 SnapFusion:将智能手机生成式 AI 图像创作速度缩短至不到两秒

2023-06-20 09:01 · 稿源:站长之家

站长之家(ChinaZ.com) 6月20日消息:有很多基于 AI 的生成艺术创作者,从 Midjouney 到 Bing Image Creator 等等。但是,这些类型的图像生成器有时需要一段时间才能完成工作,具体取决于文本提示和其他因素。

6381801063672488277080322.png

图片来自 Snap

Snapchat 的母公司 Snap 今日宣布其 Snap Research 部门研发出一项新技术,可加快生成式 AI 艺术创作生成图像的速度。

Snap 称该新方法为 SnapFusion,将通过生成式 AI 制作图像的时间缩短至不到两秒。他们声称这是「迄今为止学术界发布的最快速度」。

Snap 在博文中补充道:

Snap Research 通过优化网络架构和降噪过程实现了这一突破,使其非常高效,同时保持图像质量。因此,现在可以在移动设备上运行该模型,基于文本提示生成清晰的图像,而不是像其他研究所展示的需要几分钟或几小时。

研究论文详细介绍了 SnapFusion 的工作原理,并展示了使用该新技术创建的艺术品的多个示例。论文中指出:

具体而言,我们通过识别原始模型的冗余部分并通过数据蒸馏减少图像解码器的计算,提出了一种高效的 UNet。此外,我们通过探索训练策略和引入无分类器指导的正则化来增强步骤蒸馏。

不过 Snap 表示这一新方法在面向普通用户之前仍需要一段时间。然而,他们补充道,这项技术「有潜力在移动设备上大大提升高质量生成式 AI 体验」。这一新技术很可能会在未来的 Snapchat 移动应用程序更新中加入。

这是 Snap 拥抱生成式 AI 的新尝试。此前 Snap将其「My AI」助手的可用性扩大到所有用户。但事实证明用户对这一变化并不特别感兴奋,反而招致了大量一星差评。

Snap 研究论文:

https://arxiv.org/pdf/2306.00980.pdf%20/%20https://snap-research.github.io/SnapFusion/

举报

  • 相关推荐
  • AI日报: OpenAI推出gpt-image-1图像生成API;纳米AI发布MCP万能工具箱;中国占全球AI专利60%

    【AI日报】栏目聚焦人工智能领域最新动态:1) OpenAI推出ChatGPT图像生成API,开发者可轻松集成AI绘图功能,已生成超7亿张图片;2) 谷歌Gemini月活用户突破3.5亿,但仍落后于ChatGPT的6亿用户;3) OpenAI预测2029年收入将达1250亿美元,AI代理业务成主要增长点;4) Ostris发布8B参数扩散模型Flex.2-preview,优化ComfyUI工作流;5) 英伟达推出多模态LLM模型Describe Anything,支持指定区域生成详细描�

  • OpenAI 推出首款成熟编程 AI 代理 Codex

    Codex 可复制开发环境,单任务耗时最长 30 分钟……

  • 大CEO多项分歧曝光,OpenAI与微软的“最佳合作”要破裂?

    OpenAI与微软的"科技界最佳合作关系"出现裂痕。微软6年来投资数十亿美元推动OpenAI发展,助其ChatGPT用户突破5亿;同时OpenAI为微软提供尖端AI工具,使其股价翻倍。但双方在算力供给、模型使用权和AGI研发进度上分歧加剧。微软秘密启动自研AI项目,挖角OpenAI对手苏莱曼,耗资6.5亿美元组建团队。OpenAI则可能触发合同条款限制微软接触其最新技术。若OpenAI年底前未能完成�

  • AI实力排名洗牌:OpenAI、谷歌崛起,Anthropic下滑

    人工智能的格局正以前所未有的速度演变,但超越标准化基准或排行榜平台,了解需求和使用模式 仍然是一个挑战……

  • OpenAI发布云端AI编程智能体Codex:代码准确率高达90%

    OpenAI于5月19日正式推出基于Codex-1模型的云端AI编程智能体Codex。该工具具备强大的代码生成与理解能力,支持Python、JavaScript、C等主流语言,覆盖前后端开发、算法实现等多个领域。测试显示其处理常规编程任务的速度远超人工,代码准确率达90%以上,能显著提升开发效率。Codex深度集成GitHub,支持智能代码补全和结构化代码自动生成,使开发者平均编码时间缩短30%。目前该服务已面向ChatGPT+Pro等高级用户开放,未来有望成为软件开发领域的标配工具,推动AI辅助编程进入新阶段。

  • 小米时隔十年重夺中国智能手机第一 Q1市场份额达到19%

    根据市场调研机构Canalys最新发布的报告,2025年第一季度中国智能手机市场呈现回暖态势。数据显示,该季度中国智能手机市场总出货量达到7090万部,较去年同期增长5%,这一增长主要得益于国家补贴政策的实施和消费市场的逐步复苏。

  • AI日报:腾讯混元3D生成模型2.5版本发布;海螺推出图像人物参考功能;百度上线移动端超级智能体心响App

    本文介绍了多款AI领域的新产品和技术进展:1)Kortix-AI推出开源通用AI智能体平台Suna;2)腾讯混元3D生成模型升级至2.5版本;3)海螺AI推出基于单张图像生成多角度角色图像功能;4)百度发布"心响"App整合多智能体协作;5)Nari Labs开源媲美真人的对话语音模型Dia;6)Grok新增视觉处理和多语言支持;7)Genspark推出AI幻灯片工具;8)Character.AI发布让静态图片"说话"的AvatarFX模型;9)pad.ws结合白板和代码编辑器;10)OpenBMB开源社区推出长文本生成模型"卷姬";11)腾讯推出AI阅读助手"企鹅读伴";12)OpenAI有意收购Chrome浏览器;13)字节跳动调整AI产品线布局。这些创新展现了AI技术在自动化、3D生成、语音交互、内容创作等领域的快速发展。

  • 联想发布端侧AI新技术 PC本地推理能力媲美 OpenAI-mini

    联想在Tech World大会上展示了其最新AI创新成果"联想推理加速引擎"。该引擎由联想联合清华大学、无问芯穹共同研发,专为高效AI PC设计,通过并行解码、算子融合优化及异构计算技术,显著提升本地推理速度并降低功耗。现场演示显示,搭载该引擎的AI PC解答高考数学题仅需13秒,性能媲美云端大模型但成本更低。联想CEO杨元庆表示,下一代AI PC将让用户体验到强大的本地推理能力。该技术通过软硬件协同优化,实现了推理速度提升、内存占用减少和能耗降低的显著效果。

  • 阿维塔06与极氪001:隐藏式空调出风口与NAPPA真皮,谁更注重细节?

    文章对比了阿维塔06和极氪001两款高端新能源车型。阿维塔06采用标志性"7"字型日行灯设计,配备流媒体后视镜和激光雷达,搭载华为乾崑智驾ADS 3.0系统,提供纯电和增程两种动力模式,综合续航超1000km。极氪001则以猎装轿跑造型吸睛,采用分体式大灯和熏黑贯穿尾灯设计,纯电版双电机最大功率580kW,百公里加速3.3秒,配备双英伟达Orin-X芯片和超长距激光雷达。两款车型在外观设计、智能配置和动力性能上各具特色,满足不同消费者需求。

  • 国产六大推理模型激战OpenAI?

    2025年春节前夕,DeepSeek-R1模型发布,标志着中国AI进入推理模型新时代。文章梳理了国产大模型发展历程:从2022年ChatGPT引发国内追赶OpenAI热潮,到2023年"百模大战",再到2024年"AI六小虎"格局形成。重点分析了六大国产推理模型(DeepSeek、百度、阿里、科大讯飞、字节、腾讯)的技术特点与市场表现,指出国产模型在性能上已接近GPT-4水平。特别强调科大讯飞星火X1凭借全国产化技术路线获得政企青睐,以及DeepSeek-R1以560万美元超低成本实现高性能的突破。文章还探讨了英伟达芯片断供危机下,国产全栈技术路径的重要性,认为自主可控将成为对抗国际不确定性的关键。最后指出,随着推理模型成为竞争焦点,国产大模型正从技术追随转向自主创新阶段。