首页 > 业界 > 关键词  > 正文

网易互娱AI Lab图像生成论文被AI顶会接收

2023-08-08 11:33 · 稿源:站长之家

站长之家(ChinaZ.com)8月8日 消息:网易互娱 AI Lab 的一篇学术论文《General Image-to-Image Translation with One-Shot Image Guidance》被国际计算机视觉顶级学术会议 ICCV2023接收。

image.png

该论文提出了一种名为 VCT(视觉概念转换器)的图像编辑技术,可以通过一张参考图像将物体或风格转移到源图像上,同时保持源图像的整体结构不变。

VCT 相比以往的方案有几个优势:不需要大量的训练数据,生成质量和泛化性更好;利用图片进行参考引导,实现更准确的图片编辑;不需要额外的控制信息,直接从源图像和参考图像学习结构和语义信息来生成图像。

举报

  • 相关推荐
  • 腾讯混元图像3.0登顶LMArena榜一

    腾讯混元图像3.0模型发布仅一周,即在全球26个顶尖大模型中脱颖而出,登顶LMArena权威榜单首位,成为AI生图领域新王者。其成功得益于三大核心优势:能运用知识推理生成有逻辑内涵的图像;精准实现中英文长文本及细节标注的渲染;兼具真实质感与审美把控。作为开源模型,混元系列已构建覆盖多模态的技术生态,社区衍生模型超3000个,其中混元3D模型下载量超260万次,是全球最受欢迎的3D开源模型。未来腾讯将持续拓展其应用边界。

  • 腾讯网易米哈游慌了?游戏新势力靠“小圈子”撕开巨头包围圈

    一家A股游戏公司在今年,给自己人撒了一大笔钱,27人合计分了约6亿元,而这家公司就是世纪华通,其豪横行为的背后依靠的是子公司“点点互动”现金牛的供给。 说起点点互动,要是放在以前,似乎是一家没什么“存在感”的游戏公司,在大部分人的印象里,先想到的多半是腾讯、网易,或是靠《原神》火遍全球的米哈游等厂商。毕竟腾讯有微信、QQ的流量打底,随便推个

  • 全球首个!OpenAI将推“AI版抖音”:禁止上传实拍内容 视频100%由AI生成

    国庆假期前夕,OpenAI发布了Sora 2,一款旗舰视频和音频生成模型。 据介绍,Sora 2可以完成以前的视频生成模型难以完成的事情,比如运动员的奥林匹克体动作、桨板上的后空翻,准确模拟浮力和刚度的动态等等,并擅长现实主义、电影和动漫风格。 一则来自《连线》杂志的重磅爆料更是指出,OpenAI的下一步棋,并非简单升级一个模型,而是要亲自下场,推出一个独立的AI影�

  • 网易搞了个“副业”

    相比其他动辄瞄准万亿市场的同行,网易的风格决定了其在新业务拓展上基本遵循小叙事,强调高效率,带有强烈实用主义与碎片化色彩。 务实仿佛成了网易创新业务的定语,任何微小的创新都将场景作为迈出的第一步——其许多新业务未能走出“小打小闹”的范畴,随大市场需求而流变,尤其是在需求系统性思维to B领域。另一方面,常规互联网to B思路是既有业务与组织能�

  • 破局传统办公痛点!思必驰用AI办公本、吸顶麦、信创一体机点亮智慧会议未来

    随着大数据、物联网、AI等数字化技术兴起,传统办公正向智慧办公模式跃迁。思必驰作为对话式AI领域先行者,通过智能语音交互技术为办公场景注入新活力。其推出的AI办公本X5系列搭载全链路智能对话平台,支持多语言转写与实时纪要生成,结合吸顶麦克风等硬件,实现高效会议记录与多设备协同。此外,D1信创一体机采用国产化技术架构,保障政企数据安全,适用于保密会议等场景。思必驰以软硬一体化方案推动办公智能化,助力企业提升效率,重塑移动办公体验。

  • AI日报:接入MJ!夸克发布造点AI;Wan2.5-Preview发布;可灵推最新视频生成模型可灵2.5Turbo

    近日AI领域迎来多项重要更新:阿里夸克发布AI创作平台“造点”,整合通义万相Wan2.5与Midjourney V7,支持音画同步视频生成;Wan2.5-Preview实现多模态输入与电影级视频同步生成,提升视觉创作能力;可灵AI推出视频生成模型2.5Turbo并降价30%,降低使用门槛;阿里通义推出Qwen3-ASR-Toolkit,实现小时级音视频转录;谷歌相册AI编辑功能扩展至安卓用户,支持语音修图;谷歌Mixboard工具助力创意设计,生成情绪板;Qwen发布Qwen3-Max模型,在代码生成与智能体能力表现突出;Figma推出MCP服务器,实现设计到代码的一键转换,提升开发效率。

  • 从“爆款”到“长红”,灵犀互娱长线运营现奇效

    近年来,中国网络游戏《三国志·战略版》作为文化出海“新三样”代表,凭借持续内容创新打破SLG同质化困局。游戏通过“万团大战”等玩法优化,强化团队协作与策略深度;推出“高地玩法”还原立体战场,结合历史剧本如“赤壁之战”增强沉浸感。同时,精细化运营构建线上线下生态,如龙虎赛、地区服等,提升玩家凝聚力。该作以产品力为核心,推动灵犀互娱逐步成长为具备长线运营能力的代表性企业。

  • AI日报:腾讯重磅发布混元图像3.0;快手发布KAT系列Agentic Coding大模型;苹果悄然研发ChatGPT式应用

    快手发布KAT系列代码大模型,腾讯推出“混元图像3.0”实现多模态突破,苹果研发类ChatGPT应用升级Siri,谷歌更新Gemini 2.5 Flash Lite提升效率。苹果还推出Manzano图像模型,YouTube Music测试AI音乐主播功能,VideoFrom3D框架简化3D视频生成,Moondream 3.0在多项基准测试中超越GPT-5等顶尖模型,展现强大性能。

  • 开启移动智能新时代 回顾Galaxy AI的创新之旅

    三星通过Galaxy AI开启智能手机AI驱动新时代。2024年Galaxy S24系列问世,标志AI手机进入创新新阶段。AI深度赋能沟通、创意与互联,重塑生活方式。三星持续推动多模态AI发展,将其融入可穿戴设备、平板、PC等产品,扩展移动AI生态系统。自去年Galaxy AI落地应用后,重新定义更自由、智能的生活方式,推动新时代持续演进。

  • 灵犀互娱多元产品亮相CICF,展现广东游戏产业竞争力

    2025年CICF×AGF动漫游戏盛典在广州举办,汇聚超1000个全球顶尖动漫游戏IP,展出周边产品超7000款。育碧、腾讯游戏、灵犀互娱等厂商参展,提供新作试玩。展会凸显广东游戏产业活力,2024年营收达2604亿元,海外收入增长9.9%。灵犀互娱等企业凭借多元化产品及出海表现,展现中国游戏全球竞争力与传统文化传播新路径。

今日大家都在搜的词: