网易互娱AI Lab图像生成论文被AI顶会接收

2023-08-08 11:33 · 稿源：站长之家

站长之家（ChinaZ.com）8月8日消息:网易互娱 AI Lab 的一篇学术论文《General Image-to-Image Translation with One-Shot Image Guidance》被国际计算机视觉顶级学术会议 ICCV2023接收。

该论文提出了一种名为 VCT（视觉概念转换器）的图像编辑技术，可以通过一张参考图像将物体或风格转移到源图像上，同时保持源图像的整体结构不变。

VCT 相比以往的方案有几个优势:不需要大量的训练数据，生成质量和泛化性更好;利用图片进行参考引导，实现更准确的图片编辑;不需要额外的控制信息，直接从源图像和参考图像学习结构和语义信息来生成图像。

（举报）

相关推荐

关键词：

腾讯混元图像3.0登顶LMArena榜一

腾讯混元图像3.0模型发布仅一周，即在全球26个顶尖大模型中脱颖而出，登顶LMArena权威榜单首位，成为AI生图领域新王者。其成功得益于三大核心优势：能运用知识推理生成有逻辑内涵的图像；精准实现中英文长文本及细节标注的渲染；兼具真实质感与审美把控。作为开源模型，混元系列已构建覆盖多模态的技术生态，社区衍生模型超3000个，其中混元3D模型下载量超260万次，是全球最受欢迎的3D开源模型。未来腾讯将持续拓展其应用边界。

腾讯混元图像3.0 AI文生图开源生图模型
荐腾讯网易米哈游慌了？游戏新势力靠“小圈子”撕开巨头包围圈

一家A股游戏公司在今年，给自己人撒了一大笔钱，27人合计分了约6亿元，而这家公司就是世纪华通，其豪横行为的背后依靠的是子公司“点点互动”现金牛的供给。说起点点互动，要是放在以前，似乎是一家没什么“存在感”的游戏公司，在大部分人的印象里，先想到的多半是腾讯、网易，或是靠《原神》火遍全球的米哈游等厂商。毕竟腾讯有微信、QQ的流量打底，随便推个

游戏公司世纪华通点点互动
全球首个！OpenAI将推“AI版抖音”：禁止上传实拍内容视频100%由AI生成

国庆假期前夕，OpenAI发布了Sora 2，一款旗舰视频和音频生成模型。据介绍，Sora 2可以完成以前的视频生成模型难以完成的事情，比如运动员的奥林匹克体动作、桨板上的后空翻，准确模拟浮力和刚度的动态等等，并擅长现实主义、电影和动漫风格。一则来自《连线》杂志的重磅爆料更是指出，OpenAI的下一步棋，并非简单升级一个模型，而是要亲自下场，推出一个独立的AI影�

OpenAI Sora 2
荐网易搞了个“副业”

相比其他动辄瞄准万亿市场的同行，网易的风格决定了其在新业务拓展上基本遵循小叙事，强调高效率，带有强烈实用主义与碎片化色彩。务实仿佛成了网易创新业务的定语，任何微小的创新都将场景作为迈出的第一步——其许多新业务未能走出“小打小闹”的范畴，随大市场需求而流变，尤其是在需求系统性思维to B领域。另一方面，常规互联网to B思路是既有业务与组织能�

文章搜索核心标签网易风格
破局传统办公痛点！思必驰用AI办公本、吸顶麦、信创一体机点亮智慧会议未来

随着大数据、物联网、AI等数字化技术兴起，传统办公正向智慧办公模式跃迁。思必驰作为对话式AI领域先行者，通过智能语音交互技术为办公场景注入新活力。其推出的AI办公本X5系列搭载全链路智能对话平台，支持多语言转写与实时纪要生成，结合吸顶麦克风等硬件，实现高效会议记录与多设备协同。此外，D1信创一体机采用国产化技术架构，保障政企数据安全，适用于保密会议等场景。思必驰以软硬一体化方案推动办公智能化，助力企业提升效率，重塑移动办公体验。

智慧办公智能语音交互数字化技术
荐AI日报：接入MJ！夸克发布造点AI；Wan2.5-Preview发布；可灵推最新视频生成模型可灵2.5Turbo

近日AI领域迎来多项重要更新：阿里夸克发布AI创作平台“造点”，整合通义万相Wan2.5与Midjourney V7，支持音画同步视频生成；Wan2.5-Preview实现多模态输入与电影级视频同步生成，提升视觉创作能力；可灵AI推出视频生成模型2.5Turbo并降价30%，降低使用门槛；阿里通义推出Qwen3-ASR-Toolkit，实现小时级音视频转录；谷歌相册AI编辑功能扩展至安卓用户，支持语音修图；谷歌Mixboard工具助力创意设计，生成情绪板；Qwen发布Qwen3-Max模型，在代码生成与智能体能力表现突出；Figma推出MCP服务器，实现设计到代码的一键转换，提升开发效率。

AI创作平台通义万相音画同步
从“爆款”到“长红”，灵犀互娱长线运营现奇效

近年来，中国网络游戏《三国志·战略版》作为文化出海“新三样”代表，凭借持续内容创新打破SLG同质化困局。游戏通过“万团大战”等玩法优化，强化团队协作与策略深度；推出“高地玩法”还原立体战场，结合历史剧本如“赤壁之战”增强沉浸感。同时，精细化运营构建线上线下生态，如龙虎赛、地区服等，提升玩家凝聚力。该作以产品力为核心，推动灵犀互娱逐步成长为具备长线运营能力的代表性企业。

文化出海网络游戏三国志·战略版
荐AI日报：腾讯重磅发布混元图像3.0；快手发布KAT系列Agentic Coding大模型；苹果悄然研发ChatGPT式应用

快手发布KAT系列代码大模型，腾讯推出“混元图像3.0”实现多模态突破，苹果研发类ChatGPT应用升级Siri，谷歌更新Gemini 2.5 Flash Lite提升效率。苹果还推出Manzano图像模型，YouTube Music测试AI音乐主播功能，VideoFrom3D框架简化3D视频生成，Moondream 3.0在多项基准测试中超越GPT-5等顶尖模型，展现强大性能。

AI日报快手KAT系列大模型
开启移动智能新时代回顾Galaxy AI的创新之旅

三星通过Galaxy AI开启智能手机AI驱动新时代。2024年Galaxy S24系列问世，标志AI手机进入创新新阶段。AI深度赋能沟通、创意与互联，重塑生活方式。三星持续推动多模态AI发展，将其融入可穿戴设备、平板、PC等产品，扩展移动AI生态系统。自去年Galaxy AI落地应用后，重新定义更自由、智能的生活方式，推动新时代持续演进。

AI智能手机 Galaxy AI
灵犀互娱多元产品亮相CICF，展现广东游戏产业竞争力

2025年CICF×AGF动漫游戏盛典在广州举办，汇聚超1000个全球顶尖动漫游戏IP，展出周边产品超7000款。育碧、腾讯游戏、灵犀互娱等厂商参展，提供新作试玩。展会凸显广东游戏产业活力，2024年营收达2604亿元，海外收入增长9.9%。灵犀互娱等企业凭借多元化产品及出海表现，展现中国游戏全球竞争力与传统文化传播新路径。

动漫游戏展游戏博览会 IP周边产品

网易互娱AI Lab图像生成论文被AI顶会接收

腾讯混元图像3.0登顶LMArena榜一

荐腾讯网易米哈游慌了？游戏新势力靠“小圈子”撕开巨头包围圈

全球首个！OpenAI将推“AI版抖音”：禁止上传实拍内容视频100%由AI生成

荐网易搞了个“副业”

破局传统办公痛点！思必驰用AI办公本、吸顶麦、信创一体机点亮智慧会议未来

荐AI日报：接入MJ！夸克发布造点AI；Wan2.5-Preview发布；可灵推最新视频生成模型可灵2.5Turbo

从“爆款”到“长红”，灵犀互娱长线运营现奇效

荐AI日报：腾讯重磅发布混元图像3.0；快手发布KAT系列Agentic Coding大模型；苹果悄然研发ChatGPT式应用

开启移动智能新时代回顾Galaxy AI的创新之旅

灵犀互娱多元产品亮相CICF，展现广东游戏产业竞争力

今日大家都在搜的词：

热文

雷军：小米17系列开售仅5天销量破100万台

理想汽车推出焕新版L系限时优惠 10 月 8 日前享1.5万置换补贴

小米回应“小米汽车突然自己开走”：排除车辆质量问题

比特币价格突破12.5万美元刷新历史最高纪录

小米17 1TB版明日开售售价5299元

乔布斯逝世14周年库克发文缅怀：我们深切怀念你

腾讯混元图像3.0登顶LMArena榜一

小米 17 标准版1TB版本 5299 元开售全系列销量同比增超20%

雷军：小米17系列开售仅5天销量破100万台

站长商机