谷歌研究团队推新AI方法SynCLR:从合成图像和字幕中学习视觉表征

2024-01-05 17:28 · 稿源：站长之家

划重点:
- 💡 SynCLR是一种新颖的人工智能方法，通过合成图像和合成字幕，实现对视觉表征的学习，无需使用真实数据。
- 💡 该方法通过三个阶段实现，包括合成图片字幕、生成合成图像和字幕，以及训练视觉表征模型。
- 💡 研究结果表明，SynCLR在图像分类、细粒度分类和语义分割等任务上表现出色，显示了利用合成数据训练强大AI模型的潜力。

站长之家（ChinaZ.com）1月5日消息:近期，Google Research和MIT CSAIL共同推出了一项名为SynCLR的新型人工智能方法，该方法旨在通过使用合成图像和字幕，实现对视觉表征的学习，摆脱对真实数据的依赖。

SynCLR的工作原理

研究团队首先提出了一个三阶段的方法。首先，在“合成图片字幕”阶段，他们采用大型语言模型的上下文学习能力，通过单词到字幕的转换示例，生成了大量的图片字幕。接着，在“生成合成图像和字幕”阶段，利用文本到图像扩散模型，生成了包含6亿张合成图片的数据集。最后，在“训练视觉表征模型”阶段，研究团队使用了掩蔽图像建模和多正对比学习，训练模型从合成数据中学到有意义的表征。

实验结果

研究结果表明，SynCLR在多个任务上取得了令人瞩目的成绩。通过与现有模型如CLIP和DINO v2进行比较，SynCLR在ImageNet-1K上的线性探测准确率以及细粒度分类和ADE20k上的语义分割任务上都表现出色。特别值得一提的是，SynCLR在以字幕为级别的细粒度上的优越性，为模型的可扩展性和在线类别增强提供了便利。

尽管SynCLR在合成数据上展现出了强大的性能，研究团队也提出了一些改进方向。其中包括使用更复杂的大型语言模型、优化不同概念之间的样本比例、探索高分辨率训练阶段等。这些改进有望进一步提升合成数据在训练人工智能模型中的效果。

项目网址:https://github.com/google-research/syn-rep-learn

论文网址:https://arxiv.org/pdf/2312.17742.pdf

（举报）

相关推荐

关键词：

DeepSeek：已对AI生成合成内容添加标识用户不得恶意删除

今天下午，DeepSeek发布了《关于AI生成合成内容标识的公告》。公告中称，Deepseek始终高度重视AI的安全问题，已在平台内对AI生成合成内容添加标识，并明确提醒用户相关内容由AI生成。此举为贯彻落实《人工智能生成合成内容标识办法》（2025年9月1日起施行）及《网络安全技术人工智能生成合成内容标识方法》等国家标准的相关要求，防止AI生成内容可能引发的公众混淆、�

AI生成内容 DeepSeek公告合成内容标识
大模型技术赋能声音创作：逗哥配音引领AI语音合成新浪潮‌

逗哥配音作为国内领先的AI配音平台，凭借自主研发的语音合成大模型技术，已服务超千万创作者，累计生成音频量突破270亿次。其核心技术突破包括：1）支持40种语言，语音质量MOS分提升0.25，拟人度超83%；2）首创"AI分角功能"，将多角色配音效率提升90%以上；3）建成覆盖近千款发音人的全球声库，包含方言、外语及影视角色音；4）创新"真人声纹+AI增强"模式，

人工智能大模型技术 AI配音
华洋饮品携手里斯大树开启战略合作，共绘汽水品牌新蓝图

2025年9月1日，华洋饮料与里斯战略合作项目在郑州启动。双方将聚焦品牌定位与品类创新，通过里斯成熟的定位理论及全球经验，助力华洋重塑品牌差异化，驱动稳健增长。合作内容包括战略制定、执行辅导及量化评估，预计2026年春季逐步应用于市场推广。此举旨在巩固华洋在国产汽水头部地位，为全国化推广奠定基础。

华洋饮品战略合作品类创新
领星ERP：筑牢数据安全防线，契合数据合规标准，为跨境企业发展保驾护航！

在数字化浪潮下，跨境企业运营愈发依赖数据支撑。数据安全与合规对跨境企业至关重要，尤其对计划上市的企业，数据泄露或违规操作可能面临高额罚款、损害声誉，影响上市进程。领星ERP作为跨境电商ERP市场领先的管理系统，构建了九大安全防护体系，从物理环境、网络硬件到数据管理、权限控制等多维度保障数据安全。同时，其业财一体化方案确保业务与财务数据无缝集成，符合不同国家财税法规，助力企业实现数据合规，为稳健发展提供坚实支撑。

数据安全数据合规跨境电商
金仓数据库亮相2025数博会，以AI融合创新赋能产业升级

2025中国国际大数据产业博览会8月28日在贵阳开幕，聚焦"数聚产业动能+智启发展新篇"主题，展示数据要素与人工智能融合创新成果。重点呈现金仓数据库系列产品，包括KXData一体机，通过软硬一体设计实现成本降低40%以上，并搭载智能运维系统。产品覆盖政务、医疗、金融等多个领域，助力产业升级与高质量发展，推动数字经济新篇章。

数博会数据要素人工智能
34Q9 垂直整合重塑 Mini LED 格局

2025年9月1日，雷鸟推出34Q9 Mini LED电竞显示器，定价3999元。该产品采用2304分区Mini LED背光和HVA面板，实现1ms响应速度和4000:1对比度，精准切入3000-4000元市场空档。凭借华星光电供应链优势，产品在画质、色域（97% DCI-P3）及多设备兼容性（90W Type-C）上表现突出，覆盖电竞玩家、内容创作者和多设备用户三大群体。业界认为该产品可能重塑中高端显示器市场格局，加速Mini LED技术普及。
自然阳光净萃复合植物粉，季节更替调养身体的热门之选

随着健康意识提升，大健康行业蓬勃发展，消费者对健康产品需求日益精细多元。自然阳光品牌坚持“严肃营养”理念，推出净萃复合植物粉固体饮料，精选马齿苋、西兰花提取物等天然成分，科学配比，协同增效。产品从肠道健康切入，通过净化、修复、营养支持，全面调节人体代谢系统，助力消费者在季节交替时保持最佳状态。该产品获国家直销许可，成为现代人追求健康生活的理想选择。

健康产品肠道健康代谢调理
女子晾晒的裤子被大风吹走好在最后风配合把裤子“飞”回小区

近日，在湖南长沙的一个普通小区里，发生了一件令人忍俊不禁的趣事。一女子像往常一样，将洗好的裤子晾晒在窗边。然而，天有不测风云，一阵大风突如其来，其风势迅猛在城市中穿梭。女子眼睁睁地看着自己晾晒的裤子被这股狂风卷走，开始了它的冒险之旅”。视频画面显示，这条裤子在空中随风飘荡，一会儿向上翻飞，不一会儿就飞在了马路上空，仿佛在和女子�

湖南长沙裤子被风吹走趣事
启信宝解码常州“新能源之都”，母公司合合信息启动港股上市征程

常州新能源产业实现跨越式发展，2024年产业规模突破8500亿元，整车产量近80万辆，占江苏七成。已形成光伏和新能源汽车两条千亿级产业链，产业集聚度全国第三。依托溧阳动力电池、金坛能源电子等三大国家级特色产业集群，构建完整“发电-储能-输送-应用”闭环生态。机器人等新兴产业同步崛起，武进区形成紧密产业链协作体系。启信宝发布产业报告，为政企提供决策支持，其母公司合合信息已提交港股上市申请。

新能源产业产业集群常州经济
Matrixport 旗下 Cactus Custody 与 OnChain 合作，完成招银国际美元货币市场基金化上链

新加坡Matrixport旗下合规数字资产托管商Cactus Custody与OnChain合作，将招商国际美元货币市场基金以化形式上链运营，成为全球首只港新互认基金上链案例。该合作解决市场缺乏可审计、可托管的现金类资产等痛点，通过链上净值计算、白名单管理等机制，为机构与合格投资者提供透明、合规的链上投资选项。未来双方将持续深化合作，推动RWA标准化发展。

数字资产托管 RWA上链港新互认基金

今日大家都在搜的词：

热文

3 天
7天

谷歌研究团队推新AI方法SynCLR:从合成图像和字幕中学习视觉表征

DeepSeek：已对AI生成合成内容添加标识用户不得恶意删除

大模型技术赋能声音创作：逗哥配音引领AI语音合成新浪潮‌

华洋饮品携手里斯大树开启战略合作，共绘汽水品牌新蓝图

领星ERP：筑牢数据安全防线，契合数据合规标准，为跨境企业发展保驾护航！

金仓数据库亮相2025数博会，以AI融合创新赋能产业升级

34Q9 垂直整合重塑 Mini LED 格局

自然阳光净萃复合植物粉，季节更替调养身体的热门之选

女子晾晒的裤子被大风吹走好在最后风配合把裤子“飞”回小区

启信宝解码常州“新能源之都”，母公司合合信息启动港股上市征程

Matrixport 旗下 Cactus Custody 与 OnChain 合作，完成招银国际美元货币市场基金化上链

今日大家都在搜的词：

热文

华为MatePad Mini外观公布支持蜂窝网络通话功能

AI日报：AI内容新规正式生效；美团推出开源大模型LongCat；阶跃

抖音升级AI内容标识功能上线两项核心功能

苹果新增三款过时产品 iPhone 8 Plus被列为复古产品

小米汽车8月交付量超3万台全年交付量有望冲击42万

特斯拉Model 3长续航后轮驱动版降价1万元售价25.95万起

人去世了朋友圈会消失？微信客服回应：建议保持账号活跃

腾讯回应被米哈游起诉：没正式程序不能违规提供QQ用户资料

小鹏汽车：8月共交付新车37709台单月交付量创历史新高

零跑汽车8月交付57066台增长超88%

华为MatePad Mini官宣9月4日发布

2025民营企业500强揭晓：京东第一

今日七夕节微信 520 元大额红包限时上线

AI日报：字节OmniHuman-1.5发布；PixVerse V5模型上线；腾讯

首发iPhone 17系列！苹果Apple Store官方旗舰店入驻抖音商城

realme真我15000mAh电池容量手机亮相

华为三折叠屏手机Mate XTs非凡大师上架开启预约

史上最大Mate！华为智慧屏MateTV将于9月4日发布

AI日报：海螺AI首尾帧功能上线；元石科技发布问小白5；OpenAI发

小米澎湃OS 3发布：帧率更稳功耗更低

站长商机