首页 > 业界 > 关键词  > 正文

号称业界水平!Mate公布文生图模型CM3Leon

2023-07-16 20:23 · 稿源: 快科技

快科技7月16日消息,近日,Meta宣布,将开发一款名为CM3Leon的AI模型,该模型能够根据文本内容生成图片,也可以为图片生成文本描述。

Meta方面表示,CM3Leon在文生图方面的表现,达到了业界最高水平。

这意味着,该模型的表现将超越谷歌、微软等厂商的一众产品。

目前,Meta已经演示了CM3Leon的表现,展现了该模型在包括复杂的文本提示生成图片、根据文本指令编辑图像等方面的表现。

据悉,为了训练该模型,Meta使用了数百万张来自Shutterstock的授权图片,有着高达70亿个参数,这是OpenAI的EALL-E2模型的两倍以上。

不过,Meta也承认,现阶段的CM3Leon模型可能存在数据偏见的问题,仍然需要行业监管。

CM3Leon是一款基于Transformer神经网络结构的模型,该神经网络的特性是利用注意力机制来处理输入数据。

这一特点使得相较基于Transformer神经网络的模型,相较基于diffusion的模型具有更高的训练效率,且计算成本更低。

举报

  • 相关推荐
  • 大家在看
  • AI文生图模型PixArt-sigma,可以生成4K分辨率

    PixArt-sigma由华为诺亚方舟实验室联合多个研究机构共同开发的项目,是一个强大的文本到图像生成模型,通过弥散Transformer进行弱到强训练,旨在实现4K分辨率的图像生成。PixArt-sigma采用了弥散Transformer进行弱到强训练,从能够更好地生成高质量的4K分辨率图像。在应用方面,PixArt-Σ是一款强大的文本到图像生成工具,具有广泛的应用场景,可以满足艺术、设计、游戏开发、营销

  • 清华大学:2023年学生出国出境交流8000余人次 创历史最高水平

    今天清华大学113周年校庆,官方发表献辞《开新局展新貌奋力谱写高质量发展的清华篇章》。献辞中提到,2023年,清华学生出国出境参加学术和文化交流8000余人次,超过疫情前最高水平。清华大学共设22个学院、59个系,已成为一所设有理学、工学、文学、艺术学、历史学、哲学、经济学、管理学、法学、教育学、医学和交叉学科等12个学科门类的综合性、研究型、开放式大学。

  • 国际顶尖水平!首个Sora级国产自研视频大模型Vidu发布

    在2024中关村论坛年会未来人工智能先锋论坛上,生数科技联合清华大学发布中国首个长时长、高一致性、高动态性视频大模型Vidu。这也是自Sora发布之后全球率先取得重大突破的视频大模型,性能全面对标国际顶尖水平在加速迭代提升中。除了在时长方面突破,Vidu在视频效果方面也实现了显著提升,主要包括:能够生成细节复杂的场景,且符合真实的物理规律;能够生成真实世界不存在的虚构画面,创造出具有深度和复杂性的超现实主义内容;能够生成复杂的动态镜头,不再局限于简单的推、拉、移等固定镜头是能够围绕统一主体在一段画面里就实现远景、近景、中景、特写等不同镜头的切换;在16秒的时长上保持连贯流畅,随着镜头的移动,人物和场景在时间、空间中能够保持一致;能够生成特有的中国元素,例如熊猫、龙等。

  • 井坊ESG实践成果显著,获业界专家度认可

    近期,知名高端白酒品牌水井坊(600779.SH)交出了 2022 年“绿色成绩单”,报告显示,水井坊在环保、可持续发展和社会责任等方面取得了显著成果,彰显了企业对于绿色发展的坚定承诺和长期行动。据悉,在 2022 年的ESG报告中,水井坊首 次公布了“水井坊 2035 可持续发展目标”,围绕商业道德与合规、产品质量与安全、原料采购可持续性、能源与碳排放管理等十大领域设定�

  • Hugging、英特尔发布文生图一致性解决方案——SPRIGHT

    Hugging和英特尔发布了提高文生图模型空间一致性的方案,大幅提高了模型对提示词中空间关系的理解能力。在当前的将文字描述转换为图像的技术中,一个关键短板是它们往往无法精准地生成与文字提示中所描述的空间关系相符的图像。他们还会开源这个模型和数据集,以便其他研究者和开发者能够利用这些资源来进一步提高文生图模型的性能。

  • 周鸿祎调侃雷军英文:我的英文水平比Are you OK一点

    在第27届哈佛中国论坛上,周鸿祎开玩笑地调侃了雷军的英语水平。他表示自己选择用中文演讲,因为相较于雷军的英语水平,他的水平稍微高一点,开玩笑地说自己的英文只比雷军说的Areyouok,thankyou”略好一些。在小米SU7发布后,他连续发表评论表示要向小米学习,并对自己投资的哪吒汽车表示遗憾,觉得虽然有好车但却不会宣传。

  • 为什么地暖机能打破热泵上楼难题?得看它的硬件水平

    北方的隆冬腊月是怎样的?寒风肆虐,万物显得落寞萧条,白皑皑的雪凝在刺着灰的天空的树枝上,枯荣的草儿瑟瑟地在寒风中抖动着。路上的行人冻得佝偻着背,呼出的气在空中凝结成白雾……南方的冬天同样不轻松,天空总是阴沉沉的,凛冽的寒风中总夹着刺骨的冬雨,无论是在室外还是在室内,都驱不走那种湿漉漉的冰冷。热立方凭借强大的研发实力和技术水平,确保了地暖机在各种极端环境下的稳定运行,让消费者无惧严寒,享受每一个温馨、舒适的冬日时光。

  • Stable Diffusion 3 API申请入口 AI文生图API官方免费申请地址

    StableDiffusion3API是一款先进的文本到图像生成系统,它在排版和提示遵循方面与DALL-E3和Midjourneyv6等顶尖系统相匹敌或更优。该系统采用新的多模态扩散变换器架构,使用不同的权重集来改善图像和语言的表示,从提高文本理解和拼写能力。StableDiffusion3API的使用场景示例在以下情况下,您可以使用StableDiffusion3API进行图像生成:生成广告宣传图创建游戏角色概念图辅助教学材料的图像制作产品特色和功能StableDiffusion3API具有以下特色和功能:文本到图像的生成多模态扩散变换器架构图像和语言的独立表示文本理解和拼写能力提升想要了解更多关于StableDiffusion3API的信息并开始您的图像生成之旅,请访问StableDiffusion3API官方网站。

  • 杭州效果科技:OA系统为什么可以提工作效率和管理水平

    企业采用OA系统是为了提高工作效率和管理水平,这是因为OA系统具备多种功能,可以有效地帮助企业优化工作流程、加强内部沟通、提升决策质量和团队协作能力。1. 流程优化和标准化:OA系统可以帮助企业对内部流程进行优化和标准化,通过自动化和集成各项工作流程,减少繁琐的手工操作和重复性工作,提高工作效率。同时,标准化流程可以使得各部门之间的合作更加顺畅�

  • Adobe发布新一代图像生成模型Firefly Image3号称迄今为止最好

    Adobe发布了Firefly图像生成模型的最新版本,名为FireflyImage3,声称具有“摄影细节”的图像生成能力。相比之前的版本,这一第三代模型在图像生成能力上有了显著的改进。即使是新手用户也可以在Photoshop中游刃有余,并更快地成为高级用户,PhotoshopgentechAI产品管理总监JohnMetzger表示。

今日大家都在搜的词:

热文

  • 3 天
  • 7天