首页 > 业界 > 关键词  > 正文

Hugging Face 推出开源多模态 AI 模型 IDEFIX

2023-08-23 14:46 · 稿源:站长之家

站长之家(ChinaZ.com) 8月23日 消息:人工智能创业公司 Hugging Face 最近推出了一款名为 IDEFIX 的开源多模态 AI 模型。IDEFIX 可以处理图像和文本输入,并生成连贯的文本输出。

IDEFIX 基于视觉语言模型 Flamingo 构建,Flamingo 是去年由 DeepMind 开发的一款领先的多模态 AI 模型。IDEFIX 使用了包括维基百科、公共多模态数据集和 LAION 在内的各种开放数据集进行了训练。此外,Hugging Face 还引入了一个新的多模态数据集 OBELIX,其中包含1.41亿个从互联网收集的图像文本文档。

Hugging Face,人工智能,AI

与专有模型相比,IDEFIX 在各种图像文本理解评估中的表现非常优异。它有两个版本,基本版本有90亿个参数,指导版本有800亿个参数。这标志着多模态 AI 开源模型的一个重要进步。

相比之下,OpenAI 的 ChatGPT 目前还不支持处理图像。GPT-4尽管宣称具有多模态功能,但其图像处理能力还非常有限。

除了 IDEFICS 之外,目前 Bard 和 Bing 还接受图像作为输入并创建文本。

您可以在这里尝试 IDEFICS:https://huggingface.co/spaces/HuggingFaceM4/idefics_playground

举报

  • 相关推荐
  • 大家在看

今日大家都在搜的词:

热文

  • 3 天
  • 7天