首页 > 业界 > 关键词  > SakanaAI最新资讯  > 正文

谷歌 Transformer 论文合著者在东京创办人工智能公司 Sakana AI

2023-08-21 09:48 · 稿源:站长之家

站长之家(ChinaZ.com) 8月21日消息:如今,生成式人工智能的格局正处于快速发展的状态,不仅与 OpenAI、Meta 和 Google 在基础模型上直接竞争,而且在他们一些最优秀的内部人才离开去推出产品的同时他们自己的一代人工智能初创公司。

谷歌,google

David Ha 和 Llion Jones 是两位著名的前谷歌研究人员(其中 Llion Jones 是「Transformer」人工智能架构的共同发明者,David Ha 曾担任 Stability AI 的研究主管)上周四宣布,他们已经启动了一个研究总部位于东京的新人工智能公司——Sakana AI。

Jones 是谷歌 2017 年研究论文《Attention Is All You Need》的第五作者。该研究论文介绍了基于「Transformer」的深度学习架构,成为病毒式聊天机器人 ChatGPT 和当前竞相开发生成式人工智能产品的基础。

在这篇著名论文发表之后,生成式人工智能基础模型的发展集中在制造越来越大的「Transformer」——基于模型,而 Sakana AI 将专注于为基础模型创建新的架构。

我们的方法可能不是构建一个吸取所有数据的巨大模型,而是使用大量更小的模型,每个模型都有自己独特的优势和较小的数据集,让这些模型相互通信并共同解决问题,」David Ha 说,尽管他表示这只是一个想法。

David Ha 在接受彭博社采访时表示:「蚂蚁四处走动,动态地自行形成一座桥梁,这可能不是最坚固的桥梁,但它们可以立即做到这一点并适应环境。」「我认为这种适应是我们在自然算法中看到的非常强大的概念之一。」

两位创始人告诉 FT,Sakana 这个名字源自日语中的「鱼」一词(さかな),意思是「一群鱼聚集在一起,通过简单的规则形成一个连贯的实体」

《Attention Is All You Need》论文的所有作者现已离开谷歌。作者的新创企业已经吸引了来自风投机构的数百万美元的投资,其中包括运行 AI 聊天机器人初创企业Character.AI 的 Noam Shazeer 和创立大型语言模型初创企业 Cohere 的 Aidan Gomez。

举报

  • 相关推荐
  • 视觉Transformer中ReLU替代softmax,DeepMind新招让成本速降

    Transformer架构已经在现代机器学习领域得到了广泛的应用。注意力是transformer的一大核心组件,其中包含了一个softmax,作用是产生token的一个概率分布。对于使用ReLU的S/8模型,这种门控机制会将实验所需的核心时间增多大约9.3%。

  • Sam Bankman 陷入法律争端:去年持有人工智能公司 Anthropic 价值 5 亿美元股份

    美国检察官周日表示,FTX创始人SamBankman-Fried应被禁止提及人工智能公司Anthropic最近的筹款活动,以应对美国司法部的指控。美国司法部一直在讨论在Bankman-Fried的审判中可能提出的问题,双方「在许多这些问题上达成了协议」,一份文件称。117Partners咨询公司的创始人兼首席执行官ThomasBraziel表示,关于筹款的消息对FTX债权人来说是一个「极好的事件转折」。

  • 中国研究人员提出DualToken-ViT:CNN和视觉Transformer的融,提高图像处理效率和准确性

    视觉Transformer成为各类视觉任务如物体识别和图片分类的有效架构。这是因为自注意力可以从图片中提取全局信息卷积核大小限制了卷积神经网络只能提取局部信息。他们的贡献有:1)提出了紧凑高效的视觉Transformer模型DualToken-ViT,通过卷积和自注意力的优势实现有效的注意力结构;2)提出位置感知全局令牌,通过图像位置信息来增强全局信息;3)DualToken-ViT在相同FLOPs下在多个视觉任务上表现最好。

  • AMD收购人工智能软件公司 Nod.ai

    AMD宣布签署协议收购开源人工智能软件公司Nod.ai,以扩展公司的开源AI软件能力。Nod.ai的加入将为AMD带来一个经验丰富的团队,该团队开发了领先行业的软件技术,可加速部署针对AMDInstinct™数据中心加速器、Ryzen™AI处理器、EPYC™处理器、Versal™SoC和Radeon™GPU进行优化的AI解决方案。Nod.ai的SHARK软件基于编译器的自动化能力减少了对手动优化的需求,缩短了部署高性能AI模型在AMDCDNA™、XDNA™、RDNA™和“Zen”架构的数据中心、边缘和客户平台上运行所需的时间。

  • 苹果在人工智能方面保持沉默 但它是 AI 初创公司的最大买家

    如果在人工智能热潮中有一件事是始终如一的,那就是大型科技公司谷歌、微软、Meta和亚马逊无法停止谈论他们的人工智能投资,无论是在财报电话会议中还是新产品发布中。但有一个行业领袖往往在这类交流中缺席:苹果公司。这种大型科技公司与人工智能初创公司的合作方式与微软与OpenAI的关系相呼应。

  • 先进的人工智能工具正在崛起,但「安全」并不是监管人工智能的最佳标准

    微软于上周发布了其BingImageCreator的新版本,这是一个由OpenAI的新模型DALL-E3提供支持的AI图像生成工具。它旨在提供比之前的图像生成AI模型更强大的功能,包括比以前更丰富地理解复杂用户请求的能力。倘若幸运的话,也许它还能提升我们讨论的基调。

  • 揭开多模态神经元的秘密:从 Molyneux 到 Transformers 的过程

    Transformers成为了人工智能领域最重要的创新之一。这种神经网络架构于2017年推出,彻底改变了机器理解和生成人类语言的方式。这有望推动人工智能在多模态智能应用中的发展。

  • 波兰一公司聘请全球首个人工智能CEO

    今年8月,波兰饮品公司Dictador任命了一名名为Mika的AI动力机器人作为其实验性首席执行官。Mika是HansonRobotics开发的SophiaAI机器人的升级版本。她相信随着人工智能在企业中的应用越来越广泛,类似她这样的机器人CEO会越来越多。

  • 纽约将在下周成为人工智能展示中心:希望成为 AI 世界之都

    纽约的科技公司和投资者视人工智能的出现为最新的机会,试图取代旧金山湾区成为人工智能的世界之都。纽约将在下周成为人工智能展示中心,该市将于10月16日开始举办由风险投资公司AndreessenHorowitz协调的包含370场活动的「科技周」。与纽约相比,旧金山湾区仍然遥遥领先,成为科技就业、初创企业和投资的中心。

  • 谷歌宣布为医生推出 Vertex AI:新的生成式人工智能搜索功能

    GoogleCloud周一宣布了新的人工智能驱动搜索功能,据称将帮助医护工作者快速从不同类型的医疗记录中获取准确的临床信息。医疗行业拥有大量有价值的信息和数据,但由于通常存储在多个系统和格式中,因此对于临床医生来说,找到这些信息可能会很具有挑战性。」「现在,我们已经到了一个AI在这些非常实际的用例中有所帮助的地步。