首页 > 业界 > 关键词  > SakanaAI最新资讯  > 正文

谷歌 Transformer 论文合著者在东京创办人工智能公司 Sakana AI

2023-08-21 09:48 · 稿源:站长之家

站长之家(ChinaZ.com) 8月21日消息:如今,生成式人工智能的格局正处于快速发展的状态,不仅与 OpenAI、Meta 和 Google 在基础模型上直接竞争,而且在他们一些最优秀的内部人才离开去推出产品的同时他们自己的一代人工智能初创公司。

谷歌,google

David Ha 和 Llion Jones 是两位著名的前谷歌研究人员(其中 Llion Jones 是「Transformer」人工智能架构的共同发明者,David Ha 曾担任 Stability AI 的研究主管)上周四宣布,他们已经启动了一个研究总部位于东京的新人工智能公司——Sakana AI。

Jones 是谷歌 2017 年研究论文《Attention Is All You Need》的第五作者。该研究论文介绍了基于「Transformer」的深度学习架构,成为病毒式聊天机器人 ChatGPT 和当前竞相开发生成式人工智能产品的基础。

在这篇著名论文发表之后,生成式人工智能基础模型的发展集中在制造越来越大的「Transformer」——基于模型,而 Sakana AI 将专注于为基础模型创建新的架构。

我们的方法可能不是构建一个吸取所有数据的巨大模型,而是使用大量更小的模型,每个模型都有自己独特的优势和较小的数据集,让这些模型相互通信并共同解决问题,」David Ha 说,尽管他表示这只是一个想法。

David Ha 在接受彭博社采访时表示:「蚂蚁四处走动,动态地自行形成一座桥梁,这可能不是最坚固的桥梁,但它们可以立即做到这一点并适应环境。」「我认为这种适应是我们在自然算法中看到的非常强大的概念之一。」

两位创始人告诉 FT,Sakana 这个名字源自日语中的「鱼」一词(さかな),意思是「一群鱼聚集在一起,通过简单的规则形成一个连贯的实体」

《Attention Is All You Need》论文的所有作者现已离开谷歌。作者的新创企业已经吸引了来自风投机构的数百万美元的投资,其中包括运行 AI 聊天机器人初创企业Character.AI 的 Noam Shazeer 和创立大型语言模型初创企业 Cohere 的 Aidan Gomez。

举报

  • 相关推荐
  • AI日报:腾讯混元开源Hunyuan-GameCraft;最强图像编辑器nano-banana发布;字节开源Agent专用模型 M3-Agent-Control

    本文介绍了AI领域最新动态:1)腾讯开源Hunyuan-GameCraft框架,可快速生成高质量游戏视频;2)Nano-Banana模型在图像编辑领域超越FLUX+Kontext;3)字节开源基于Qwen 3 32B的328亿参数M3-Agent-Control模型;4)Kimi将推出PPT生成功能;5)阿里1688将上线"诚信通AI版"会员服务;6)苹果智能家居中心推迟至2026年发布;7)万兴科技接入GPT-5;8)全球AI独角兽达498家,总估值2.7万亿美元;9)谷歌为Slides和

  • 红魔11 Ultra曝光:首款支持主动散热的骁龙8 Elite 2旗舰

    红魔11 Ultra现身Geekbench跑分网站,首发搭载骁龙8 Elite 2旗舰平台,单核3309分、多核10742分。该芯片采用8核设计,集成Adreno 840 GPU,博主透露量产版频率将提升至4.6GHz左右。新机延续主动散热风扇设计,支持IP68防尘防水,是行业内唯一支持防水的主动散热手机,通过高效散热保证处理器性能稳定释放。新品预计今年第四季度发布。

  • OPPO Find X9 Ultra工程机曝光:全球首款2亿双潜望旗舰

    博主数码闲聊站曝光了OPPO Find X9 Ultra的工程机参数,该机采用2K LTPO直屏,屏幕尺寸为6.8英寸,后置2亿像素四摄,包括2亿像素1/1.1英寸超大底主摄 1/1.3英寸超大底潜望长焦 超长焦 超广角。 这是行业首款2亿像素双潜望长焦旗舰,也是Find X9系列唯一一款双潜望长焦手机,相比传统的单潜望镜方案,双潜

  • Lamett乐迈石晶快装秘籍!让武汉20年老宅“一键焕新”

    武汉黄先生一家140平米老宅经《梦想改造家》节目改造后焕然一新。设计师采用零甲醛添加的Lamett乐迈石晶地板,解决潮湿问题,提升防滑耐磨性能。空间重构实现客卧对调、主卧休闲办公一体化,厨房岛台增进家人互动。全屋原木色调营造温馨氛围,兼顾健康与美学,为五口之家打造安全舒适的生活环境。

  • 小米SU7 Ultra广告牌亮相首都机场 雷军:多做点广告 让更多人知道

    今天早上,小米雷军在个人微博宣布,小米SU7 Ultra广告牌正式亮相首都机场。 雷军还以互动口吻向网友提问:Ultra 这样的车型,大家觉得,是不是应该多做点广告,让更多人知道?” 从雷军的微博内容来看,小米SU7 Ultra此次选择在首都机场投放广告牌,显然是瞄准了机场庞大的客流量与高曝光度。

  • 2025年最值得入手的酷睿Ultra轻薄本大盘点,看完再买不后悔!

    文章介绍了轻薄本市场因移动办公、远程学习和创作需求爆发而迎来技术革命,重点分析了英特尔酷睿Ultra系列处理器的核心优势。该系列以高性能、低功耗和AI功能为特色,满足用户对高效计算和长续航的双重需求。文章还推荐了三款搭载该处理器的优质机型:荣耀MagicBook Pro 14适合学生群体,ThinkBook 16+面向办公用户,联想小新Pro 16 GT则针对高性能需求的专业用户。每款机型在性能、便携性和扩展性上均有出色表现,帮助不同用户精准匹配需求,提升使用体验。

  • OPPO Find X9 Ultra影像曝光:全新2亿主摄加持

    博主数码闲聊站爆料,OPPO Find X9 Ultra配备全新2亿像素超大底主摄以及超大底潜望长焦,同时测试了多分区光谱摄像头,可以同时识别并处理场景中不同区域里的多种环境色温,修正画面色彩表现,让照片色彩精准还原。 该博主还爆料,OPPO Find X9 Ultra的2亿像素主摄尺寸是1/1.1英寸,这是OPPO第一次在Ultra机型上使用2亿像素摄像头。

  • 报价345亿美元!AI新贵公司计划收购谷歌旗下Chrome浏览器

    美国AI搜索新贵Perplexity正考虑以高达345亿美元的全现金方式,收购谷歌旗下拥有逾30亿用户的Chrome浏览器。 成立仅三年、总部位于旧金山的Perplexity(由阿拉温德斯里尼瓦斯等人创立),专注于生成式AI搜索引擎,直接挑战谷歌和微软必应。 截至2024年4月,其月活跃用户约1500万,主要依靠付费订阅盈利。这家初创公司已从英伟达、软银集团等巨头筹集约10亿美元融资,最新估值

  • OpenAI的开源模型现已在IBM watsonx.ai上提供

    OpenAI发布两款开源AI模型GPT-OSS-120B和GPT-OSS-20B,允许开发者自由下载、运行和定制。其中120B模型已部署在IBM Watsonx.ai平台,采用专家混合架构,支持本地或云端部署,不受商业用途限制。模型具备高透明度,输出完整推理链,在多项基准测试中表现优异。此次发布标志着OpenAI首次加入开源生态,IBM强调其开放战略,为企业提供灵活、安全的AI开发选择。

  • 自研遇阻!苹果考虑用谷歌Gemini升级Siri

    苹果正与谷歌就使用Gemini AI引擎为新一代Siri提供技术支持进行初步谈判,这一动向表明苹果可能进一步将人工智能能力外包,成为其AI战略的关键一步。 据知情人士透露,这家iPhone制造商近期已与Alphabet旗下谷歌接触,商讨合作构建一款定制化AI模型,以用于明年预计推出的新版本Siri。 谷歌目前已开始训练一款可在苹果服务器上运行的模型。苹果在生成式人工智能领域起步�

今日大家都在搜的词: