首页 > AI头条  > 正文

亚马逊开发新型多模态语言模型 “Olympus” 或将亮相 AWS 大会

2024-11-29 10:15 · 来源: AIbase基地

亚马逊公司近日被报道正在开发一种名为 “Olympus” 的多模态大型语言模型,预计最早将于下周的 AWS re:Invent 大会上正式发布。根据theinformation的消息,这一算法的内部代号为 “Olympus”。

去年11月,《路透社》曾报道,亚马逊在训练名为 “Olympus” 的大型语言模型上投入了数百万美元,模型的参数量高达2万亿。至于这次报道中提到的模型是否与之前的 “Olympus” 相同,或是其新版本,亦或是全新的系统,仍然不清楚。

音频 人工智能

图源备注:图片由AI生成,图片授权服务商Midjourney

据悉,新的 “Olympus” 模型不仅能够处理文本,还能处理图像和视频。这意味着用户可以通过自然语言指令,在视频库中搜索特定片段。此外,该模型还被认为能帮助能源公司分析地质数据。这表明 “Olympus” 具有广泛的应用潜力。

theinformation的消息来源预计,亚马逊可能会在下周的 AWS re:Invent 大会上宣布这一新模型。若 “Olympus” 真的在大会上发布,很可能会通过亚马逊网络服务(AWS)提供,或许会作为 AWS Bedrock 的一部分。AWS Bedrock 是亚马逊去年4月推出的一项托管服务,用户可以访问云端托管的前沿模型。

目前,该服务已提供超过六种亚马逊开发的模型,其中最先进的模型是亚马逊 Titan Text Premier,支持最多32,000个标记的输入,能够生成文本和代码,并且能够进行逐步推理分析。

Bedrock 还包括三种亚马逊开发的生成嵌入的模型,这些模型为机器学习应用提供信息存储的数学结构。其中一个模型支持多模态数据的嵌入生成,这可能使得客户在使用 “奥林匹斯” 的多模态功能时更加便捷。

除了亚马逊自研的模型外,Bedrock 还提供其他公司的语言模型,其中包括与亚马逊关系密切的 Anthropic PBC。最近,Anthropic 获得了来自亚马逊的80亿美元融资,其中上周宣布的40亿美元融资尤为引人注目。

此次 “Olympus” 模型的发布,或许是亚马逊降低对 Anthropic 依赖的一种方式。同时,其他科技巨头也在努力将更多的人工智能技术内化,比如 Meta 正在开发自己的搜索引擎,以减少对微软和谷歌搜索技术的依赖。

亚马逊的人工智能战略不仅限于软件,还包括硬件。该公司已开发了两款针对训练和推理工作负载优化的芯片系列:AWS Trainium 和 AWS Inferentia。上周,Anthropic 也与亚马逊达成合作,旨在提升 Trainium 芯片的性能。

划重点:  

💡 亚马逊正在开发名为 “Olympus” 的多模态语言模型,预计将在下周的 AWS re:Invent 大会上发布。  

🎥 新模型能够处理文本、图像和视频,支持自然语言搜索视频库中的特定片段。  

💻 “Olympus” 可能会通过 AWS Bedrock 服务提供,同时亚马逊的 AI 战略还包括硬件方面的布局。

  • 相关推荐
  • 亚马逊祭出地表最强全家桶,多模态Nova却败给Claude 3.5!

    【新智元导读】围剿英伟达,数十万颗自研二代芯片超算在建!亚马逊祭出地表最强全家桶,多模态Nova击败GPT-4o。亚马逊推出了号称最强大的多模态模型Nova系列。IDC在2023年12月发布的最新研究报告显示,英伟达当前在AI芯片市场中占据着约95%的主导地位。

  • 北大等发布多模态版o1!首个慢思考VLM将开源,视觉推理超越闭源模型

    北大等出品,首个多模态版o1开源模型来了——代号LLaVA-o1,基于Llama-3.2-Vision模型打造,超越传统思维链提示,实现自主“慢思考”推理。在多模态推理基准测试中,LLaVA-o1超越其基础模型8.9%,并在性能上超越了一众开闭源模型。团队宣布LLaVA-o1的代码、预训练权重、数据集等即将全部开源。

  • 不做Sora背后:百度的多模态路线是什么?

    当ChatGPT掀起国内“百模大战”,百度率先交卷文心一言。Sora再掀视频生成风潮,却传出李彦宏内部讲话“Sora无论多么火,百度都不去做”。大量的行业应用所产生的数据,又能为AGI的发展提供丰富的养分,形成良性循环,推动数据飞轮的高速运转,从加快我们迈向AGI的步伐。

  • 超GPT-4o,1240亿参数!最强开源多模态模型 Pixtral Large!

    法国著名开源大模型平台Mistral.ai,开源了超大多模态模型——PixtralLarge。PixtralLarge有1240亿参数,支持128K上下文,能理解文本、图表、图像等,也是Mistral.ai自家聊天助手leChat目前正在使用的视觉模型。LeChat提供了一个从模型到输出的完全集成平台,用户可以在一个平台上完成所有的多模态任务,无需在多个工具之间切换,简化了工作流程。

  • AI日报:OpenAI重磅上线Sora;智谱AI免费多模态模型GLM-4V-Flash;腾讯云打造AI代码助手

    欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解:https://top.aibase.com/1、OpenAI正式上线Sora,ChatGPTPro用户可无限生成、最长20秒OpenAI在"ship-mas"系列活动中发布了SoraTurbo视频生成AI,支持生成20秒1080p视频,用户可通过文本、图片或视频进行创作,具有多种风格和剪辑功能。See3D已开源,支持多种3D创作应用。

  • 亚马逊联合英伟达举办AI路演大赛,AI新星PromptBio入围6强

    由亚马逊云服务和英伟达联合举办的AI路演大赛在亚马逊奥斯汀总部圆满落幕。此次竞赛旨在吸引北美地区快速发展的AI初创公司,为它们提供一个向人工智能行业及风险投资人展示AI前沿技术应用的平台。公司致力于将前沿人工智能和多组学技术应用于生物数据分析,为生命科学用户、药企和医疗机构提供专业全面的解决方案,推动医学和生物科学的前沿发展。

  • 首个可保留情感的音频LLM!Meta重磅开源7B-Spirit LM,一网打尽「音频+文本」多模态任务

    【新智元导读】Meta最近开源了一个7B尺寸的SpiritLM的多模态语言模型,能够理解和生成语音及文本,可以非常自然地在两种模式间转换,不仅能处理基本的语音转文本和文本转语音任务能捕捉和再现语音中的情感和风格。在纯文本大模型取得进展的同时,其他模态数据,如语音与文本结合的语言模型也成为了一个热门的研究领域,但现有的模型要么在仅包含语音的数据上进行训练,要么是关注特定任务,如文本转语音、自动语音识别或翻译,在其他模态数据和任务上的泛化能力十分有限。研究人员还直接评估了模型对输入提示的处理能力,结果发现,无论是哪种提示,模型都能得到很高的评分,表明还有很大的空间来进一步提高模型在保持情感表达方面的能力,也意味着,智能体在理解和生成情感丰富的内容方面还有很大的潜力可以挖掘。

  • AI日报:阿里云逆天大模型Qwen2.5-Turbo;ElevenLabs支持打造对话AI智能体;Mistral推最强开源多模态模型Pixtral Large

    欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解:https://top.aibase.com/1、阿里云发布逆天大模型Qwen2.5-Turbo一口气读完十本小说,推理速度提升4.3倍!阿里云推出的Qwen2.5-Turbo大语言模型在上下文处理能力和推理速度上都取得了革命性的突破,令人期待其�

  • AI日报:科大讯飞星火多模态交互大模型上线;Anthropic发布提示词优化新功能;腾讯AI智能工作台ima上线Windows版

    欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解:https://top.aibase.com/1、科大讯飞星火多模态交互大模型上线实现“语音、视觉、数字人交互”三合一科大讯飞最新推出的讯飞星火多模态交互大模型标志着其从单一语音交互技术拓展到音视频流实时多模态交互的新阶段。多家汽车制造商参与认购,推动Robotaxi技术合作与全球布局。

  • 亚马逊绿标就选绿舟!小绿标撬动大流量

    一、绿标认证:从“选择题”到“必答题”全球可持续发展是当今世界经济发展的必然趋势,如何寻找一种平衡经济增长与生态保护的新路径显得尤为重要。为了应对紧迫的环境压力以及可持续发展的要求,2020年亚马逊正式启动气候友好承诺计划,这是一个广泛深入的环保计划,旨在通过一系列措施来减少碳排放、降低全球温室气体排放,并推动可持续发展。绿舟将继续秉持成为您最出色、最值得信赖的可持续服务合作伙伴的初心,以专业高效的方式解决相关问题,为更多中国企业提供气候解决方案,与大家一起携手迈入更环保、更低碳、更加可持续的美好未来。

今日大家都在搜的词: