首页 > 业界 > 关键词  > Mistral7B最新资讯  > 正文

亚马逊机器学习团队推出 Mistral 7B 基础模型 支持8000个token上下文长度

2023-10-10 09:51 · 稿源:站长之家

文章概要:

- Mistral7B 是Mistral AI开发的英文文本和代码生成基础模型,参数规模70亿。

- SageMaker JumpStart提供一键部署Mistral7B进行推理,可快速自定义。

- Mistral7B具有8000个token的上下文长度,表现低延迟和高吞吐量。

站长之家(ChinaZ.com)10月10日 消息:亚马逊机器学习团队近日宣布,Mistral AI开发的Mistral7B基础模型现已在亚马逊SageMaker JumpStart上提供,用户可以通过该平台一键部署模型进行推理。

Mistral 7B是Mistral AI开发的英文文本和代码生成基础模型,拥有70亿个参数,支持文本摘要、分类、文本补全和代码补全等多种用例。为展示模型的易于自定义性,Mistral AI还发布了Mistral7B Instruct对话模型,使用各种公开对话数据集进行了优化。

Mistral 7B采用transformer架构,通过grouped-query attention和sliding-window attention实现更快的推理速度和处理更长序列的能力。该模型具有8000个token的上下文长度,表现出低延迟和高吞吐量,与更大模型相比性能出色,参数量只有70亿,显存需求较低。Mistral7B基于宽松的Apache2.0许可发布,可无限制使用。

亚马逊SageMaker JumpStart是一个机器学习中心,提供各种预训练好的算法和模型,用户可以快速上手机器学习。现在,用户可以通过几次点击在SageMaker Studio中发现并部署Mistral 7B,或者通过SageMaker Python SDK以编程方式部署,利用SageMaker的各项功能如管道、调试器对模型性能及MLOps进行控制。模型部署在AWS安全环境下、用户的VPC控制之中,有助于确保数据安全。

image.png

SageMaker JumpStart为机器学习从业者提供了越来越多性能最好的基础模型。它们帮助降低训练和基础设施成本,并支持自定义以适应特定用例。

总结Mistral7B的主要特色功能点大致如下:

1. 参数规模达70亿,支持多种自然语言处理任务。Mistral 7B是一个具有70亿参数的基础模型,支持文本摘要、分类、补全等多种英文NLP任务。

2. 推理速度快,具有8000个token的上下文长度。Mistral 7B使用了transformer架构,可以实现低延迟和高吞吐量推理,支持长达8000个token的上下文长度。

3. 易于部署使用,提供一键体验。用户可以通过Amazon SageMaker JumpStart一键部署Mistral7B,并便捷获得其推理服务,无需训练即可使用。

4. 模型开源,基于Apache2.0协议。Mistral7B的模型权重已在宽松的Apache2.0许可下开源,用户可以无限制地使用。

SageMaker JumpStart体验网址:https://aws.amazon.com/cn/sagemaker/jumpstart/

举报

  • 相关推荐
  • 亚马逊推出AI语音模型Nova Sonic:价格比GPT-4o便宜80%

    亚马逊正式推出新一代生成式AI语音模型NovaSonic,标志着其在人工智能语音领域取得重大突破。这款创新模型能够原生处理语音输入并生成自然流畅的语音输出,在速度、语音识别准确率和对话质量等核心性能指标上,已达到与OpenAI、谷歌等科技巨头的尖端语音模型相媲美的水平。该模型的推出是亚马逊构建人工通用智能战略的重要一步,未来还将推出支持多模态理解的AI模型,涵盖图像、视频及其他物理世界感知数据。

  • 1000上下文!新开源多模态大模型,单个GPU就能运行

    今年2月初,谷歌发布的Gemini2.0Pro支持200万上下文,震惊了整个大模型领域。仅过了2个月,Meta最新开源的Llama4Scout就将上下文扩展至1000万,整整提升了5倍开启千万级时代。根据实验数据显示,Llama4Behemoth在MMLUPro、GPQA、MATH-500等测试的数据比GPT-4.5、ClaudeSonnet3.7、Gemini2.0Pro更好。

  • 腾讯开启史上最大就业计划 三年将新增28000校招岗位

    站长之家(ChinaZ.com)4月17日 消息:今日,科技巨头腾讯正式对外宣布了一项旨在推动青年人才发展的重大举措——启动其历史上规模最大的就业促进计划,计划在未来三年内新增28000个实习岗位,并承诺将加大实习生的转化录用比例,为行业注入新鲜血液。尤为引人注目的是,仅在即将到来的2025年,腾讯就计划吸纳10000名校招实习生,其中技术类岗位占比高达六成,显示出公司

  • 上市即爆单!问界M8上市8分钟大定突破8000

    快科技4月16日消息,发布会还没结束,鸿蒙智行就已经发出喜报,全新问界M8仅用8分钟,大定订单就已经突破了8000台,累计小订订单已突破150000台。官方表示,该车将与4月20日正式开启交付。作为鸿蒙智行2025年的重磅车型,全新问界M8的官方指导价为35.98-44.98万元。全系标配华为高阶智驾ADS 3.0搭配HarmonyOS 4.0智能座舱等配置对BBA等合资豪华品牌带来了降维打击。作为一款专为家

  • 小米SU7限时购车权益:赠送8000元真皮座椅 辅助驾驶终身免费

    快科技5月1日消息,小米汽车今天公布了小米SU7 5月限时购车权益。5月1日至31日,下定可享受两大权益:1、全系赠送价值8000元Nappa真皮座椅;2、小米辅助驾驶终身免费使用权。根据官方公布的最新数据,小米SU7 4月份共计交付超28000台。此前1月份交付量超越超过20000台,2月份交付量超20000台大关,3月份交付量超29000台。截止今年4月底,小米汽车今年累计交付已经接近10万辆。而小米汽车今年的全年交付目标是35万台,意味着接下来8个月要交付25万辆,平均每个月3.1万辆。

  • 行业第一款8000mAh续航怪兽!荣耀Power将支持卫星通信

    荣耀Power将在4月15日发布,这是荣耀一款全新机型,主打户外体验。今天的预热中,官方暗示该机将支持卫星通信,可以让户外远行永不失联,不过目前暂不确定是北斗还是天通系统。从官方公布的外观图来看,荣耀Power延续了家族式的药丸”双挖孔屏幕,黑边控制也比较出色。

  • 刚刚,OpenAI发布GPT-4.1,性能暴涨、100上下文

    今天凌晨1点,OpenAI进行了技术直播发布了最新模型——GPT-4.1。除了GPT-4.1之外,还有GPT4.1-Mini和GPT4.1-Nano两款模型,在多模态处理、代码能力、指令遵循、成本方面实现大幅度提升。特别是支持100万token上下文,这对于金融分析、小说写作、教育等领域帮助巨大。由于GPT-4.1的发布,OpenAI宣布将会淘汰刚发布不久的GPT-4.5,其能力可见一斑。目前,如果想体验GPT-4.1而无法通过API身�

  • 荣耀 Power 之后,国产旗舰手机将步入8000mAh时代

    今年以来,OPPO、vivo、小米、真我等国产手机厂商纷纷加入 7000mAh+ 电池战局。与此同时,荣耀Power 率先将战场推向 Next Level —— 即 8000mAh 层级电池……

  • 为什么要使用MCP?MCP模型上下文协议能解决什么问题?

    在当今数字化时代,AI应用的开发和部署正面临着一个关键挑战:如何将AI技术与现有的服务和系统高效集成。为了解决这一难题,MCP应运生。AIbase的MCP资源网站还提供了详细的开发文档和教程,帮助开发者快速上手并深入学习MCP技术。

  • 国产旗舰手机将步入8000mAh时代 部分机型将冲击万毫安级门槛

    国内手机行业掀起新一轮电池容量竞赛,多款搭载8000mAh级电池的旗舰机型即将集中上市。小米16系列、荣耀Magic8 Pro、一加14、iQOO 14及红魔11 Pro等新机将普遍采用第二代高通骁龙8移动平台,并标配8000mAh大电池,部分机型或将冲击万毫安门槛。行业观察指出,国产厂商集体发力大容量电池并非偶然,此前OPPO、vivo已推出多款7000mAh产品,小米Redmi Turbo4 Pro工程机实测达7500mAh,荣耀Power系列更以8000mAh刷新主流品牌续航纪录。供应链透露,头部厂商正规划"8000mAh起步、万毫安级储备"方案,部分实验室原型机已实现120W快充与大电池的兼容测试。