首页 > 业界 > 关键词  > Mistral7B最新资讯  > 正文

亚马逊机器学习团队推出 Mistral 7B 基础模型 支持8000个token上下文长度

2023-10-10 09:51 · 稿源:站长之家

文章概要:

- Mistral7B 是Mistral AI开发的英文文本和代码生成基础模型,参数规模70亿。

- SageMaker JumpStart提供一键部署Mistral7B进行推理,可快速自定义。

- Mistral7B具有8000个token的上下文长度,表现低延迟和高吞吐量。

站长之家(ChinaZ.com)10月10日 消息:亚马逊机器学习团队近日宣布,Mistral AI开发的Mistral7B基础模型现已在亚马逊SageMaker JumpStart上提供,用户可以通过该平台一键部署模型进行推理。

Mistral 7B是Mistral AI开发的英文文本和代码生成基础模型,拥有70亿个参数,支持文本摘要、分类、文本补全和代码补全等多种用例。为展示模型的易于自定义性,Mistral AI还发布了Mistral7B Instruct对话模型,使用各种公开对话数据集进行了优化。

Mistral 7B采用transformer架构,通过grouped-query attention和sliding-window attention实现更快的推理速度和处理更长序列的能力。该模型具有8000个token的上下文长度,表现出低延迟和高吞吐量,与更大模型相比性能出色,参数量只有70亿,显存需求较低。Mistral7B基于宽松的Apache2.0许可发布,可无限制使用。

亚马逊SageMaker JumpStart是一个机器学习中心,提供各种预训练好的算法和模型,用户可以快速上手机器学习。现在,用户可以通过几次点击在SageMaker Studio中发现并部署Mistral 7B,或者通过SageMaker Python SDK以编程方式部署,利用SageMaker的各项功能如管道、调试器对模型性能及MLOps进行控制。模型部署在AWS安全环境下、用户的VPC控制之中,有助于确保数据安全。

image.png

SageMaker JumpStart为机器学习从业者提供了越来越多性能最好的基础模型。它们帮助降低训练和基础设施成本,并支持自定义以适应特定用例。

总结Mistral7B的主要特色功能点大致如下:

1. 参数规模达70亿,支持多种自然语言处理任务。Mistral 7B是一个具有70亿参数的基础模型,支持文本摘要、分类、补全等多种英文NLP任务。

2. 推理速度快,具有8000个token的上下文长度。Mistral 7B使用了transformer架构,可以实现低延迟和高吞吐量推理,支持长达8000个token的上下文长度。

3. 易于部署使用,提供一键体验。用户可以通过Amazon SageMaker JumpStart一键部署Mistral7B,并便捷获得其推理服务,无需训练即可使用。

4. 模型开源,基于Apache2.0协议。Mistral7B的模型权重已在宽松的Apache2.0许可下开源,用户可以无限制地使用。

SageMaker JumpStart体验网址:https://aws.amazon.com/cn/sagemaker/jumpstart/

举报

  • 相关推荐
  • 雷军:成都车展将首次展出小米SU7 Ultra纽北限量版

    随着8月29日成都车展开幕临近,小米汽车创始人雷军通过短视频提前剧透参展亮点。 此次小米汽车将携全阵容车型亮相西博城展览馆16号馆H1607展台。 在参展车型方面,小米SU7、SU7 Ultra与YU7将集体登场,覆盖不同用户需求。车身颜色选择十分丰富,除了市场反响热烈的YU7流金粉、影青色外,兼具质感与个性的丹霞紫也将亮相。 此次车展最受瞩目的亮点,当属小米 SU7 Ultra纽北

  • 问界新M5 Ultra跃影红亮相成都车展,现场上演“人从众”

    成都车展上,问界新M5 Ultra以“跃影红”配色惊艳亮相,成为全场焦点。其外观设计灵感源自极光掠影,流动红色车身搭配黑色运动轮毂,尽显低调张扬气质。新车搭载华为ADS辅助驾驶系统,配备激光雷达与毫米波雷达,提供更智能安全的驾驶体验。四驱版4.3秒破百,增程版续航达1440km,满足年轻用户对性能与续航的双重需求。售价22.98万元起,即日起至10月9日订车可享最高37000元权益。

  • 真我GT8 Pro预热:Ultra级的产品力

    今天下午,真我举行了七周年直播活动,realme副总裁徐起提前预热真我GT8 Pro。 徐起表示,真我GT8 Pro将是一款大改款旗舰,从外观设计、核心技术、用户体验等维度全方位革新,拥有Ultra级的产品力,而且真我还将带来颠覆想象的影像效果,是真我史上最强旗舰。

  • 小米SU7 Ultra广告牌亮相首都机场 雷军:多做点广告 让更多人知道

    今天早上,小米雷军在个人微博宣布,小米SU7 Ultra广告牌正式亮相首都机场。 雷军还以互动口吻向网友提问:Ultra 这样的车型,大家觉得,是不是应该多做点广告,让更多人知道?” 从雷军的微博内容来看,小米SU7 Ultra此次选择在首都机场投放广告牌,显然是瞄准了机场庞大的客流量与高曝光度。

  • 酷睿 Ultra 赋能 AIPC 轻薄本:不止性能飞跃,更懂用户需求的智能新体验

    AI技术正从实验室走向日常生活,AIPC(人工智能个人计算机)成为满足用户多元化需求的关键载体。英特尔酷睿Ultra处理器凭借先进技术布局,突破传统轻薄本性能瓶颈,实现高效多任务处理与强大AI算力融合。华硕灵耀14Air等产品以性能与体验双优特质脱颖而出,不仅提升办公创作效率,更重新定义轻薄本的使用价值。随着技术迭代与生态完善,AIPC正从“小众尝鲜”走向“大众普及”,智能体验将成为未来轻薄本的标准配置。

  • 豆包1.5 Vision Lite 对比 GPT-5-min,谁更适合你?实测AI模型选型利器|AIBase

    文章探讨了企业选择AI大模型时面临的实际决策难题,指出单纯比较学术参数无法满足业务需求。AIBase模型对比平台(https://model.aibase.cn/compare)通过三大核心价值解决痛点:1)聚焦业务场景而非参数堆砌,突出价格、语言支持、上下文长度等实用维度;2)透明化成本计算,标注长文本溢价规则和多模态附加费;3)一键生成对比报告。平台特别强调中文场景的特殊性(如豆包1.5在中文处理成本的优势),并揭示厂商宣传中容易忽略的隐藏成本(如GPT-5-min超5000字符的30%溢价)。典型电商客服案例显示,需综合中文理解、多模态、性价比等维度决策,最终选择取决于具体业务需求而非绝对性能排名。

  • 科龙静省电Ultra上市,跳出空调参数内卷,全能实力重塑用户体验

    空调市场竞争激烈,科龙静省电Ultra以硬核实力破局。产品搭载美芝压缩机、7mm铜管等优质硬件,APF值达6.26超一级能效,实现15秒速冷、30秒速热。四向送风消除温差,防直吹设计提升舒适度。经中家院认证,能效稳定领先,满足年轻消费者对性能、节能与场景适配的全方位需求,引领行业回归实效竞争。

  • B站要变成AI站

    互联网平台都在跟AI结合,B站没有成为例外。从新一季度财报来看,B站的AI味儿也越来越浓了。 8月21日,B站公布第二季度业绩,总营收达73.4亿元人民币,同比增长20%。其中,游戏业务收入为16.1亿元,同比增长60%,广告业务收入为24.5亿元,同比增长20%。由此推动B站毛利率从去年同期的29.9%提升至36.5%,调整后净利润达到5.6亿元,创下历史最好成绩。 从整体来看,B站生态集聚

  • AI日报:AI内容新规正式生效;美团推出开源大模型LongCat;阶跃发布语音大模型Step-Audio 2 mini

    AI日报栏目每日更新AI领域热点内容,聚焦开发者需求。本期重点包括:阶跃星辰发布端到端语音大模型Step-Audio2 mini,在多项基准测试中表现优异;9月1日起AI生成内容需强制标识;美团推出开源大模型LongCat;上海AI实验室发布多模态大模型InternVL3.5;腾讯ARC团队推出音频生成模型AudioStory;OpenAI发布实时语音模型GPT-realtime;Meta与UCSD合作推出DeepConf技术;xAI代码库遭窃事件;阿里巴巴Qwen团队发布GUI自动化框架;微软推出Copilot Labs实验中心;小红书自动化工具xiaohongshu-mcp上线。

  • Matrixport 受邀出席 Bitcoin Asia 2025,共议机构投资新趋势

    Bitcoin Asia 2025峰会将于8月28-29日在香港举行,由BTC Media主办。预计吸引超1.5万名与会者,涵盖主题演讲、圆桌讨论及展览等活动,突显香港在全球数字资产领域的战略地位。会议将探讨亚太市场潜力、机构化进程及多元化投资机会,并邀请200余位全球重量级嘉宾参与。Matrixport作为亚洲领先加密金融服务平台,将持续推动资产数字化及Web3基础设施落地,助力行业创新与发展。

今日大家都在搜的词: