首页 > 业界 > 关键词  > StabilityAI最新资讯  > 正文

Stability AI新开源LLM项目“FreeWilly”表现优于 Meta 的 Llama 2

2023-07-24 10:16 · 稿源:站长之家

站长之家(ChinaZ.com)7月24日 消息:Stability AI 与 CarperAI 发布了两个新的大型语言模型,名为 FreeWilly。其中一个模型基于 Meta 的 Llama v2,通过优化性能展示了开源开发的速度。

两个 FreeWilly 模型均基于 Meta 的 Llama 模型,其中 FreeWilly2已使用具有700亿个参数的较新的 Llama-2模型。FreeWilly 团队自己的努力是使用“高质量指令”生成的新合成数据集进行“仔细微调”。

FreeWilly 团队使用微软的 “Orca 方法” 训练小型模型逐步推理,而不是简单地模仿大型模型的输出风格。他们创建了一个包含600,000个数据点的数据集,相比于 Orca 团队使用的数据集只占了10% 左右。

在常见的基准测试中,以这种方式训练的 FreeWilly 模型在某些逻辑任务中表现出与 ChatGPT 相当的结果,其中基于 Llama2的 FreeWilly2模型优于 FreeWilly1。

总体而言,FreeWilly2在性能上领先于 Llama v2约4%,这表明 Meta 的新标准模型仍有改进的空间,并且开源社区可以提供帮助。

image.png

FreeWilly2目前在性能最佳的开源模型列表中处于领先地位,而原始的 Llama2在通用语言理解基准测试 MMLU 上略微领先。

FreeWilly 模型在开放访问大型语言模型领域树立了新标准,推动了研究并增强了自然语言理解和复杂任务的实现。这些模型可免费用于研究目的,并且 FreeWilly2被认为是在基准测试中具有最佳平均结果的开源模型。

项目网址:https://huggingface.co/spaces/HuggingFaceH4/open_llm_leaderboard

举报

  • 相关推荐
  • 三星Galaxy Tab S10 Lite:为你开启多彩校园「星」生活!

    三星Galaxy Tab S10 Lite平板电脑是新学期学习的理想助手。它配备10.9英寸大屏,支持S Pen触控笔,提供流畅书写体验。多任务处理功能可同时运行多个应用,提高学习效率。轻巧便携设计适合校园使用,Vision Booster技术确保户外清晰显示。内置AI功能可快速搜索解题,是课堂笔记、资料查阅的得力工具。

  • iOS 26.1首个Beta版更新发布 苹果AI支持更多语言

    苹果发布iOS 26.1开发者预览版Beta更新,内部版本号23B5044l。主要更新包括:Apple Intelligence新增丹麦语、荷兰语、挪威语、葡萄牙语、瑞典语、土耳其语、繁体中文及越南语支持;AirPods实时翻译功能扩展至日语、韩语、意大利语和中文(含繁简);电话应用数字键盘采用全新液态玻璃设计。此外,Apple Music支持滑动切换歌曲,照片、日历和Safari浏览器迎来视觉优化。iOS 26正式版已于9月16日推送,适配第二代iPhone SE及之后共25款机型,iPhone 17系列和iPhone Air出厂预装该系统。

  • AI眼镜的痛,Meta也治不了

    对于全球科技从业者而言,Meta Connect大会是一年一度的重要时刻。 不少人早早守在电脑前,想知道扎克伯格此次会带来哪些前沿技术产品,更对会上即将亮相的新款AI眼镜充满关注。 事实上,AI眼镜这类消费电子产品,在过去一年里已快速从“小众科技产品”走进大众视野,但看似火热的市场背后,AI眼镜当下的发展却陷入了明显瓶颈。 此前,国内AI眼镜市场曾掀起“百镜大

  • 远东股份:ALL IN“电能+算力+AI”,智能驱动未来

    远东股份(600869)凭借“电能+算力+AI”战略,在能源与算力融合领域形成先发优势。公司深耕特高压输电、新能源等关键技术,自主研发高导铝绞线提升输电效率,产品应用于多条国家级特高压线路。同时布局液冷技术研发,为数据中心提供高效散热方案。未来将持续推进“AI+能源”产业生态建设,助力制造业智能化升级和绿色高效算能模式构建。

  • StarRocks Connect 2025 圆满落幕:AI Native 时代,数据分析未来已来

    StarRocks Connect 2025峰会圆满落幕,聚焦AI Native时代的数据分析未来。活动汇聚全球开发者与行业专家,分享StarRocks在复杂业务场景中的实践,探讨技术演进方向。从性能引擎到AI原生平台,StarRocks 4.0将支持多智能体协作框架,提升数据分析效率。多家企业展示应用案例,覆盖电商、金融、旅游等领域,验证了其高性能与成本优势。开源精神推动技术创新,共同探索数据智能的无限可能。

  • 三星全线产品亮相北京京东MALL 全场景呈现有AI的科技·艺术·家

    9月12日,三星家电以“AI的呵护”为主题在北京京东MALL举办线下体验展,集中展示搭载AI技术的全线产品,包括冰箱、洗衣机、电视及手机等。重点展出了荣获IFA创新奖的AI神·黑钻热泵洗烘旗舰等产品,通过五大主题展区呈现科技与艺术融合的家电新形态。观众可现场体验食材管理、衣物护理等智能功能,感受AI技术带来的生活便利。展览将持续至9月17日,并提供互动礼品。

  • AI日报:美团发布推理大模型LongCat-Flash-Thinking;阿里Wan-Animate开源;字节推豆包翻译大模型

    AI日报栏目聚焦人工智能领域最新动态。美团推出高性能推理大模型LongCat-Flash-Thinking;阿里开源Wan-Animate模型革新AI视频生成;字节跳动发布豆包翻译模型,支持28种语言互译;华为与浙大联合推出安全大模型DeepSeek-R1-Safe;阿里云即将发布跨模态模型Qwen3-Omni;xAI推出计算成本降低98%的Grok4Fast模型;YouTube发布多项AI创作辅助功能;IBM推出轻量级文档处理模型Granite-Docling-258M;中科院发布类脑大模型SpikingBrain实现百倍速度突破;OpenAI将推出仅限Pro用户的计算密集型新功能。

  • 不止于价格,DigitalOcean、AWS和Linode该选谁?

    本文对比了DigitalOcean、AWS和Linode三大海外云服务商,从定位、成本、易用性、GPU性能及本土化支持等维度分析其优劣势。DigitalOcean以开发者友好、简单易用和高性价比著称,适合初创企业和中小团队;AWS功能全面但复杂昂贵,适合大型企业;Linode性能稳定但生态有限。特别强调DigitalOcean通过卓普云提供本土化支持,解决支付、备案和技术响应等痛点,是中国企业出海的高效选择。

  • 三星Galaxy S10 Lite:为你开启多彩校园「星」生活!

    新学期开启,三星Galaxy Tab S10 Lite平板电脑凭借10.9英寸大屏、轻巧便携设计和S Pen触控笔,成为学习好帮手。支持多任务分屏、数学求解器、即圈即搜等功能,提升学习效率。高颜值外观搭配丰富配色,适合校园使用,助力规划时间、掌握知识,让新学期更精彩。

  • 小米澎湃OS 3第二批Beta版开启招募:覆盖REDMI K80、小米MIX Flip2等五款

    据小米官方消息,澎湃OS 3第二批Beta版已经开启招募,覆盖五款机型,包括:小米MIX Flip 2、REDMI K80、小米平板7 Ultra、小米平板7、REDMI K Pad。 据了解,澎湃OS 3采用自研底层内核技术平台,深入微架构流水线,识别CPU空转时长,通过一体化调频技术提升效率,整体任务执行效率提升19%。 同时,澎湃OS 3终于登岛”,命名为小米超级岛”,支持三岛并存,能显示待取快递提醒、登�

今日大家都在搜的词: