首页 > 业界 > 关键词  > 微软最新资讯  > 正文

微软发布Phi-3 Vision等大模型系列

2024-05-22 10:31 · 稿源:站长之家

站长之家(ChinaZ.com)5月22日 消息:微软发布了其最新的大型语言模型系列,Phi-3,包括Phi-3Vision、Phi-3Small7B和Phi-3Medium14B型号。这些模型在性能上与当前领先的大型模型相媲美,同时在特定领域提供了一些独特的优势。

GOHfCPpaIAclWCs.jpg

Phi-3Medium14B 型号的性能与Mixtral8x22B和Llama370B相当,甚至超过了Command R+104B和GPT3.5。这表明微软的这个模型在大型模型领域具有较强的竞争力。

Phi-3Small7B 型号虽然规模较小,但其性能依然超过了Mistral7B和Llama38B,这使得它在需要处理大量数据但计算资源有限的场景下具有潜在的应用价值。

GOHfCPrbMAAt-pq.jpg

Phi-3系列模型支持的上下文长度为4K和128K,这为处理长文本数据提供了灵活性。模型规模方面,Medium版本为14B参数,Small版本为7.5B参数,而Vision版本则为4.2B参数。

在训练数据方面,微软使用了4.8T(万亿)令牌对模型进行训练,训练过程持续了42天,使用了512个H100GPU。训练数据集包含了10%的多语言数据,并且采用了经过严格过滤的数据和合成数据,特别是科学和编程教材,这可能有助于模型在这些领域的特定任务上表现更好。

微软还为Phi-3系列引入了一个新的分词器,拥有10万词汇量,这有助于模型更好地理解和生成语言。此外,Phi-3模型的权重兼容AWQ、INT4、ONNX和transformers,这为开发者提供了在不同平台上部署和运行模型的灵活性。

总体而言,微软的Phi-3系列模型在大型语言模型领域展现了强大的性能和灵活性,为研究人员和开发者提供了新的工具和可能性。随着这些模型的发布,我们可以期待在自然语言处理和相关领域出现新的创新和应用。

模型地址:https://top.aibase.com/tool/phi-3-vision-128k-instruct

举报

  • 相关推荐
  • AI日报:xAI 震撼发布Grok4;微软开源全新Phi-4-mini版本;上海累计82款大模型通过备案

    AI日报栏目聚焦人工智能领域最新动态:1)xAI发布旗舰模型Grok4,在数学推理和代码生成表现突出,同时推出开发者专用Grok4Code;2)微软开源Phi-4-mini模型,推理效率提升10倍,适合边缘设备;3)上海82款大模型完成备案,垂直领域应用取得突破;4)Hugging Face推出开源桌面机器人Reachy Mini,支持Python编程;5)Perplexity发布AI浏览器Comet挑战Chrome;6)OpenAI将首次发布开放权重模型,打破闭源惯例;7)谷歌医疗AI模型MedGemma系列上新,单个GPU即可运行;8)OpenAI以约65亿美元收购AI硬件公司io Products,正式进军硬件市场。

  • OPPO K13 Turbo系列官宣将于7月21日发布 内置散热风扇

    OPPO近日正式宣布,将于7月21日14:30举行新品发布会,隆重推出OPPO K13Turbo系列。根据官方发布的预告片,该系列最大亮点在于内置了散热风扇,OPPO官方宣称K13Turbo将借此掀起一场性能风暴。 预告片中透露,OPPO K13Turbo系列采用了竖排相机设计,而散热风扇巧妙地安置在摄像头下方,整体造型简约大气,与iPhone16有着异曲同工之妙。OPPO产品经理鳃鳃saisai进一步揭秘,K13系列的风扇�

  • 「6月30日AI日报」百度开源文心大模型4.5系列;通义千问发布多模态生成模型Qwen VLo

    AI日报精选:1)百度开源文心大模型4.5系列,含10款新模型,性能优异;2)通义千问发布多模态模型Qwen-VL,支持图文交互;3)阿里开源3亿参数多模态模型Ovis-U1;4)华为开源盘古7B稠密和72B混合专家模型;5)美图MOKI推出AI创意广告功能,一键生成专业视频;6)谷歌Gemini 2.5 Pro API重新免费开放;7)豆瓣上线"深入研究"AI功能;8)小米"AI百宝箱"结束内测;9)北京智研院开源多模态系统OmniGen2;10)知乎升级"直答"知识库功能。

  • OPPO K13 Turbo系列真机亮相:自带风扇+RGB

    OPPO K13 Turbo系列真机已经现身在bilibili world《胜利女神:NIKKE》展区。 从图片来看,OPPO K13 Turbo系列系列后摄区域有点类似一加13T,采用了矩形金属方案,主摄下方就是散热风扇,同时外圈还自带RGB等效。 这个设计方案可以明显看出,该机是主打电竞体验。 风扇模组采用电镀镍工艺,放弃普通喷涂,带来更好的防水、防锈效果,并且号称风力提升120%,从而实现更强、更持久�

  • 直接对标iPhone!魅族22系列本月发布:最强手感小直屏

    据博主智慧皮卡丘爆料,魅族22系列将在本月发布,是全新开模的真小尺寸新机,直接对标iPhone。 该系列机型此前已经三证齐全,型号为M582Q,备案单电芯容量5370mAh,典型值5500mAh。

  • @开发者们:百度文心大模型4.5系列模型开源,国内首发平台GitCode现已开放下载!

    6月30日,百度文心大模型4.5系列正式开源并在国内领先的开源平台GitCode首发上线。该系列包含10款模型,涵盖47B和3B参数的混合专家(MoE)模型及0.3B的稠密参数模型,采用创新的多模态异架构结构实现跨模态知识融合。模型基于飞桨框架开发,训练效率达47% MFU,在文本和多模态基准测试中达到SOTA水平。所有模型按Apache2.0协议开源,配套产业级开发套件支持多种芯片部署。GitCode平台已汇聚620万用户,为AI开发者提供代码托管、协同开发等全流程支持。此次开源将推动中国AI生态创新,加速大模型技术产业化应用。

  • 轻薄多彩 强悍耐用 | TECNO正式发布SPARK 40 系列

    传音旗下TECNO发布全新SPARK40系列手机,包含四款机型,主打轻薄机身与旗舰级配置。全系配备6.78英寸144Hz AMOLED屏、5200mAh大电池及45W快充,Pro+机型厚度仅6.49mm,支持30W无线充电。搭载联发科Helio G200处理器,安兔兔跑分近47万,配备5000万主摄和EIS防抖。AI方面整合ChatGPT等平台,支持离线通信功能。通过IP64防水防尘认证,采用抗摔玻璃,重新定义中端机性能标杆。

  • Neousys宸曜科技亮相2025 Vision China(北京)

    2025年6月19-20日,北京机器视觉助力智能制造创新发展大会暨Vision+China2025在京成功举办。Neousys宸曜科技展示了多款边缘AI计算平台解决方案,包括:1)Nuvo-9160GC强固型AI推理平台,支持行为分析、安防监控等应用;2)NRU-230V-AWP自动驾驶计算平台,具备IP66防护和备用电源;3)基于NVIDIA Jetson的智能采集卡系列;4)Nuvo-10001系列高性价比嵌入式平台。产品覆盖机器视觉、自动驾驶、智能制造等领域,以宽温强固、无风扇设计满足严苛工业环境需求,获得现场观众高度评价。

  • 小米16系列后壳首曝!iPhone 17 Pro同款超大后摄模组

    博主参考线Referline”今天曝光了一款手机背板谍照,疑似小米下一代数字旗舰小米16系列。 可以看到,其背部最大的亮点是采用了超大的横向矩阵模组,与爆料中的iPhone 17 Pro如出一辙。 当然了,这并不是小米提前抄袭了iPhone,早在小米11 Ultra上,小米就用过这种超大模组,甚至还在右侧加入了副屏。 按照目前手机镜头模组和电池的空间需求来看,小米16系列上肯定不会再加�

  • 2025最新全球AI大模型排名,国内外模型动态洗牌(实时更新平台推荐)

    2025年全球AI大模型竞争进入白热化阶段,OpenAI、Google等国际巨头与中国企业激烈交锋。技术迭代远超预期,仅半年内排名就经历多次洗牌。当前全球AI大模型综合排名Top10显示:1)GPT-4.5综合80.4分领跑;2)Claude3.7编程领域领先;3)Gemini2.0多模态标杆;4)国产DeepSeek R1推理速度提升3倍;5)阿里Qwen2.5数学编程单项第一。中国模型通过开源策略、垂直优化和成本革命实现弯道超车,如DeepSeek R1仅耗资600万美元达到GPT-4水平,字节豆包采用稀疏MoE架构成本大幅降低。中文场景深度优化表现突出,如文心一言4.0方言交互准确率92%。开源生态爆发,通义千问全尺寸开源(7B~110B参数)在Hugging Face排名第一。权威评估需结合标准化测试、人类盲测和场景适配性。