首页 > 业界 > 关键词  > 正文

超13万个大模型!微软增强ChatGPT等开源模型,训练、推理能力

2023-10-06 09:20 · 稿源: AIGC开放社区公众号

目前,著名AI模型开源平台Hugging Face上有超过320,000个大模型,并且每天保持高速增长。据统计只有大约6,000个模型支持ONNX格式,但微软表示,实际上有超过130,000个模型支持该格式。而ONNX格式模型可以通过微软的ONNX Runtime优化性能、节省算力、增强训练/推理能力,例如,通

......

本文由站长之家合作伙伴自媒体作者“AIGC开放社区公众号”授权发布于站长之家平台,本平台仅提供信息索引服务。由于内容发布时间超过平台更新维护时间,为了保证文章信息的及时性,内容观点的准确性,平台将不提供完全的内容展现,本页面内容仅为平台搜索索引使用。需阅读完整内容的用户,请查看原文,获取内容详情。

举报

  • 相关推荐
  • AI日报:阿里上线首个官方大模型NBA Chat; Ideogram4.0开源发布;OpenAI升级ChatGPT记忆系统

    今日AI领域动态:Ideogram 4.0开源发布,93亿参数打造最强文字生成AI,提升海报与品牌营销创作;OpenAI升级ChatGPT记忆系统,算力降至1/5,解决过时与准确性痛点;腾讯文档推出行业首创“人机双写”原生编辑器;xAI发布Grok Imagine Video 1.5,支持图片转视频;豆包回应AI识别野生蘑菇误判,强调仅供参考;知乎Q1扭亏为盈,AI短剧成增长点;腾讯云ADP 4.0新增Claw模式,提升企业Agent构建效率;NBA中国与阿里推出首个官方大模型“NBA Chat”。

  • AI日报:微信开放平台发布AI生态接入指引;月之暗面再融资20亿美元;ChatGPT紧急上线封锁模式

    【AI日报】今日要点:微信开放平台发布AI生态接入指引,小程序可调用微信AI能力;高德发布全球首个3D原生城市世界模型ABot-Earth0.5,覆盖190多个国家和地区;OpenAI推出ChatGPT“锁定模式”防数据泄露;中国AI大模型周调用量达14.19万亿Token,连续六周超越美国;腾讯发布首个智能体行业应用LearnBuddy;顾全全确认离职字节跳动Seed团队;月之暗面再融资20亿美元,估值达300亿;苹果计划在WWDC2026推出全新AI战略,升级Siri并引入Google Gemini。

  • 小米大模型推理速度全球最快!1000 tokens/s是啥概念:官方科普

    日前,小米正式上线Xiaomi MiMo-V2.5-Pro-UltraSpeed模式。 据介绍,这是全球首个在通用GPU上突破1000 tokens/s的万亿参数模型,刷新了旗舰模型的全球最快推理速度。 今日,小米技术”公众号发文科普了什么是1000 tokens/s,以及这一速度到底有多快。 小米表示,token即词元,是大模型中的计量单位,类似日常买菜时使用的斤”两”。 1000 tokens/s也就是1000 Tokens Per Second,简称1000 TPS,意

  • AI日报:MiniMax发布M3 大模型;英伟达物理大模型Cosmos3发布;小红书已治理超120万个AI托管账号

    今日AI领域动态丰富:MiniMax发布M3+大模型,首创MSA架构并支持1M上下文,全面开源对标海外旗舰;英伟达联合行业巨头发布全球首款全开源全模态物理AI大模型Cosmos3,成立宇宙联盟;千问APP六一期间礼品选购咨询量增长260%,展现AI购物潜力;小红书治理超120万AI托管账号,处置18万篇AI造假笔记;抖音4月新增AI短剧超4.4万部,但爆款率仅0.6%;胡彦斌上线粉丝社区应用“彦火”,展示Vibe Coding潜力;LobsterAI推出图片视频大模型矩阵,整合四大主流模型;OpenAI重启机器人业务,奥特曼公开招募工程师,拓展具身智能布局。

  • 阿里语音大模型在Speech Arena斩获国内第一 全球排名第五

    在全球权威AI评测平台Artificial Analysis的语音排行榜(Speech Arena)上,阿里巴巴语音大模型Fun-Realtime-TTS-Preview以1190分的Elo评分位列全球第五、国产第一。 在ASR(将语音转为文字)、Chat(端到端的语音理解与对话)以及TTS(将文字转为语音)三个核心赛道,该模型均斩获全国第一,实现语音交互领域的大满贯”。 语音大模型的能力可拆解为三个层次:听得准(ASR)、说得好(TT

  • 最强AI大模型Fable 5、Mythos 5发布:人类智力优势还能撑多久

    Anthropic发布基于Mythos Preview的Claude Fable 5和Mythos 5两款AI模型,自称最强,在多项测试中达SOTA水平。Fable 5面向公众开放,保留安全运制;Mythos 5无运制但仅限审核机构使用。两者性能卓越,尤其在编程方面提升明显,但存在定价昂贵(1M输入/输出分别需10/50美元)、安全运制敏感(触发即降级至Opus 4.8)及强制30天安全审计等问题,影响商业用户使用。

  • 8GB内存成硬伤!iPhone 17无缘苹果最强端侧AI大模型

    根据苹果官方硬件适配细则,iPhone 17标准版和满血版因仅配备8GB内存,无法达到12GB门槛,无缘端侧AI大模型。目前仅iPhone Air、iPhone 17 Pro及Pro Max三款机型可完整体验。博主透露,苹果后续可能调整策略,下一代iPhone 18系列或全系标配12GB内存,以从根源满足端侧大模型需求,避免基础款用户被核心功能割裂。12GB内存将大幅强化本地AI推理速度,支持更复杂多模态任务,并降低对云端的依赖,提升数据隐私保护。

  • 京东云率先上线MiniMax M3:显著提升模型推理吞吐

    MiniMax M3正式上线,京东云JoyBuilder模型开发平台已第一时间接入MiniMax M3模型并同步开放服务。 依托京东云自研推理框架,JoyBuilder采用了PD分离部署、KV Cache缓存、投机采样等先进推理优化技术,显著提升了模型推理吞吐量与响应效率。 MiniMax M3在编程、智能体等专业任务上达到了前沿水平。其采用全新的MiniMax稀疏注意力架构(MSA),最高支持100万token的超长上下文。作为一款�

  • 美团Tabbit AI浏览器正式版上线:核心功能永久免费!整合主流国内大模型

    美团正式发布Tabbit AI浏览器1.0标准版,结束100天公测,全面开放下载,支持安卓、鸿蒙、苹果系统。该产品打破传统浏览器局限,通过整合DeepSeek、Kimi等多款国内主流大模型,实现AI全流程自动化任务处理,如搜索、筛选、执行等。新增记忆功能提升交互连贯性,内置300余种实用技能,覆盖学习、办公、生活等场景,并启动“妙招大赛”鼓励用户分享原创技能。

  • 自变量开源 Wall-OSS-0.5,全球领先首次实现“预训练”比肩“后训练”

    自变量机器人今日正式开源具身基础模型Wall-OSS-0.5,全球首次实现无需下游任务后训练,预训练模型直接部署至机器人即可完成搬运、分拣、整理绳索等多种操作任务,在部分任务上零样本泛化表现接近常规微调水平。该模型通过梯度桥、视觉对齐动作分词器、动作空间监督流匹配和DMuon优化器四项改进,让主干网络真正掌握动作能力而非依赖外挂模块,在十余个真实机器人任

今日大家都在搜的词: