首页 > 业界 > 关键词  > AI大模型最新资讯  > 正文

猎户星空大模型日、韩语能力全球:能跟日本人流畅交流

2024-01-30 14:12 · 稿源: 快科技

1月21日,猎户星空推出 Orion-14B 开源大模型,其 140 亿参数规模展示出强劲性能。Orion-14B 在通用能力评估中取得行业领先地位,超越了许多更大的模型。

值得注意的是,Orion-14B 针对日语和韩语进行了专门训练,为猎户星空在海外部署商业机器人应用提供支持。这些机器人不仅提供送餐服务,还能顺畅地与用户交流。

通过 AWQ Q4 量化技术,Orion-14B 的模型大小减少了 70%,推理速度提升了 30%,性能几乎没有损失(小于 1%)。它可以在千元级显卡上流畅运行,在 NVIDIA RTX 3060 显卡上实测推理速度可达 31 token/s(约每秒 50 个汉字)。

举报

  • 相关推荐
  • 8GB内存成硬伤!iPhone 17无缘苹果最强端侧AI大模型

    根据苹果官方硬件适配细则,iPhone 17标准版和满血版因仅配备8GB内存,无法达到12GB门槛,无缘端侧AI大模型。目前仅iPhone Air、iPhone 17 Pro及Pro Max三款机型可完整体验。博主透露,苹果后续可能调整策略,下一代iPhone 18系列或全系标配12GB内存,以从根源满足端侧大模型需求,避免基础款用户被核心功能割裂。12GB内存将大幅强化本地AI推理速度,支持更复杂多模态任务,并降低对云端的依赖,提升数据隐私保护。

  • 小米超高端手机下半年发布:玄戒芯片+OS+AI大模型大会师!全自研

    小米将于下半年发布一款超高端新品,属于MIX系列,可能命名为MIX Fold 5,搭载自研玄戒O3旗舰SoC(3nm制程、超大核4.05Ghz等)、澎湃OS 4系统(底层重构提升流畅度)和自研MiMo大模型(MiMo-V2.5系列全球领先)。该产品并非小米17S Pro,而是新一代大折叠屏手机,此外MIX系列还规划了一款直板机,带模块化磁吸镜头量产方案,两款机型预计Q3发布,最快7月亮相。

  • 苹果满血AI大模型仅支持iPhone 17 Pro/Air:iPhone 17用户无缘

    苹果今天凌晨在WWDC2026开发者大会上正式发布了全新的Siri AI,这是一套完全由Apple Intelligence驱动的智能助理,相当于把过去几代的Siri完成了彻底重构。 据悉,Siri AI搭载了个人情境深度理解能力、覆盖海量信息的广泛世界知识库,还有实时屏幕感知能力,能随时协助用户找到自己需要的所有内容,不管是解答各类问题,还是从用户短信、电子邮件、照片等不同应用里精准提取�

  • 谷歌推出Gemini Go:2GB内存手机也能跑大模型

    谷歌为Android Go系统推出全新Gemini Go AI助手,专为内存超2GB的低配设备设计。该精简版大模型取代Google Assistant Go,用户无需下载独立应用,长按Home键或电源键即可唤醒。它支持拨打电话、发短信、查询地图、搜索餐厅、设置闹钟等日常功能,还能上传文档和照片以提供更自然的对话体验。目前,Gemini Go已开始分阶段向符合条件的设备推送。

  • 小米大模型推理速度全球最快!1000 tokens/s是啥概念:官方科普

    日前,小米正式上线Xiaomi MiMo-V2.5-Pro-UltraSpeed模式。 据介绍,这是全球首个在通用GPU上突破1000 tokens/s的万亿参数模型,刷新了旗舰模型的全球最快推理速度。 今日,小米技术”公众号发文科普了什么是1000 tokens/s,以及这一速度到底有多快。 小米表示,token即词元,是大模型中的计量单位,类似日常买菜时使用的斤”两”。 1000 tokens/s也就是1000 Tokens Per Second,简称1000 TPS,意

  • AI日报:阿里上线首个官方大模型NBA Chat; Ideogram4.0开源发布;OpenAI升级ChatGPT记忆系统

    今日AI领域动态:Ideogram 4.0开源发布,93亿参数打造最强文字生成AI,提升海报与品牌营销创作;OpenAI升级ChatGPT记忆系统,算力降至1/5,解决过时与准确性痛点;腾讯文档推出行业首创“人机双写”原生编辑器;xAI发布Grok Imagine Video 1.5,支持图片转视频;豆包回应AI识别野生蘑菇误判,强调仅供参考;知乎Q1扭亏为盈,AI短剧成增长点;腾讯云ADP 4.0新增Claw模式,提升企业Agent构建效率;NBA中国与阿里推出首个官方大模型“NBA Chat”。

  • AI日报:MiniMax发布M3 大模型;英伟达物理大模型Cosmos3发布;小红书已治理超120万个AI托管账号

    今日AI领域动态丰富:MiniMax发布M3+大模型,首创MSA架构并支持1M上下文,全面开源对标海外旗舰;英伟达联合行业巨头发布全球首款全开源全模态物理AI大模型Cosmos3,成立宇宙联盟;千问APP六一期间礼品选购咨询量增长260%,展现AI购物潜力;小红书治理超120万AI托管账号,处置18万篇AI造假笔记;抖音4月新增AI短剧超4.4万部,但爆款率仅0.6%;胡彦斌上线粉丝社区应用“彦火”,展示Vibe Coding潜力;LobsterAI推出图片视频大模型矩阵,整合四大主流模型;OpenAI重启机器人业务,奥特曼公开招募工程师,拓展具身智能布局。

  • AI日报:Claude Opus 4.8上线;小红书PC端上线AI搜索助手点点;阶跃星辰开源Step 3.7 Flash 大模型

    今日AI领域亮点:Anthropic发布Claude Opus 4.8,性能提升且价格大降;小红书PC端上线AI搜索助手“点点”,基于真实笔记提供对话式交互;阶跃星辰开源Step 3.7 Flash模型,专注智能体生产化;拼多多加强AI治理,打击涉考作弊工具;Grok Build 0.2.7更新,新增多代理共享终端;小米宣布MiMo旧版模型2026年6月下线;阿里云百炼全面CLI化并开源;腾讯混元推出Hy-Memory智能记忆插件,提升记忆密度与效率。

  • 行业最强游戏平板!红魔游戏平板5 Pro入网:内置豆包大模型

    红魔游戏平板5 Pro正式入网,预计6月发布。核心配置:9英寸2400×1504 OLED屏,185Hz刷新率同级首发,峰值亮度2600nit;搭载高通骁龙8+ Elite Gen5处理器,自研液冷+涡轮风扇双散热架构;8300mAh电池+80W快充,支持旁路充电。提供12GB+256GB至24GB+1TB四档存储,机身7.2mm厚、375g重。系统集成AI游戏功能,如语音查攻略、生成出装方案等。参考上代3999元起售价,新品或因存储成本上涨而调价。

  • 全球AI大模型周调用量五连涨 DeepSeek-V4-Flash登顶

    根据OpenRouter最新数据测算,上周(5月18日至5月24日),全球AI大模型总调用量达28.9万亿Token,较此前一周增长7.4%,连续五周上涨,大模型调用需求仍在持续释放。 在主要上榜模型中,中国AI大模型周调用量达9.223万亿Token,环比增长19.89%;同期美国AI大模型周调用量为4.93万亿Token,环比增长16.27%。中国大模型周调用量已连续四周超过美国,稳居全球首位,表明中国模型正更深入

今日大家都在搜的词: