首页 > 业界 > 关键词  > 正文

Martian发布智能模型路由器,实现LLM动态切换以降低成本

2023-11-16 11:15 · 稿源:站长之家

站长之家(ChinaZ.com)11月16日 消息:在人工智能领域,一家名为Martian的初创公司近日从隐秘状态中脱颖而出,成功获得了来自NEA、Prosus Ventures、Carya Venture Partners和General Catalyst等投资者的900万美元融资。该公司的创新产品是一款智能模型路由器,有望在高风险商业场景中服务,降低公司使用大型语言模型(LLM)的成本。

Martian的创始人Shriyash Upadhyay和Etan Ginsberg表示,他们公司的目标是解决人工智能研究难以盈利的问题,通过建立一家产品受益于可解释性的公司。与此同时,他们分享了Martian公司的融资计划,包括用于产品开发、对模型内部运营的研究以及扩大公司团队规模。

image.png

官网地址:https://withmartian.com/

这家初创公司的关键创新在于他们提出的智能模型路由器,能够在不实际运行模型的情况下估计模型的表现。Upadhyay和Ginsberg解释说,Martian可以根据特定的任务要求动态切换到更便宜的型号,其性能与最昂贵的型号相媲美,仅在必要时才切换到昂贵的型号。这种智能切换可以实现比完全依赖高端LLM模型更高的性能和更低的成本。

对于很多公司而言,完全依赖高端LLM模型的成本可能过高。市场情报公司Permutable.ai的首席执行官透露,使用OpenAI的高端模型每天处理约200万篇文章,每年的成本超过100万美元。因此,Martian的智能模型路由器为公司提供了一种在不牺牲性能的前提下降低人工智能成本的创新方法。

Upadhyay和Ginsberg补充说,已经有一些公司开始采用Martian的技术,其中包括“价值数十亿美元”的公司。他们认为,建立一个真正有效的模型路由器是非常困难的,因为它需要深入了解各种模型的基本工作原理。然而,Martian的创新在于他们成功克服了这一挑战,为公司提供了更灵活、高效且成本更低的人工智能解决方案。

在人工智能领域,Martian的智能模型路由器的推出标志着该行业的进一步发展,为公司提供了在不同任务需求下实现LLM动态切换的先进工具。这一创新有望推动人工智能领域朝着更加可持续、经济高效的方向发展。

举报

  • 相关推荐
  • 1699元 小米路由器BE10000 Pro发布:三频万兆无线 可装SSD当网盘

    小米9月25日推出旗舰路由器BE10000+Pro,售价1699元。产品以AI双万兆和Wi-Fi 7为核心卖点,性能、扩展性与智能化实现多重突破。无线端支持三频万兆速率,最高达10024Mbps,配备12根天线与12路信号放大器,轻松应对大流量或多设备并发。有线端配备双万兆网口与4个2500Mbps高速网口,提升大数据连接效率。经过187类严苛测试,稳定性强,消除断网顾虑。支持加装M.2硬盘与USB接口,可打造个人轻存储网盘。搭载AI场景加速功能,针对游戏、影音等五大场景一键优化,并支持中继与蓝牙网关,可连接300+蓝牙设备,联动响应速度提升3倍。

  • 强强联手!深度求索、寒武纪同步发布DeepSeek-V3.2模型架构和基于vLLM的模型适配源代码

    2025年9月29日,深度求索公司发布新一代模型架构DeepSeek-V3.2,引发行业关注。寒武纪同步宣布适配该模型并开源vLLM-MLU推理引擎代码。新发布的DeepSeek-V3.2-Exp是实验性版本,在V3.1-Terminus基础上引入稀疏注意力机制,优化长文本训练和推理效率。目前官方应用端已同步更新,API大幅降价。此次模型体积达671GB,下载需8-10小时。业内专家指出,此次快速适配表明双方早有深度技术协�

  • 易鑫发布Agentic大模型,破解汽车金融风控与效率痛点

    9月12日,易鑫集团在“IT Value Summit数字价值年会”上入选“2025创新场景年度AI应用TOP榜”,成为汽车金融科技领域唯一上榜企业。首席科技官贾志峰指出,易鑫以AI为核心驱动力,通过自研大模型“智鑫多维”等技术,显著提升风控水平与融资通过率,推动行业智能化转型。平台已连接全国4.2万家经销商及上百家金融机构,服务覆盖牧民、基层员工等多元群体,体现技术普惠价值。未来将持续加大科技创新投入,深化国内普惠金融服务,并探索技术出海,助力全球汽车金融行业迈向更高水平智能化。此次上榜不仅是对其技术实力的认可,更反映出行业正加速拥抱智能化变革。

  • 全2.5G网口弱电箱神器!中兴星云MAX主路由小白也能秒懂全屋组网

    中兴星云MAX作为首款2.5G网口全屋主路由,专为国内家庭以信息箱布线场景设计,简化传统复杂组网流程,实现即插即用。其强大性能支持WiFi6/7/8平滑升级,配备自研处理器与双WAN口,可承载多设备高速传输。一体化小巧机身适配标准信息箱,通过有线连接子路由,无需复杂设置即可完成全屋覆盖。同时提供USB接口扩展NAS功能,构建家庭私有云,结合智能App实现远程管理、青少年管控等,兼顾易用性与高性能,首发价269元。

  • AI日报:腾讯重磅发布混元图像3.0;快手发布KAT系列Agentic Coding大模型;苹果悄然研发ChatGPT式应用

    快手发布KAT系列代码大模型,腾讯推出“混元图像3.0”实现多模态突破,苹果研发类ChatGPT应用升级Siri,谷歌更新Gemini 2.5 Flash Lite提升效率。苹果还推出Manzano图像模型,YouTube Music测试AI音乐主播功能,VideoFrom3D框架简化3D视频生成,Moondream 3.0在多项基准测试中超越GPT-5等顶尖模型,展现强大性能。

  • 百度智能云Qianfan-VL系列模型开源!全尺寸领域增强效果优异,全自研芯片计算

    百度智能云千帆正式推出全新视觉理解模型Qianfan-VL并全面开源。该系列模型包含3B、8B和70B三个版本,面向企业级多模态应用场景,具备出色的基础通用能力,并针对OCR、教育等高频需求进行专项强化。模型基于昆仑芯P800芯片实现高效计算,支持5000卡并行,在通用和垂直任务评测中达到SOTA水平。Qianfan-VL具备多尺寸模型、思维链推理和OCR增强三大特点,可广泛应用于文档识别、数学解题、图表分析等场景,为企业提供高精度视觉理解解决方案。

  • 00后小伙做老房子微缩模型年入百万:200元成本售1万

    ​近日,一位00后小伙凭借其精湛的手艺和独特的创意,在微缩模型领域大放异彩,年收入突破百万大关,成为众人瞩目的焦点。他专门制作老房子的微缩模型,不仅还原度极高,更融入了深厚的文化底蕴和情感记忆,深受市场欢迎。 据悉,这位小伙从小就对传统建筑和手工艺术充满热爱,大学期间更是深入研究微缩模型制作技艺。毕业后,他毅然决然地投身于这一领域,凭�

  • AI日报:阿里推多模态模型Qwen3-Omni;谷歌推出AP2协议;百度推出Qianfan-VL 模型

    本期AI日报聚焦多领域技术突破:阿里云推出全球首个全模态AI模型Qwen3-Omni,支持文本、图像、音频和视频统一处理;百度发布多尺寸视觉理解模型Qianfan-VL,优化企业级应用。苹果扩展Image Playground平台,引入ChatGPT等第三方模型。谷歌与PayPal合作推出AP2协议,推动AI支付安全创新。钉钉上线AI表格助手,支持自然语言生成表格。DeepSeek开源V3.1-Terminus模型,性能显著提升。Kimi推出Agent会员服务,智元机器人开源全球首个通用具身智能模型GO-1,降低技术门槛促进行业创新。

  • 雷军:小米17 Pro Max屏幕采用超级像素技术 功耗降低26%

    小米创始人雷军近日揭晓了小米17 Pro Max在屏幕技术上的重大突破——革命性的“超级像素”技术。该技术首次在每个像素点集成RGB三个子像素,使屏幕清晰度媲美传统2K屏,同时功耗降低26%,显示效果更出色。此外,小米17系列还标配全新M10屏幕发光技术,采用国产新型红色发光主材,发光效率达全球顶尖水平。全系采用直屏设计,边框窄至1.18mm,视觉体验更出众。小米17系列将于9月25日正式亮相,雷军还将分享小米玄戒芯片和小米汽车背后的故事,引发市场期待。

  • AI日报:美团发布推理大模型LongCat-Flash-Thinking;阿里Wan-Animate开源;字节推豆包翻译大模型

    AI日报栏目聚焦人工智能领域最新动态。美团推出高性能推理大模型LongCat-Flash-Thinking;阿里开源Wan-Animate模型革新AI视频生成;字节跳动发布豆包翻译模型,支持28种语言互译;华为与浙大联合推出安全大模型DeepSeek-R1-Safe;阿里云即将发布跨模态模型Qwen3-Omni;xAI推出计算成本降低98%的Grok4Fast模型;YouTube发布多项AI创作辅助功能;IBM推出轻量级文档处理模型Granite-Docling-258M;中科院发布类脑大模型SpikingBrain实现百倍速度突破;OpenAI将推出仅限Pro用户的计算密集型新功能。

今日大家都在搜的词: