首页 > 业界 > 关键词  > 大语言模型LLM最新资讯  > 正文

浏览器就能跑大模型了,陈天奇团队发布WebLLM,无需服务器支持

2023-04-20 11:17 · 稿源: 量子位公众号

现在,只需一个浏览器,就能跑通“大力出奇迹”的大语言模型(LLM)了!不仅如此,基于LLM的类ChatGPT也能引进来,而且还是不需要服务器支持、WebGPU加速的那种。例如这样:这就是由陈天奇团队最新发布的项目——Web LLM。短短数日,已经在GitHub上揽货3.2K颗星。一切尽在浏览器,怎

......

本文由站长之家合作伙伴自媒体作者“量子位公众号”授权发布于站长之家平台,本平台仅提供信息索引服务。由于内容发布时间超过平台更新维护时间,为了保证文章信息的及时性,内容观点的准确性,平台将不提供完全的内容展现,本页面内容仅为平台搜索索引使用。需阅读完整内容的用户,请查看原文,获取内容详情。

举报

  • 相关推荐
  • 中兴通讯:将发布支持大模型训练的最新AI服务器

    10月11日,中兴通讯在互动平台上表示,作为国内主流的服务器厂商,其一直在积极应对人工智能领域的应用需求,并适时推出满足各类AI应用场景的服务器产品。采取了以下两个策略:首先,针对中小型模型的训练和推理需求,中兴通讯在今年1月推出了G5系列服务器。中兴通讯计划在今年内发布一款支持大模型训练的最新AI服务器。

  • QQ浏览器推出“PDF阅读助手”AI工具 由腾讯混元大模型支持

    QQ浏览器推出了一款名为“PDF阅读助手”的智能工具,用户可以申请加入体验测试。该工具由腾讯混元大模型支持,可以在手机或电脑上随时使用。该助手还将覆盖Word、Excel、PPT和网页等更多应用场景。

  • 手把手教你剪「羊驼」,陈丹琦团队提出LLM-Shearing大模型剪枝法

    给Llama2大模型剪一剪驼毛,会有怎样的效果呢?今天普林斯顿大学陈丹琦团队提出了一种名为LLM-Shearing的大模型剪枝法,可以用很小的计算量和成本实现优于同等规模模型的性能。自大型语言模型出现以来,它们便在各种自然语言任务上取得了显著的效果。更多研究细节,可参考原论文。

  • LLM评估测试框架DeepEval 可离线评估大模型性能

    DeepEval是一个用于对语言模型应用进行评估和单元测试的框架。它提供了各种指标,可以测试语言模型应用生成的回复在相关性、一致性、无偏见性和无毒性等方面的表现。如果你在开发聊天机器人、语言模型应用,DeepEval绝对是一个提高工程效率的好帮手。

  • LLM Guard:增强LLM安全性的开源工具包 安全使用各种等模型

    LLMGuard是一个旨在增强大型语言模型安全性的开源工具包,旨在简化LLMs在企业中的安全采用。它的设计目的是为了轻松集成和部署在生产环境中,为LLMs的输入和输出提供广泛的评估,包括清理、检测有害语言和数据泄漏,以及防止注入和越狱攻击。这一工具包的推出将有望促进大型语言模型在企业中的更广泛应用,为企业提供了更好的安全保障和可控性,从更加自信地采用这一新兴技术。

  • CMU华人打破大模型黑盒,Llama 2撒谎被一眼看穿!脑电波惨遭曝光,LLM矩阵全破解

    大语言模型黑盒,居然被CMU等机构的学者打破了?他们发现,LLM内部有可解释的表征,如果撒谎能被测谎仪检测出来!最近,来自CAIS、CMU、斯坦福、康奈尔、马里兰、宾大等机构的学者又有了令人震惊的发现——大语言模型,并不仅仅是黑匣子,或者难以理解的庞大矩阵。在它们内部,具有可解释的内部表征。CMU等机构研究者的探索也告诉我们,人类对于AI系统的理解和控制会越

  • LLM-Shearing大模型剪枝法:用5%的成本拿下SOTA,比从头开始预训练更划算

    陈丹琦团队近期发布了一项重要的研究成果,他们开发了一种名为LLM-Shearing的大模型剪枝法。这项技术允许将庞大的预训练模型剪枝至仅需3%的计算量和5%的成本,同时保持着SOTA水平的性能。这有望在大规模深度学习模型的研究和应用中产生广泛的影响。

  • AI视野:Adobe发布新一代AI生成模型Firefly Image2;Meta发布Llama2-Long模型;TikTok支持从AI应用直接发布内容;Opera浏览器推出升级版的AI工具Aria

    今天凌晨,Adobe甩出AdobeFirefly创意生成式AI模型系列中的三个主要新模型:AdobeFireflyImage2、FireflyVectorModel和FireflyDesignModel。在线体验地址:PS在线体验地址:https://photoshop.adobe.com/discoverIllustrator体验地址:https://www.adobe.com/hk_zh/products/illustrator/generative-recolor.htmlMeta再放「长文本」杀器Llama2-LongMeta发布Llama2-Long模型,可高效处理长文本,降低计算需求40%,采用创新策略,提升性能,领先自�

  • Brave浏览器公司裁员9%

    Brave浏览器与搜索引擎的开发公司BraveSoftware确认已裁员9%。尽管公司没有具体说明受到影响的员工人数,但他们表示这一决策是受到了困难的经济环境的驱动。随着技术行业的竞争加剧,公司可能需要进一步调整策略,以确保其可持续发展和增长。

  • 百度发布医疗大模型“灵医大模型

    9月19日,百度正式发布国内首个“产业级”医疗大模型——灵医大模型。百度正式宣布面向大健康上下游产业开放灵医大模型测评、试用,推动医疗行业的数字化和智能化进程。在辅助诊疗方面,灵医大模型可实现通过多轮对话了解病人病情,实时辅助医生确诊疾病,推荐治疗方案,提升就诊全流程的效率和体验,并成为患者的24小时“健康管家”,提供智能客服服务。

今日大家都在搜的词: