首页 > 业界 > 关键词  > ChinaZcom最新资讯  > 正文

Facebook 强大的AI大型语言模型LLaMa遭泄露

2023-03-08 09:50 · 稿源:站长之家

站长之家(ChinaZ.com)3月8日 消息:Facebook的大型语言模型LLaMa通常只供获得批准的研究人员、政府官员或民间社会成员使用,现在已经泄露到网上供任何人下载。

据悉,目前在4chan 上已经有人在共享泄露的语言模型。上周,一名成员上传了 Facebook 工具 LLaMa((Large Language Model Meta AI))的 torrent 文件。这标志着一家大型科技公司的专有 AI 模型首次遭公开泄露。

facebook (2)

迄今为止,谷歌、微软和 OpenAI 等公司最新模型都处于保密状态,只能通过消费者界面或 API 访问,据称是为了控制滥用情况。4chan 成员声称在他们自己的机器上运行 LLaMa,但此次泄漏的确切内容尚不清楚。

在一份声明中,Meta 也并没有否认 LLaMa 遭泄漏的说法,并强调了其在研究人员之间共享模型的方法。

“Meta 的目标是与研究社区的成员分享最先进的 AI 模型,以帮助我们评估和改进这些模型。LLaMA 是出于研究目的而共享的,这与我们之前共享大型语言模型的方式一致。虽然并非所有人都可以使用该模型,并且有些人试图规避批准程序,但我们相信当前的发布策略允许我们在责任和开放之间取得平衡,”Meta 发言人在一封电子邮件中写道。

据了解,与包括 OpenAI 的 GPT-3在内的其他人工智能模型一样,LLaMa 建立在大量单词或“标记”的基础上。只要在LLaMa 输入单词,就能预测下一个单词,并生成更多文本。

LLaMa 有多个不同大小的版本,其中 LLaMa65B 和 LLaMa33B 在1.4万亿token上进行了训练。该模型主要从维基百科、书籍、以及来自 ArXiv、GitHub、Stack Exchange 和其他网站的学术论文中收集的数据集上训练的。

报道称,Meta 似乎正在在线提交该模型的删除请求以控制其传播。

举报

  • 相关推荐
  • 大家在看
  • ScanIt:轻量级、快速、无广告的文档扫描应用

    ScanIt是一款专为iPhone和iPad设计的文档扫描应用,以其轻量级、快速、无广告的特点,为用户提供了一种简单高效的文档数字化解决方案。它拥有智能文档识别、曲面调整和文本提取(OCR)等专业功能,支持多种格式导出,并能安全加密文档,满足不同用户对扫描效率和安全性的需求。

  • PhotoMaker V2:一键生成个性化照片,快速便捷。

    PhotoMaker V2是由腾讯ARC实验室开发的AI照片生成应用,利用先进的图像识别和生成技术,用户可以快速生成个性化的照片。产品背景信息显示,PhotoMaker V2旨在为用户提供一个简单、高效的图片创作工具,无论是社交媒体分享还是个人收藏,都能满足用户需求。目前产品处于免费试用阶段,具体价格尚未公布。

  • Speax AI:AI视频多语言配音服务

    Speax AI提供快速、准确的AI视频配音服务,支持29种以上语言的即时翻译和配音。它通过先进的AI技术确保声音同步和文化准确性,同时提供具有竞争力的价格。

  • Cerebella:智能学习卡片应用,简化知识学习过程。

    Cerebella是一款iOS平台上的智能学习卡片应用,旨在通过简洁美观的设计,帮助学生和终身学习者高效备考和探索新知识。它提供了创建个性化学习卡片、智能学习算法、多选测试和自定义学习体验等功能,致力于让学习变得更简单、更有趣。

  • Volv:9秒新闻,为高效人士提供精炼资讯。

    Volv是一款为追求效率的个人设计的新闻APP,它由AI驱动,通过9秒的短文章形式,提供最有趣、最热门和最重要的内容。Volv旨在减少用户在社交媒体上无目的滚动的时间,帮助他们快速获取信息。

  • SuperCoder:自主软件开发系统,提高编码效率。

    SuperCoder是一个开源的自主软件开发系统,利用先进的AI工具和代理来简化和自动化编码、测试和部署任务,提高效率和可靠性。它支持多种编程语言和框架,以满足不同的开发需求。

  • Composio:AI代理工具集,赋能复杂任务处理。

    Composio是一个为AI代理提供高质量工具和集成的平台,它简化了代理的认证、准确性和可靠性问题,使得开发者能够通过一行代码集成多种工具和框架。它支持100多种工具,覆盖了GitHub、Notion、Linear等90多个平台,提供了包括软件操作、操作系统交互、浏览器功能、搜索、软件开发环境(SWE)以及即席代理数据(RAG)等多种功能。Composio还支持六种不同的认证协议,能够显著提高代理调用工具的准确性。此外,Composio可以作为后端服务嵌入到应用程序中,为所有用户和代理管理认证和集成,保持一致的体验。

  • NeuralGCM:高效准确的气候模拟模型

    NeuralGCM是由谷歌研究团队开发的气候模型,与传统基于物理的气候模型相比,它结合了机器学习技术,提高了模拟的准确性和效率。NeuralGCM能够生成2至15天的天气预测,其准确性超过了当前的黄金标准物理模型,并且在重现过去40年的温度数据方面比传统大气模型更为准确。尽管NeuralGCM尚未构建为完整的气候模型,但它标志着开发更强大、更易用气候模型的重要一步。

  • RouteLLM:节省LLM成本,不牺牲质量的框架

    RouteLLM是一个用于服务和评估大型语言模型(LLM)路由器的框架。它通过智能路由查询到不同成本和性能的模型,以节省成本同时保持响应质量。它提供了开箱即用的路由器,并在广泛使用的基准测试中显示出高达85%的成本降低和95%的GPT-4性能。

  • Meta-Llama-3.1-8B:8B参数的大型多语言生成模型

    Meta Llama 3.1是一系列预训练和指令调整的多语言大型语言模型(LLMs),包含8B、70B和405B大小的版本,支持8种语言,专为多语言对话用例优化,并在行业基准测试中表现优异。Llama 3.1模型采用自回归语言模型,使用优化的Transformer架构,并通过监督式微调(SFT)和强化学习结合人类反馈(RLHF)来提高模型的有用性和安全性。

  • Meta-Llama-3.1-70B:70亿参数的大型多语言文本生成模型

    Meta Llama 3.1是Meta公司推出的大型语言模型,拥有70亿个参数,支持8种语言的文本生成。该模型采用优化的Transformer架构,并通过监督式微调和人类反馈强化学习进一步优化,以符合人类对帮助性和安全性的偏好。模型在多语言对话使用案例中表现优异,超越了许多现有的开源和封闭聊天模型。

  • Meta Llama 3.1-405B:大型多语言预训练语言模型

    Meta Llama 3.1-405B 是由 Meta 开发的一系列大型多语言预训练语言模型,包含8B、70B和405B三种规模的模型。这些模型经过优化的变压器架构,使用监督式微调(SFT)和强化学习与人类反馈(RLHF)进行调优,以符合人类对帮助性和安全性的偏好。Llama 3.1 模型支持多种语言,包括英语、德语、法语、意大利语、葡萄牙语、印地语、西班牙语和泰语。该模型在多种自然语言生成任务中表现出色,并在行业基准测试中超越了许多现有的开源和封闭聊天模型。

  • Llama 3.1:最前沿的开源AI模型,支持多语言和高级功能。

    Llama 3.1是Meta AI推出的最新一代大型语言模型,具有128K的上下文长度扩展、支持八种语言,并首次开源了405B参数级别的前沿AI模型。该模型在通用知识、可控性、数学、工具使用和多语言翻译方面具有最先进的能力,能够与最好的闭源模型相媲美。Llama 3.1的发布,将为开发者提供解锁新工作流程的工具,例如合成数据生成和模型蒸馏。

  • YouOrMe:通过面部识别技术比较你与父母的相似度

    YouOrMe是一款利用面部识别技术的应用,通过比较用户的面部照片与父母的面部照片,来确定用户更像谁。该技术不仅有趣,还能引发家庭间的互动和讨论。它使用先进的面部识别算法,为用户提供一个简单、直观的方式来探索他们的遗传特征。

  • Arcane.com:AI助力的营销自动化工具

    Arcane是一个面向现代营销人员的AI驱动的生产力平台,旨在通过自动化行业和受众研究、文案撰写以及内容再利用来提高工作效率。它通过集成的应用程序库,帮助营销人员快速生成有价值的LinkedIn帖子,节省时间,扩大影响力。

  • Awan LLM:无限令牌,无限制,成本效益高的LLM推理API平台。

    Awan LLM是一个提供无限令牌、无限制、成本效益高的LLM(大型语言模型)推理API平台,专为高级用户和开发者设计。它允许用户无限制地发送和接收令牌,直到模型的上下文限制,并且使用LLM模型时没有任何约束或审查。用户只需按月付费,而无需按令牌付费,这大大降低了成本。Awan LLM拥有自己的数据中心和GPU,因此能够提供这种服务。此外,Awan LLM不记录任何提示或生成内容,保护用户隐私。

  • Screenflick:电影台词搜索与生成工具

    Screenflick是一个提供电影台词搜索和生成服务的网站,用户可以通过它来寻找特定的电影台词或生成新的台词。它不仅能够增加用户对电影的了解和兴趣,还能激发创意思维,为电影爱好者和创作者提供灵感。

  • Airy:智能日记,助你轻松反思成长

    Airy是一款AI驱动的反思日记应用,它通过语音输入和图像识别简化了记录过程,同时提供个性化的分析和建议,帮助用户提高自我认知,促进个人成长。Airy的使命是让心理健康像聊天一样自然,其愿景是让自我发现变得愉快,个人成长变得轻松,心理健康真正可及。

  • custom-pilot:将自定义代码补全模型集成到VS Code

    Custom Pilot 是一个 Visual Studio Code 扩展框架,允许用户轻松地将自定义的代码补全模型集成到 VS Code 中。它支持使用任何遵循 OpenAI API 格式的 API 服务器,特别是需要提供 /v1/models 和 /v1/completions 两个端点。用户可以在扩展的侧边栏面板中设置 API 服务器的 URL、选择推理模型,并输入 API 密钥(如果需要)。此外,Custom Pilot 还可以与 LM Studio 配合使用,允许用户在本地机器上离线运行大型语言模型(LLMs),并通过 VS Code 进行代码补全。

  • GPTsWorks:第三方GPTs商店,聊天搜索GPTs。

    GPTs Works 是一个第三方GPTs商店,提供用户通过聊天的方式搜索和发现各种GPTs。该平台汇集了大量优秀的GPTs资源,用户可以通过提交链接或直接与平台交互来获取所需信息。平台的主要优点包括丰富的GPTs资源、便捷的搜索方式以及高效的信息获取能力。

今日大家都在搜的词: