模型LLM

Allen人工智能研究机构在HuggingFace和GitHub上发布了首个开放语言模型OLMo，意在通过提供数据、代码、模型和评估工具的开放访问，促进人工智能领域的共同研究。这一举措的首批模型包括7B和1B规模的变体，覆盖不同架构和训练硬件，为未来更大规模、指令调整等模型的发布奠定基础。通过提供权重的开放访问，并鼓励合作，Allen致力于共同构建全球最卓越的开放语言模型，助力人工智能技术的进步。...

特别声明：本页面标签名称与页面内容，系网站系统为资讯内容分类自动生成，仅提供资讯内容索引使用，旨在方便用户索引相关资讯报道。如标签名称涉及商标信息，请访问商标品牌官方了解详情，请勿以本站标签页面内容为参考信息，本站与可能出现的商标名称信息不存在任何关联关系，对本页面内容所引致的错误、不确或遗漏，概不负任何法律责任。站长之家将尽力确保所提供信息的准确性及可靠性，但不保证有关资料的准确性及可靠性，读者在使用前请进一步核实，并对任何自主决定的行为负责。任何单位或个人认为本页面内容可能涉嫌侵犯其知识产权或存在不实内容时，可及时向站长之家提出书面权利通知或不实情况说明，并提权属证明及详细侵权或不实情况证明（点击查看反馈联系地址）。本网站在收到上述反馈文件后，将会依法依规核实信息，第一时间沟通删除相关内容或断开相关链接。

与“模型LLM”的相关热搜词：

相关“模型LLM” 的资讯412篇

【腾讯云】11.11云上盛惠！云服务器首年1.8折起，买1年送3个月！

11.11云上盛惠！海量产品 · 轻松上云！云服务器首年1.8折起，买1年送3个月！超值优惠，性能稳定，让您的云端之旅更加畅享。快来腾讯云选购吧！

Docker容器镜像
去看看

Docker容器镜像 60元/15天

爆款产品组合购
去看看

爆款产品组合购低至1元

腾讯云x NVIDIA加速计划
去看看

腾讯云x NVIDIA加速计划最高获赠10万元扶持基金

2核2G云服务器
去看看

2核2G云服务器 112元/1年

查看更多相关信息>>

腾讯云 12-20

广告
Allen人工智能研究所推开源模型LLM OLMo 提供模型数据、训练代码等

Allen人工智能研究机构在HuggingFace和GitHub上发布了首个开放语言模型OLMo，意在通过提供数据、代码、模型和评估工具的开放访问，促进人工智能领域的共同研究。这一举措的首批模型包括7B和1B规模的变体，覆盖不同架构和训练硬件，为未来更大规模、指令调整等模型的发布奠定基础。通过提供权重的开放访问，并鼓励合作，Allen致力于共同构建全球最卓越的开放语言模型，助力人工智能技术的进步。

模型
Refuel AI 推出专为数据标注和清洗设计的开源语言模型 RefuelLLM-2

RefuelAI最近宣布推出两个新版本的大型语言模型，RefuelLLM-2和RefuelLLM-2-small，这两个模型专为数据标注、清洗和丰富任务设计，旨在提高处理大规模数据集的效率。RefuelLLM-2的主要特点包括:自动化数据标注:能够自动识别和标记数据中的关键信息，如分类数据和解析特定属性。RefuelAI的这一创新为数据标注和清洗领域带来了新的解决方案，有助于自动化和优化大规模数据处理流程。

RefuelLLM-2
研究人员发现了针对云托管AI模型的“LLM劫持”计划

他们发现了一种新颖的攻击方式，利用窃取的云凭证针对云托管的大型语言模型服务，目的是向其他威胁行为者出售访问权限。该攻击技术被Sysdig威胁研究团队命名为LLMjacking。”建议组织启用详细日志记录，并监视云日志以发现可疑或未经授权的活动，同时保建立有效的漏洞管理流程以防止初始访问。

LLM AI模型 AI头条
荐开源模型打败GPT-4！LLM竞技场最新战报，Cohere Command R+上线

GPT-4又又又被超越了!近日，LLM竞技场更新了战报，人们震惊地发现:居然有一个开源模型干掉了GPT-4!这就是Cohere在一周多前才发布的CommandR。排行榜地址:https://huggingface.co/spaces/lmsys/chatbot-arena-leaderboard截至小编码字的这个时间，竞技场排行榜更新到了4月11号，CommandR拿到了2.3万的投票，综合得分超越了早期版本的GPT-4，和GPT-4-0314版本并列第7位，——它可是一个开源模型。2024年，在开源和闭源两条道路上，LLM都发展迅猛。

Cohere CommandR+ 人工智能
苹果公司发布新型机器学习语言模型MLLLLM Ferret-UI 用于理解应用 UI 界面

苹果公司近日发布了一款名为MLLLLMFerret-UI的新型机器学习语言模型，旨在提升对移动应用用户界面的理解。这款模型经过特别优化，能够处理移动UI屏幕上的各种任务，并具备指向、定位和推理等能力。Ferret-UI还能够通过功能推断来解释屏幕的整体目的，显示出在理解和生成自然语言指令方面的高级能力。

模型 AI头条
Hume AI EVI对话人工智能体验入口情感大语言模型eLLM使用地址

Hume.AI专注于开发能够理解人类情感和表情的技术，提供表情测量API和自定义模型API，以预测和改善人类福祉。近日发布的EVI是一款具有情感感知能力的对话AI，采用了情感大语言模型技术。如果您是研究人员、开发者或企业，不妨尝试Hume.AI提供的技术，探索其在情感计算领域的应用和潜力。

Hume.AI
MedChatZH:一款专为传统中医会诊设计的调校LLM模型

GenerativeLargeLanguageModels在各种自然语言处理任务中取得了显著成功，包括问答和对话系统。大多数模型是在英文数据上训练的，缺乏在提供中文答案方面的强大泛化能力。MedChatZH的有效性有望为特定于不同语言和文化背景的LLMs开辟新途径。

MedChatZH LLM AI头条
大模型“路由器”OpenRouter 为LLM何其他AI模型提供统一接口

OpenRouter是一个创新性的项目，它为大语言模型和其他AI模型提供了一个统一的接口。通过这个接口，用户可以直接访问和使用几十种AI模型，包括GPT、LLama、Claude、Command-R等80多个模型，未来还将扩展到数百种。AI角色聊天和故事，更好的ChatGPT用户界面等功能，为用户带来全新的AI体验。

大模型 OpenRouter LLM
LLM Pricing官网体验入口大型语言模型定价比较工具在线使用地址

LLMPricing是一个聚合并比较各种大型语言模型定价信息的网站，这些模型由官方AI提供商和云服务供应商提供。用户可以在这里找到最适合其项目的语言模型定价。点击前往LLMPricing官网体验入口需求人群：适用于需要选择合适的大型语言模型进行项目开发的企业和开发者，帮助他们根据成本效益做出决策。

LLMPricing
微软AI研究推数学LLM Orca-Math:通过对Mistral-7B模型进行微调的7B参数小模型

微软研究团队引领着教育技术领域的不断创新，近日推出了一款名为Orca-Math的前沿工具，它是一款小语言模型，拥有7亿参数，并基于Mistral-7B架构微调来。这一创新方法重新定义了传统数学单词问题教学的策略，彻底改变了学生参与和掌握这一学科的方式。通过利用SLM通过合成数据集和迭代反馈来解锁学习工具的全新时代，Orca-Math为技术和学习手牵手走向解锁全球学生的全部潜力的未来提供了一瞥。

Orca-Math Mistral-7B AI头条
SLD自纠正LLM控制的扩散模型框架怎么使用？SLD官网地址入口

SLD 是一个自纠正的LLM控制的扩散模型框架，它通过集成检测器增强生成模型，以实现精确的文本到图像对齐。SLD框架支持图像生成和精细编辑，并且与任何图像生成器兼容，如DALL-E 3，无需额外训练或数据。点击前往SLD官网体验入口需求人群：适用于需要精确文本到图像对齐的研究者和开发者，以及希望进行图像生成和编辑的用户。使用场景示例：使用SLD框架根据文本提示生�

SLD
荐今日AI：GPT4强敌Inflection-2.5模型发布；Midjourney要推中国版APP；MovieLLM一句话生成电影

欢迎来到【今日AI】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。

Inflection
金融分析多模态LLM FinTral:基于Mistral-7B模型得分接近GPT-4

来自不列颠哥伦比亚大学和InvertibleAI的研究人员推出了一款具有突破性的大型语言模型——FinTral，专为金融领域量身定制。FinTral采用了多模态方法，能够处理文本、数字、表格和视觉数据，以应对金融文件的复杂性。研究人员承认了研究中存在的限制和风险因素，并对未来发展充满乐观。

Mistral-7B FinTral AI头条
VSP-LLM官网体验入口视觉语音处理AI模型免费使用下载地址

VSP-LLM是一个结合视觉语音处理与大型语言模型的框架，旨在通过LLMs的强大能力最大化上下文建模能力。VSP-LLM设计用于执行视觉语音识别和翻译的多任务，通过自监督视觉语音模型将输入视频映射到LLM的输入潜在空间。该框架通过提出一种新颖的去重方法和低秩适配器，可以高效地进行训练。

VSP-LLM
Open WebUI官网体验入口 LLMs机器学习模型Web用户界面免费搭建方法指南教程

OpenWebUI是一个为LLMs设计的友好型Web用户界面，支持Ollama和OpenAI兼容的API。它提供了直观的聊天界面、响应式设计、快速响应性能、简易安装、代码语法高亮、Markdown和LaTeX支持、本地RAG集成、Web浏览能力、提示预设支持、RLHF注释、会话标记、模型下载/删除、GGUF文件模型创建、多模型支持、多模态支持、模型文件构建器、协作聊天、OpenAIAPI集成等功能。欲了解更多信息并体验OpenWebUI的强大功能，请访问OpenWebUI官方网站。

OpenWebUI
荐模型融合、混合专家、更小的LLM，几篇论文看懂2024年LLM发展方向

在过去的2023年中，大型语言模型在潜力和复杂性方面都获得了飞速的发展。展望2024年的开源和研究进展，似乎我们即将进入一个可喜的新阶段:在不增大模型规模的前提下让模型变得更好，甚至让模型变得更小。论文标题:Astraios:Parameter-EfficientInstructionTuningCodeLargeLanguageModels论文地址:https://arxiv.org/abs/2401.00788这篇论文评估了不同的全微调和参数高效型微调技术，并且发现全微调�

LLM
荐 LLM是世界模型的新证据？ChatGPT能理解WiFi等物理信号，并猜出你的位置

大语言模型是否是世界模型?大语言模型除了在数字世界完成如写作或翻译等任务，它们能否理解并处理物理世界中的信息并进完成更广泛的任务呢?最近来自香港科技大学、南洋理工大学与加利福尼亚大学洛杉矶分校的研究者们提供了新的思路:他们发现大语言模型如ChatGPT可以理解传感器信号进完成物理世界中的任务。该项目初步成果发表于ACMHotMobile2024。如想进一步了解渗透式

ChatGPT LLM 大模型
DrugAssist:基于LLM的分子优化模型可以用自然语言与人类实时交互

随着近年来大型语言模型在语言处理领域的显著进展，研究人员尝试将这些模型应用于药物发现，以优化相关任务。在药物发现的分子优化方面，LLMs并未取得显著进展。它在单属性和多属性优化中展现了出色的结果，表现出很强的可迁移性。

DrugAssist LLM AI头条
Web LLM官网体验入口可定制的JavaScript语言模型聊天工具在线使用地址

WebLLM是一个模块化、可定制的JavaScript包，旨在直接将语言模型聊天引入到Web浏览器中。与其他工具不同，一切都在浏览器内部运行，无需服务器支持，同时通过WebGPU进行加速。如果您正在寻找一种在Web浏览器上实现智能聊天的方法，不妨尝试WebLLM。

WebLLM
荐 Llama 2打败GPT-4！Meta让大模型自我奖励自迭代，再证合成数据是LLM终局

【新智元导读】AI训AI必将成为一大趋势。Meta和NYU团队提出让大模型「自我奖励」的方法，让Llama2一举击败GPT-40613、Claude2、GeminiPro领先模型。还有人表示「令人惊讶的是，每次迭代的改进几乎保持线性，仅在3次迭代之后，就已经接近GPT-4级别」。

GPT-4
中国电信开源星辰AI大模型：央企中首个完成LLM研发和开源的选手诞生

开源大模型家族里，居然挤进来一位特别的选手:来自央企，身份为运营商。具体是谁?中国电信。对于本段提出的问题:为什么中国电信能做到央企中第一个发布大模型?答案也就情理之中了。

星辰AI大模型中国电信
谷歌多模态图像生成模型Instruct-Imagen 整合LLM和SD生态

谷歌的Instruct-Imagen模型展现了多模态图像生成领域的强大力量，成功整合了大型语言模型和现有的自监督学习生态系统。这一模型的核心优势在于其能够通过自然语言和输入内容智能地调用SD生态系统中的各种模型，实际上，相当于利用LLM将SD生态中的Lora和Controlnet等模型打造成智能Agents。这一技术创新为实现更广泛、更智能的图像生成任务打开了新的可能性。

Instruct-Imagen
字节多模态大模型PixelLM：高效像素级推理，无需依赖SAM

多模态大模型爆发，准备好进入图像编辑、自动驾驶和机器人技术等细粒度任务中实际应用了吗?目前大多数模型的能力还是局限于生成对整体图像或特定区域的文本描述，在像素级理解方面的能力相对有限。针对这个问题，一些工作开始探索借助多模态大模型来处理用户的分割指令。在三个benchmark的绝大多数指标上，PixelLM的性能均优于其他方法，且由于PixelLM不依赖于SAM，其TFLOPs远远低于同尺寸的模型。

PixelLM SAM
生成式LLM PowerInfer:单个GPU就能运行，机器学习模型推理速度提高11倍

生成式大语言模型因其在各种任务中的出色表现闻名，包括复杂的自然语言处理、创意写作、问答和代码生成。LLM已在易于使用的本地系统上运行，包括带有消费级GPU的家用PC，以改善数据隐私、可定制模型并降低推理成本。PowerInfer显着提高了LLM推理速度，表明其作为在GPU功能有限的台式电脑上执行高级语言模型的解决方案的潜力。

PowerInfer LLM
荐 2080 Ti就能跑70B大模型，上交大新框架让LLM推理增速11倍

原本需要一张16万元的80GA100干的活，现在只需要一张不到2万元的24G4090就够了!上海交大IPADS实验室推出的开源推理框架PowerInfer，让大模型推理速度加快了11倍。且不用量化，就用FP16精度，也能让40B模型在个人电脑上运行;如果加入量化，2080Ti也能流畅运行70B模型。现有的云端CPU也有强大的AMX计算单元支持，通过利用CPU、GPU间的异构特征，可以乐观地认为PowerInfer能够使用更少的高

大模型
荐谷歌10秒视频生成模型破世界记录！LLM终结扩散模型，效果碾压顶流Gen-2

【新智元导读】谷歌全新视频生成模型VideoPoet再次引领世界!十秒超长视频生成效果碾压Gen-2可进行音频生成，风格转化。AI视频生成，或许就是2024年下一个最前沿的领域。对于未来的研究方向，谷歌研究人员表示，VideoPoet框架将会实现「any-to-any」的生成，比如扩展文本到音频、音频到视频，以及视频字幕等等。

视频生成模型
谷歌AI提出视觉语言模型PixelLLM:能够进行细粒度定位和视觉语言对齐

谷歌AI研究团队与加州大学圣迭戈分校的研究人员合作，提出了一种名为PixelLLM的智能模型，旨在解决大型语言模型在细粒度定位和视觉-语言对齐方面的挑战。这一模型的提出受到了人类自然行为的启发，尤其是婴儿描述其视觉环境的方式，包括手势、指向和命名。这一研究成果标志着在大型语言模型领域取得的一项重要进展，为实现更精确的视觉-语言对齐和定位打开了新的�

PixelLLM AI头条语言模型
LLM360: 首个完全开源和透明的大语言模型

在众多开源的大型语言模型中，如LLaMA、Falcon和Mistral等，大多数仅公开了特定组件，如最终模型权重或推理脚本。技术文档通常集中在更广泛的设计方面和基本指标上，限制了该领域的进展，因为训练方法的清晰度不足，导致团队不断努力揭示训练过程的众多方面。如果您喜欢他们的工作，不要忘记加入MLSubReddit、Facebook社群、Discord频道和电子邮件通讯，以获取最新的AI研究新闻和有趣的AI项目。

LLM360 大语言模型
20倍的压缩比例！微软发布LLMLingua:压缩长提示并加快模型推理速度

微软的研究团队开发了一种名为LLMLingua的独特粗细压缩技术，旨在解决大型语言模型中长提示带来的问题。LLMs以其强大的泛化和推理能力显著推动了人工智能领域的发展，展示了自然语言处理、自然语言生成、计算机视觉等方面的能力。该方法表现出色，并提供了一种改善LLM应用程序的效果和可负担性的有用方式。

LLMLingua 大模型 AI头条
邢波团队提出全开源倡议LLM360 让大模型实现真正的透明

开源模型在人工智能领域展现强大活力，但闭源策略限制了LLM的发展。邢波团队提出的LLM360全面开源倡议旨在解决这一问题。这一全面开源的趋势有望促进更多研究者的参与与合作，推动人工智能技术的不断创新。

LLM360

热文

3 天
7天

模型LLM

与“模型LLM”的相关热搜词：

相关“模型LLM” 的资讯412篇

热文

站长商机