语言大模型

OpenBuddy团队发布了基于MetaLlama370B的最新成果:OpenBuddy-Llama3-70B-v21.1-8k，这是他们首次在Llama370B基座上的中文跨语言训练尝试。Llama370B是一个15T训练集训练成的稠密大模型，然由于训练集中缺少中文数据，Meta官方的Llama3系列对话模型在中文领域的认知、理能力较弱，容易出现以英文回答中文问题的现象。值得一提的是，于量化版模型能力下降较为明显，他们本次只发布了模型的完整版权重，后续会尝优化70B模型的量化后性能，并挑选合适时机发布量化版。...

特别声明：本页面标签名称与页面内容，系网站系统为资讯内容分类自动生成，仅提供资讯内容索引使用，旨在方便用户索引相关资讯报道。如标签名称涉及商标信息，请访问商标品牌官方了解详情，请勿以本站标签页面内容为参考信息，本站与可能出现的商标名称信息不存在任何关联关系，对本页面内容所引致的错误、不确或遗漏，概不负任何法律责任。站长之家将尽力确保所提供信息的准确性及可靠性，但不保证有关资料的准确性及可靠性，读者在使用前请进一步核实，并对任何自主决定的行为负责。任何单位或个人认为本页面内容可能涉嫌侵犯其知识产权或存在不实内容时，可及时向站长之家提出书面权利通知或不实情况说明，并提权属证明及详细侵权或不实情况证明（点击查看反馈联系地址）。本网站在收到上述反馈文件后，将会依法依规核实信息，第一时间沟通删除相关内容或断开相关链接。

与“语言大模型”的相关热搜词：

相关“语言大模型” 的资讯2673篇

【腾讯云】11.11云上盛惠！云服务器首年1.8折起，买1年送3个月！

11.11云上盛惠！海量产品 · 轻松上云！云服务器首年1.8折起，买1年送3个月！超值优惠，性能稳定，让您的云端之旅更加畅享。快来腾讯云选购吧！

Docker容器镜像
去看看

Docker容器镜像 60元/15天

爆款产品组合购
去看看

爆款产品组合购低至1元

腾讯云x NVIDIA加速计划
去看看

腾讯云x NVIDIA加速计划最高获赠10万元扶持基金

2核2G云服务器
去看看

2核2G云服务器 112元/1年

查看更多相关信息>>

腾讯云 12-20

广告
OpenBuddy发布新一代中文跨语言大模型基于Llama 3 70B打造

OpenBuddy团队发布了基于MetaLlama370B的最新成果:OpenBuddy-Llama3-70B-v21.1-8k，这是他们首次在Llama370B基座上的中文跨语言训练尝试。Llama370B是一个15T训练集训练成的稠密大模型，然由于训练集中缺少中文数据，Meta官方的Llama3系列对话模型在中文领域的认知、理能力较弱，容易出现以英文回答中文问题的现象。值得一提的是，于量化版模型能力下降较为明显，他们本次只发布了模型的完整版权重，后续会尝优化70B模型的量化后性能，并挑选合适时机发布量化版。

OpenBuddy Llama370B 跨语言训练
Soul上线自研语言大模型SoulX 赋能社交关系和内容链路

新型社交平台Soul近日宣布上线自研语言大模型SoulX。该模型基于海量数据训练，具备prompt驱动、条件可控生成、上下文理解、多模态理解等能力，能够在保证对话流畅、自然、具备情感温度的同时，覆盖百种细粒度风险类别，保证了大模型的内容生产质量和安全性。SoulX的强大能力，将为Soul在社交关系和内容链路的打造上带来新的可能。
北大提出统一的视觉语言大模型Chat-UniVi 3天训练成果惊艳众人

北京大学和中山大学等机构的研究者提出了一种名为Chat-UniVi的视觉语言大模型，实现了统一的视觉表征，使其能够同时处理图片和视频任务。这一框架的独特之处在于，它不仅在深度学习任务中表现卓越仅需短短三天的训练时间，就能够训练出具有130亿参数的通用视觉语言大模型。Chat-UniVi的提出为视觉语言模型的研究领域带来了新的思路，通过统一的视觉表征实现了对多模态数据的高效处理，为深度学习模型的训练和推理提供了更加便捷和经济的解决方案。

大模型
提前对齐，视频问答新SOTA！北大全新Video-LLaVA视觉语言大模型，秒懂视频笑点

最近，来自北京大学等机构研究者提出了一种全新视觉语言大模型——Video-LLaVA，使得LLM能够同时接收图片和视频为输入。Video-LlaVA在下游任务中取得了卓越的性能，并在图片、视频的13个基准上达到先进的性能。这些结果证明了联合图片和视频一起训练能够促进LLM理解视觉表示。

Video-LLaVA SOTA
元象开源多语言大模型XVERSE-13B 可免费商用

元象XVERSE公司宣布开源其百亿参数的高性能通用大模型XVERSE-13B，可免费商用。XVERSE-13B是由深圳元象科技自主研发的支持多语言的大语言模型，基于它生成的服务包括了文本生成、自动化写作、数据分析、知识问答等方面。训练框架:经过对算子、通信、并行策略及调度等的优化，千卡集群上的峰值算力利用率达到58.5%，达到业界前列。
中译语通展示格物多语言大模型技术和工业实践

2023年7月18日至20日，第二届自然语言生成与智能写作大会在新疆乌鲁木齐召开。中译语通科技股份有限公司作为大会战略合作伙伴，向与会嘉宾展示了公司格物大模型技术和工业实践。中国中文信息学会自然语言生成与智能写作专委会为中译语通等8家企业颁发感谢奖牌，表达各企业对本届大会的特别支持。
思必驰DFM-2语言大模型正式发布，多项创新技术助推产业落地！

7月12日，【东风生万物】思必驰DFM-2大模型及创新技术应用成果发布会在苏州成功举行。思必驰董事长、CEO高始兴，联合创始人、首席科学家俞凯，分别分享了思必驰的未来战略以及以DFM-2大模型为代表的对话式AI创新技术。思必驰将发挥平台技术和语言大模型的优势，在政策指导下，建好“语言计算国家新一代人工智能开放创新平台”，提升创新技术发展与科研成果转化，助力产业整体竞争力提升，努力成长为壮大创新集群的支撑力量。
商汤科技发布自研中文语言大模型应用平台「商量SenseChat」

商汤科技今日举行技术交流日活动。商汤科技展示了「日日新+SenseNova」大模型体系。这些应用可以帮助开发者编写和调试代码、为用户提供个性化的医疗建议、并从复杂的文档中提取和概括信息。

SenseChat 商汤科技编程
百度文心一言，缘何成就中国语言大模型浪潮之巅？

2月22日晚，百度发布了其2022年年度业绩报告，财报显示，2022年，百度实现营收1236.75亿元，归属百度的净利润206.8亿元，同比增长10%。百度实现营收330.77亿元，归属百度的净利润53.71亿元，同比增长32%。以百度为首国内厂商，也一定能在这次AIGC的发展大潮中，推出有着中国特色的语言大模型，并跟随AIGC的进步方向，为各行各业的发展赋予新的能量，推动我国AI产业发展进入下一个时代。

自然语言 NLP领域 ERNIE
趣AI | Meta的AI科学语言大模型仅上线48小时就下架因提供的内容太扯

在疫情爆发最初的12个月里，有超过100，000篇关于新冠病毒论文发表这产生了大量新信息。想要阅读和理解每一项研究是不可能的从理论上来说，Galactica可以做到。人工智能背后的团队没有回应澄清导致暂停的原因的请求。

Meta 语言大模型人工智能
小米大语言模型MiLM正式通过大模型备案：将应用于汽车、手机、智能家居等产品

小米官方宣布，小米大语言模型MiLM正式通过大模型备案。通过备案后，小米大模型将逐步应用于小米公司的汽车、手机、智能家居等产品中，通过端云结合，既带来单个设备的智能提升，也实现场景内和场景间多设备的协同，为人车家全生态战略赋能。在全新高通骁龙8Gen3终端上，基于NPU运行了小米自研60亿参数语言大模型，在首词响应、生成速度等几项关键指标上均处于行业领先水平。

小米大语言模型智能家居
荐专注数学的开源大模型LLEMMA来了性能领先其他数学语言模型

研究人员介绍了LLEMMA，这是一个开源的大型语言模型，专门设计用于解决数学问题。与其他领先的数学语言模型相比，LLEMMA在性能上表现出色，为进一步的研究提供了一个强大的平台。”我们将会看到LLEMMA能够激发出哪些新的研究。

大模型 LLEMMA
荐 AI视野：文心大模型4.0将发布;Stability AI发布移动端语言模型Stable LM3B;OpenAI举办ChatGPT应用开发大赛；视觉中国、华为云携手打造视觉大模型

百度正在加速训练文心大模型4.0，并计划在10月17日的百度世界大会上发布。这一新版本将是文心大模型3.5的重要升级，重点提升基础模型能力，尤其在逻辑推理、代码和数学等方面取得显著进展。GoogleDeepMind提出DRaFT算法以高效优化扩散模型GoogleDeepMind最新提出的DRaFT算法用于高效优化扩散模型，提高了文本到图像生成等实际应用的效率和性能，成为机器学习领域的有价值工具�

文心大模型
荐「深呼吸」让大模型表现更佳！谷歌DeepMind利用大语言模型生成Prompt，还是AI更懂AI

【新智元导读】谷歌DeepMind提出了一个全新的优化框架OPRO，仅通过自然语言描述就可指导大语言模型逐步改进解决方案，实现各类优化任务。「深呼吸，一步一步地解决这个问题。这项研究首次提出并验证了使用大语言模型进行优化的有效性，为利用LLM进行更广泛优化任务提供了框架和经验，是这个新的研究方向的开拓性工作，具有重要意义。

DeepMind 大语言模型
天工大模型登顶多模态榜单！解决幻觉、跨语言两大难题

国产大模型，登顶多模态榜单!昆仑万维最近在大模型圈可谓“风生水起”。几天前刚被曝挖来了AI大牛颜水成，出任天工智能联席CEO。在一次又一次的榜单排名更迭之中，属于多模态大模型的“ChatGPT时刻”终将会到来。

天工大模型
作业帮发布教育领域银河大模型：支持AI解题、多语言AI问答

作业帮最近在2023中国国际服务贸易交易会上正式发布了自研银河大模型。银河大模型支持AI解题、多语言AI问答等能力，号称精通诗词字句和课文常识；并支持AI写作功能，可用于提高写作技巧、优化写作结构，并提供文章润色、语法纠错和创意启发等场景。作业帮表示，银河大模型即将在作业帮App等学习工具、旗下智能硬件及智能图书、教育数字化等多种场景中得到应用。
荐大模型「上车」关键一步：全球首个语言+自动驾驶全栈开源数据集来了

说到科技圈的近期新闻，没有比小马和小扎约架这件事更热闹的八卦话题了。马斯克直播了自己上门寻找扎克伯格的过程。想要了解数据集的更多细节，请参考OpenDriveLab发布在Github上的DriveLM演示数据。

自动驾驶
LEVER可提高大模型将自然语言描述转化为代码的能力

近期研究人员提出了一种名为LEVER的技术，通过学习验证生成的程序与执行结果来改善自然语言到代码的生成。LEVER使用自然语言描述、程序表面形式和执行结果的组合表示进行训练，以识别和拒绝错误的程序。LEVER的技术可以提高代码LLMs将自然语言描述转化为可执行代码的能力，有潜力改善数据库接口、机器人控制和虚拟助手等人工智能应用。
大模型竞争突然升级！亚马逊 CEO 亲自监督、组建新的核心技术团队，集中优势资源打造“最具野心”的大语言模型

亚马逊“最具野心”的大语言模型，将会是什么样?1.亚马逊被曝组建新团队研发大语言模型据外媒Insider近日报道，亚马逊CEOAndyJassy目前正直接领导一支新团队，负责开发该公司最具野心的AI项目。Jassy告知亚马逊的S-team，他将提拔Alexa首席科学家兼高级副总裁RohitPrasad作为自己的直接下属，向他直接汇报。大型语言模型和生成式人工智能对客户、股东和亚马逊来说都将是一件大�

大模型亚马逊
王炸更新！谷歌发布PaLM 2大模型：支持100种语言

谷歌年度开发者大会Google+I/O+2023上，PaLM+2大模型正式发布，准备向OpenAI的GPT-4等竞争对手发起挑战。PaLM+2是谷歌首个从头开始构建的多模态模型，具有不同规模的高度能力，并能有效地与其他工具和API集成。PaLM+2已经应用在25种功能和产品中，包括办公全家桶、聊天机器人Bard、搜索等等。

PaLM2 谷歌开发者大会多模态模型
商汤科技推出大模型体系“日日新”：支持语言、3D模型生成

在商汤技术交流日活动上，商汤科技董事长兼首席执行官徐立宣布推出大模型体系商汤日日新大模型”。日日新”取自《礼记大学》，汤之盘铭：苟日新，日日新，又日新。基于大装置，商汤已构建了计算机视觉、自然语言处理、AI内容生成、多模态、决策智能等多个领域的大模型，持续演进能力并广泛支持各种应用。

内容生成商汤模型
字节跳动将参与语言生成大模型研发

阿里M6大模型的前带头人杨红霞已加入字节AI+Lab，参与语言生成大模型的研发。杨红霞在语言生成大模型团队中处于领导地位，直接向字节跳动副总裁杨震原汇报。字节跳动相关技术负责人表示，技术中台在这些领域的探索仍处于初期，尚未成熟。

阿里M6大模型字节AILab人工智能实验室语言生成大模型
荐谷歌的野心：通用语音识别大模型已经支持100+语言

去年11月，谷歌宣布推出「1000种语言计划」，旨在构建一个机器学习++模型，支持世界上使用最广泛的1000种语言，从为全球数十亿人带来更大的包容性。其中一些语言的使用人数不到两千万，因此核心挑战是如何支持使用人数相对较少或可用数据有限的语言。USM+的基础模型架构和训练+pipeline+奠定了将语音建模扩展到未来1000种语言的根基。

OpenAI 谷歌使用人数
荐 AI日报：百度搜索11%结果由AI生成；腾讯混元支持生成16s视频；谷歌发布开源视觉语言模型PaliGemma；Hugging Face承诺免费提供1000万美元GPU计算资源

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解：https://top.aibase.com/1、李彦宏：百度搜索已有11%结果由AI生成在百度2024年第一季度财报电话会上，百度创始人李彦宏深入探讨了公司的业务表现和未来发展方向，强调人工智能技术对用户体验的推动�

百度搜索
谷歌发布开源视觉语言模型PaliGemma 支持多视觉语言任务

谷歌推出了一款名为PaliGemma的开源视觉语言模型，该模型结合了图像处理和语言理解的能力，旨在支持多种视觉语言任务，如图像和短视频字幕生成、视觉问答、图像文本理解、物体检测、文件图表解读以及图像分割等。PaliGemma的关键特点:多任务支持:PaliGemma能够处理多种视觉语言相关的任务，提供广泛的应用场景。开源的特性意味着PaliGemma可以被社区广泛地使用、改进和集成到各种产品和服务中。

谷歌 PaliGemma AI头条
Refuel AI 推出专为数据标注和清洗设计的开源语言模型 RefuelLLM-2

RefuelAI最近宣布推出两个新版本的大型语言模型，RefuelLLM-2和RefuelLLM-2-small，这两个模型专为数据标注、清洗和丰富任务设计，旨在提高处理大规模数据集的效率。RefuelLLM-2的主要特点包括:自动化数据标注:能够自动识别和标记数据中的关键信息，如分类数据和解析特定属性。RefuelAI的这一创新为数据标注和清洗领域带来了新的解决方案，有助于自动化和优化大规模数据处理流程。

RefuelLLM-2
Meditron：先进的医学大语言模型

Meditron是一个基于Llama的大型医学语言模型，由Meta公司更新并发布。Meditron项目是完全开源的，包括数据、模型权重和配置，这意味着全球的研究人员和开发者都可以自由地访问、使用、修改和改进这一技术。在紧急情况下快速提供医疗响应，或在基础设施不足的地区辅助医疗工作，Meditron可以发挥重要作用。

Meditron 大模型
Meta 推出 LayerSkip：提升大语言模型推理速度

Meta公司最新发布了LayerSkip，这是一款端到端的解决方案，专门设计用于提升大型语言模型的推理速度。这一技术在不同规模的Llama模型上经过了广泛的训练实验，并在多个任务上展现了显著的性能提升。未来展望:随着LayerSkip技术的不断完善和应用，预计将为大语言模型的部署和使用带来更多可能性，特别是在需要快速处理大量语言数据的场合。

LayerSkip
Meta新大语言模型LLama 3将在英特尔和高通硬件上运行

Meta最近发布了LLama3，这是一款新的大型语言模型，用于实现更安全、更准确的生成式人工智能体验。除了LLM，Meta还推出了LlamaGuard2、CodeShield和CyberSecEval2等信任和安全工具，以帮助确保符合行业和用户安全期望。随着400亿参数显示出更高的准确性，可以推断出更高的AI硬件需求不会很快减少。

Meta LLama3 AI头条
苹果开发设备内运行的大型语言模型优先考虑速度和隐私

苹果公司正在开发自己的大型语言模型。这款模型将能够在设备上本地运行，从优先考虑速度和隐私保护。苹果更广泛的人工智能战略预计将在6月份的WWDC上与主要软件更新预览一起公布。

热文

3 天
7天

语言大模型

与“语言大模型”的相关热搜词：

相关“语言大模型” 的资讯2673篇

热文

站长商机