首页 > 关键词 > 大语言模型最新资讯
大语言模型

大语言模型

在当今日益全球化的时代,准确高效的跨多语言翻译需求前所未有的增长。传统的翻译方法虽然有效,但在可扩展性和多样性方面仍有待提升,这促使研究人员探索更为动态的解决方案。通过弥合语言多样性和任务特定功能之间的鸿沟,TOWER提升了LLMs的能力,重新定义了翻译技术的可能性。...

特别声明:本页面标签名称与页面内容,系网站系统为资讯内容分类自动生成,仅提供资讯内容索引使用,旨在方便用户索引相关资讯报道。如标签名称涉及商标信息,请访问商标品牌官方了解详情,请勿以本站标签页面内容为参考信息,本站与可能出现的商标名称信息不存在任何关联关系,对本页面内容所引致的错误、不确或遗漏,概不负任何法律责任。站长之家将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。任何单位或个人认为本页面内容可能涉嫌侵犯其知识产权或存在不实内容时,可及时向站长之家提出书面权利通知或不实情况说明,并提权属证明及详细侵权或不实情况证明(点击查看反馈联系地址)。本网站在收到上述反馈文件后,将会依法依规核实信息,第一时间沟通删除相关内容或断开相关链接。

与“大语言模型”的相关热搜词:

相关“大语言模型” 的资讯374篇

  • TOWER: 开放式多语言大语言模型,用于翻译相关任务

    在当今日益全球化的时代,准确高效的跨多语言翻译需求前所未有的增长。传统的翻译方法虽然有效,但在可扩展性和多样性方面仍有待提升,这促使研究人员探索更为动态的解决方案。通过弥合语言多样性和任务特定功能之间的鸿沟,TOWER提升了LLMs的能力,重新定义了翻译技术的可能性。

  • 苹果研究人员提出MAD-Bench基准,克服多模态大语言模型中幻觉和误导性提示

    在人工智能领域,多模式大语言模型在推动进步方面发挥了巨大作用,但它们面临处理误导性信息的挑战,可能导致不正确或产生幻觉的响应。这种脆弱性引发了对MLLM在需要准确解释文本和视觉数据的应用中可靠性的担忧。作为一个不断发展的领域,解决这些挑战对于在现实应用中部署MLLMs至关重要。

  • ChatMusician:一个融合了音乐天赋的开源大语言模型

    ChatMusician是一个基于开源大语言模型的项目,它通过与文本兼容的音乐符号系统ABC记谱法,使LLaMA2模型能够理解和创作音乐。这意味着模型可以独立地使用纯文本来处理音乐,无需依赖外部的多模态神经网络结构或特殊的词法分析器。其开创性的方法为音乐和语言之间的交叉研究提供了有益的范例,展示了人工智能在创意领域的巨大潜力。

  • Google 预计其更先进的大语言模型将在明年登陆 Android 手机

    谷歌对其更先进的人工智能模型在智能手机上应用的前景感到乐观。该互联网巨头预计,与由微软支持的OpenAI推出的最强大GPT-4AI模型竞争的目前可用的Gemini大型语言模型,将从明年开始嵌入设备中。从微软到亚马逊等科技巨头的首席执行官都强调了他们致力于构建AI代理作为生产工具的承诺。

  • 研究表明:大语言模型从人类反馈中学得更快更智能

    近期研究表明,大型语言模型在通过在线上下文学习方面表现出许多强大的能力,其中包括从语言命令中编写机器人代码的技能。这使得非专家用户能够直接指导机器人行为,根据反馈进行修改,甚至组合行为以执行新任务。这项研究通过LMPC框架的应用,成功提高了机器人代码编写LLMs的可教学性,为人机交互中机器学习的快速适应性开辟了新的道路。

  • 揭秘Sora:用大语言模型的方法理解视频,实现了对物理世界的“涌现”

    当全球还沉迷在如何用文本生成文本,以及文本生成图片的时候,OpenAI就这么掏出来了一个视频生成模型Sora。有关Sora的具体介绍和效果展示可以看我们昨天的文章《OpenAISora问世,通往AGI的又一个ChatGPT时刻!GPT4可能也要被干掉了》。OpenAI显然在把Sora描述成它一直坚持的Scalinglaw的又一次胜利——没有多么纯粹原创的技术,很多技术成分早已存在,但它却比所有人都更笃定的走了

  • 网信办发布第四批深度合成服务算法备案信息 小米大语言模型算法等在列

    今日,国家互联网信息办公室发布第四批深度合成服务算法备案信息。《互联网信息服务深度合成管理规定》第十九条明确规定,具有舆论属性或者社会动员能力的深度合成服务提供者,应当按照《互联网信息服务算法推荐管理规定》履行备案和变更、注销备案手续。网信算备440305295988701240113号266意间图像生成算法-1服务提供者上海亘聪信息科技有限公司意间ai、意间ai、意间ai应用于图像生成场景,根据用户输入的文本、图像数据,生成符合用户需求的图像,实现文生图、图生图等功能。

  • 谷歌内部推出AI大语言模型Goose 主打代码编写、产品研发

    据BusinessInsider报道,近日,谷歌内部秘密开发了一款名为“Goose”的人工智能大语言模型,据知情人士透露。这款AI工具被特别设计给谷歌工程师使用,融入了公司25年的技术积淀,目的是大幅度提高内部团队的工作效能,特别是在代码编写和新产品研发方面。借助深度学习和自然语言处理技术,Goose能够深刻理解工程师的需求,并精准地转化为实际可行的代码解决方案,实现了人机协作的新境界。

  • MGIE官网体验入口 苹果多模态大语言模型AI图像编辑工具在线使用地址

    MGIE是一项由苹果开源的技术,利用多模态大型语言模型生成图像编辑指令,通过端到端训练,捕捉视觉想象力并执行图像处理操作,使图像编辑更加智能、直观。点击前往MGIE官网体验入口需求人群:"用户可以通过自然语言直观地描述图像编辑需求,如改变颜色、调整大小等,无需复杂的描述或区域掩码,使图像编辑更加自由和轻松。为了深入了解MGIE并开始您的图像编辑之旅,请点击前往MGIE官网。

  • 支持534种语言,开源大语言模型MaLA-500

    无论是开源的LLaMA2还是闭源的GPT系列模型,功能虽然很强大,但对语言的支持和扩展比较差,例如,二者都是以英语为主的大模型。为了提升大模型语言的多元化,慕尼黑大学、赫尔辛基大学等研究人员联合开源了,目前支持语言最多的大模型之一MaLA-500。相比原始LLaMA2模型,MaLA-500在主题分类等评测任务上的准确率提高了12.16%,这说明MaLA-500的多语言优于,现有的众多开源大语言模型。

  • 通过纠正检索增强生成 (CRAG) 提高大语言模型的准确性

    在自然语言处理中,追求语言模型精度的过程中,创新的方法不断涌现,以缓解这些模型可能存在的固有不准确性。其中一个显著的挑战是模型倾向于产生“幻觉”或事实错误,因为它们依赖内部知识库。这一进展承诺提升LLMs在从自动化内容创建到复杂对话代理等应用中的效用,为语言模型可靠地反映人类知识的丰富性和准确性铺平了道路。

  • GenEM:利用大语言模型实现机器人行为的生成表达

    在人机交互领域存在许多挑战,其中之一是使机器人展示类似于人类的表达行为。传统的基于规则和基于数据的方法在新的社交环境中需要更大的可扩展性数据驱动方法受到数据集的限制。这一方法突显了LLMs在机器人领域的潜力,强调了它们通过自主生成富有表现力行为来促进有效的人机交互的作用。

  • 商汤日日新SensNova 4.0发布 商量大语言模型推出V4通用版本

    商汤科技发布了全新的AI体验产品“日日新SenseNova4.0”,该产品通过多维度全面升级大模型体系,提供更全面的知识覆盖、更可靠的推理能力、更优越的长文本理解力、更稳定的数字推理能力和更强的代码生成能力,并支持跨模态交互。日日新・商量大语言模型-通用版本支持128K语境窗口长度,综合整体评测成绩水平比肩GPT-4,相较GPT-3.5已经实现全面超越。商汤的“日日新SenseNova”大模型体系及相关产品和工具将继续助力实现通用人工智能,拓宽大模型应用边界,助力全场景、多产业实现“大模型”。

  • iPhone将加入ChatGPT:iOS 17.4开发者预览版现大语言模型代码

    苹果发布最新iOS17.4开发者预览版,引发关注的是其中包含的大语言模型代码。这些代码表明苹果正在开发由大语言模型驱动的全新版本Siri。这一功能将在未来推动苹果产品在AI领域的发展,并提供更先进、智能化的用户体验。

  • iOS 17.4泄密:Siri获大语言模型加持

    前不久苹果发布了iOS17.4开发者预览版Beta更新,然近日有开发者在其中发现了大语言模型技术代码,代码表明苹果正在开发由大语言模型加持的Siri新版本。除了苹果内部模型Ajax”外,iOS17.4还包含一个新的SiriSummarization私有框架,该框架可以调用OpenAI的ChatGPTAPI。外界普遍预计苹果将在6月份通过iOS18推出大预言模型加持的新人工智能功能。

  • 小红书提出创新框架:充分利用负样本提升大语言模型推理能力

    在AAAI2024上,小红书搜索算法团队推出了一项创新框架,旨在解决大语言模型在推理任务中的黑盒属性和庞大参数量带来的问题。传统研究方法主要关注正样本这项工作强调了负样本在知识蒸馏中的价值。这一研究为提高大语言模型应用性能提供了新思路,通过引入负样本的知识,弥补了传统研究方法的不足,为推理任务的应用提供了更可靠和高效的解决方案。

  • abab6体验入口 MiniMax大语言模型免费在线使用地址

    abab6,作为国内首个MoE大语言模型,已全面发布,代表着大语言模型发展的一个新阶段。abab6凭借其庞大的参数规模,能够处理更加复杂的任务,同时保持高效的训练和计算性能。走在人工智能的最前沿,探索无限可能,只需一步之遥。

  • MiniMax 发布国内首个 MoE 大语言模型 abab6

    MiniMax在2024年1月16日全量发布了大语言模型abab6,这是国内首个采用MoE架构的大语言模型。MoE架构使得abab6具备处理复杂任务的能力,并且在单位时间内能够训练更多的数据,提高计算效率。用户可以访问MiniMax开放平台官网来申请试用abab6大模型。

  • ​字节与浙大联合推多模态大语言模型Vista-LLaMA 可解读视频内容

    在自然语言处理领域,大型语言模型如GPT、GLM和LLaMA等的成功应用已经取得了显著的进展。将这些技术扩展到视频内容理解领域则是一项全新的挑战。其在长视频内容方面的显著优势为未来多模态交互和自动化内容生成领域提供了广泛的机遇。

  • 研究称:英特尔Gaudi2技术在大语言模型推理方面媲美英伟达AI加速器

    根据Databricks的最新研究,英特尔的Gaudi2技术在大规模语言模型推理方面与业界领先的英伟达AI加速器相媲美。该研究发现,Gaudi2在解码方面的延迟与英伟达H100系统相当,并且优于英伟达A100。我们的总体策略是提供一系列解决方案。

  • Google Gemini官方体验入口在哪 谷歌大语言模型功能有哪些

    GoogleGemini是一款由GoogleAI开发的大型语言模型,于2023年12月6日发布。Gemini具有强大的语言生成能力,可用于多种应用,包括文本生成、翻译、代码编写等。以上就是GoogleGemini的全部介绍了,感兴趣的小伙伴可以点击上方链接前往体验。

  • 谷歌推大语言模型VideoPoet:文本图片皆可生成视频和音频

    GoogleResearch最近发布了一款名为VideoPoet的大型语言模型,旨在解决当前视频生成领域的挑战。该领域近年来涌现出许多视频生成模型,但在生成连贯的大运动时仍存在瓶颈。VideoPoet作为大型语言模型,通过集成多种视频生成任务,为零镜头视频生成提供了新的可能性,为艺术创作、影视制作等领域带来了潜在的创新机遇。

  • 上海钢联申请大语言模型商标 此前发布大宗行业模型“钢联宗师”

    企查查APP显示,近日,上海钢联申请注册一枚“钢联宗师大语言模型”商标,国际分类为设计研究,当前商标状态为注册申请中。图源备注:图片由AI生成,图片授权服务商Midjourney2023年12月16日,钢联公司正式发布了名为“钢联宗师”的大宗商品行业垂类大语言模型以及名为“小钢”的数字智能助手。该模型具备多种能力,包括价格和数据查询、行业百科问答、资讯整理和内容汇总、知识内容生成、报告解读和分析预测等。

  • 免费用!全国首个古籍大语言模型“荀子”发布:能写诗 会翻译

    南京农业大学官网发文称,该校信息管理学院王东波教授研究团队发布荀子”古籍大语言模型。该模型包含《四库全书》在内的绝大多数传世古籍文献,拥有超过20亿字的大型语料库。值得一提的是,该模型作为开源公益研究成果,已在GitHub、ModelScope等网站发布,用户可免费下载部署使用。

  • 南京农业大学研发全国首个古籍大语言模型“荀子”:智能标引、翻译等

    12月2日,南京农业大学信息管理学院王东波教授团队在北京发布了一款名为“荀子”的古籍大语言模型。这是该团队在国家社科基金资助的“中国古代典籍跨语言知识库构建及应用研究”项目支持下,与中华书局古联公司合作推出的专门进行古籍处理和研究的智能工具。国内多家高校、出版机构和互联网企业的专家学者高度评价了该模型的实用性。

  • LLM360: 首个完全开源和透明的大语言模型

    在众多开源的大型语言模型中,如LLaMA、Falcon和Mistral等,大多数仅公开了特定组件,如最终模型权重或推理脚本。技术文档通常集中在更广泛的设计方面和基本指标上,限制了该领域的进展,因为训练方法的清晰度不足,导致团队不断努力揭示训练过程的众多方面。如果您喜欢他们的工作,不要忘记加入MLSubReddit、Facebook社群、Discord频道和电子邮件通讯,以获取最新的AI研究新闻和有趣的AI项目。

  • 微软高管透露将推出更多超越OpenAI的大语言模型

    微软的高级执行官EricBoyd在一次采访中透露,公司计划在未来推出更多超越OpenAI的大语言模型,以迎合企业客户对多样选择的需求。Boyd强调,微软的生成式AI应用及其所使用的LLMs是安全可靠的,但他指出,那些专注于文本生成等领域的公司更容易实现快速发展。公司的生成式AI应用及其驱动这些应用的LLMs是安全可用的,但那些专注于模型在文本生成等领域表现良好的公司能够�

  • 小浣熊Raccoon开放公测,商汤大语言模型实力加持,编程效率提升超50%

    基于商汤科技自研大语言模型的智能编程助手——代码小浣熊Raccoon,即日起全面开放公测。它功能覆盖软件需求分析、架构设计、代码编写、软件测试等环节,满足用户代码编写、数据分析、编程学习等各类需求。未来代码小浣熊Raccoon也将持续随之进化,陆续引入代码仓库级记忆、AIAgents等能力,进一步提升编程效率和开发者体验。

  • 腾讯与悉尼大学联手打造GPT4Video:显著提升大语言模型视频生成能力

    在多模态大型语言模型领域取得显著进展的同时,尽管在输入端多模态理解方面取得了显著进展,但在多模态内容生成领域仍存在明显的空白。为填补这一空白,腾讯人工智能实验室与悉尼大学联手推出了GPT4Video,这是一个统一的多模态框架,赋予大型语言模型独特的视频理解和生成能力。其在多模态基准测试中表现出色进一步强调了其卓越性能。

  • 新加坡投资5200万美元计划发展东南亚大语言模型

    新加坡的InfocommMediaDevelopmentAuthority与AISingapore以及AgencyforScience,TechnologyandResearch携手启动了总额为5200万美元的国家多模态大语言模型计划。这一由新加坡国家研究基金支持的倡议旨在发展该国在多模态大语言模型方面的研究和工程能力,以填补当前LLM模型主要源自西方的关键空白。通过投资人才和为区域语言投资大语言人工智能模型,我们希望促进跨境产业合作,推动东南亚人工智能创新的下一波浪潮。