大模型性能

由IDEA研究院、微软亚洲研究院、香港科技大学等多方研究团队合作推出的Think-on-Graph技术，在深度推理领域掀起了一场革新。这一技术通过紧耦合大模型与知识图谱，成功弥补了大模型在金融、法律、医疗等领域幻觉问题上的能力短板。这一研究成果为深度推理领域的发展带来了新的思路和方法，为实现大模型在各领域应用中更可靠、可解释的推理能力提供了有力支持。...

特别声明：本页面标签名称与页面内容，系网站系统为资讯内容分类自动生成，仅提供资讯内容索引使用，旨在方便用户索引相关资讯报道。如标签名称涉及商标信息，请访问商标品牌官方了解详情，请勿以本站标签页面内容为参考信息，本站与可能出现的商标名称信息不存在任何关联关系，对本页面内容所引致的错误、不确或遗漏，概不负任何法律责任。站长之家将尽力确保所提供信息的准确性及可靠性，但不保证有关资料的准确性及可靠性，读者在使用前请进一步核实，并对任何自主决定的行为负责。任何单位或个人认为本页面内容可能涉嫌侵犯其知识产权或存在不实内容时，可及时向站长之家提出书面权利通知或不实情况说明，并提权属证明及详细侵权或不实情况证明（点击查看反馈联系地址）。本网站在收到上述反馈文件后，将会依法依规核实信息，第一时间沟通删除相关内容或断开相关链接。

与“大模型性能”的相关热搜词：

相关“大模型性能” 的资讯2273篇

【腾讯云】11.11云上盛惠！云服务器首年1.8折起，买1年送3个月！

11.11云上盛惠！海量产品 · 轻松上云！云服务器首年1.8折起，买1年送3个月！超值优惠，性能稳定，让您的云端之旅更加畅享。快来腾讯云选购吧！

Docker容器镜像
去看看

Docker容器镜像 60元/15天

爆款产品组合购
去看看

爆款产品组合购低至1元

腾讯云x NVIDIA加速计划
去看看

腾讯云x NVIDIA加速计划最高获赠10万元扶持基金

2核2G云服务器
去看看

2核2G云服务器 112元/1年

查看更多相关信息>>

腾讯云 12-20

广告
IDEA提出ToG思维图谱大模型性能提升214%！

由IDEA研究院、微软亚洲研究院、香港科技大学等多方研究团队合作推出的Think-on-Graph技术，在深度推理领域掀起了一场革新。这一技术通过紧耦合大模型与知识图谱，成功弥补了大模型在金融、法律、医疗等领域幻觉问题上的能力短板。这一研究成果为深度推理领域的发展带来了新的思路和方法，为实现大模型在各领域应用中更可靠、可解释的推理能力提供了有力支持。

ToG
ROUGE 矩阵：大模型性能评估工具

ROUGE矩阵是评估大型语言模型的性能和能力的工具。在自然语言处理领域中，评估模型的性能非常重要，但由于语言输出的不可预测性和人类语言的复杂性，传统的机器学习评估方法存在局限性。ROUGE矩阵是评估语言模型摘要能力的重要工具，通过不断改进和结合其他指标，可以更准确地评估语言模型的性能。
LLM评估测试框架DeepEval 可离线评估大模型性能

DeepEval是一个用于对语言模型应用进行评估和单元测试的框架。它提供了各种指标，可以测试语言模型应用生成的回复在相关性、一致性、无偏见性和无毒性等方面的表现。如果你在开发聊天机器人、语言模型应用，DeepEval绝对是一个提高工程效率的好帮手。

DeepEval
荐 20B量级大模型性能媲美Llama2-70B！完全开源，从基座到工具全安排明白了

【新智元导读】国产模型开源纪录，又被刷新了!上海AI实验室等机构开源的InternLM-20B，竟然能和Llama2-70B打个平手?就在刚刚，国内开源模型参数量纪录，又被刷新了!9月20日，上海人工智能实验室与商汤科技联合香港中文大学和复旦大学，正式开源了200亿参数的InternLM-20B模型。项目地址:https://github.com/InternLM/InternLM魔搭社区:https://modelscope.cn/organization/Shanghai_AI_Laboratory这次的200亿参数版书生·浦语大模型，可以说是「加量不加价」，参数量还不到三分之一，性能却可以剑挑当今开源模型的标杆——Llama2-70B。上海AI实验室的「雪中送炭」，必然会让大模型在落地领域发挥出巨大的价值。

模型
扎克伯格放大招：新AI大模型性能升级几倍要做世界最强 | AI前哨

凤凰网科技讯《AI前哨》北京时间9月11日消息，脸书创始人马克扎克伯格已经把目标对准了OpenAI。知情人士称，脸书母公司Meta正在开发一种新的人工智能系统，希望它能够与OpenAI提供的最先进模型一样强大。凤凰网科技《AI前哨》对此将持续关注。
SPP开源：支持多人协同提升大模型性能

SoloPerformancePrompting是一款旨在提升大型语言模型性能的多人合作助手。它通过多人设定，实现了协同合作的方式来解决任务。通过引入多人合作的方式，SoloPerformancePrompting能够显著提升大型语言模型在各种任务上的性能，为用户提供更好的体验和辅助。
清华发布大模型性能报告：GPT-4第一更懂中文的还是百度

AI大模型成为今年的热点，OpenAI的ChatGPT一马当先，微软、谷歌、Meta紧随其后，国内科技巨头也迅速跟进，现在国内据说已经有上百款大模型问世了。这么多大模型中，实力到底如何?日前清华大学新闻与传播学院发布了《大语言模型综合性能评估报告》，将国内外的大模型做了一番对比。这跟百度的大模型包含大量中文文本有关系，因此能够更好地处理本土文化相关的内容。
华为云研究团队提出 PanGu-Coder2 模型和 RRTF 框架提升大模型性能

华为云、中国科学院和北京大学的研究人员最近提出了一种名为RRTF的新框架，能够有效地提升预训练的大型语言模型在代码生成方面的性能。RRTF框架通过自然语言LLM对齐技术和排名反馈的方式来改进代码生成LLM的表现。6.除了提高代码生成效率外，研究团队还建议了PanGu-Coder2使用的优化方法，以确保快速推理，这对于实际应用非常重要。

大模型 AI头条
小红书内测自研大模型“小地瓜” 拓展社交和搜索等新场景

多个独立消息源透露，小红书正悄然推进其在人工智能领域的布局。其AI创新领军人物张德兵所领导的大模型团队，已在内部产品中进行了自研通用大模型基座“小地瓜”的灰度测试。这一举动无疑进一步印证了小红书在AI领域布局的决心。

小红书人工智能内容生态
支付宝小程序云推出新解决方案烹饪机器人也用上了大模型

第135届广交会正在火热进行支付宝小程序云助力合作伙伴田螺云厨，在烹饪机器人上开始用上大模型技术。各类智能产品的亮相，从中国制造迈向中国创造，也成为广交会的一个亮点。CookGPT不仅是菜谱的提供者，更能与用户一同成为“创新者”，让每个用户都能创造出专人专属的膳食解决方案与个性化菜谱创作，体验烹饪乐趣。

广交会支付宝小程序人工智能
写真视频击败Sora？人大自研全新多模态大模型Awaker 1.0震撼登场

在人工智能领域，人大系初创公司智子引擎近日发布了一款名为Awaker1.0的全新多模态大模型，标志着向通用人工智能迈出了重要一步。该模型在写真视频效果上超越了Sora，展现了其在视觉生成方面的卓越能力。Awaker1.0在理解侧和生成侧都实现了效果突破，有望加速多模态大模型行业的发展，最终让人类实现AGI。

Awaker1.0 AI头条 Sora
卓世科技闪耀中关村论坛，共绘大模型时代蓝图

2024年4月25日至29日，北京中关村论坛年会盛大召开，来自全球100多个国家和地区的代表以及国际组织嘉宾共襄盛举。本次论坛以“创新:构筑更美好的世界”为主题，精心组织了论坛会议、技术交易、成果发布等五大核心板块，共计近120场丰富多彩的活动。卓世科技将继续致力于推动AI技术的发展与创新，为实现智能普惠、开源共享、科技平权的目标努力。

中关村论坛创新科技前沿
荐 AI日报：当前最强国产Sora大模型Vidu发布；Kimi Chat移动端升级；通义千问开源首个千亿参数模型；苹果计划与 OpenAI 合作

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解：https://top.aibase.com/1、清华团队发布视频大模型Vidu可生成16秒、1080P视频清华大学与生数科技在中关村论坛未来人工智能先锋论坛上发布了中国首个长时长、高一致性、高动态性视频大模型Vidu，标志�
久其女娲平台2.0全新升级！AI大模型加速，赋能政企数治未来

4月25日，久其女娲平台2.0发布会在线成功举办。活动以 “数治未来大模型加速” 为主题，通过专题报告、功能路演等环节，集中介绍了久其女娲平台作为久其新一代政企赋能底座，在以新质生产力为引领、AI大模型加速的新趋势下的全新定位与功能创新。高度聚焦政策导向，以创新引领服务升级，女娲平台2.0的发布彰显了久其软件作为卓越的政企产品与服务提供商的重要价值
每日互动持续增强大模型能力，推出、升级多款大模型应用产品

人工智能引领的"第四次工业革命"正在到来，特别是2023年以来，以大模型、多模态、生成式为特征的新一轮人工智能浪潮席卷全球，带来新的变革。在这机遇与挑战并存的时期，国内专业的数据智能服务商--每日互动快速响应、积极探索大模型、AIGC等先进数智技术，升级产品性能，驱动业务创新，并储备公司下一条S型曲线。每日互动本身就是优质数据资源的持有方，因此在未来，拥有海量鲜活的数据积累、深厚沉淀的数据治理能力、丰富多元的数据应用场景的每日互动将更有可为。
元象开源首个多模态大模型XVERSE-V 支持任意宽高比图像输入

元象公司发布了首个多模态大型模型XVERSE-V，并将其开源。这一模型支持任意宽高比的图像输入，并在多个权威评测中取得了优异的成绩。除了图像识别，XVERSE-V还在多个实际应用场景中表现突出，包括信息图理解、视障场景处理、文本生成、教育解题等。
国际顶尖水平！首个Sora级国产自研视频大模型Vidu发布

在2024中关村论坛年会未来人工智能先锋论坛上，生数科技联合清华大学发布中国首个长时长、高一致性、高动态性视频大模型Vidu。这也是自Sora发布之后全球率先取得重大突破的视频大模型，性能全面对标国际顶尖水平在加速迭代提升中。除了在时长方面突破，Vidu在视频效果方面也实现了显著提升，主要包括：能够生成细节复杂的场景，且符合真实的物理规律；能够生成真实世界不存在的虚构画面，创造出具有深度和复杂性的超现实主义内容；能够生成复杂的动态镜头，不再局限于简单的推、拉、移等固定镜头是能够围绕统一主体在一段画面里就实现远景、近景、中景、特写等不同镜头的切换；在16秒的时长上保持连贯流畅，随着镜头的移动，人物和场景在时间、空间中能够保持一致；能够生成特有的中国元素，例如熊猫、龙等。
清华团队发布视频大模型Vidu 可生成16 秒、1080P 视频

生数科技与清华大学在中关村论坛未来人工智能先锋论坛上共同发布了中国首个长时长、高一致性、高动态性视频大模型——Vidu。这款模型是国内首个达到Sora级别的视频大模型，标志着中国在视频生成技术领域的重要进展。开源成就:2023年3月，团队开源了基于U-ViT架构的多模态扩散模型UniDiffuser，这是全球首个此类模型，验证了U-ViT架构的大规模可扩展性。

Vidu 大模型 AI头条
中国首个Sora级大模型Vidu：文本生成16秒，1080p高清视频

4月27日，在2024中关村论坛-未来人工智能先锋论坛上，清华大学联合生数科技正式发布了，中国首个长时间、高一致性、高动态性视频大模型——Vidu。Vidu采用了原创的Diffusion与Transformer融合的架构U-ViT，支持文本生成长达16秒、分辨率高达1080P的高清视频内容。生数科技致力打造世界领先的多模态大模型，融合文本、图像、视频、3D等多模态信息，探索生成式AI在艺术设计、游戏�

Vidu
清华团队国产“Sora”火了：生数科技发布视频大模型「Vidu」

在中关村论坛的未来人工智能先锋论坛中，生数科技与清华大学携手，正式推出了中国首个具备长时长、高一致性及高动态性的视频大模型——“Vidu”。这款引领时代的视频大模型，其核心在于团队原创的Diffusion与Transformer融合的U-ViT架构。作为通用视觉模型，Vidu能够生成更加多样化、更长时长的视频内容，其灵活的架构也将为未来兼容更广泛的模态、拓展多模态通用能力的�

人工智能视频模型 Diffusion
荐震撼！GPT-4 Turbo级国产大模型登场，周冠宇F1赛事数据秒分析惊呆国际大佬

中国的大模型，已经震惊了外国科技圈。这几天商量大模型的更新，直接让外国网友惊呼:太疯狂了，中国的AI界究竟还有多少我们不知道的巨变?不怪这些网友太大惊小怪——最近全新升级的日日新·商量大模型5.0，在基础能力上再次重大更新，直接把大模型能力升级到新的阶段，直观印象可感的那种。还真是有点期待日日新6.0的诞生了。

大模型
聚焦AI大模型激发城市新活力城市云数字领军人才研修班·东莞站成功举办

新一代人工智能发展如火如荼，大模型如何落地推动数字转型赋能城市发展?4月25日，以“AI大模型打造城市新质生产力”为主题的城市云数字领军人才研修班在东莞举办。国家信息中心信息化和产业发展部主任单志广、东莞市发展与改革局副局长魏亚东、中国信息通信研究院云计算与大数据研究所政企数字化转型部主任徐恩庆、广东工业大学机电工程学院院长刘强、华为云中国区副总裁刘少华，全国20多个省市城市数字化建设相关负责人等政府、高校、研究院以及企业的专家、学者参加了此次活动。“城市云数字领军人才研修班”将针对不同层级、领域、区域的数字化建设者，建立差别化的课程体系，紧扣智慧城市、数字政府、数字化转型实际需要，增强学员的数字思维和专业素质，为全面增强数字城市建设效能提供重要人才保障。

人工智能大数据数字化转型
会颠勺的国产机器人来了：大模型加持，家务能力满分

随着AI向AGI的圣杯方向加速发展，大模型与机器人的结合是必然趋势。单一用途机器人市场已趋于饱和，AI通用机器人的巨大潜力急待开垦。有此长期志向的伙伴，欢迎加入我们，让AI机器人从梦想变为现实。

机器人
荐为什么要做长文本、长图文、长语音的大模型？深度解读讯飞星火V3.5春季上新

4月26日，科大讯飞发布讯飞星火大模型V3.5的功能上新，其中一个重点就是面向用户各种场景中高效获取信息需求，发布首个长文本、长图文、长语音的大模型，能够支持文档、图文资料、会议录音等各种信息来源的快速理解和学习能够结合各种行业场景知识给出专业、准确回答。效果到底如何?今年人形机器人发展火热，我们将一份长达70多页的人形机器人报告，丢给了讯飞星火。科大讯飞将在6月27日发布讯飞星火大模型V4.0，进一步实现对GPT-4Turbo的对标。

大模型
讯飞星火大模型V3.5升级推出长文本、长图文、长语音大模型

科大讯飞今日发布重大更新，讯飞星火大模型V3.5升级，不仅推出了首个长文本、长图文、长语音大模型首次将多情感超拟人合成技术引入市场，并同步推出了星火智能体平台。这一系列创新举措，旨在为招投标应用和合同应用提供更为强大的技术支持。插件市场和原生应用也为开发者和用户提供更多功能和工具选择，共同构建讯飞星火大模型生态。

科大讯飞讯飞星火大模型V3.5 多情感超拟人合成技术
荐 Sam Altman：GPT-5，将会比现在的大模型更智能

4月25日晚，斯坦福大学日报消息，OpenAI联合创始人兼首席执行官SamAltman，在斯坦福大学的英伟达礼堂进行了公开演讲，超过1000名学生排队参加此次活动。Altman表示，从现在的技术创新和功能迭代来看，人类远远没有达到AI的极限，如果只是聚焦现在的AI能力将会是徒劳的。Altman则希望，二者之间的羁绊友谊可以继续长存下去。

GPT 大模型
荐 AI刘强东007带货，背后大模型也就10亿参数，京东：我家数字人平均水平

京东创始人刘强东啊，他昨天又加班了。是他的AI数字人形象“采销东哥”，昨晚开启了自己生涯第四场直播。OneMoreThing聊着聊着，一个有趣的问题被抛出来。

刘强东大模型
股价飙升！商汤大模型挑战GPT4

4月24日，商汤集团在港交所暂停交易前股价上涨31.15%。商汤集团表示，其大模型日日新5.0发布会受到市场极大关注，公司将进一步刊发相关公告。商汤的生成式AI业务在2023年取得了显著增长，占总收入的35%。

商汤
荐揭秘腾讯混元大模型：400+场景落地，协作SaaS产品全面接入

进入2024，大模型的风向变了。当初“百模大战”时，只要简单粗暴拿个Demo搞MaaS，也就是让用户直接和大模型交互就足以上牌桌。简单告别后，他又一屁股坐回沙发上，一心沉醉到琢磨怎么改进Badcase的世界里了。

混元大模型 SaaS
荐国产大模型卷翻机器人！这些火遍全网的机器人，都装上了星火「大脑」

【新智元导读】大模型这把火点燃了整个机器人行业的热情。纵观全世界，过去几个月，国内外大模型大厂和机器人初创公司的合作也是动作不断。科大讯飞所做的，就是用技术革新，让机器人走进每个家庭。

大模型

热文

3 天
7天

大模型性能

与“大模型性能”的相关热搜词：

相关“大模型性能” 的资讯2273篇

热文

站长商机