首页 > 关键词 > 小模型最新资讯
小模型

小模型

微软研究团队引领着教育技术领域的不断创新,近日推出了一款名为Orca-Math的前沿工具,它是一款小语言模型,拥有7亿参数,并基于Mistral-7B架构微调来。这一创新方法重新定义了传统数学单词问题教学的策略,彻底改变了学生参与和掌握这一学科的方式。通过利用SLM通过合成数据集和迭代反馈来解锁学习工具的全新时代,Orca-Math为技术和学习手牵手走向解锁全球学生的全部潜力的未来提供了一瞥。...

特别声明:本页面标签名称与页面内容,系网站系统为资讯内容分类自动生成,仅提供资讯内容索引使用,旨在方便用户索引相关资讯报道。如标签名称涉及商标信息,请访问商标品牌官方了解详情,请勿以本站标签页面内容为参考信息,本站与可能出现的商标名称信息不存在任何关联关系,对本页面内容所引致的错误、不确或遗漏,概不负任何法律责任。站长之家将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。任何单位或个人认为本页面内容可能涉嫌侵犯其知识产权或存在不实内容时,可及时向站长之家提出书面权利通知或不实情况说明,并提权属证明及详细侵权或不实情况证明(点击查看反馈联系地址)。本网站在收到上述反馈文件后,将会依法依规核实信息,第一时间沟通删除相关内容或断开相关链接。

与“小模型”的相关热搜词:

相关“小模型” 的资讯4241篇

  • 微软AI研究推数学LLM Orca-Math:通过对Mistral-7B模型进行微调的7B参数小模型

    微软研究团队引领着教育技术领域的不断创新,近日推出了一款名为Orca-Math的前沿工具,它是一款小语言模型,拥有7亿参数,并基于Mistral-7B架构微调来。这一创新方法重新定义了传统数学单词问题教学的策略,彻底改变了学生参与和掌握这一学科的方式。通过利用SLM通过合成数据集和迭代反馈来解锁学习工具的全新时代,Orca-Math为技术和学习手牵手走向解锁全球学生的全部潜力的未来提供了一瞥。

  • 智源研究院推出新一代多模态小模型Bunny-3B

    智源研究院近期提出了一项新技术,通过数据浓缩技术获得高质量训练数据,从提升多模态小模型的性能。他们将LAION-2B压缩成2M核心集,得到更丰富的预训练数据,同时精选数据集进行指令微调,训练出性能强劲的小模型。通过数据浓缩技术获得高质量训练数据,Bunny系列小模型在多模态任务上表现优异,将促进大模型技术的发展和普及。

  • AI视野:谷歌推小模型MobileDiffusion;Midjourney测试风格一致性功能;字节跳动推AI Bot开发平台扣子;LLaVA-1.6赶超Gemini Pro

    欢迎来到【AI视野】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。

  • 三个臭皮匠顶个诸葛亮?可能是真的,已证实混合多个小模型性能比肩GPT3.5

    对模型参数量的迷信、执念也许可以放下了,混合多个小模型也是未来构造对话型AI的一个光明的方向。在对话型人工智能研究中,存在趋势即朝着开发参数更多的模型方向发展,如ChatGPT等为代表的模型。混合模型通过协作多个较小的对话型人工智能,在提供比单个更大的对话型人工智能更高质量的对话方面是有效的。

  • 异军突起的小模型,有多大想象空间?

    大模型之战进入到今日,许多开发者都面临着一个共同的挑战:如何在保证高性能的同时,降低资源和算力的需求?这一困境在端侧应用尤为明显,因为许多设备和应用场景对计算能力和存储空间有严格的限制。这无疑大大制约了大模型在各种设备和场景中的普及。对一线研究者言,唯有自由地践行自己的技术构想,在初期不过多地被资本干涉与左右,才更有可能做出亮眼的成果

  • 源代码is all you need!7B代码小模型同尺寸无敌,性能媲美ChatGPT和谷歌Gemini

    HuggingFace技术负责人PhilippSchmid表示:“代码自动补全工具,如GitHubCopilot,已被超过一百万开发者使用,帮助他们的编码速度提高了55%。看到像Magicoder和OSS-INSTRUCT这样的开源创新超越了OpenAI的GPT-3.5和GoogleDeepMind的GeminiUltra,真是令人振奋。张令明老师现任UIUC计算机系副教授,主要从事软件工程、机器学习、代码大模型的相关研究,更多详细信息请见张老师的个人主页:https://lingming.cs.illinois.edu/。

  • OpenAI新研究:让小模型来监督大模型能显著提高泛化性能

    人工智能的超级对齐问题在未来AI系统超越人类智能的情境下变得尤为复杂。研究小模型是否能够有效监督大模型成为关键问题。期待研究者在这一领域取得更多的突破。

  • 小模型也可以「分割一切」,Meta改进SAM,参数仅为原版5%

    对于2023年的计算机视觉领域来说,「分割一切」是备受关注的一项研究进展。Meta四月份发布的「分割一切模型」效果,它能很好地自动分割图像中的所有内容SegmentAnything的关键特征是基于提示的视觉Transformer模型,该模型是在一个包含来自1100万张图像的超过10亿个掩码的视觉数据集SA-1B上训练的,可以分割给定图像上的任何目标。图3、4、5提供了一些定性结果,以便读者对Effic

    SAM
  • 大模型+小模型,AI手机 METAVERTU2 既要安全 又要个性化运算

    2023年11月1日,英国奢侈手机品牌VERTU在香港举办了新品发布会,推出全球首款双模型AI手机——METAVERTU2。VERTU在去年发布了全球首款Web3手机,今年又将Web3与AI相结合,通过AI模型标记数据,AIAgent处理任务的方式,将METAVERTU2打造成更懂你的PERSONALAI。METAVERTU2的发布不仅体现在其产品技术的精益求精,更展现在对奢侈品与手机行业的深入理解和不断赋予的新定义。

  • ChatGPT/GPT-4/Llama电车难题大PK!小模型道德感反而更高?

    微软对大语言模型的道德推理能力进行了测试,但在电车问题中大尺寸的模型表现反比小模型差。但最强大语言模型GPT-4的道德得分依旧是最高的。这与研究最初的假设:大型模型总是比小型模型具有更强的能力相反,说明利用这些较小的模型开发道德系统具有很大的潜力。

  • Chinchilla之死:只要训练足够长时间,小模型也能超过大模型

    2022年3月,DeepMind一篇论文《TrainingCompute-OptimalLargeLanguageModels》通过构建的Chinchilla模型得出了一个结论:大模型存在训练不足的缺陷,模型大小和训练token的数量应该以相等的比例扩展。也就是说模型越大,所使用的训练token也应该越多。如果学习率遵循分配给更少训练步骤的余弦调度,其在同等训练时间下的损失会更低。

  • GPT-4太烧钱,微软想甩掉OpenAI?曝出Plan B:千块GPU专训「小模型」,开启必应内测

    GPT-4太吃算力,微软被爆内部制定了PlanB,训练更小、成本更低的模型,进摆脱OpenAI。GPT-4太吃算力,连微软也顶不住了!今年,无数场微软AI大会上,CEO纳德拉台前激动地官宣,将GPT-4、DALL·E3整合到微软「全家桶」。毕竟后者对哪些公司可以将其开源LLM进行商业化是有所限制的。

  • 2024数势科技产品发布会:大模型增强的指标平台和营销平台重磅推出

    【数智的力量】数势科技客户大会暨2024大模型增强的数据分析产品发布会隆重举行。本次大会汇聚了行业领袖、技术专家和企业数字化转型负责人,共同见证了数势科技新一代数据智能分析产品的发布,并深入探讨了企业数智化经营的未来。数势科技以先进的技术和深厚的行业洞见,持续走在企业数字化转型的前列,通过提供基于大模型增强的智能指标平台、营销平台等系列产品,助力企业提升数字化决策能力,共创数智化的美好未来。

  • AI日报:首个AI程序员Devin造假被抓;​Sora平替?StreamingT2V试玩地址公布;Udio AI还可以创作喜剧、演讲;XAI发布Grok-1.5Vision多模态模型

    欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解:https://top.aibase.com/🤖📱💼AI应用Sora平替?2分钟超长AI视频模型StreamingT2V免费开源试玩地址公布UdioAI提供多功能音频生成还可以创作喜剧、演讲、电台广播等美图Wink“AI动漫”功能升级可将短剧作品转化为动漫风格StableDesign:适用于室内装修设计的SD方案文字提示就可修改室内设计图比换脸更强大!SwapAnything:替换图片中的任意元素AI延时视频生成工具MagicTime在线体验地址放出自动化写作工具STORM:可生成像维基百科一样的深度长篇内容Meta推出ViewDiff模型:文本生成多视角3D图像📰🤖📢AI新鲜事首个AI程序员造假被抓,Devin再次“震撼”硅谷!扒皮视频文字详解附上马斯克XAI发布Grok-1.5Vision多模态模型,可处理文本和图片信息360智脑7B参数大模型正式开源最长支持约50万字输入Adobe图像生成AI“Firefly”训练集中约有5%为AI图像代码、模型全开源!贾佳亚团队多模态模型Mini-Gemini登上热榜面壁智能开源MiniCPM2.0系列模型OCR等能力显著增强竞争升温!ChatGPT增长疲软3月全球访问量17.7亿次,Claude逐渐崛起InstantID团队推新风格迁移方法InstantStyle一键置身“梵高星空”——————每日midjourneyprompt:小说古风美女图源备注:图片由AI生成,图片授权服务商MidjourneyAbeautifulwomanfromancientChina,dressedinagorgeousredHanfu,withlonghairdrapedoverhershoulders,satinherboudoirwithasmile.Ancientstyle,hanfu,boudoir,gorgeous,palace,screen,carpet,softlight,eleganttemperament,ancientculture,inlinewithorientalaesthetics,richdetails,bestquality,exquisitemakeup,cleareyelinerpen,slendereyebrows,texturedskin,whiteskin,charmingheaddress,--ar3:4--niji6--styleraw一个中国古代美女,穿着华丽的红色汉服,长发披肩,微笑着坐在闺房内。

  • 蚂蚁云科技集团正式发布以正教育大模型,专注因材施教

    4月12日,蚂蚁云科技集团成功举办“智以育人、慧正无界——以正教育大模型产品发布会”,该产品致力于智慧教育变革,让因材施教成为可能。上海科学技术交流中心科技企业服务处处长陈霖博士、中国信通院华东分院院长廖运发、上海市科协常委马慧民博士等出席并致辞;南威软件集团执行总裁洪创业、蚂蚁云科技集团董事长冯乔羽、蚂蚁云科技集团CEO蒋俊、蚂蚁云科技集团CTO谢恽、蚂蚁云科技集团首席科学家谢军博士、广州华腾教育科技股份有限公司董事长熊小𠇔、杭州北冥星眸科技有限公司联合创始人全海峰、北大校友会代表等出席。期待该产品能够真正实现因材施教的理念,为每一位学习者提供公平的教育机会,打造一个充满智慧和创造力的未来。

  • 代码、模型全开源!贾佳亚团队多模态模型 Mini-Gemini登上热榜

    香港中文大学终身教授贾佳亚团队最近推出了一款名为Mini-Gemini的多模态模型,该模型在多模态任务榜单上取得了显著成绩,其性能堪比GPT-4与DALLE3的结合。Mini-Gemini模型以其更精确的图像理解能力、更高质量的训练数据和更强的图像解析推理能力著称。这一成果不仅为开源社区带来了新的活力,也为多模态模型的发展和应用开辟了新的可能性。

  • 马斯克XAI发布Grok-1.5 Vision 多模态模型 可处理文本和图片信息

    在人工智能领域,多模态模型的发展一直是行业关注的焦点。马斯克XAI公司发布了其最新的多模态模型——Grok-1.5Vision,这一模型不仅能够处理文本信息能够理解和分析各种视觉数据,如文档、图表、截图和照片,标志着公司在人工智能技术上迈出了重要一步。随着该模型的进一步优化和应用,我们有理由相信,它将在多个领域发挥重要作用,推动人工智能技术向前发展。

  • Grok-1.5 Vision Preview官网体验入口 X.AI多模态AI模型详细介绍

    Grok-1.5VisionPreview是X.AI公司推出的首个多模态模型。除了强大的文本处理能力,Grok还能处理各种视觉信息,如文档、图表、截图和照片等。点击前往Grok-1.5VisionPreview官网体验入口需求人群:辅助决策分析内容生成工作效率提升使用场景示例:使用Grok-1.5V分析复杂的商业报告,快速提取关键数据和见解利用Grok-1.5V自动生成项目计划草稿,并优化资源分配通过Grok-1.5V理解工厂设备使用说明,提高维修效率产品特色:多学科推理文档理解图表解读现实世界理解图像处理掌握Grok-1.5VisionPreview,体验多模态AI的强大功能和无限潜力。

  • Sora平替?2分钟超长AI视频模型StreamingT2V免费开源 试玩地址公布

    PicsartAIResearch等团队联合发布了一款名为StreamingT2V的AI视频模型,该模型能够生成长达1200帧、时长达2分钟的视频,这在技术上超越了之前备受关注的Sora模型。StreamingT2V的发布不仅在视频长度上取得了突破它是一个免费开源的项目,可以无缝兼容SVD和animatediff等模型,这对于开源生态的发展具有重要意义。我们或许可以期待更多基于这类技术的创新应用,例如在电影制作、游戏�

  • Archetype AI发布可深入理解世界的基础模型Newton

    ArchetypeAI推出的Newton是一个革命性的人工智能平台,专为理解和推理物理世界设计。与传统的文本和图像分析AI模型不同,Newton结合了实时传感器数据和自然语言处理技术,使用户能够对周围环境提出开放式问题,并据此做出明智的决策。Newton支持与各种传感器结合使用,支持实时或预录数据流。

  • 面壁智能开源MiniCPM 2.0系列模型 OCR等能力显著增强

    面壁智能最新推出的新一代旗舰端侧模型——面壁MiniCPM2.0系列模型带来了一系列令人惊叹的性能和功能:1.MiniCPM-V2.0是端侧最强的多模态模型,具有强大的OCR能力,甚至部分能力比肩GeminiPro。它通过自研的高清图像解码技术,可以准确识别各种复杂的图像内容,包括街景和长图等。面壁智能刚刚完成了新一轮数亿元融资,计划继续面向AGI的高效大模型征程,欢迎优秀的人才加入他们的团队。

  • Meta 推出 ViewDiff 模型:文本生成多视角 3D 图像

    Meta与德国慕尼黑工业大学研发出创新模型ViewDiff,旨在帮助用户通过文本、图像或二者结合使用,快速生成高质量多视角3D图像。该模型解决了传统文本生成多视角3D图像领域的三大难点:无法生成真实背景环境、图像质量和多样性不理想、缺乏多视角和一致性。该模型的推出不仅在技术层面上具有重大意义,也将为未来的3D图像生成领域带来更多创新可能。

  • 360智脑7B参数大模型正式开源 最长支持约50万字输入

    360公司自主研发的7B参数大模型——360智脑,现已正式上线开源社区,并提供了基础模型以及4K、32K、360K三种不同文本长度的版本。这一大模型在支持文本长度方面表现出色,最长可处理360K长文本,相当于约50万字的输入内容。在中英文360K大海捞针效果测试中,也取得了超过98%的高分。

  • 李彦宏称大模型开源意义不大 周鸿祎:说这话的公司都是靠开源发展的

    在近日的一次内部讲话中,百度董事长李彦宏给开源大模型泼了不少冷水。李彦宏认为,大模型开源的意义不大,闭源模型在成本和能力上会持续领先。其实你仔细听听李彦宏说的是有道理的,他是说在写古诗方面,百度超过了GPT4,”周鸿祎的这番言论也引发了现场轰笑。

  • 剑指Sora!120秒超长AI视频模型免费开玩

    近日,PicsartAIResarch等团队联合发布了StreamingT2V,可以生成长达1200帧、时长为2分钟的视频,一举超越Sora。作为开源世界的强大组件,StreamingT2V可以无缝兼容SVD和animatediff等模型。也许未来的某一天,那里也会是我们人类的生存空间。

  • 识读2300多年的战国竹简,竟只用2B端侧大模型!面壁发布新一代“小钢炮”

    识读距今2300多年战国时期的上古竹简,AI正在立功。且在这背后的“大功臣”,竟是只有2B大小的多模态大模型!这批上古竹简,由清华大学于2008年7月收藏,因此也被称为清华简。李大海在公开信中也透露了资金的用处,依旧将是技术和人才:有技术,有人才,有市场,面壁智能是值得继续关注一波的大模型实力派选手了。

  • 从小数据到大模型,“AI+”何以落地?

    南京师范大学附属中学宿迁分校成立智慧教学小组,并以周为单位,对教师的智慧课堂应用数据进行复盘;中国人民大学附属中学丰台学校的教师们,已经习惯于课后通过课堂智能反馈系统总结自己的上课情况;而通过集体备课平台,北京师范大学广州实验学校的教师们可以随时随地进行线上交流互动和资源共享……在全国各地的中小学,AI技术正与教育不断融合。变化背后,有�

  • 中兴通讯赋能AI大模型,重磅发布高端多控磁阵KF8810

    随着AI大模型及其相关产业深入发展,对于海量数据的高速存储需求与日俱增。在此背景下,中兴通讯于2024年中兴通讯云网生态峰会当中,重磅发布中兴通讯高端多控磁阵产品KF8810,其采用自研高性能处理器,自研存储操作系统,单系统最大支持32控,性能领先。基于该产品,中兴通讯能够有效满足低时延、大带宽的存储业务需求,为数字经济赋能,也为新质生产力的发展做出突出贡献。

  • AI日报:GPT-4Turbo向所有付费用户开放;谷歌将推3款免费AI工具;百度将发布AI原生操作系统DuerOS X,中山大学“梗王”大模型靠讲笑话入选顶会CVPR

    欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。

  • 中山大学“梗王”大模型CLoT 靠讲笑话入选顶会CVPR

    中山大学HCP实验室联合SeaAILab和哈佛大学等单位开展的一项研究,成功地让大型人工智能模型通过讲笑话的方式,探索多模态大模型的创造力,并因此获得了计算机视觉和模式识别领域的顶级会议CVPR的认可。这项研究的关键在于使用来自日本的“大喜利”创新响应游戏作为数据源。此次研究的成功,不仅展示了该实验室在AI领域的创新能力,也为未来的人工智能研究提供了新的