首页 > 关键词 > 小模型最新资讯
小模型

小模型

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解:https://top.aibase.com/1、阿里对口型项目EMO开启内测可将照片转为唱歌视频阿里推出的对口型项目EMO开启内测,用户只需提供一张照片和语音模型即可定制数字人像,实现低成本高效率的数字人出镜体�...

特别声明:本页面标签名称与页面内容,系网站系统为资讯内容分类自动生成,仅提供资讯内容索引使用,旨在方便用户索引相关资讯报道。如标签名称涉及商标信息,请访问商标品牌官方了解详情,请勿以本站标签页面内容为参考信息,本站与可能出现的商标名称信息不存在任何关联关系,对本页面内容所引致的错误、不确或遗漏,概不负任何法律责任。站长之家将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。任何单位或个人认为本页面内容可能涉嫌侵犯其知识产权或存在不实内容时,可及时向站长之家提出书面权利通知或不实情况说明,并提权属证明及详细侵权或不实情况证明(点击查看反馈联系地址)。本网站在收到上述反馈文件后,将会依法依规核实信息,第一时间沟通删除相关内容或断开相关链接。

与“小模型”的相关热搜词:

相关“小模型” 的资讯4366篇

  • AI日报:阿里对口型视频项目EMO开启内测;苹果官宣端侧小模型OpenELM;Open-Sora偷偷升级;微信发布AI工具小微助手

    欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解:https://top.aibase.com/1、阿里对口型项目EMO开启内测可将照片转为唱歌视频阿里推出的对口型项目EMO开启内测,用户只需提供一张照片和语音模型即可定制数字人像,实现低成本高效率的数字人出镜体�

    EMO
  • 算力不足,小模型成AI模型发展下个方向?

    大模型不是AI的唯一出路,把模型做小也是本事。AI模型界是真的热闹,新的模型不断涌现,不管是开源还是闭源,都在刷新成绩。谁能在将模型做小的同时能实现性能的增长,也是实力的体现。

  • 微软AI研究推数学LLM Orca-Math:通过对Mistral-7B模型进行微调的7B参数小模型

    微软研究团队引领着教育技术领域的不断创新,近日推出了一款名为Orca-Math的前沿工具,它是一款小语言模型,拥有7亿参数,并基于Mistral-7B架构微调来。这一创新方法重新定义了传统数学单词问题教学的策略,彻底改变了学生参与和掌握这一学科的方式。通过利用SLM通过合成数据集和迭代反馈来解锁学习工具的全新时代,Orca-Math为技术和学习手牵手走向解锁全球学生的全部潜力的未来提供了一瞥。

  • 智源研究院推出新一代多模态小模型Bunny-3B

    智源研究院近期提出了一项新技术,通过数据浓缩技术获得高质量训练数据,从提升多模态小模型的性能。他们将LAION-2B压缩成2M核心集,得到更丰富的预训练数据,同时精选数据集进行指令微调,训练出性能强劲的小模型。通过数据浓缩技术获得高质量训练数据,Bunny系列小模型在多模态任务上表现优异,将促进大模型技术的发展和普及。

  • AI视野:谷歌推小模型MobileDiffusion;Midjourney测试风格一致性功能;字节跳动推AI Bot开发平台扣子;LLaVA-1.6赶超Gemini Pro

    欢迎来到【AI视野】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。

  • 三个臭皮匠顶个诸葛亮?可能是真的,已证实混合多个小模型性能比肩GPT3.5

    对模型参数量的迷信、执念也许可以放下了,混合多个小模型也是未来构造对话型AI的一个光明的方向。在对话型人工智能研究中,存在趋势即朝着开发参数更多的模型方向发展,如ChatGPT等为代表的模型。混合模型通过协作多个较小的对话型人工智能,在提供比单个更大的对话型人工智能更高质量的对话方面是有效的。

  • 异军突起的小模型,有多大想象空间?

    大模型之战进入到今日,许多开发者都面临着一个共同的挑战:如何在保证高性能的同时,降低资源和算力的需求?这一困境在端侧应用尤为明显,因为许多设备和应用场景对计算能力和存储空间有严格的限制。这无疑大大制约了大模型在各种设备和场景中的普及。对一线研究者言,唯有自由地践行自己的技术构想,在初期不过多地被资本干涉与左右,才更有可能做出亮眼的成果

  • 源代码is all you need!7B代码小模型同尺寸无敌,性能媲美ChatGPT和谷歌Gemini

    HuggingFace技术负责人PhilippSchmid表示:“代码自动补全工具,如GitHubCopilot,已被超过一百万开发者使用,帮助他们的编码速度提高了55%。看到像Magicoder和OSS-INSTRUCT这样的开源创新超越了OpenAI的GPT-3.5和GoogleDeepMind的GeminiUltra,真是令人振奋。张令明老师现任UIUC计算机系副教授,主要从事软件工程、机器学习、代码大模型的相关研究,更多详细信息请见张老师的个人主页:https://lingming.cs.illinois.edu/。

  • OpenAI新研究:让小模型来监督大模型能显著提高泛化性能

    人工智能的超级对齐问题在未来AI系统超越人类智能的情境下变得尤为复杂。研究小模型是否能够有效监督大模型成为关键问题。期待研究者在这一领域取得更多的突破。

  • 小模型也可以「分割一切」,Meta改进SAM,参数仅为原版5%

    对于2023年的计算机视觉领域来说,「分割一切」是备受关注的一项研究进展。Meta四月份发布的「分割一切模型」效果,它能很好地自动分割图像中的所有内容SegmentAnything的关键特征是基于提示的视觉Transformer模型,该模型是在一个包含来自1100万张图像的超过10亿个掩码的视觉数据集SA-1B上训练的,可以分割给定图像上的任何目标。图3、4、5提供了一些定性结果,以便读者对Effic

    SAM
  • 大模型+小模型,AI手机 METAVERTU2 既要安全 又要个性化运算

    2023年11月1日,英国奢侈手机品牌VERTU在香港举办了新品发布会,推出全球首款双模型AI手机——METAVERTU2。VERTU在去年发布了全球首款Web3手机,今年又将Web3与AI相结合,通过AI模型标记数据,AIAgent处理任务的方式,将METAVERTU2打造成更懂你的PERSONALAI。METAVERTU2的发布不仅体现在其产品技术的精益求精,更展现在对奢侈品与手机行业的深入理解和不断赋予的新定义。

  • ChatGPT/GPT-4/Llama电车难题大PK!小模型道德感反而更高?

    微软对大语言模型的道德推理能力进行了测试,但在电车问题中大尺寸的模型表现反比小模型差。但最强大语言模型GPT-4的道德得分依旧是最高的。这与研究最初的假设:大型模型总是比小型模型具有更强的能力相反,说明利用这些较小的模型开发道德系统具有很大的潜力。

  • Chinchilla之死:只要训练足够长时间,小模型也能超过大模型

    2022年3月,DeepMind一篇论文《TrainingCompute-OptimalLargeLanguageModels》通过构建的Chinchilla模型得出了一个结论:大模型存在训练不足的缺陷,模型大小和训练token的数量应该以相等的比例扩展。也就是说模型越大,所使用的训练token也应该越多。如果学习率遵循分配给更少训练步骤的余弦调度,其在同等训练时间下的损失会更低。

  • GPT-4太烧钱,微软想甩掉OpenAI?曝出Plan B:千块GPU专训「小模型」,开启必应内测

    GPT-4太吃算力,微软被爆内部制定了PlanB,训练更小、成本更低的模型,进摆脱OpenAI。GPT-4太吃算力,连微软也顶不住了!今年,无数场微软AI大会上,CEO纳德拉台前激动地官宣,将GPT-4、DALL·E3整合到微软「全家桶」。毕竟后者对哪些公司可以将其开源LLM进行商业化是有所限制的。

  • LobeChat支持通过网页版直接调用Ollama 本地模型 体验媲美ChatGPT

    LobeChat是一个创新的网页平台,它支持通过网页版直接调用Ollama本地模型。这项服务的推出,为用户提供了一种便捷的方式,通过网页界面直接利用开源大模型的能力。体验地址:https://chat-preview.lobehub.com/chat随着LobeChat等工具的不断发展,我们可以预见未来将有更多集成本地大模型的网页应用出现,为用户提供更丰富的交互体验和更高效的工作流程。

  • AI日报:当前最强国产Sora大模型Vidu发布;Kimi Chat移动端升级;通义千问开源首个千亿参数模型;苹果计划与 OpenAI 合作

    欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解:https://top.aibase.com/1、清华团队发布视频大模型Vidu可生成16秒、1080P视频清华大学与生数科技在中关村论坛未来人工智能先锋论坛上发布了中国首个长时长、高一致性、高动态性视频大模型Vidu,标志�

  • 久其女娲平台2.0全新升级!AI大模型加速,赋能政企数治未来

    4月25日,久其女娲平台2.0发布会在线成功举办。活动以 “数治未来 大模型加速” 为主题,通过专题报告、功能路演等环节,集中介绍了久其女娲平台作为久其新一代政企赋能底座,在以新质生产力为引领、AI大模型加速的新趋势下的全新定位与功能创新。高度聚焦政策导向,以创新引领服务升级,女娲平台2.0的发布彰显了久其软件作为卓越的政企产品与服务提供商的重要价值

  • 每日互动持续增强大模型能力,推出、升级多款大模型应用产品

    人工智能引领的"第四次工业革命"正在到来,特别是2023年以来,以大模型、多模态、生成式为特征的新一轮人工智能浪潮席卷全球,带来新的变革。在这机遇与挑战并存的时期,国内专业的数据智能服务商--每日互动快速响应、积极探索大模型、AIGC等先进数智技术,升级产品性能,驱动业务创新,并储备公司下一条S型曲线。每日互动本身就是优质数据资源的持有方,因此在未来,拥有海量鲜活的数据积累、深厚沉淀的数据治理能力、丰富多元的数据应用场景的每日互动将更有可为。

  • 元象开源首个多模态大模型XVERSE-V 支持任意宽高比图像输入

    元象公司发布了首个多模态大型模型XVERSE-V,并将其开源。这一模型支持任意宽高比的图像输入,并在多个权威评测中取得了优异的成绩。除了图像识别,XVERSE-V还在多个实际应用场景中表现突出,包括信息图理解、视障场景处理、文本生成、教育解题等。

  • 阿里开源千亿参数模型 Qwen1.5-110B,性能超越 Meta-Llama3-70B

    阿里巴巴宣布开源其最新的Qwen1.5系列语言模型-Qwen1.5-110B。这是Qwen1.5系列中规模最大的模型,也是该系列中首个拥有超过1000亿参数的模型。它在与最近发布的SOTA模型Llama-3-70B的性能上表现出色,并且明显优于72B模型。

  • Meta 推出 LayerSkip:提升大语言模型推理速度

    Meta公司最新发布了LayerSkip,这是一款端到端的解决方案,专门设计用于提升大型语言模型的推理速度。这一技术在不同规模的Llama模型上经过了广泛的训练实验,并在多个任务上展现了显著的性能提升。未来展望:随着LayerSkip技术的不断完善和应用,预计将为大语言模型的部署和使用带来更多可能性,特别是在需要快速处理大量语言数据的场合。

  • LLaVA++:为Phi-3和Llama-3模型增加视觉处理能力

    LLaVA项目通过扩展现有的LLaVA模型,成功地为Phi-3和Llama-3模型赋予了视觉能力。这一改进标志着AI在多模态交互领域的进一步发展。LLaVA的推出,预示着未来AI模型将更加智能和灵活,能够更好地服务于需要视觉与文本结合理解的复杂场景。

  • 国际顶尖水平!首个Sora级国产自研视频大模型Vidu发布

    在2024中关村论坛年会未来人工智能先锋论坛上,生数科技联合清华大学发布中国首个长时长、高一致性、高动态性视频大模型Vidu。这也是自Sora发布之后全球率先取得重大突破的视频大模型,性能全面对标国际顶尖水平在加速迭代提升中。除了在时长方面突破,Vidu在视频效果方面也实现了显著提升,主要包括:能够生成细节复杂的场景,且符合真实的物理规律;能够生成真实世界不存在的虚构画面,创造出具有深度和复杂性的超现实主义内容;能够生成复杂的动态镜头,不再局限于简单的推、拉、移等固定镜头是能够围绕统一主体在一段画面里就实现远景、近景、中景、特写等不同镜头的切换;在16秒的时长上保持连贯流畅,随着镜头的移动,人物和场景在时间、空间中能够保持一致;能够生成特有的中国元素,例如熊猫、龙等。

  • 清华团队发布视频大模型Vidu 可生成16 秒、1080P 视频

    生数科技与清华大学在中关村论坛未来人工智能先锋论坛上共同发布了中国首个长时长、高一致性、高动态性视频大模型——Vidu。这款模型是国内首个达到Sora级别的视频大模型,标志着中国在视频生成技术领域的重要进展。开源成就:2023年3月,团队开源了基于U-ViT架构的多模态扩散模型UniDiffuser,这是全球首个此类模型,验证了U-ViT架构的大规模可扩展性。

  • 照片分享平台EyeEm被收购后 将用户照片用于训练人工智能模型

    柏林照片分享社区EyeEm在去年被西班牙公司Freepik收购后,正在采取一项引发争议的举措-将用户上传的照片用于训练人工智能模型。EyeEm最近通过电子邮件通知用户,它正在其条款和条件中添加一项新条款,授予其"训练、开发和改进软件、算法和机器学习模型"的权利。开放社交网络Pixelfed已明确表示,它永远不会使用用户图像来训练AI模型,并以此吸引EyeEm的用户。

  • 终局之战!OpenAI Sora大佬专访:AI视频模型仍处在GPT-1时代

    【新智元导读】Sora一出,谁与争锋!近日,Sora团队的三位负责人AdityaRamesh、TimBrooks和BillPeebles接受了采访,解读了Sora在模拟现实、预测结果和丰富人类体验等方面带来的变革。对于视频生成领域,大家一致的看法就是:Sora一出,谁与争锋!然,身处于风口浪尖的Sora团队成员怎么看?近日,Sora的三位领导者,Aditya、Tim和Bill接受了专访。「这是令人兴奋的时刻,我们期待未来模型的�

  • 中国首个Sora级大模型Vidu:文本生成16秒,1080p高清视频

    4月27日,在2024中关村论坛-未来人工智能先锋论坛上,清华大学联合生数科技正式发布了,中国首个长时间、高一致性、高动态性视频大模型——Vidu。Vidu采用了原创的Diffusion与Transformer融合的架构U-ViT,支持文本生成长达16秒、分辨率高达1080P的高清视频内容。生数科技致力打造世界领先的多模态大模型,融合文本、图像、视频、3D等多模态信息,探索生成式AI在艺术设计、游戏�

  • 通义千问团队开源首个千亿参数模型Qwen1.5-110B

    通义千问团队开源的首个千亿参数模型,Qwen1.5-110B。该模型在基础能力和Chat评估中表现出色,与其他同类模型相比有显著提升。团队将继续探索模型规模提升和扩展预训练数据规模两种方法带来的优势。

  • 清华团队国产“Sora”火了:生数科技发布视频大模型「Vidu」

    在中关村论坛的未来人工智能先锋论坛中,生数科技与清华大学携手,正式推出了中国首个具备长时长、高一致性及高动态性的视频大模型——“Vidu”。这款引领时代的视频大模型,其核心在于团队原创的Diffusion与Transformer融合的U-ViT架构。作为通用视觉模型,Vidu能够生成更加多样化、更长时长的视频内容,其灵活的架构也将为未来兼容更广泛的模态、拓展多模态通用能力的�

  • 震撼!GPT-4 Turbo级国产大模型登场,周冠宇F1赛事数据秒分析惊呆国际大佬

    中国的大模型,已经震惊了外国科技圈。这几天商量大模型的更新,直接让外国网友惊呼:太疯狂了,中国的AI界究竟还有多少我们不知道的巨变?不怪这些网友太大惊小怪——最近全新升级的日日新·商量大模型5.0,在基础能力上再次重大更新,直接把大模型能力升级到新的阶段,直观印象可感的那种。还真是有点期待日日新6.0的诞生了。

热文

  • 3 天
  • 7天