11.11云上盛惠!海量产品 · 轻松上云!云服务器首年1.8折起,买1年送3个月!超值优惠,性能稳定,让您的云端之旅更加畅享。快来腾讯云选购吧!
【新智元导读】最大开源模型,再次刷爆纪录!Snowflake的Arctic,以128位专家和4800亿参数,成为迄今最大的开源模型。是又大又稀疏,因此计算资源只用了不到Llama38B的一半,就达到了相同的性能指标。他本人的研究兴趣是机器学习与系统的交叉领域。
GPT-4又又又被超越了!近日,LLM竞技场更新了战报,人们震惊地发现:居然有一个开源模型干掉了GPT-4!这就是Cohere在一周多前才发布的CommandR。排行榜地址:https://huggingface.co/spaces/lmsys/chatbot-arena-leaderboard截至小编码字的这个时间,竞技场排行榜更新到了4月11号,CommandR拿到了2.3万的投票,综合得分超越了早期版本的GPT-4,和GPT-4-0314版本并列第7位,——它可是一个开源模型。2024年,在开源和闭源两条道路上,LLM都发展迅猛。
HuggingFace最近发布了一款名为“HuggingChat”的iOS客户端应用,为用户带来了便捷。用户现在可以在手机上访问和使用HuggingFace平台上托管的各种开源模型。HuggingFace的这一创新举措,再次展示了其在语言模型领域的领先地位和对用户需求的关注。
在Create2024百度AI开发者大会上,百度创始人、董事长兼首席执行官李彦宏分享了他对于AI技术发展趋势的独特见解。他明确指出,开源模型在当前的AI发展中正逐渐显露出其局限性,预示着其可能逐渐落后于时代。通过灵活应用文心4.0等基础模型,百度正致力于推动AI技术的更广泛应用,以满足不同场景下的多元化需求。
Picsart人工智能研究所、德克萨斯大学和SHI实验室的研究人员联合推出了StreamingT2V视频模型。通过文本就能直接生成2分钟、1分钟等不同时间,动作一致、连贯、没有卡顿的高质量视频。视频中的物体运动姿态丰富,场景和物体随时间的演变更加自然流畅,没有突兀的断层或冻结情况出现。
欢迎来到【今日AI】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解:https://top.aibase.com/📰🤖📢AI新鲜事DBRX抢占开源大模型王座编程、数学等领域超越GPT-3.5Claude3再次登顶!化学专业一骑绝尘,全面碾压GPT-4清明节前AI复活亲人成热门生意:几十元到上百元不等微软亚�
DBRX是一个由Databricks的Mosaic研究团队构建的通用大型语言模型,在标准基准测试中表现优于所有现有开源模型。它采用Mixture-of-Experts架构,使用362亿个参数,拥有出色的语言理解、编程、数学和逻辑推理能力。为了体验「DBRX」的强大功能,请访问AIbase网站查看更多介绍。
Grok-1,由xAI推出的314亿参数的专家混合模型,标志着在大型语言模型领域的一大步。该模型未经针对特定应用的微调,展现了Grok-1预训练阶段的原始基础模型检查点。为了深入了解「Grok-1」的能力,请访问官网查看更多详情。
HPT是HyperGAI研究团队推出的新型多模态大型语言模型框架。它具有高效且可扩展地训练大型多模态基础模型的能力,能够理解包括文本、图像、视频等多种输入模态。点击前往HPT官网体验入口需求人群:"适用于需要处理和理解多模态数据的研究人员和开发者,如进行视觉-语言任务、图像分析、图表解读等。
Grok-1是一个全球热门的大型语言模型,专家混合模型,包括了314亿参数的训练。该模型未经针对特定应用的微调,是Grok-1预训练阶段的原始基础模型检查点。了解更多关于Grok-1的信息,访问官网。
Chat-With-MLX是一个利用苹果MLX框架实现的高效、多语言支持的检索增强生成聊天界面。这个聊天界面可以轻松地自动集成任何HuggingFace和MLX兼容的开源模型,并支持通过URL与Doc、PDF、txt文件和YouTube视频进行交互聊天。希望Chat-With-MLX能够为用户带来更加愉快和高效的使用体验。
StarCoder2是一款专为代码生成和分析设计开源模型,拥有3B、7B和15B参数版本,具备16384令牌上下文窗口,在3-4万亿Tokens上进行训练。其支持的600多种编程语言使其成为多领域开发者的得力助手。StarCoder2的推出为开发者提供了一个全方位的代码支持工具,不仅能够提高开发效率在代码质量、学习与教育以及代码优化等方面发挥着积极作用。
Gemma-2B-IT是谷歌推出的2B参数指令调整模型,基于Gemini架构,专为提高数学、推理和代码处理能力设计。该模型在普通笔记本上即可运行,无需庞大的AI算力,适用于多种应用场景。赶快体验这款强大的AI写作指令调整工具吧!
Gemma-2b是谷歌推出的开源预训练语言模型系列,提供了多个不同规模的变体。它可以生成高质量的文本,广泛应用于问答、摘要、推理等领域。要了解更多关于Gemma-2b的信息和开始使用这一全球热门的预训练模型,请访问Gemma-2b官方网站。
欢迎来到【AI视野】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
RMBGv1.4是一个新的背景分割开源模型,最近引起了广泛的关注。这个模型的效果非常出色,让人感觉与目前市面上顶尖产品removebg的效果不相上下。通过不断地优化和改进,RMBGv1.4有望成为行业内的翘楚,为用户提供更好的背景分割体验。
MGIE是一项由苹果开源的技术,利用多模态大型语言模型生成图像编辑指令,通过端到端训练,捕捉视觉想象力并执行图像处理操作,使图像编辑更加智能、直观。点击前往MGIE官网体验入口MGIE旨在满足以下需求人群:"用户可以通过自然语言直观地描述图像编辑需求,如改变颜色、调整大小等,无需复杂的描述或区域掩码,使图像编辑更加自由和轻松。欢迎访问MGIE官方网站,体验这一前沿的多模态大语言模型图像编辑工具。
这几天引发了AI社区大讨论的逼近GPT-4性能的泄漏模型「miqu」,的确是Mistral公司训练的一个旧模型的量化版。冲上各大榜单的这个开源模型引发开发者热议,开源AI或已进入关键时刻。靠着GPT-4Turbo和GPT-4V,OpenAI已经竭尽全力保持优势,但开源AI社区的迅速追赶,已经不容忽视了。
Allen人工智能研究机构在HuggingFace和GitHub上发布了首个开放语言模型OLMo,意在通过提供数据、代码、模型和评估工具的开放访问,促进人工智能领域的共同研究。这一举措的首批模型包括7B和1B规模的变体,覆盖不同架构和训练硬件,为未来更大规模、指令调整等模型的发布奠定基础。通过提供权重的开放访问,并鼓励合作,Allen致力于共同构建全球最卓越的开放语言模型,助力人工智能技术的进步。
Google与HuggingFace近日宣布战略合作,旨在推动开放AI和机器学习的发展。这一合作将集成HuggingFace的平台与GoogleCloud的基础设施,包括VertexAI,旨在使生成式AI更易于开发者使用。包括VertexAI和GKE部署选项,预计将在2024年上半年提供给HuggingFaceHub用户。
从Llama、Llama2到Mixtral8x7B,开源模型的性能记录一直在被刷新。由于Mistral8x7B在大多数基准测试中都优于Llama270B和GPT-3.5,因此它也被认为是一种「非常接近GPT-4」的开源选项。通过这些新颖的算法,他们希望聚合并分析数字注意力生态系统中以往非结构化的专题数据,为客户提供隐藏的市场脉搏信息。
生成式AI占据着2023年诸多头条新闻,2024年大概也会如此。随着大模型的持续进步,许多玩家在讨论:AI会朝着什么方向发展?2024年AI行业会遇冷吗?或者迎来新的突破和更广泛的应用?监管者和公众将如何应对?“头号AI玩家”整理汇总了近期海内外各大AI公司、AI研究者、风险投资人、科技媒体的主要观点,他们就生成式AI的未来、AIAgent、多模态、开源和闭源模型之争、AI安全等话题�
随着人工智能领域的不断发展,新的创新层出不穷,科学家和研究人员需要时刻保持对未来潜在发展的关注。在一条最近的推文中,Twitter用户Santiago强调了在大型语言模型应用程序开发、检索增强生成工作流、优化开源模型、实施开源模型以及一般工程能力等领域的专业知识需求。MonsterAPI托管了许多最先进的模型,包括Dreambooth、Whisper、Bark、Pix2Pix和StableDiffusion,并通过直观的API以比其他选项节省高达80%的价格提供给开发人员。
Mistral最近发布了Mixtral8x7B模型,这一举动在AI圈引起了巨大反响。这一模型超越了业界知名的GPT-3.5和Meta的Llama2家族,在开源AI领域掀起了轩然大波。但正如宾夕法尼亚大学沃顿商学院教授兼AI影响者EthanMollick在X上指出的那样,Mistral8x7B似乎“没有安全防护栏”,这意味着那些受够OpenAI日益严格的内容政策的用户,现在有了一个性能相当的模型可供选择,但也引发了对安全性的担
BSChecker:细粒度大模型幻觉检测工具与基准测试排行榜大模型长期以来一直存在一个致命的问题,即生成幻觉。由于数据集的复杂性,难免会包含过时和错误的信息,这使得输出质量面临着极大的挑战。对于BSChecker来说,引入一个关于有益性的评估标准可能很重要。
近期上海AI实验室与Meta合作推出的开源模型标志着在3D空间音频领域迈出的一大步。该模型通过处理头戴式麦克风的输入音频信号和分析人体姿态关键点,成功地实现了为人体生成3D空间音频的目标。未来仍需进一步优化和拓展,以满足更广泛的应用场景和设备要求。
国内此前开源了多个70到130亿参数大模型,落地成果涌现,开源生态系统初步建立。随着智能体等任务复杂性与数据量的提升,业界与社区对更「大」模型的需求愈发迫切。在3D领域,已自主研发出行业引领性的「端云协同」3D互动技术,开创零门槛、一站式、高品质全新3D体验;在AI领域,开源中国最大参数可商用大模型XVERSE-65B,旨在推动大模型国产可替代与行业应用发展。
李开复是一位著名的计算机科学家,他以西方畅销书《AISuperpowers》和在中国对人工智能独角兽的投注闻名。他最近创办了一家名为01.AI的新公司,旨在满足中国市场对大型语言模型的需求。李开复的01.AI计划有望在未来获得成功,为中国市场带来创新和解决方案。
腾讯和香港科技大学最近合作推出了一种全新的视频生成模型VideoCrafter,用于高质量视频生成。这个模型包括视频VAE和3D去噪U-net,经过在庞大的数据集上进行了训练,其性能表现出色,超过了其他开源视频生成模型。项目鼓励使用其代码、模型和数据的研究引用,并采用Apache2.0许可分发其代码、模型和数据。
开源界最强的中英双语大模型,悟道·天鹰34B,来了!有多强?一言蔽之:不仅模型够大够能打还一口气送上整套“全家桶”级豪华周边。能有如此大手笔的,正是中国大模型开源派先锋——智源研究院。Aquila2模型全系开源地址:https://github.com/FlagAI-Open/Aquila2https://model.baai.ac.cn/https://huggingface.co/BAAIAquilaSQL开源仓库地址:https://github.com/FlagAI-Open/FlagAI/tree/master/examples/Aquila/Aquila-sqlFlagAttenti