11.11云上盛惠!海量产品 · 轻松上云!云服务器首年1.8折起,买1年送3个月!超值优惠,性能稳定,让您的云端之旅更加畅享。快来腾讯云选购吧!
【新智元导读】最大开源模型,再次刷爆纪录!Snowflake的Arctic,以128位专家和4800亿参数,成为迄今最大的开源模型。是又大又稀疏,因此计算资源只用了不到Llama38B的一半,就达到了相同的性能指标。他本人的研究兴趣是机器学习与系统的交叉领域。
近日,Meta重磅推出其80亿和700亿参数的MetaLlama3开源大模型。该模型引入了改进推理等新功能和更多的模型尺寸,并采用全新标记器,旨在提升编码语言效率并提高模型性能。即使80亿参数的Llama3模型比70亿参数的Llama2模型参数更高,在AWSm7i.metal-48xl实例上运行BF16推理时,整体prompt的推理时延几乎相同。
JetMoE-8B是一款采用稀疏激活架构的人工智能模型,其性能卓越且训练成本不到10万美元,令人惊讶的是,它的表现甚至超越了LLaMA2-7B、LLaMA-13B和DeepseekMoE-16B。JetMoE-8B由24个块组成,每个块包含两个MoE层:注意力头混合和MLP专家混合。这不仅证明了其在性能上的优势,也展示了其在成本效益上的显著优势。
Llama2是由MetaAI开发的一款先进的人工智能模型,专注于理解和生成人类语言文本。这一模型自2023年推出以来,已成为自然语言AI处理领域的一个关注点。由于内容生成式AI工具对算力的高要求,部署在高性能主机或服务器上的Llama2面临着远程访问的难题,这时贝锐花生壳内网穿透技术成为了一个简单有效的解决方案,简单的三步操作,用户可以轻松实现远程访问本地部署的Llama2,无需复杂的网络配置节省了大量时间成本,如需了解贝锐花生壳更多的AI场景应用或申请试用,可以搜索“贝锐花生壳”进入官网。
随着人工智能技术的发展,视频生成领域取得了长足的进步。在现有的文本到视频生成模型中,对镜头姿势的精确控制往往被忽视镜头姿势在视频生成中扮演着表达更深层叙事细微差别的影视语言角色。这一技术的应用前景广阔,有望在视频生成领域发挥重要作用。
马斯克宣布将在本周开源由xAI旗下公司推出的生成式AI产品——Grok。这款类ChatGPT产品于去年11月首次亮相,针对生成文本、代码、邮件和信息检索等多个领域提供功能。以上内容参考xAI官网,如有侵权请联系删除。
英伟达最新推出的大型语言模型Nemotron-415B,以其卓越性能和创新架构引起广泛关注。该模型拥有150亿参数,基于庞大的8万亿文本标注数据进行了预训练。这一成就为大型语言模型的发展和应用提供了崭新的视角。
MistralAI是一家总部位于法国的人工智能公司,专注于将公开可用的模型提升至最先进的性能水平。他们主要致力于构建快速安全的大型语言模型,可用于各种任务,如聊天机器人和代码生成。MistralAI模型具有以下优势:MistralAI的模型即将登陆AmazonBedrock,让用户能够更灵活地选择最适合其需求的高性能基础模型,构建并扩展生成式AI应用程序。
网络犯罪团伙已开始利用生成式人工智能进行攻击,包括Meta的Llama2大型语言模型,根据网络安全公司CrowdStrike周三发布的年度全球威胁报告。据CrowdStrike报道,一个名为ScatteredSpider的组织利用Meta的大型语言模型生成了Microsoft的PowerShell任务自动化程序脚本,用于下载“一家北美金融服务公司受害者”的员工登录凭证。那些举办选举的国家中政治活跃的党派很可能会使用生成式人工智能制造虚假信息,以在自己的圈子内传播。
尽管如今的AI圈花样层出、新闻满天,但OpenAI的新动向仍然一直是人们最关注的话题之一。OpenAI首席执行官SamAltman就在参加达沃斯论坛时高调表示,公司目前的首要任务就是推出下一代大型语言模型,可能被称为GPT-5。AI竞赛风起云涌,奥特曼不敢停下来事实上,奥特曼这一年到头永动机一样地为OpenAI上下奔走,实在是因为咄咄逼人的对手太多,不得不卷。
【新智元导读】AI训AI必将成为一大趋势。Meta和NYU团队提出让大模型「自我奖励」的方法,让Llama2一举击败GPT-40613、Claude2、GeminiPro领先模型。还有人表示「令人惊讶的是,每次迭代的改进几乎保持线性,仅在3次迭代之后,就已经接近GPT-4级别」。
大模型领域中,微调是改进模型性能的重要一步。随着开源大模型逐渐变多,人们总结出了很多种微调方式,其中一些取得了很好的效果。大模型可以通过搜索数据库来验证其答案的准确性,从获得更准确和可靠的输出。
欢迎来到【AI视野】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解:https://top.aibase.com/🤖📱💼AI应用1、百度推出视频生成模型UniVG可处理各种文本和图像的组合输入【AiBase提要:】⭐UniVG是一种“统一模态视频生成系统”。🔸研究强调了预训练数据筛选过程中的复杂
目前内容产业的数据积累在3D模型和4D动画等方面仍较为薄弱。为了满足即将到来的多维沉浸式体验,清华系创业团队生数科技近期联合清华大学、同济大学等高校推出了全球首个基于「骨骼动画」的4D动画生成框架「AnimatableDreamer」。这些技术的创新能力将为未来的多维数字体验和人机交互带来更多可能性,从开启全新的内容娱乐与消费模式。
MagicVideo-V2是一种革命性的视频生成技术,集成了文本到图像模型、视频运动生成器、参考图像嵌入模块和帧插值模块,用于生成外观美观、高分辨率的视频,提供出色的保真度和平滑性。📰🤖📢AI新鲜事OpenAI推出自定义GPT商店OpenAI在官网正式发布了自定义GPT商店,用户可以分享和寻找最流行、最好用的自定义ChatGPT助手。Amphion音频生成工具包开源上海AI实验室、香港中文大学�
当地时间12月24日,SamAltman在X平台上罕见地发起了一个「许愿池」,「希望OpenAI在2024年构建/修复什么?」,这条推文迅速吸引AI领域众多大佬和网友的参与。如果计划像OpenAI一样的闭源,可能是通往SuperAPP的唯一通路开源只是ToB的获客手段。这些问题需要综合考虑,并在AI的发展过程中制定相应的规范和政策。
2023年即将结束,SamAltman发布了年终总结,分享了17个建议。他感激OpenAI团队推出ChatGPT,认为2023年是全球开始认真对待AI的一年。17.与优秀的人共事是人生中最美好的经历之一。
微软是迄今为止生成式人工智能热潮的最大赢家之一,这要归功于其早期支持OpenAI并整合了后者初创公司的技术进入Bing、Azure和各种其他服务,其显然一直在努力避免将所有人工智能鸡蛋放在一个篮子里。图片来自Microsoft如今,该公司宣布将Meta的竞争对手开源AI模型Llama2作为「模型即服务」引入AzureAIStudio,其云平台AI。Llama-2和GPT-4TurbowithVision可以。
TogetherAI最新发布了StripedHyena-7B,这一人工智能模型领域的创新力量引起了广泛关注。该模型的基础版本为StripedHyena-Hessian-7B,同时还推出了聊天模型StripedHyena-Nous-7B。读者可以查看该项目的博客和项目详细信息,对此研究给予所有研究人员应有的赞誉。
微软研究院今天宣布发布其Phi-2小语言模型,这是一种文本到文本的人工智能程序,具有27亿个参数。Phi-2的性能可与其他更大的模型相媲美,包括Meta的Llama2-7B和Mistral-7B。想要在其之上构建产品的企业就不走运了。
微软研究院当地时间周二宣布其Phi-2小型语言模型,这是一款文本到文本的人工智能程序,据X平台的一篇帖子称,它「足够小,可以在笔记本电脑或移动设备上运行」。Phi-2拥有27亿参数,性能堪比其他更大的模型,包括Meta的Llama2-7B和Mistral-7B。希望在其基础上构建产品的企业暂时无缘。
仅次于GPT-4,李开复零一万物Yi-34B-Chat最新成绩公布——在Alpaca经认证的模型类别中,以94.08%的胜率,超越LLaMA2Chat70B、Claude2、ChatGPT!不仅如此,在加州大学伯克利分校主导的LMSYSORG排行榜中,Yi-34B-Chat也以1102的Elo评分,晋升最新开源SOTA开源模型之列,性能表现追平GPT-3.5。在五花八门的大模型评测中,伯克利LMSYSORG排行榜采用了一个最为接近用户体感的“聊天机器人竞技场”特殊测评模式,让众多大语言模型在评测平台随机进行一对一battle,通过众筹真实用户来进行线上实时盲测和匿名投票,11月份经25000的真实用户投票总数计算了20个大模型的总得分。”现在,Eric已经成为Yi-34B的忠实拥趸,会使用Yi-34b-200k数据集训练其他的模型产品,并感叹丝滑般的训练体验。
家人们谁懂,连大模型都学会看好莱坞大片了,播放过亿的GTA6预告片大模型还看得津津有味,实在太卷了!让LLM卷出新境界的办法简单到只有2token——将每一帧编码成2个词即可搞定。如果对描述指令有疑惑的,Demo也给出了一些示例,感兴趣的小伙伴们不妨来pick一下这个电影搭子。
2020年11月,苹果推出M1芯片,其速度之快、功能之强大一时令人惊艳。2022年苹果又推出了M2,今年10月,M3芯片正式登场。图源:https://github.com/ml-explore/mlx-examples/tree/main/mnistMLX还有其他更多有用的示例,包括如下:Transformer语言模型训练;LLaMA大规模文本生成和LoRA微调;StableDiffusion生成图片;OpenAI的Whisper语音识别。
斯坦福大学和卡内基梅隆大学的研究团队联合提出了一种新的序列模型,名为Mamba,它在语言、音频和DNA序列等任务上超越了Transformer模型。Mamba采用了一种新的架构,具有线性复杂度和更高的推理吞吐量。Mamba的出现对于序列建模领域来说是一个重要的突破,未来还有许多研究和实践的工作需要进行。
在别的领域,如果你想形容一个东西非常重要,你可能将其形容为「撑起了某领域的半壁江山」。但在AI大模型领域,Transformer架构不能这么形容,因为它几乎撑起了「整个江山」。与类似规模的Transformer相比,Mamba具有5倍的生成吞吐量Mamba-3B的质量与两倍于其规模的Transformer相当。
阿里云开源了通义千问Qwen-72B、Qwen-1.8B以及音频大模型Qwen-Audio,提供对话模型和量化版,支持开发者推理训练。体验地址:https://modelscope.cn/studios/qwen/Qwen-72B-Chat-Demo/summaryDeepMind发布自监督扩散模型SODAGoogleDeepMind发布的自监督扩散模型SODA通过无监督方式精准控制扩散模型,实现风格与内容分离及3D视图生成。基于大学水平考试的多模�
亚马逊宣布推出全新一代语音基础模型驱动的ASR系统,将自动语音识别服务扩展到支持100多种语言。AmazonTranscribe是一项完全托管的ASR服务,使您能够轻松地将语音转换为文本,并在应用程序中添加语音到文本的功能。要了解本文讨论的功能的更多信息,请查看功能页面和新功能帖子。
在OpenAI发生权力斗争和大规模辞职的时刻,微软作为AI巨头的长期支持者,依然在其人工智能努力上不懈努力。微软公司的研究部门今日发布了Orca2,这是一对小型语言模型,经测试在复杂推理任务的零样本设置中,与Meta的Llama-2Chat-70B等五到十倍大的语言模型相匹敌或更胜一筹。六个月前在巴黎创立并以其独特的WordArt标志和创纪录的1.18亿美元种子轮融资引起轰动的MistralAI公司�
在不断追求提升用户体验的道路上,WhatsApp正在准备推出一系列新功能,其中备受期待的是集成AI聊天机器人。这一功能目前正处于测试阶段,有望在未来为用户带来更便捷的通讯体验。如果您希望尝试WhatsApp的AI聊天机器人功能,需要加入测试计划,不过目前测试名额已满。