11.11云上盛惠!海量产品 · 轻松上云!云服务器首年1.8折起,买1年送3个月!超值优惠,性能稳定,让您的云端之旅更加畅享。快来腾讯云选购吧!
阿里巴巴宣布开源其最新的Qwen1.5系列语言模型-Qwen1.5-110B。这是Qwen1.5系列中规模最大的模型,也是该系列中首个拥有超过1000亿参数的模型。它在与最近发布的SOTA模型Llama-3-70B的性能上表现出色,并且明显优于72B模型。
Meta最近发布了LLama3,这是一款新的大型语言模型,用于实现更安全、更准确的生成式人工智能体验。除了LLM,Meta还推出了LlamaGuard2、CodeShield和CyberSecEval2等信任和安全工具,以帮助确保符合行业和用户安全期望。随着400亿参数显示出更高的准确性,可以推断出更高的AI硬件需求不会很快减少。
尽管Meta的新型Llama3迅速成为使用最广泛和定制程度最高的巨型语言模型排行榜榜首,但率先开启生成式人工智能时代的竞争对手OpenAI却通过为其GPT-4TurboLLM和其他模型之上构建和编程引入新的企业级功能来摆脱竞争。OpenAI今天宣布了其面向API客户的企业级功能的扩展,进一步丰富了其助手API,并引入了一些旨在增强安全性和管理控制权以及更有效地控制成本的新工具。如果您公司的一个团队使用一套面向公众的文档,另一个团队使用一套机密或内部文档,那么您可以在OpenAI的API中为每个团队分配一个单独的项目,并且这两个团队都可以使用AI模型来处理这些文档不会混合或危及后者。
Meta突然官宣了Llama3,把开源模型的实力又往上提了一截。Llama3总共有三个版本——8B、70B和405B。正如BenHorowitz所说,「keepthemainthing,themainthing」,并努力专注于你的关键优先事项。
近日,Meta重磅推出其80亿和700亿参数的MetaLlama3开源大模型。该模型引入了改进推理等新功能和更多的模型尺寸,并采用全新标记器,旨在提升编码语言效率并提高模型性能。即使80亿参数的Llama3模型比70亿参数的Llama2模型参数更高,在AWSm7i.metal-48xl实例上运行BF16推理时,整体prompt的推理时延几乎相同。
LLM界的「真·OpenAI」,又来整顿AI圈了!业内惊呼:首个开源GPT-4级的模型,终于来了!开源模型追上闭源模型的历史性一刻,或许就在眼前了?一石激起千层浪,Llama3才刚刚发布没几小时,就破纪录地登顶了HuggingFace排行榜。Meta共开源了Llama38B和Llama370B两款模型,分别有预训练和指令微调两个版本。MetaAI即将在Quest头显中推出。
MetaLlama3是Meta公司最新推出的一款开源大型语言模型。它在多项行业基准测试中表现出色,性能卓越,可支持广泛的使用场景,包括改善推理能力等新功能。要了解更多信息,请访问MetaLlama3官方网站。
Meta计划在下周预演其大型语言模型Llama3的两个基础版本。Llama3预计将支持多模态功能,允许用户输入文本和图像予以回应。预计将Meta在全球夏季推出完整的Llama3模型。
MetaPlatforms公司计划在下周推出Llama3大语言模型的两个小参数版本,作为即将在2024年夏天推出的Llama3最大版本的前奏。Llama3最高版本可能拥有超过1400亿个参数,这将使其性能有望赶上OpenAI最新的GPT-4Turbo版本。Meta正在全力推进Llama3的开发,这不仅体现了该公司在AI领域的野心,也为用户带来了更加智能和开放的AI服务的期待。
随着人工智能技术的发展,视频生成领域取得了长足的进步。在现有的文本到视频生成模型中,对镜头姿势的精确控制往往被忽视镜头姿势在视频生成中扮演着表达更深层叙事细微差别的影视语言角色。这一技术的应用前景广阔,有望在视频生成领域发挥重要作用。
LivingImages|Coframe是一项由Coframe提供的服务,旨在通过生成性A/B测试来优化网站图片。这项技术可以帮助提升用户体验和网站性能,通过不断的测试和优化,找到最适合目标受众的图片版本。如欲了解更多详情,请访问LivingImages|Coframe官网。
【新智元导读】LLM开源从Infra做起!Meta公布了自己训练Llama3的H100集群细节,看来Llama3快来了。每年3月份,照例各家大厂又要开始秀自己最新的产品和研究了。Meta的目标是创建灵活可靠的系统,以支持快速发展的新模式和研究。
根据《TheInformation》的报道,Meta平台计划于7月推出最新版本的人工智能大型语言模型Llama3。这一新版本将具有更强大的推理能力和更准确的预测能力,能够更好地回答用户提出的有争议性问题。随着Llama3的推出,人工智能技术有望在更多领域发挥重要作用,为用户提供更智能、更高效的语言交流体验。
网络犯罪团伙已开始利用生成式人工智能进行攻击,包括Meta的Llama2大型语言模型,根据网络安全公司CrowdStrike周三发布的年度全球威胁报告。据CrowdStrike报道,一个名为ScatteredSpider的组织利用Meta的大型语言模型生成了Microsoft的PowerShell任务自动化程序脚本,用于下载“一家北美金融服务公司受害者”的员工登录凭证。那些举办选举的国家中政治活跃的党派很可能会使用生成式人工智能制造虚假信息,以在自己的圈子内传播。
【新智元导读】把小扎从元宇宙大坑中拯救出来的,居然是开源AI!市值大涨的Meta,现在能让小扎一年分红7亿美元。股价图一出,LeCun都评论:有意思。Egan在律师事务所Covington&Burling担任合伙人,同时也是全球数据业务的联合主席,专注于消费者保护工作。
欢迎来到【AI视野】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
CodeLlama70B是一个基于175亿参数通用语言模型Llama2的大型开源代码生成语言模型。经过专门针对代码生成任务的微调,CodeLlama70B能够高效准确地生成多种编程语言的代码,包括Python、C、Java等。探索更多关于CodeLlama70B的信息,访问官方网站。
Meta公司最新发布了CodeLlama70B,这是一款被称为“最大且性能最佳”的人工智能编程工具。该工具于去年8月推出,目前可供研究和商业使用,并在Meta的AI博客中介绍说,CodeLlama70B相比之前的版本能够处理更多的查询,这意味着开发人员在编程时可以提供更多的提示,并且它的准确性更高。这一新闻进一步展示了人工智能领域的创新势头,Meta的CodeLlama70B的发布有望为开发人员提�
Meta最新更新了其代码生成AI模型,CodeLlama70B,这是“目前最大、最优秀的模型”。CodeLlama工具于2023年8月推出,无论是研究还是商业用途,都是免费的。亚马逊的CodeWhisperer于2023年4月推出。
【新智元导读】AI训AI必将成为一大趋势。Meta和NYU团队提出让大模型「自我奖励」的方法,让Llama2一举击败GPT-40613、Claude2、GeminiPro领先模型。还有人表示「令人惊讶的是,每次迭代的改进几乎保持线性,仅在3次迭代之后,就已经接近GPT-4级别」。
大模型领域中,微调是改进模型性能的重要一步。随着开源大模型逐渐变多,人们总结出了很多种微调方式,其中一些取得了很好的效果。大模型可以通过搜索数据库来验证其答案的准确性,从获得更准确和可靠的输出。
目前内容产业的数据积累在3D模型和4D动画等方面仍较为薄弱。为了满足即将到来的多维沉浸式体验,清华系创业团队生数科技近期联合清华大学、同济大学等高校推出了全球首个基于「骨骼动画」的4D动画生成框架「AnimatableDreamer」。这些技术的创新能力将为未来的多维数字体验和人机交互带来更多可能性,从开启全新的内容娱乐与消费模式。
在最新的官方公告中,Meta的扎克伯格宣布了一项重要消息,即正在训练Llama3,并将继续以负责任的方式开源。这一消息对于企业和个人开发者来说都是一个好消息,因为他们可以继续以开源的方式使用与GPT-4、GeminiUltra相媲美的大模型。这一系列的举措表明Meta对生成式AI的庞大场景化落地充满信心,同时致力于推动整个开源大模型生态的发展。
Meta首席执行官马克·扎克伯格宣布公司正计划打造通用人工智能,成为继Metaverse之后的新使命。扎克伯格表示,公司正在训练Llama系列中的下一个大型语言模型Llama3,预计在代码生成、推理和规划方面将具有更出色的能力,达到了GPT-4级别。公司将继续推进RealityLabs和Metaverse计划,今年还将推出新平台,允许用户为Meta的社交应用程序创建自己的AI角色,展望着一个由人工智能生成并充满AI角色的虚拟世界的未来。
全球社交、科技巨头Meta在官网开源了全新模型——LlamaGuard。LlamaGuard是一个基于Llama2-7b的输入、输出保护模型,可对人机会话过程中的提问和回复进行分类,以判断其是否存在风险。用户可以通过零样本或小样本的方式便可实现指令迁移,以适配不同的应用场景需求。
Meta今天宣布了一项名为「PurpleLlama」的新倡议,旨在促进人工智能系统的负责任开发。Meta表示,该项目将逐步提供AI开发社区构建开放生成AI模型所需的所有工具和评估,以确保安全和负责任的方式进行。Meta表示,它将在12月10日开始的NeurIPs2023活动上展示这些组件的第一批,并为希望实施它们的开发者提供技术深入解析。
斯坦福大学和卡内基梅隆大学的研究团队联合提出了一种新的序列模型,名为Mamba,它在语言、音频和DNA序列等任务上超越了Transformer模型。Mamba采用了一种新的架构,具有线性复杂度和更高的推理吞吐量。Mamba的出现对于序列建模领域来说是一个重要的突破,未来还有许多研究和实践的工作需要进行。
在别的领域,如果你想形容一个东西非常重要,你可能将其形容为「撑起了某领域的半壁江山」。但在AI大模型领域,Transformer架构不能这么形容,因为它几乎撑起了「整个江山」。与类似规模的Transformer相比,Mamba具有5倍的生成吞吐量Mamba-3B的质量与两倍于其规模的Transformer相当。
阿里云开源了通义千问Qwen-72B、Qwen-1.8B以及音频大模型Qwen-Audio,提供对话模型和量化版,支持开发者推理训练。体验地址:https://modelscope.cn/studios/qwen/Qwen-72B-Chat-Demo/summaryDeepMind发布自监督扩散模型SODAGoogleDeepMind发布的自监督扩散模型SODA通过无监督方式精准控制扩散模型,实现风格与内容分离及3D视图生成。基于大学水平考试的多模�
根据当地时间周日晚间发给公司员工的一份内部备忘录,雄心勃勃的人工智能初创公司OpenAI的董事会坚持其推翻前首席执行官SamAltman的决定。OpenAI任命Twitch前高管EmmettShear为新的临时首席执行官,取代了在Altman被解雇后被任命为临时首席执行官的长期担任OpenAI高管的MiraMurati。Shear在2月份辞去了Twitch首席执行官的职务,并被任命为YCombinator的兼职顾问,YCombinator是一家颇具影响力�