11.11云上盛惠!海量产品 · 轻松上云!云服务器首年1.8折起,买1年送3个月!超值优惠,性能稳定,让您的云端之旅更加畅享。快来腾讯云选购吧!
【新智元导读】前段时间,微软公布并开源了最新一代大模型WizardLM-2,号称性能堪比GPT-4。还未上线一天,模型权重和公告全被删除了,原因竟是......上周,微软空降了一个堪称GPT-4级别的开源模型WizardLM-2。开发者们还需要耐心等待,微软团队承诺,会在测试完成后重新上线。
扎克伯格:「有了Llama3,全世界就能拥有最智能的AI。」ChatGPT拉开了大模型竞赛的序幕,Meta似乎要后来居上了。也许只有OpenAI的GPT-5才能压下开源模型了。
蚂蚁集团和浙江大学合作开发了一个名为OneKE的开源大模型知识抽取框架。该框架旨在帮助处理信息抽取、文本数据结构化和知识图谱构建等任务,为研究人员和开发者提供有力工具。他们将持续优化知识抽取的性能,并将相关技术应用到金融、医疗、政务等领域,推动可控生成技术的产业落地。
开源大模型食用指南是一个旨在帮助用户学习和应用开源大模型的全流程指导教程。它提供了详细的环境配置、模型部署、高效微调等方法,以简化开源大模型的使用和应用,让更多普通学习者能够轻松上手。要获取更多详细信息并开始您的开源大模型之旅,请访问开源大模型食用指南官网。
在百度智能云GENERATE全球生态大会上,百度智能云发布千帆大模型一体机,从算力资源角度分为通用版、昇腾版、昆仑芯版三个版本,为企业私有化部署大模型提供解决方案。千帆大模型一体机预置了百度自研的文心大模型,以及Llama、Baichuan、ChatGLM等十余个主流开源大模型。过去6个月,百度智能云生态伙伴的数量增长了5倍,伙伴们开发的300多款应用通过千帆应用商店”进入市场。
AutoGPT的出现让我们见识到了AI代理强大的自动化能力,并开创了一个全新的AI代理赛道。但在子任务调度、资源分配以及AI之间协作还有不少的难题。AIOS会引入更复杂的内存共享机制和层级缓存策略,以进一步优化AI代理的整体性能。
大数据公司Databricks最近发布了一款名为DBRX的MoE大模型,引发了开源社区的热议。DBRX在基准测试中击败了Grok-1、Mixtral等开源模型,成为了新的开源之王。根据Databricks公布的协议,基于DBRX打造的产品,如果月活超过7亿,就必须另行向Databricks提交申请。
最新开源大语言模型DBRX以其惊人的1320亿参数量成为业界新宠。该模型不仅在语言理解、编程和数学等方面超越了业内领先的开源模型在效率上有所突破。随着其在各项基准测试中的优异表现,DBRX有望成为未来开源大模型发展的重要里程碑,为人工智能领域的进步贡献力量。
3月28日,著名数据和AI平台Databricks在官网正式开源大模型——DBRX。DBRX是一个专家混合模型有1320亿参数,能生成文本/代码、数学推理等,有基础和微调两种模型。Databricks主要提数据智能分析服务,帮助企业、个人用户快速挖掘数据的商业价值。
Yi-9B是01.AI研发的下一代开源双语大型语言模型系列之一。训练数据量达3T,展现出强大的语言理解、常识推理、阅读理解等能力。要获取更多详细信息并开始体验Yi-9B,请访问Yi-9B网站。
开源领域大模型,迎来了重磅新玩家。谷歌推出了全新的开源模型系列「Gemma」。谷歌还通过标准化AI安全基准评估了Gemma的安全性,结果如下表8所示。
今天凌晨,谷歌宣布推出全球性能最强大、轻量级的开源模型系列Gemma。该模型共分为分为2B和7B两种尺寸版本,2B版本甚至可直接在笔记本电脑上运行。并且还实现了跨设备兼容,可以在笔记本电脑、台式机、物联网、移动设备和云端等多个主流设备类型上运行,支持广泛的AI功能。
语言模型一直是自然语言处理技术的核心,考虑到模型背后的巨大商业价值,最大最先进的模型的技术细节都是不公开的。真·完全开源的大模型来了!来自艾伦人工智能研究所、华盛顿大学、耶鲁大学、纽约大学和卡内基梅隆大学的研究人员,联合发表了一项足以载入AI开源社区史册的工作——他们几乎将从零开始训练一个大模型过程中的一切数据和资料都开源了!论文:https://allenai.org/olmo/olmo-paper.pdf权重:https://huggingface.co/allenai/OLMo-7B代码:https://github.com/allenai/OLMo数据:https://huggingface.co/datasets/allenai/dolma评估:https://github.com/allenai/OLMo-Eval适配:https://github.com/allenai/open-instruct具体来说,艾伦人工智能研究所推出的这个开放大语言模型实验和训练平台,则提供了一个完全开源的大模型,以及所有和训练开发这个模型有关的数据和技术细节——训练和建模:它包括完整的模型权重、训练代码、训练日志、消融研究、训练指标和推理代码。她对机器学习的技术和认知科学的理论的融合应用充满了热情。
【新智元导读】首个基于全国产化算力平台「飞星一号」的大模型,正式开源!1月26日,美国商务部长雷蒙多表示,拜登政府正在尽全力阻止中国获得训练AI模型所需的算力资源。美国的云计算公司,都被要求确定是否有外国实体正在访问美国数据中心以训练AI模型。在全国产化算力平台的支撑下,星火认知大模型将进一步对标国际先进水平星火开源大模型,也将使国内开源生态更加欣欣向荣。
今天讯飞正式发布了星火开源-13B,这是首个基于全国产化算力平台”飞星一号”的开源大模型。华为昇思开源社区已正式上架星火大模型开源版-13B,面对学术、企业研究完全免费,增进学术合作的同时,增进产业探索。科大讯飞表示,不仅是对昇腾AI硬件的进一步深度优化,也展示了国产算力在追赶国际先进水平方面的决心和能力。
随着人工智能技术的发展,以GPT-4为代表的大语言模型依靠其强大的能力正在对社会产生深远的影响。大模型本身的安全性问题也变得尤为重要。也公开了收集的所有法律准则与道德准则,以及5个测试基准中所使用的所有数据。
讯飞星火V3.5宣布将于2024年1月30日正式发布。这次升级中,讯飞星火首次基于全国产化算力平台进行训练,实现了全民开放大模型。科大讯飞还发布了首部企业史《星火相传》,回顾了科大讯飞的创业精神谱系。
元象发布了全球首个上下文窗口长度为256K的开源大模型XVERSE-Long-256K,支持输入25万汉字,无条件免费商用。该模型填补了开源生态空白,与元象之前的大模型组成了高性能全家桶。用户可以在元象大模型官网或小程序中体验XVERSE-Long-256K。
随着对生成式人工智能技术需求的激增,大型语言模型的训练和容错性要求也在不断增加。为应对这一挑战,密歇根大学的研究人员开发了一款名为Oobleck的开源大型模型训练框架。Oobleck的开发标志着利用固有冗余提高容错性的新里程碑,为大型模型的高效训练和故障恢复提供了一种创新性的解决方案。
开源大模型社区HuggingFace公布了最新的开源大模型排行榜,通义千问在预训练模型类别中脱颖出,占据榜首位置。HuggingFace开源大模型排行榜涵盖了全球上百个顶尖的开源大模型,并从阅读理解、逻辑推理、数学计算、事实问答等六个维度进行了全面评估。阿里云开源通义千问720亿参数模型。
全球社交、科技巨头Meta在官网宣布,与甲骨文、英特尔、AMD、IBM、索尼、戴尔等57家科技、学术研究机构组成——AI联盟。在这57家组织中很多是大模型开源领域的领导者,例如,类ChatGPT模型的开源鼻祖Meta;文生图领域最知名开源平台StabilityAI;全球著名的大模型开源分享平台之一HuggingFace等。除了汇聚AI领域的领先开发者、科学家、学者、学生和商界领袖,AI联盟还将计划与政府、非营利组织和民间社会组织的现有重要倡议合作,这些组织正在AI领域开展有价值的合作。
科技的浪潮几十年一个轮回,不同的剧本却总是响起相似的鼓点。一年前ChatGPT的惊艳现身,是属于大模型时代的「iPhone时刻」;那么,7月间Meta将Llama2开源,则被认为是拉开了大模型时代的IOS与安卓之争。高质量开源的基础大模型,在开放生态的推动下不断迭代优化,进推动AI应用的创新涌现,这一整条清晰的商业路径正悄然形成增长飞轮,让AI普惠不再是一句虚言。
一年前的今天,ChatGPT横空出世,人工智能的新时代似乎已经到来。短短两个月,ChatGPT积累了一亿用户,速度远超TikTok和YouTube等热门应用;似乎每隔几天就会有新的基于生成式人工智能的创业公司出现;以ChatGPT和GPT-4为核心的智能助手也开始走进各个行业中,帮助普通用户简化工作流程和提高效率。这份调查为开源LLM的有前景的方向提供了启发,并将激励该领域的进一步研究和发
招联金融在金融科技前沿课题研究方面捷报频传。在2023年国际计算机视觉会议ICCV上,招联与中科大完成的“3D动作表示学习”“扩散生成图像检测”2篇论文在该顶会发表。招联消费金融也希望通过在“招联智鹿”项目应用上的持续深耕,为引领消费金融行业新时代的高质量发展作出有力探索。
在今日的2023年世界互联网大会乌镇峰会上,阿里巴巴集团CEO吴泳铭表示,阿里巴巴即将开源720亿参数大模型。这将是国内参数规模最大的开源大模型。阿里云还一同发布了通义星尘、通义灵码、通义晓蜜、通义点金、通义智文、通义法睿、通义仁心等应用模型。
11月6日,李开复亲自领导的零一万物在官网正式开源了,两款预训练大模型Yi-34B和6B。在HuggingFace英文开源社区平台和C-Eval中文评测显示,Yi-34B取得了多项SOTA国际最佳性能指标认可,成为全球开源大模型“双料冠军”,也是迄今为止唯一成功登顶HuggingFace全球开源模型排行榜的国产模型。零一万物将致力于打造一个开放、共享、协作的大模型平台,与全球的研究者、开发者、创业者共同探索和创造AI2.0的未来。
由李开复博士亲自下场创办的零一万物,自3月底官宣成立后,于近日发布并开源了两个版本的中英文大模型Yi-6B和Yi-34B。在线上发布环节,李开复博士重点介绍了Yi系列大模型的三处性能亮点:全球最长200K上下文窗口,免费开源超强AlInfra实测训练,成本下降40%科学训模自研「规模化训练实验平台」Yi-34B目前在各个基准测试中,都获得了很好的表现,据零一万物提供的评测结果看来,Yi-34B和Yi-6B均在MMLU、BBH、C-Eval取得了不错的成绩。零一万物相信AI赋能推动人类社会前行,AI应本着以人为本的精神,为人类创造巨大的价值。
零一万物发布全球最强的开源大模型Yi-34B,具备超强的语言理解和处理能力,支持处理40万汉字,在中文指标上表现卓越,标志着中国在大模型领域的重大突破。项目地址:https://huggingface.co/spaces/HuggingFaceH4/open_llm_leaderboard马斯克旗下xAI首个大模型Grok炸场马斯克旗下xAI团队发布了首个AI大模型产品“Grok”,它是一款智能助手,能回答各种问题并实时获取最新信息。论文地址:https://
零一万物推出了「Yi」系列开源大模型,其中Yi-34B在全球开源大模型排行榜上取得了显著成就,击败了其他竞品模型,成为双料冠军,尤其在中文指标上表现卓越。Yi-34B的性能超越了全球其他大模型,拥有强大的语言理解和处理能力,可以满足国内市场的需求。Yi-34B的发布标志着中国在大模型领域的取得重大突破,为全球开源大模型社区带来了新的竞争力。
据OpenCompass评测平台最新数据,OPPO大模型AndesGPT-7B以62.2的综合分位列中文数据集综合榜单中第五,在同为70亿规模参数下的大模型中排名第一。值得注意的是,OpenCompass提供的完整开源可复现的评测框架,可同时对大模型的多项能力进行评测,同时也意味着AndesGPT-7B是国内终端厂商首个已开源的大模型,将持续为中文大模型开源社区做出贡献。11月16日,AndesGPT会在即将发布的ColorOS14系统中被首次应用,AndesGPT更多元化的应用场景或将在之后揭晓。