11.11云上盛惠!海量产品 · 轻松上云!云服务器首年1.8折起,买1年送3个月!超值优惠,性能稳定,让您的云端之旅更加畅享。快来腾讯云选购吧!
7月12日凌晨,全球著名AI科学家吴恩达在社交平台发表深度长文,再次抵制并吐槽美国加州拟定的SB-1047法案。仍然对美国加州拟定的SB1047法案,对开源大模型带来的巨大伤害感到震惊。这是一个专门针对开源大模型的法案,里面有很多不合理的条款,受到了科技界专业人士的强烈抵抗和不满。
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解:https://top.aibase.com/1、对标GPT-4o!任天堂将谨慎对待生成式人工智能的使用,依靠团队内部的创造力和经验。
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解:https://top.aibase.com/1、Claude推类GPTs功能Projects可创建特定项目的个性化机器人Claude最近推出的创新功能\"Projects\"为用户提供了定制化的聊天机器人服务,具有独特的特点和优势。DIVID是哥伦比�
全球知名的开源平台HuggingFace的联合创始人兼首席执行官Clem在社交平台激动宣布,阿里巴巴最新开源的Qwen2-72B指令微调版本在开源模型排行榜上荣登榜首。为了打造一个更为公正和准确的开源大模型排名,Clem及其团队利用300块H100高性能硬件,对全球100多个主流开源大模型,包括Qwen2、Llama-3、Mixtral、Phi-3等,在BBH、MUSR、MMLU-PRO、GPQA等严格的基准测试集上进行了全面深入的评估。中国在这一领域正逐渐展现出领导者的姿态,引领着全球开源模型的发展潮流。
随着ChatGPT、Midjourney等大模型产品的影响力、应用场景越来越多,为了确保输出的内容安全、可靠,对齐成为开发人员的关注重点和难点。但现在的模型参数少则几百亿多则上千亿,想通过传统的监督式微调方法来完成对齐效果往往不理想。在多轮AI对话中,可以指导模型生成符合用户期望的回答;在文本摘要任务中,可以指导模型生成更加准确和有信息量的摘要内容;在机器翻�
开源大模型,已经开启大卷特卷模式。太平洋两岸,双雄格局正在呼之欲出。自研大模型的必要性和竞争力,正在不断被开源卷王们卷没了。
【新智元导读】前段时间,微软公布并开源了最新一代大模型WizardLM-2,号称性能堪比GPT-4。还未上线一天,模型权重和公告全被删除了,原因竟是......上周,微软空降了一个堪称GPT-4级别的开源模型WizardLM-2。开发者们还需要耐心等待,微软团队承诺,会在测试完成后重新上线。
扎克伯格:「有了Llama3,全世界就能拥有最智能的AI。」ChatGPT拉开了大模型竞赛的序幕,Meta似乎要后来居上了。也许只有OpenAI的GPT-5才能压下开源模型了。
蚂蚁集团和浙江大学合作开发了一个名为OneKE的开源大模型知识抽取框架。该框架旨在帮助处理信息抽取、文本数据结构化和知识图谱构建等任务,为研究人员和开发者提供有力工具。他们将持续优化知识抽取的性能,并将相关技术应用到金融、医疗、政务等领域,推动可控生成技术的产业落地。
开源大模型食用指南是一个旨在帮助用户学习和应用开源大模型的全流程指导教程。它提供了详细的环境配置、模型部署、高效微调等方法,以简化开源大模型的使用和应用,让更多普通学习者能够轻松上手。要获取更多详细信息并开始您的开源大模型之旅,请访问开源大模型食用指南官网。
在百度智能云GENERATE全球生态大会上,百度智能云发布千帆大模型一体机,从算力资源角度分为通用版、昇腾版、昆仑芯版三个版本,为企业私有化部署大模型提供解决方案。千帆大模型一体机预置了百度自研的文心大模型,以及Llama、Baichuan、ChatGLM等十余个主流开源大模型。过去6个月,百度智能云生态伙伴的数量增长了5倍,伙伴们开发的300多款应用通过千帆应用商店”进入市场。
AutoGPT的出现让我们见识到了AI代理强大的自动化能力,并开创了一个全新的AI代理赛道。但在子任务调度、资源分配以及AI之间协作还有不少的难题。AIOS会引入更复杂的内存共享机制和层级缓存策略,以进一步优化AI代理的整体性能。
大数据公司Databricks最近发布了一款名为DBRX的MoE大模型,引发了开源社区的热议。DBRX在基准测试中击败了Grok-1、Mixtral等开源模型,成为了新的开源之王。根据Databricks公布的协议,基于DBRX打造的产品,如果月活超过7亿,就必须另行向Databricks提交申请。
最新开源大语言模型DBRX以其惊人的1320亿参数量成为业界新宠。该模型不仅在语言理解、编程和数学等方面超越了业内领先的开源模型在效率上有所突破。随着其在各项基准测试中的优异表现,DBRX有望成为未来开源大模型发展的重要里程碑,为人工智能领域的进步贡献力量。
3月28日,著名数据和AI平台Databricks在官网正式开源大模型——DBRX。DBRX是一个专家混合模型有1320亿参数,能生成文本/代码、数学推理等,有基础和微调两种模型。Databricks主要提数据智能分析服务,帮助企业、个人用户快速挖掘数据的商业价值。
Yi-9B是01.AI研发的下一代开源双语大型语言模型系列之一。训练数据量达3T,展现出强大的语言理解、常识推理、阅读理解等能力。要获取更多详细信息并开始体验Yi-9B,请访问Yi-9B网站。
开源领域大模型,迎来了重磅新玩家。谷歌推出了全新的开源模型系列「Gemma」。谷歌还通过标准化AI安全基准评估了Gemma的安全性,结果如下表8所示。
今天凌晨,谷歌宣布推出全球性能最强大、轻量级的开源模型系列Gemma。该模型共分为分为2B和7B两种尺寸版本,2B版本甚至可直接在笔记本电脑上运行。并且还实现了跨设备兼容,可以在笔记本电脑、台式机、物联网、移动设备和云端等多个主流设备类型上运行,支持广泛的AI功能。
语言模型一直是自然语言处理技术的核心,考虑到模型背后的巨大商业价值,最大最先进的模型的技术细节都是不公开的。真·完全开源的大模型来了!来自艾伦人工智能研究所、华盛顿大学、耶鲁大学、纽约大学和卡内基梅隆大学的研究人员,联合发表了一项足以载入AI开源社区史册的工作——他们几乎将从零开始训练一个大模型过程中的一切数据和资料都开源了!论文:https://allenai.org/olmo/olmo-paper.pdf权重:https://huggingface.co/allenai/OLMo-7B代码:https://github.com/allenai/OLMo数据:https://huggingface.co/datasets/allenai/dolma评估:https://github.com/allenai/OLMo-Eval适配:https://github.com/allenai/open-instruct具体来说,艾伦人工智能研究所推出的这个开放大语言模型实验和训练平台,则提供了一个完全开源的大模型,以及所有和训练开发这个模型有关的数据和技术细节——训练和建模:它包括完整的模型权重、训练代码、训练日志、消融研究、训练指标和推理代码。她对机器学习的技术和认知科学的理论的融合应用充满了热情。
【新智元导读】首个基于全国产化算力平台「飞星一号」的大模型,正式开源!1月26日,美国商务部长雷蒙多表示,拜登政府正在尽全力阻止中国获得训练AI模型所需的算力资源。美国的云计算公司,都被要求确定是否有外国实体正在访问美国数据中心以训练AI模型。在全国产化算力平台的支撑下,星火认知大模型将进一步对标国际先进水平星火开源大模型,也将使国内开源生态更加欣欣向荣。
今天讯飞正式发布了星火开源-13B,这是首个基于全国产化算力平台”飞星一号”的开源大模型。华为昇思开源社区已正式上架星火大模型开源版-13B,面对学术、企业研究完全免费,增进学术合作的同时,增进产业探索。科大讯飞表示,不仅是对昇腾AI硬件的进一步深度优化,也展示了国产算力在追赶国际先进水平方面的决心和能力。
随着人工智能技术的发展,以GPT-4为代表的大语言模型依靠其强大的能力正在对社会产生深远的影响。大模型本身的安全性问题也变得尤为重要。也公开了收集的所有法律准则与道德准则,以及5个测试基准中所使用的所有数据。
讯飞星火V3.5宣布将于2024年1月30日正式发布。这次升级中,讯飞星火首次基于全国产化算力平台进行训练,实现了全民开放大模型。科大讯飞还发布了首部企业史《星火相传》,回顾了科大讯飞的创业精神谱系。
元象发布了全球首个上下文窗口长度为256K的开源大模型XVERSE-Long-256K,支持输入25万汉字,无条件免费商用。该模型填补了开源生态空白,与元象之前的大模型组成了高性能全家桶。用户可以在元象大模型官网或小程序中体验XVERSE-Long-256K。
随着对生成式人工智能技术需求的激增,大型语言模型的训练和容错性要求也在不断增加。为应对这一挑战,密歇根大学的研究人员开发了一款名为Oobleck的开源大型模型训练框架。Oobleck的开发标志着利用固有冗余提高容错性的新里程碑,为大型模型的高效训练和故障恢复提供了一种创新性的解决方案。
开源大模型社区HuggingFace公布了最新的开源大模型排行榜,通义千问在预训练模型类别中脱颖出,占据榜首位置。HuggingFace开源大模型排行榜涵盖了全球上百个顶尖的开源大模型,并从阅读理解、逻辑推理、数学计算、事实问答等六个维度进行了全面评估。阿里云开源通义千问720亿参数模型。
全球社交、科技巨头Meta在官网宣布,与甲骨文、英特尔、AMD、IBM、索尼、戴尔等57家科技、学术研究机构组成——AI联盟。在这57家组织中很多是大模型开源领域的领导者,例如,类ChatGPT模型的开源鼻祖Meta;文生图领域最知名开源平台StabilityAI;全球著名的大模型开源分享平台之一HuggingFace等。除了汇聚AI领域的领先开发者、科学家、学者、学生和商界领袖,AI联盟还将计划与政府、非营利组织和民间社会组织的现有重要倡议合作,这些组织正在AI领域开展有价值的合作。
科技的浪潮几十年一个轮回,不同的剧本却总是响起相似的鼓点。一年前ChatGPT的惊艳现身,是属于大模型时代的「iPhone时刻」;那么,7月间Meta将Llama2开源,则被认为是拉开了大模型时代的IOS与安卓之争。高质量开源的基础大模型,在开放生态的推动下不断迭代优化,进推动AI应用的创新涌现,这一整条清晰的商业路径正悄然形成增长飞轮,让AI普惠不再是一句虚言。
一年前的今天,ChatGPT横空出世,人工智能的新时代似乎已经到来。短短两个月,ChatGPT积累了一亿用户,速度远超TikTok和YouTube等热门应用;似乎每隔几天就会有新的基于生成式人工智能的创业公司出现;以ChatGPT和GPT-4为核心的智能助手也开始走进各个行业中,帮助普通用户简化工作流程和提高效率。这份调查为开源LLM的有前景的方向提供了启发,并将激励该领域的进一步研究和发
招联金融在金融科技前沿课题研究方面捷报频传。在2023年国际计算机视觉会议ICCV上,招联与中科大完成的“3D动作表示学习”“扩散生成图像检测”2篇论文在该顶会发表。招联消费金融也希望通过在“招联智鹿”项目应用上的持续深耕,为引领消费金融行业新时代的高质量发展作出有力探索。