11.11云上盛惠!海量产品 · 轻松上云!云服务器首年1.8折起,买1年送3个月!超值优惠,性能稳定,让您的云端之旅更加畅享。快来腾讯云选购吧!
近日,小米的大语言模型MiLM-6B首次现身C-Eval、CMMLU两大AI模型评测榜单。截至本文成稿,MiLM-6B在C-Eval总榜单排名第10、同参数量级排名第1,在CMMLU中文向大模型排名第1。MiLM-6B模型目前已经在大多数科目中表现出了相对良好的准确度,但在诸如法学、数学、编程、概率论、离散数学等科目上的表现依旧有明显进步空间。
马斯克的AI创企xAI正式宣布其大语言模型Grok-1已实现开源,并向公众开放下载。Grok-1是一款基于混合专家系统技术构建的大语言模型,拥有3140亿参数,远超OpenAIGPT-3.5的1750亿。xAI并没有放出Grok-1的具体测试成绩,它与其他公司的大模型之战将成为业内关注的焦点。
苹果发布了俄罗斯套娃式扩散模型,用于生成高分辨率图像和视频,通过嵌套UNet架构和多分辨率损失提高训练效率和质量。文心一言开展专业版邀测活动百度文心一言聊天机器人推出“专业版邀测”活动,用户可在2023年10月28日至10月31日期间申请,获得邀测权限后可体验更强大的文心大模型4.0,包括提升的理解、生成、逻辑、记
微软的一篇论文引发了广泛讨论,揭示了GPT-3.5的真实参数量可能只有20B,远远小于之前官方宣布的1750亿。这一曝料在AI圈内引起了巨大的震动,让人们开始重新评估这一庞大模型的性能和潜力。这一争议仍在继续,只有等待更多信息的揭晓才能解开谜团。
数学通才「猛犸」模型给开源语言模型带来了「推理春天」,面对GPT-4都有一战之力!数学推理问题是语言模型绕不过的痛点,在各种黑科技的加持下,开源模型的推理性能依然不够看。滑铁卢大学、俄亥俄州立大学、香港科技大学、爱丁堡大学的研究人员联合开源了一个专为「通用数学问题」定制的大模型MAmmoTH和一个指令调优数据集MathInstruct.论文链接:https://arxiv.org/pdf/2309.05653
日本的人工智能初创公司ELYZA宣布发布了一款基于Meta的「Llama2」的日本语言模型,该模型被命名为「ELYZA-japanese-Llama-2-7b」,拥有70亿参数。此举使得该模型能够与开放AI领域的巨头GPT3.5相媲美。虽然目前在参数数量上仍不及一些国际级模型,但这一进展为日本语自然语言处理和生成领域带来了更多可能性,未来可望进一步提高日本语LLM的性能。
【新智元导读】外媒爆料,Meta正在加急研发全新开源大模型,对标GPT-4,参数量比Llama2还要大上数倍。Meta这是又要颠覆AI社区了?根据外媒《华尔街日报》消息,Meta正在加紧开发新的大语言模型,能力将完全对标GPT-4,预计将于明年推出。但令人欣慰的是,Meta依旧释放了自己将继续坚持原有战略的信号。
OpenAI+CEO+Sam+Altman+认为,专注于增加大型语言模型的参数数量不再有效,AI+模型的未来应该以效率和数据质量不是单纯的参数数量来区分。Altman+建议重点应该放在改进和扩展模型的能力上,未来可能的架构可能由几个较小的模型一起工作组成。Deepmind+的+Chinchilla、Aleph+Alpha+的+Sparse+Luminous+Base+和+Meta+的+LLaMA+模型等模型表明,参数较少的语言模型可以通过更高效的架构或更多的数�
这总体上加快了大脑的计算速度,因为内存和处理器之间没有分离,这在经典(冯·诺依曼)机器中会导致速度减慢。但它也避免了执行从主存储器组件访问数据的特定任务的需要,就像传统计算系统中发生的那样,并且消耗大量的能量。
近日,在 2019 赛灵思开发者大会(XDF)亚洲站展会上,来自中科院计算所的领域专用计算架构研发的开拓者——中科驭数,携其金融交易系统中的网络、数据库和风控系统加速解决方案——RiskCop(锐警)亮相,吸引了人工智能、5G、FPGA、ASIC、金融科技、券商期货公司、与会媒体等相关技术和行业领域人群的深度互动与现场采访。中科驭数产品副总裁张宇接受现场媒体采访“中科驭数的初衷就是在不同应用领域,以软件定义加速器的方法为指导,
马斯克表示,新的芯片将比当前使用的的汽车芯片快一个数量级。当前的芯片由 NVIDIA 开发,这家公司同时还是 20 多个智能汽车开发者的供应商。马斯克表示,NVIDIA 的芯片每秒可处理 200 帧视频,而特斯拉的芯片每秒可处理来自汽车周围的摄像头的 2000 帧视频,且仍有剩余容量用于数据冗余和提升安全保障。
近日,第二届世界互联网大会在乌镇召开。百度高级副总裁王劲应邀出席“互联网技术与标准”论坛,参与“技术与标准促进互联网发展”议题的研讨。会上,王劲透露,百度创新研发出新DNS系统,其处理性能相比目前的商用方案提升了一个数量级。