11.11云上盛惠!海量产品 · 轻松上云!云服务器首年1.8折起,买1年送3个月!超值优惠,性能稳定,让您的云端之旅更加畅享。快来腾讯云选购吧!
也许是时候寻找新的方法了?大模型回答人类的对话内容,究竟有多少「智能」成分在里面?本周五,知名AI领域学者,OpenAI创始成员、特斯拉前AI高级总监AndrejKarpathy发表观点:「人们对『向人工智能询问某件事』的解释过于夸张」,引发网友热议。Karpathy称:人工智能基本上是通过模仿人工标注数据来进行训练的语言模型。这或许为大模型下一步性能突破提供了新的思路。
全球首个全切片数字病理学模型Prov-GigaPath正式发布,这一创新模型在癌症亚型分类和突变预测方面显著提高了病理诊断的准确性。GigaPath模型采用了两阶段的级联结构,并结合了微软研究院近期开发的LongNet架构,有效解决了处理和理解十亿像素级别图像的难题。这一突破性成果为病理诊断提供了更加准确和可靠的工具,推动了癌症诊断和治疗的进步。
【新智元导读】训大模型的方法可能要被革新了!AI大神Karpathy发布的新项目仅用1000行的C语言训完GPT-2不再依赖庞大的GPT-2库。他本人预告,即将上线新课。等着这一切完成之后,另一期「从头开始构建」的视频也会上线。
谷歌最新研究提出SpatialVLM,旨在解决视觉语言模型缺乏空间推理能力的问题。视觉语言模型在理解目标在三维空间中位置或关系时存在困难,研究者通过借鉴人类空间推理能力的思路,提出了这一新方法。这一研究成果有望推动视觉语言模型在未来的发展方向上取得更大突破,为人工智能领域带来新的进步。
Karpathy离开OpenAI后并未放松,快速推出了新项目minbpe。该项目的GitHub标星数量在短短一天内就突破了1.2k,展现出了巨大的关注度和吸引力。相信随着项目的不断发展和完善,minbpe将在人工智能领域发挥重要作用,为行业的进步和发展贡献力量。
谷歌最新论文揭示的SpatialVLM,是一种具备空间推理能力的视觉语言模型,旨在解决当前视觉语言模型在空间推理方面的困难。视觉语言模型在图像描述、视觉问答等任务上取得显著进展,但在理解目标在三维空间中的位置或空间关系方面仍存在难题。这一研究为视觉语言模型的空间推理能力提供了新的思路,为未来在机器人、图像识别等领域的发展带来了新的可能性。
谷歌AI研究团队最近提出了SpatialVLM,这是一种旨在增强视觉语言模型空间推理能力的创新系统。尽管先进的模型如GPT-4V在人工智能驱动任务中取得了显著进展,但它们在空间推理方面仍存在显著局限。-SpatialVLM的开发标志着人工智能技术的重大进步。
早已成为LLM老生常谈的问题。OpenAI科学家AndrejKarpathy今早关于大模型幻觉的解释,观点惊人,掀起非常激烈的讨论。每个LLM都是一个不可靠的叙述者,就其架构的本质言,它是不可逆转的。
TogetherAI最近发布了RedPajamav2,这是一个庞大的在线数据集,包含了30万亿token,成为目前公开可用的最大数据集之一,专门用于学习型机器学习系统的培训。对于像Llama、Mistral、Falcon、MPT和RedPajama等最先进的开放式LLM,高质量的数据至关重要,但由于HTML到纯文本的转换引发的异常、通常质量较低的数据来源以及网络内容传播中固有的偏见,这些数据未经精细处理,不适合直接用于LLM的培训。这一工作将为LLM领域的研究和应用提供更多的有力数据支持。