11.11云上盛惠!海量产品 · 轻松上云!云服务器首年1.8折起,买1年送3个月!超值优惠,性能稳定,让您的云端之旅更加畅享。快来腾讯云选购吧!
近日,苹果公司推出了300亿参数的多模态AI大模型MM1.5,该版本是在前代MM1的架构基础上发展来的。该模型继续遵循数据驱动的训练原则,着重探究在不同训练周期中混合各类数据对模型性能产生的影响,相关模型文档已在HuggingFace上发布。尽管MM1.5模型在多项基准测试中表现优异,但苹果团队仍计划通过进一步融合文本、图像和用户交互数据,并设计更复杂的架构,来提升模型对移动设备UI的理解能力,从让苹果牌”AI更强大。
TechWeb文/卞海川毫无预热的情况下,OpenAI于9月13日凌晨发布了o1系列的大模型,这是传闻中内部代号为“草莓”的项目,也是OpenAI首款具备复杂推理能力的大模型。与其前代模型相比,新模型o1擅长通用复杂推理,在物理、信息学等领域表现优异,OpenAICEO奥特曼称它是一种新范式的开始:可以进行通用复杂推理的人工智能。但在一些自然语言任务中,GPT-4o更胜一筹。
9月13日,OpenAI发布了全新的AI大模型——o1系列,标志着大模型技术发展迈入了一个新的里程碑。o1模型专注于解决复杂问题,通过强化学习实现了在复杂推理任务上的突破,使得一个通用模型能够处理比以往科学、代码和数学模型更加困难的问题。OpenAI表示,未来将继续推进模型的迭代更新,并增加更多实用功能,如网络浏览、文件和图像上传等,以进一步提升AI模型的实用性和用户体验。
今日凌晨,OpenAI正式推出了OpenAIo1预览模型。对于复杂推理任务言,新模型代表着人工智能能力的崭新水平,其特点就是会在回答之前花更多时间进行思考,就像人类思考解决问题的过程一样。OpenAI宣布,ChatGPT订阅用户从9月12日起可以访问这两个新模型,o1-preview每周消息数量限制为30条,o1-mini则为50条。
虽然我人还在泰国跟红衣大叔周鸿祎在靶场开心的射击。但是也知道昨天的一条微博热搜爆了。这是我最微不足道、最真诚的祝愿。
谷歌旗下的DeepMind团队近期在国际数学奥林匹克中取得了令人瞩目的成绩。DeepMind的两款人工智能模型——AlphaProof和AlphaGeometry2,成功解决了本年度比赛中的四个难题,达到了银牌水平。OpenAI正在开发名为“Strawberry”的新型AI模型,以显著提升AI的推理能力;Meta公司也推出了最新的AI模型Llama3.1,推动开源AI的发展。
OpenAI被曝出了新项目「草莓」,据悉能提前计划,自主浏览网页能进行深度研究。草莓由大量通用数据上后训练成,推理能力显著提高。在产品层面,OpenAI已经做到了如此先进的地步,如果再加上Strawberry的推理能力,OpenAI离AGI的实现,恐怕是要很近了。
在最近的一项由北卡罗莱纳大学教堂山分校和艾伦AI研究所共同进行的研究中,人工智能的道德推理能力再次得到了令人瞩目的展现。特别是OpenAI的新型聊天机器人GPT-4o,在道德推理和提供道德建议方面,已经超越了公认的道德专家。研究人员也提醒我们,尽管AI在道德推理方面表现出色,但在实际应用中仍需谨慎对待其建议,特别是在缺乏人类监督的情况下。
新加坡国立大学联合加州大学圣芭芭拉分校与奥克兰大学的研究人员提出了一种名为SymbCoT的全新推理框架,旨在提升大语言模型的符号逻辑推理能力。这一框架结合了符号化逻辑表达式与思维链,极大提升了推理的质量、鲁棒性与可信度。不同LLM的影响:SymbCoT与更先进的模型之间的协同效应更为显著。
OpenAI和Meta据称正在准备发布更先进的AI模型,这些模型将能够帮助解决问题并承担更复杂的任务。OpenAI的首席运营官BradLightcap告诉《金融时报》,公司下一个版本的GPT将在解决"困难问题"方面取得进展,例如推理。马斯克表示,"有感知计算的总量"——这个概念可能指的是AI独立思考和行动——将在五年内超过所有人类。
小孩子都会的脑筋急转弯推理题,GPT-4和Claude3做不出?国外一位开发者小哥坚称这一观点,认为GPT模型在训练集外毫无推理能力,无法实现AGI,甚至悬赏1万美元,发起比赛。他当天就被光速打脸了!网友用高能的prompt,让GPT-4和Claude3几乎达到百分百的正确率。我只是互联网上的一名普通人经常犯错。
3月29日,马斯克旗下的AI公司x.ai在官网宣布,未来几天内即将发布Grok-1.5。x.ai开源了Grok-1的权重和网络架构,成为大模型开源领域的一匹黑马。训练数据方面,Grok-1发布版本所使用的训练数据截至2023年第三季度的互联网数据以及xAI人工智能导师提供的数据。
随着ChatGPT的出现,大语言模型在生成连贯文本和遵循指令方面获得了巨大技术突破。然后在推理和解决复杂内容方面,面临内容不准确、安全等难题。每次只需要一个查询获得相似性能的集成方法需要40倍的查询量,也就是说可以节省很多算力资源。
深度学习领域的研究人员发现,语言模型在逻辑推理方面的表现仍然是一个重要挑战。最新的一项由Google旗下的DeepMind进行的研究揭示了一个简单重要的发现:任务中前提的顺序显著影响语言模型的逻辑推理性能。通过这项研究,我们可以看到改变前提顺序可能是提升语言模型推理能力的一种简单有效的方法,也为未来改进这一领域的研究提供了新的方向。
谷歌最新研究提出SpatialVLM,旨在解决视觉语言模型缺乏空间推理能力的问题。视觉语言模型在理解目标在三维空间中位置或关系时存在困难,研究者通过借鉴人类空间推理能力的思路,提出了这一新方法。这一研究成果有望推动视觉语言模型在未来的发展方向上取得更大突破,为人工智能领域带来新的进步。
谷歌最新论文揭示的SpatialVLM,是一种具备空间推理能力的视觉语言模型,旨在解决当前视觉语言模型在空间推理方面的困难。视觉语言模型在图像描述、视觉问答等任务上取得显著进展,但在理解目标在三维空间中的位置或空间关系方面仍存在难题。这一研究为视觉语言模型的空间推理能力提供了新的思路,为未来在机器人、图像识别等领域的发展带来了新的可能性。
谷歌AI研究团队最近提出了SpatialVLM,这是一种旨在增强视觉语言模型空间推理能力的创新系统。尽管先进的模型如GPT-4V在人工智能驱动任务中取得了显著进展,但它们在空间推理方面仍存在显著局限。-SpatialVLM的开发标志着人工智能技术的重大进步。
在AAAI2024上,小红书搜索算法团队推出了一项创新框架,旨在解决大语言模型在推理任务中的黑盒属性和庞大参数量带来的问题。传统研究方法主要关注正样本这项工作强调了负样本在知识蒸馏中的价值。这一研究为提高大语言模型应用性能提供了新思路,通过引入负样本的知识,弥补了传统研究方法的不足,为推理任务的应用提供了更可靠和高效的解决方案。
“一个法律案件的事实是否清晰,与法条之间的关系如何判定,全部都在讲求逻辑。”在MEET2024智能未来大会现场,面壁智能联合创始人、CEO李大海谈到大模型在法律行业的落地时强调了逻辑推理能力的重要性。希望行业里的所有伙伴一起来把这些问题攻克和解决,让整个社会和人们的生活变得更好。
英特尔正式发布了全新酷睿Ultra移动处理器,代号为MeteorLake。酷睿Ultra的设计目标是在能效、制造工艺和性能方面实现突破。它的AI性能在各个方面都遥遥领先竞品,比如在GIMPStableDiffusion中,性能提升达到了竞品的5.4倍。
ChatGPT推出已满一周年,目前每周活跃用户约1亿,超过92%的财富500强公司都在使用ChatGPT。但最近几周,OpenAI经历了过山车式的人事变动,首席执行官SamAltman被董事会罢免后又回归,宣布组建了新的董事会。注:Lightcap和OpenAI拒绝就Altman被罢免和重新任命的具体情况发表进一步评论。
LeCun在推特上引发了关于大语言模型推理能力的讨论,强调LLM缺乏真正的规划推理能力,其涌现能力实际上是上下文学习的结果。研究通过多个实验验证LLM在复杂规划任务上表现不佳,强调其能力受限于任务复杂度。随着对LLM的研究的不断深入,对其真实能力的理解也在逐渐清晰,为未来自然语言处理研究方向提供了有价值的参考。
Meta的研究者发表了一项关于Transformer架构的新研究,提出了一种名为System2Attention的全新注意力机制。该研究旨在解决大型语言模型在推理能力上的不足,特别是在处理复杂任务时可能出现的错误。S2A的引入为解决当前LLM推理能力不足的问题提供了一种创新性的解决方案。
微软研究团队推出的13亿参数模型Orca2在近期发布的一篇论文中探索了如何提升小型语言模型的推理能力。通过增强的训练信号,Orca2能够在与其大小相似的模型中取得与5-10倍更大的模型相媲美甚至更好的性能。研究团队相信,提升小型模型的能力将为不同的应用部署场景开辟新的可能,并在效率和功能之间找到平衡。
随着大型语言模型的出现,人工智能和数学问题求解领域取得了显著进展。这些模型在面对复杂的数学挑战时仍然存在问题。对工具交互的优势和挑战进行的全面分析为未来的研究提供了重要见解,有望开发更先进和适应性更强的推理代理。
著名AI模型开源平台HuggingFace上有超过320,000个大模型,并且每天保持高速增长。据统计只有大约6,000个模型支持ONNX格式,但微软表示,实际上有超过130,000个模型支持该格式。在HuggingFace开源平台上还有10万个模型不支持ONNX格式,鼓励更多的技术研究机构、开源项目加入到ONNX社区,以通过ONNXRuntime增强开发效率。
【新智元导读】昨天,Baichuan2-53B正式发布!首次开放API,意味着百川大模型开始正式进军商用了。模型的数学和逻辑推理能力都大幅飙升,对于幻觉的处理,已经在国内遥遥领先。已经有一大波令人印象深刻的创新,正在土壤中被酝酿了。
OpenAI开源的数学数据集,中国厂商新成绩一举冲到最前列!就在9月16日,国产大模型在权威推理评测集GSM8K中,首次达到了80%正确率,大幅领先GPT-3.5和LLaMA2-70B。且这家厂商在大模型榜单上刷新全球纪录,已经不是第一次了。可以不夸张地说一句,昆仑万维和它家的天工大模型,已经是大模型江湖中,一个绕不过去的狠角色了。
昆仑万维表示,其自研的天工大模型在BenchmarkGSM8K测试中取得了80%的正确率,超过了GPT-3.5和LLaMA2-70B,达到了全球领先水平,接近于GPT-4。天工大模型还在MMLU、C-EVAL、HumanEval等多个数据集上表现出色,准确率均高于其他主流大模型。天工大模型目前仍处于内测阶段,将持续提升技术实力,为用户和企业提供强大的智能化助力。
Trickle是一个支持GPT-4人工智能推理能力的截图集中管理平台,能够将你杂乱无章的截图转变成有价值的视觉备忘录。Trickle通过AI的文本理解与生成能力,不仅可以为你的每张截图生成概要能深入解码截图的本质,找到真正重要的信息。Trickle帮助你重新发现截图的价值,使之从杂乱无章的图片堆中脱颖出,成为organized和structured的视觉思维扩展。