11.11云上盛惠!海量产品 · 轻松上云!云服务器首年1.8折起,买1年送3个月!超值优惠,性能稳定,让您的云端之旅更加畅享。快来腾讯云选购吧!
企业正处于部署AI的关键节点。随着AI系统在企业运营中的深度融合,计算成本与响应时间成为阻碍AI广泛应用的主要瓶颈。CoD让先进的推理技术变得更加亲民、易用,有助于推动其在更广泛场景中的普及。
【新智元导读】DeepSeek团队最新力作一上线,就获得Ai2研究所大牛推荐,和DeepSeek铁粉们的热情研读!他们提出的CodeI/O全新方法,通过代码提取了LLM推理模式,在逻辑、数学等推理任务上得到显著改进。DeepSeek团队成员的一举一动,都颇受圈内关注。JunxianHe还曾在FacebookAI研究院和Salesforce研究院工作过一段时间。
这个月尝试加入更多维度数据来补充观察视角,下个月会发力完善App榜单。白鲸出海联合非凡产研发布第4期全球AI图片web榜单,并逐步添加图片App数据。web榜单的门槛是月访问量200w、App榜单的标准是MAU200w,很多web做得比较好的产品都开始发力App端,例如出海的Fotor、SeaArt等等,前者在移动端也已经做到了百万左右的MAU,下个月我们会进一步完善数据。
全球首位AI软件工程师Devin诞生了,它掌握全栈技能,云端部署、底层代码、改bug、训练和微调AI模型都不在话下。最可怕的是,它完全不怕996,老黄的预言是彻底成真了!就在刚刚,世界上第一位AI程序员Devin诞生。CEOWu并没有详细说明他们的智能体背后使用的AI技术,只是笼统地解释说,团队找到了将大语言模型与强化学习技术相结合的独特方法。
Sora刚发布不久,就被逆向工程“解剖”了?!来自理海大学、微软研究院的华人团队发布了首个Sora相关研究综述,足足有37页。他们基于Sora公开技术报告和逆向工程,对模型背景、相关技术、应用、现存挑战以及文本到视频AI模型未来发展方向进行了全面分析。OneMoreThing这篇综述发布后引起了不少网友关注,有网友表示值得全文阅读,但也有网友吐槽标题“Sora:”的设置极易引起误会。
自曝996作息的OpenAI研究员JasonWei表示,Sora代表着视频生成的GPT-2时刻。竞争的关键,就是算力和数据了。从申请表中可以看出,OpenAI正在寻找以下认知科学、化学、生物、物理、计算机、经济学等领域的专家。
LLM智能体被众多业界AI大佬看好,甚至有望成为将人类从琐碎工作中解放出来的利器。它们该如何与世界进行最佳互动?最近,来自UIUC和苹果的华人研究员,提出了一种全新的智能体框架——CodeAct。在表5中,研究人员还发现CodeActAgent在测试的一般LLM任务中表现更好,除了CodeActAgent在MMLU上略有下降。
伊利诺伊大学香槟分校的研究团队发表了关于代码集成到LLM训练数据中的好处。这项研究概述了代码预训练对LLM的影响,并追踪了LLM作为智能智能体时的作用。对于数据密集型领域中更复杂的任务,模型需要精确掌握各种功能终端的使用方法,这是将LLM连接到不同的功能终端时面临的挑战。
NeurIPS收录的一项新研究,让大模型也学会“读心术”了!通过学习脑电波数据,模型成功地把受试者的脑电图信号翻译成了文本。且整个过程不需要大型设备,只要一块特制的“头巾”就能实现。同实验室的JinzhaoZhou和Yu-KaiWang,以及悉尼大学的ZhenWang也参与了此项目。
GPT-4V来做目标检测?网友实测:还没有准备好。虽然检测到的类别没问题,但大多数边界框都错放了。最终这个模型可以完成多种视觉任务,比如目标对象描述、视觉定位、图像说明、视觉问题解答以及从给定的输入文本中直接解析图片对象。