11.11云上盛惠!海量产品 · 轻松上云!云服务器首年1.8折起,买1年送3个月!超值优惠,性能稳定,让您的云端之旅更加畅享。快来腾讯云选购吧!
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解:https://top.aibase.com/1、一男子因利用AI撰写色情小说被判刑十个月,非法获利超两万元湖北省大冶市人民法院近期对一起利用人工智能撰写色情小说并获利的案件作出判决。软银集团收购夏普旧厂,计划改造为AI数据中心,预计2026年投入运营,助力日本人工智能产业发展。
关注NLP领域的人们,一定好奇「语言模型能做什么?」「什么是o1?」「为什么思维链有效?」在NeurIPS的LatentSpace非官方IndustryTrack上,Ai2研究科学家NathanLambert发表相关演讲,直接回答语言模型能否推理,以及o1和强化微调API给大家的启发。演讲内容亮点摘要:2025年,推理语言模型将取代后训练;强化学习训练不是后训练。他的谷歌总引用数为3459,但增长速度惊人:2024年比2023年翻了一番。
【新智元导读】来了来了,月之暗面首个「满血版o1」来了!这是除OpenAI之外,首次有多模态模型在数学和代码能力上达到了满血版o1的水平。AI大神Karpathy曾说过,「英文是最热门的编程语言」。k1.5已经带来了诸多惊喜真是有点期待下一代模型的到来。
AI玩黑神话,第一个精英怪牯护院轻松拿捏啊。在本项研究中,数据集中的有效数据为1000条。
大语言模型还能向上突破,OpenAI再次证明了自己的实力。北京时间9月13日午夜,OpenAI正式公开一系列全新AI大模型,旨在专门解决难题。「除了新的o1系列模型,我们计划继续开发和发布我们的GPT系列模型。
只用强化学习来微调,无需人类反馈,就能让多模态大模型学会做决策!这种方法得到的模型,已经学会了看图玩扑克、算“12点”等任务,表现甚至超越了GPT-4v。这是来自UC伯克利等高校最新提出的微调方法,研究阵容也是相当豪华:图灵奖三巨头之一、Meta首席AI科学家、纽约大学教授LeCunUC伯克利大牛、ALOHA团队成员SergryLevineResNeXt一作、Sora基础技术DiT作者谢赛宁香港大学数据科学学院院长、UC伯克利教授马毅该方法名为RL4VLM,论文预印本已经上线,相关代码也已在GitHub中开源。从提示词上看,这项研究采取了如下的提示过程作为多模态模型的输入,并且给出了期望的输出形式:消融实验结果表明,如果这一过程中不采用思维链,则任务成功率会出现大幅下降。
在使用强化学习进行文本生成图像时,质量奖励成为一个紧迫问题。尽管观察到通过强化学习RL可能提高图像质量,但多个奖励的聚合可能导致在某些度量中过度优化在其他度量中降级。但在Parrot潜在生成不当内容的能力方面引发了伦理关切,强调了在部署中进行审查和伦理考虑的必要性。
韩国首尔国立大学的研究人员致力于训练能够自主创作真正拼贴艺术品的AI代理人。目前市面上的AI工具可以生成类似拼贴的图像,但缺乏真正的创作过程的真实性。通过用户研究和客观评估的验证,这一突破为AI在艺术创作中开辟了新的道路,为机器在视觉艺术领域有意义地贡献创造了前景。
迪士尼研究所在国际机器人大会上首次展示了一款可表达情感的新型四肢机器人。该机器人拥有一闪一闪的大眼睛、摇摇晃晃的脑袋和灵活摆动的触角,走路时屁颠屁颠但十分稳定。研究人员表示,这个情感机器人只是首个案例,通过模块化和通用的强化学习流程,可以快速教会不同外观、不同动作的机器人实现复杂的情感表达。
传奇程序员卡马克和强化学习之父萨顿联手创办了AI创业公司KeenTechnologies,他们的目标是在2030年向公众展示通用人工智能的可行性。与主流方法不同,他们不依赖大模型是追求实时的在线学习。卡马克和萨顿的合作将引领AI领域的发展,为实现人工智能的全面进化提供新的思路和方向。