11.11云上盛惠!海量产品 · 轻松上云!云服务器首年1.8折起,买1年送3个月!超值优惠,性能稳定,让您的云端之旅更加畅享。快来腾讯云选购吧!
【新智元导读】在开源社区引起「海啸」的Mamba架构,再次卷土重来!这次,Mamba-2顺利拿下ICML。通过统一SSM和注意力机制,Transformer和SSM直接成了「一家亲」,Mamba-2这是要一统江湖了?年前,Mamba被顶会ICLR拒稿的消息曾引起轩然大波。是不是可以让SSD利用H100的新特性,让SSM在2-4K序列长度的大规模预训练中,比Transformer还快?推理优化:有许多针对Transformers的优化方法,特别是处理KV缓存。
普林斯顿大学最近推出了一款名为SWE-agent的AI程序员,这是世界上首个开源的AI程序员,它基于GPT-4技术,能够在GitHub仓库中自动修复bug。这个智能体-计算机接口的诞生,标志着AI在软件工程领域的应用迈出了重要一步。随着技术的不断进步,我们或许将见证AI在软件工程领域扮演更加重要的角色。
OpenAI宣布将上线自定义GPT商店,用户可以将自己开发的自定义ChatGPT助手进行分享的平台。这一商店的功能类似于苹果的AppStore,在大模型领域提供了新的商业机会。具备用户友好的工作流构建器、广泛的集成、开放的生态系统和无限的使用案例。
柯林斯词典宣布,“AI”已经成为2023年最受关注的词汇。这个决定是基于“AI”在过去一年中使用频率的四倍增长,以及它作为代表未来发展的技术已经成为今年的热门话题。这个词汇不仅代表了未来的趋势彰显了技术在当今社会中的广泛应用和影响。
柯林斯词典今年选择“人工智能”为2023年最受关注的词汇。这一术语的使用量在过去一年中增加了四倍,反映了它在当今社会中日益增长的影响力。随着它在各领域的应用不断扩大,这一词汇很可能会继续受到广泛关注。
【新智元导读】ChatGPT之类的AI编码工具来势汹汹,StackOverflow又裁员了!不过,普林斯顿和芝大竟发现,面对真实世界GitHub问题,GPT-4的解决率竟是0%。StackOverflow,已经被ChatGPT创飞了!因为码农大量涌向ChatGPT、GithubCopilot,StackOverflow今天不得已宣布裁员100多人,几乎占员工人数的1/3。这样就能腾出资源,用于公司筹备的其他目标。
【新智元导读】微调LLM需谨慎,用良性数据、微调后角色扮演等都会破坏LLM对齐性能!学习调大了还会继续提高风险!虽说预训练语言模型可以在零样本设置下,对新任务实现非常好的泛化性能,但在现实应用时,往往还需要针对特定用例对模型进行微调。微调后的模型安全性如何?是否会遗忘之前接受的对齐训练吗?面向用户时是否会输出有害内容?提供LLM服务的厂商也需要考虑到,当给终端用户开放模型微调权限后,安全性是否会下降?最近,普林斯顿大学、IBM、斯坦福等机构通过redteam实验证明,只需要几个恶意样本即可大幅降低预训练模型的安全性,甚至普通用户的微调也会影响模型的安全性。不管真正的原因是什么,研究人员假设,如果能够在未来的对齐工作中巩固那些不太稳健的危害类别,可能能够进一步提高良性微调情况下的整体安全性。
普林斯顿大学计算机科学专家ArvindNarayanan和他的学生SayashKapoor将出版新书“AISnakeOil”,探讨人工智能领域存在的许多炒作。尽管生成式AI取得很大进步,但部分炒作已经失控。作者希望人们对不同类型的AI有区分对待,承认生成式AI的进步,但也需要警惕其风险和炒作,通过transparency、政府监管等措施推动生成式AI的健康发展。
普林斯顿大学研究人员AlexanderRaistrick日前发布了一款名为“Infinigen”的开源AI模型,可以帮助人们生成逼真的3D场景。Infinigen是一款基于开源建模软件Blender的免费开源模型,能够通过随机数学规则生成一系列自然界的“植物、动物”场景,并且可以通过输入提示词来自定义地形,并添加“云、雨、雪、雷暴、天火”等自然现象。但Infinigen模型的当下效率还有待改进,其生成一张
矩阵世界是AI精心设计的模拟世界!普林斯顿用Infinigen这把钥匙,打开矩阵大门,AI生成的大自然比真实世界还真!尼奥在「黑客帝国」中发现自己生活的世界并非真实存在是被精心设计的模拟现实。有没有那么一瞬间,认为我们生活的世界,就是模拟的矩阵世界。目前的研究重点是多视图3D重建和程序数据生成。