11.11云上盛惠!海量产品 · 轻松上云!云服务器首年1.8折起,买1年送3个月!超值优惠,性能稳定,让您的云端之旅更加畅享。快来腾讯云选购吧!
微软面向Dev频道的WindowsInsider项目成员发布了适用于Windows11的KB5050083更新,版本号升至Build26120.2992。此次更新的一大亮点是全新的Windows11AIPC体验,尤其是对WindowsSearch搜索功能的大幅改善。用户可在设置”隐私和安全性”SearchingWindows”中调整可搜索的位置,或开启增强”以对全电脑搜索,未来,微软还将支持搜索存储在OneDrive等云存储提供商中的文档和照片。
近日,苹果公司推出了300亿参数的多模态AI大模型MM1.5,该版本是在前代MM1的架构基础上发展来的。该模型继续遵循数据驱动的训练原则,着重探究在不同训练周期中混合各类数据对模型性能产生的影响,相关模型文档已在HuggingFace上发布。尽管MM1.5模型在多项基准测试中表现优异,但苹果团队仍计划通过进一步融合文本、图像和用户交互数据,并设计更复杂的架构,来提升模型对移动设备UI的理解能力,从让苹果牌”AI更强大。
【新智元导读】AI在学会工作之后,终于也能和人一样玩游戏了!DeepMind的SIMA是一个可以感知和理解各种环境的AI代理,能够在多种视频游戏设置中执行任务,未来甚至可能可以与任何虚拟环境进行互动。谷歌DeepMind在AI和游戏方面有着悠久的历史。SIMA只是刚刚开始,我们可以期待在更多的训练环境中继续建立SIMA,并整合更有能力的模型,让它变得更具泛化性和多功能性不仅仅局限于游戏。
OpenUI是一款旨在使UI设计及构建UI组件过程变得有趣、快捷和灵活的工具。OpenUI可用于测试和原型化下一代工具,在LLM的基础上构建强大的应用程序。欲了解更多详情,请访问OpenUI官方网站。
LaVague是一个旨在自动化浏览器交互的大型动作模型框架,通过将自然语言指令转化为无缝的浏览器交互,重新定义了互联网浏览体验。该框架的设计初衷是为用户自动化繁琐的任务,节省时间,让用户能够专注于更有意义的事务。未来的发展方向可能包括优化本地模型、改进信息检索以确保生成的代码片段相关性、支持其他浏览器引擎等。
随着近年来大型语言模型在语言处理领域的显著进展,研究人员尝试将这些模型应用于药物发现,以优化相关任务。在药物发现的分子优化方面,LLMs并未取得显著进展。它在单属性和多属性优化中展现了出色的结果,表现出很强的可迁移性。
豆包是一款智能聊天机器人,能够与用户进行自然语言交互,提供各种聊天话题,包括天气、新闻、笑话、音乐等。豆包还能够根据用户的喜好和习惯,推荐相关的内容和服务。让豆包成为你的聊天伙伴,随时随地陪伴你,分享信息和乐趣。
Fairy是由MetaGenAI开发的一个视频编辑工具,它可以通过自然语言指令对视频进行编辑,包括风格转换和物体或角色变换等。该工具的速度非常快,能够在14秒内生成120帧的512×384视频。Fairy的设计支持并行计算,使其能够在多个GPU上同时处理视频,从显著提高处理速度。
Meta最新发布了Audiobox,这是一款基于语音和自然语言提示生成音频的先进研究模型。通过结合语音输入和文本提示,Audiobox可以轻松生成各种声音,包括语音、音效和音景,从为多种用例提供定制音频。这对于视频、播客、游戏等多种用例都具有潜在的影响,为未来的音频创作开辟了新的可能性。