11.11云上盛惠!海量产品 · 轻松上云!云服务器首年1.8折起,买1年送3个月!超值优惠,性能稳定,让您的云端之旅更加畅享。快来腾讯云选购吧!
由阿里、复旦大学、南京大学联合发布的可控人体视频生成工作Champ火爆全网。该模型仅开源5天GitHub即收获1k星,在Twitter更是「火出圈」,吸引了大量博主二创,浏览量总量达到300K。更多技术细节以及实验结果请参阅Champ原论文与代码,也可在HuggingFace或下载官方源码动手体验。
零一万物Yi大模型API开放平台,正式向开发者和商业界开放了!在此前,Yi系列模型凭借着国际SOTA的性能、训练成本友好和更懂中文等优势在全世界AI社区中名声大震,开源的Yi系列模型,已经是开源社区一股不可小觑的中国力量。零一万物就正式开源了Yi-34B大模型,具备了处理200K上下窗口的能力。开源模型、开放API、打造ToC超级应用,零一万物正在一步步践行着CEO李开复博士的大模型商业化方法论。
昨晚荣耀发布了顶级直板旗舰荣耀Magic6至臻版及Magic6RSR保时捷设计。荣耀Magic6RSR保时捷设计全球首发京东方的Tandem双栈串联OLED智能机终端方案,带来超高亮度、超强续航、超长寿命的性能体验。Magic6至臻版及Magic6RSR保时捷设计均采用了行业最高4320Hz超高频PWM调光模式,在暗光环境下可大幅降低屏幕频闪对眼睛的潜在危害。
CyberDemo是一个旨在通过模拟人类演示来增强现实世界中灵巧操作的项目。它可能涉及到机器人技术、机器学习和模拟环境的结合,以提高机器人在复杂环境中的操作能力。通过模拟人类演示和灵巧操作的结合,CyberDemo为机器人技术领域带来了新的突破。
加利福尼亚大学圣地亚哥分校和南加利福尼亚大学的研究人员最近推出了一种名为CyberDemo的新型人工智能框架,旨在通过视觉观察进行机器人模仿学习。传统的模仿学习方法通常需要大量高质量的示范数据来教导机器人完成复杂任务,特别是对于需要高度灵巧的任务来说。虽然为每个任务设计模拟环境需要额外的工作,但减少了数据收集的人为干预,并避免了复杂的奖励设计�
还记得日前苹果开源的图像新技术MGIE吗?这项技术能够帮助用户通过自然语言指令来修改图片,使得编辑图片更加简单和自然。苹果上线了MGIE项目的Demo,用户可以在线上试玩。不要使用MGIE对人像进行任何形式的修改,这些都不被允许。
Gemini是由谷歌DeepMind推出的新一代人工智能系统。作为全球热门的多模态AI系统,Gemini能够进行多模态推理,支持文本、图像、视频、音频和代码之间的无缝交互。点击上方链接,体验这个全球热门的多模态人工智能系统,探索无限可能性!
StableDiffusion要王者归来了?StabilityAICEOEmadMostaque最新推文,四段视频引人无数遐想。不少网友怀疑,这是StableVideoDiffusion新版本的演示Demo。又或者在可控性等上面去卷……这不就在前几天,runway的Gen-2再进化——只需5个笔刷,对着一张图一顿刷刷刷刷刷,原本静止的小鸟们就各自运动了起来。
热赛道和冷市场的矛盾之下,机器人需要一次换代式升级。冷中有热的资本市场在宏观经济下行的影响下,我国服务机器人产量从2022年开始出现明显放缓,2021年12月至2022年12月,我国服务机器人产量都处于同比下滑的状态,一时间,行业明显转冷。以定向清扫为例,发布语音命令:“清扫一下客厅”可被识别为针对地图上识别到的客厅区域进行一次规划清扫。
在谷歌发布了由DeepMind实验室大约一年前推出的代码生成模型之后,谷歌今天早上宣布了AlphaCode2,这是该模型的升级版本。与原模型相比,AlphaCode2的性能得到了显著提高。这一发布意味着谷歌在AI编程领域迈出了新的一步。
谷歌日前发布了AlphaCode2,这是一款由Gemini模型驱动的AI编程工具,是对前代AlphaCode的改进版本。与Gemini模型同时亮相,AlphaCode2在编程竞赛中表现出色,尤其在动态规划等复杂问题上具备更强大的能力。”他进一步指出:“在未来,我们预见程序员将利用高度capable的AI模型作为协作工具,从问题推理到辅助实施,助力整个软件开发过程。
一项新的技术正在将低成本、高分辨率的人工智能图像生成带给更广泛的用户群体无需强大计算机背后的付费壁垒。要创建高质量的AI图像,用户必须订阅Midjourney或DALLE-3等服务,或购买自己的超级计算机。这并不是一种简单的放大方法是通过在图像中逐块工作,至少提高16倍的细节和分辨率。
《EmuVideo》是一种基于扩散模型的文本到视频生成工具,它可以将文本提示转化为图像,然后再将这些图像转化为视频。这一分步生成方法提高了视频生成模型的训练效率。以上就是《EmuVideo》的全部介绍了,感兴趣的小伙伴可以点击上方链接前往体验!
一项重大漏洞使得ChatGPT3.5用户能够免费升级至GPT-4Plus,作者通过链接测试并确认漏洞实锤。不过目前该漏洞似乎已经被补上。项目地址:https://github.com/abi/screenshot-to-code多模态语言模型新基准AMBER评估和降低模型中的幻觉问题AMBER项目是为多模态语言模型设计的新基准,致力于评估和减少模型在生成文本、图像或音频等多模态数据时可能产生的幻觉问题,并提供开源库支持。
Facebook和Instagram的母公司Meta宣布在人工智能内容创作和编辑工具领域取得了重大进展,推出两项创新性工具:EmuEdit用于图像编辑,EmuVideo用于视频生成。EmuEdit:提升图像编辑标准EmuEdit的首次突破旨在为用户提供对图像编辑的精细控制。随着AI合成的成熟,用户或许有朝一日可以像发送短信一样直观地产生专业级别的内容。
社交媒体巨头Meta公司于11月16日在其博客文章中宣布推出最新的人工智能模型,用于内容编辑和生成。这两款AI驱动的生成模型,分别为EmuVideo和EmuEdit,代表了行业的一大进步。该平台的一般广告规则并未特别涉及AI。
但攘外需要同时安内。市场降温之后,正迎来拐点疫情之后,经济逐渐下行,服务机器人的“好日子”也随之结束,整个行业都在动荡中经历渡劫。其中与传统清洁设备厂商ICE合作的中型清洁机器人Cobi18,已在全球十几个国家批量部署,且在欧美市场实现运行零故障。
打破场景限制,不一样的“斜杠青年”。随着服务机器人不断进入到商场、超市、写字楼、酒店等新场景,场景的多样化和复杂度也在明显提升,由于场景的独特性,对于机器人的要求也千差万别,这意味机器人需要更强大的适应性,并同时满足使用体验、成本等要求。其中与传统清洁设备厂商ICE合作的中型清洁机器人Cobi18,已在全球十几个国家批量部署,且在欧美市场实现运行零故障。
多模态王炸大模型GPT-4V,166页“说明书”重磅发布!且还是微软团队出品。什么样的论文,能写出166页?不仅详细测评了GPT-4V在十大任务上的表现,从基础的图像识别、到复杂的逻辑推理都有展示;还传授了一整套多模态大模型提示词使用技巧——手把手教你从0到1学会写提示词,回答专业程度一看就懂,属实是把GPT-4V的使用门槛打到不存在了。她的研究领域是基于多模态感知智能
GoogleDeepMind与33家其他研究机构合作推出了一个令人瞩目的新项目,旨在解决机器人领域的一个重大挑战:为每个机器人、任务和环境训练机器学习模型所需的巨大工作量。这个项目的目标是创建一个通用型AI系统,能够与不同类型的物理机器人协同工作,并执行多种任务。机器人领域的未来在于使机器人能够相互学习,让研究人员互相学习。
扫地机器人好用与否,避障表现首当其冲,那么评判避障好坏的标准又是什么?有效避障仅是第一步时至今日,可以说仍有相当一部分人对于扫地机器人的印象停留在人工“智障”上,由于早期的产品基本不具备避障能力,机器人就像无头苍蝇一样到处乱撞,使用体验极其糟糕。以定向清扫为例,简单一句“清扫一下沙发周围”,机器人便能跑到沙发区域进行一次规划清扫,�
把商用机器人现场部署时间减少80-90%,噱头or真实力?费时费力的现场部署与扫地机器人开机即用不同,一般商用机器人在使用前有最后“一道工序”,现场部署。INDEMIND三年预期订单将超10万台。
始智AI团队打造的中立开放AI开源社区平台正式上线,旨在打造中国版“HuggingFace”。该社区汇聚了清华/智谱chatglm2-6B、StableDiffusionV1.5、alphafold2、seamlessm4tlarge等模型,以及shareGPT、ultrachat、moss-sft等数据集等资源。始智AI表示,wisemodel.cn平台目前已经完成了基础的社区功能,注册完成之后,在“用户中心-我的组织”模块创建组织,可以邀请成员加入到组织内,之后组织内成员都�
随着商用清洁机器人进入越来越多的场景中,单一的中型机器人并不能有效覆盖所有区域,更加细分化的产品组合正在成为新的趋势。产品形态的“新趋势”在商用场景中,目前的商用清洁机器人几乎均是中大型的产品形态,较大的体型意味着更高的清洁效率,但本身也限制了清洁覆盖率。搭载两种方案的机器人无需预部署,开箱即可使用,支持多层地图,且具备智能梯控系统,能够实现多楼层灵活作业。
字节推出了一种新的大模型,名为BuboGPT,BuboGPT是一种先进的大型语言模型,能够将文本、图像和音频等多模态输入进行整合,并具有将回复与视觉对象进行对接的独特能力。它展示了在对齐或未对齐的任意图像音频数据理解方面的出色对话能力。-对齐和非对齐理解:BuboGPT能够处理匹配的音频-图像对,实现完美的对齐理解,并能对任意音频-图像对进行高质量的响应。
字节大模型,BuboGPT来了。支持文本、图像、音频三种模态,做到细粒度的多模态联合理解。再来一张图片,并带有一段音频,BuboGPT也正确匹配了声音来源:Audio-8-bicycle_bell,量子位,22秒当然,它也会出现识别不成功,表述错误的情况,比如说下面这张图中并没有人,音频也只是钟声,但它的描述和图片似乎并不搭边。
全民健康的时代,除了通过瑜伽、普拉提等外在运动保持好的体能与体态,内在营养补充也成为更多女性追求健康生活的热门选项不同年龄段的女性对营养补充的需求大相径庭。在30女性年龄群体中,她们年龄在加,吸收却减,新陈代谢变差的情况普遍存在,因此不仅需要营养成分全面摄入,更需要做到精准补充。属于30女性变美的主场版图EMITCODE正拓疆,未来将持续深耕谷胱甘肽领域,让每一位爱美女性,为白来,不止于白,收获健康与美丽。
这或许是人们对扫地机器人避障功能的理想期待。谁才是扫地机器人的“最优解”?评判一款扫地机器人好用与否,避障表现无疑是核心因素。对于扫地机器人言,已不再是幻想。
DemoGPT是一个开源项目,旨在通过LangChain的自动代码生成功能,优化和民主化基于大型语言模型的应用程序开发。它利用强大的GPT-3.5-turbo模型,将LangChain文档树的文档理解与用户提示相结合,自动生成符合最佳编码实践的代码。它致力于推动LLM应用程序开发的范式转变,让更多的用户参与到产品的持续演进中。
没有人怀疑,VSLAM将是推动机器人再次迭代的关键之一。移动的“机器”还是机器人?INDEMIND三年预期订单将超10万台。