英伟达的研究人员最近开发了一个人工智能系统,可以从任何2D图像中预测完整的 3D 模型。这一人工智能系统被称为“DIB-R”,它可以拍摄任何2D物体的照片,例如一只鸟的图像,并预测它在三维空间的模型。预测内容包括光照、纹理和深度。研究小组希望,有一天该系统将使人工智能能够只用几毫秒的时间,就能用照片创造出完全沉浸式的3D世界。(thenextweb)
(举报)
英伟达的研究人员最近开发了一个人工智能系统,可以从任何2D图像中预测完整的 3D 模型。这一人工智能系统被称为“DIB-R”,它可以拍摄任何2D物体的照片,例如一只鸟的图像,并预测它在三维空间的模型。预测内容包括光照、纹理和深度。研究小组希望,有一天该系统将使人工智能能够只用几毫秒的时间,就能用照片创造出完全沉浸式的3D世界。(thenextweb)
(举报)
11.11云上盛惠!海量产品 · 轻松上云!云服务器首年1.8折起,买1年送3个月!超值优惠,性能稳定,让您的云端之旅更加畅享。快来腾讯云选购吧!
Nvidia和Shutterstock最近联手推出了一项名为文本转3D的全新服务GettyImages也推出了一项旨在给创意专业人士更多控制权的AI图像生成服务。Shutterstock的3D生成服务是基于Nvidia最新版本的Edify,这是一种用于视觉生成AI的多模态架构。Shutterstock和GettyImages的这些举措将进一步推动AI在创意领域的应用,为创意专业人士提供了更多创作和编辑的可能性。
在Reddit上,一个帖子引起了广泛的关注。这个帖子展示了一种利用简陋的3D模型动画和Animatediff生成高度自定义的2D动画的方法。这种创新的处理方式,不仅提高了动画制作的效率,也为动画创作提供了更多的可能性。
Cartwheel是一个创新的文本转3D动画工具,用户通过输入文字提示即可生成适用于视频、游戏、电影、广告、社交或VR项目的3D动画角色。其灵活性和易用性让用户能够轻松生成各种动作,并支持导出到任何3D程序中进行编辑。产品特色及优势通过输入文字提示生成3D动画角色支持各种动作,包括走路、舞蹈等导出动画到任何3D程序进行编辑灵活性和易用性让用户能够轻松生成各种动作要了解更多关于Cartwheel的信息并开始使用这一强大的3D动画角色创建工具,请访问Cartwheel官网。
CRM是一个高保真的单图像到3D纹理网格的生成模型,它通过整合几何先验到网络设计中,能够从单个输入图像生成六个正交视图图像,然后利用卷积U-Net创建高分辨率的三平面。CRM进一步使用Flexicubes作为几何表示,便于在纹理网格上进行直接的端到端优化。要获取更多详细信息并开始使用CRM,请访问CRM官方网站。
3D生成领域迎来新的「SOTA级选手」,支持商用和非商用。StabilityAI的大模型家族来了一位新成员。更多技术细节和实验结果请参阅原论文。
StabilityAI和TripoAI昨晚联合发布了一款名为TripoSR的3D生成模型。这款模型能够在不到1秒的时间内生成高质量的3D模型,这一创新技术的推出无疑将为3D建模领域带来革命性的变革。StabilityAI和TripoAI的这次合作,推出的TripoSR3D生成模型,不仅在技术上取得了突破,也为3D建模领域带来了新的可能性。
智能NPC,已经承担起推动游戏主线的任务了!育碧的一个DEMO中,两名个性鲜明的智能NPC带着玩家,在游戏世界中畅游了十五分钟。结合DLSS3已有的超分辨率、帧生成和低延迟功能,可以在游戏中同时实现画质和帧率的提升以及延迟的下降。英伟达也将RTXVideoSuperResolution运用到了视频之中,可以让大部分浏览器中或存储在本地的视频,分辨率再上一层楼,没有会员、网速不够也能畅享超清视频了。
3月8日,全球AI领导者英伟达在官网推出了,生成式AI专业认证,通过考试可获得行业认可的权威证书。同时英伟达也推出了相应的培训课程,包括生成式AI解释,深度学习入门/基础知识,基于Transformer的自然语言处理,使用大语言模型进行定制应用开发,大语言模型的部署、定制、微调等,帮助学员顺利通过考试。如果你是技术大牛,不学习课程直接参加考试也是没问题的。
背景介绍在数字经济建设和数字化转型的浪潮中,数据可视化大屏已成为各行各业的必备工具。传统的数据大屏往往以图表和指标为主,无法真实地反映复杂的物理世界和数据关系。无论是数据可视化还是数据分析,这个3D可视化大屏为我们提供了一个强大灵活的工具,为数字化转型带来了巨大的推动力。
StabilityAI推出了StableVideo3D,这是一款用于生成3D视频的新型genAI工具。SV3D是在稳定AI之前的StableVideo技术基础上开发的,该技术使用户能够从图像或文本提示中生成短视频。SV3D_p则扩展了这一功能,既可以使用单个图像,也可以使用轨道视图,允许用户沿指定的摄像机路径创建3D视频。
DocTranslator 是世界上最好的 AI 翻译工具,支持超过 100 种语言,可快速翻译大型 PDF、Word、Excel、PPT 文件。提供免费试用计划和存储计划,支持 MS Word、Excel 和 PDF 格式,保留原始格式和布局。价格从 0.005 美元 / 单词起,满足各种用户需求。
ポケトーク是一款梦幻的 AI 翻译机,可以让无法交流的人进行对话,具有高度实用性和便携性,是旅行、商务等场景的理想助手。
chichi-pui(ちちぷい)是一家 AI 画像专用的投稿和生成网站,用户可以在此分享和生成 AI 插画、AI 照片等作品。该网站拥有丰富的 AI 画像投稿和生成内容,适合对 AI 艺术感兴趣的用户使用。用户可在网站上参与不同的活动和投稿企划,与其他用户分享作品并获取灵感。
Al Comic Factory利用大型语言模型和SDXL技术自动生成有情感、有故事性的漫画内容。用户只需提供简单文本提示,AI Comic Factory即可生成包含人物对话和场景描述的漫画。支持多种配置、用户交互、多语言内容创建、批量生成漫画变体等功能。
Chatmind 是一款由 Xmind 团队推出的免费在线 AI 思维导图和头脑风暴工具,通过 ChatGPT 技术,帮助用户在几分钟内创建思维导图。用户可以通过简单的文本描述生成思维导图,快速总结文档或 URL 链接为思维导图,与 AI 对话产生创意并整合到思维导图中,描述文本即可立即生成图像,轻松为任何主题创建视觉内容,自动保存文件历史以便跨设备访问,编辑文本和重新排列主题轻松自如,将思维导图转化为幻灯片展示只需一键,轻松以多种格式分享思维导图。
Scribble Diffusion利用人工智能将您的草图转化为精致图像。用户可以上传草图并获得优化后的图像。产品定位为为用户提供便捷的图像处理功能,提升设计效率。
Sider 是一款 AI 助手,集成了 ChatGPT 3.5/4、Gemini 和 Claude 等多功能 AI 工具,能够帮助用户进行聊天、写作、阅读、翻译、解释、图像测试等操作。用户可在任何网页上使用 Sider,提供强大的 AI 支持。
joyland是一个沉浸式 AI 聊天平台,用户可以在其中进行基于角色的对话,创造自己的冒险故事。通过与虚拟角色互动,用户可以逃离现实生活的平凡,沉浸于充满乐趣和想象力的互动体验中。乐园的定价灵活多样,适合不同用户需求。
Charstar AI 是一个基于最新开源 AI 技术支持的虚拟角色交流平台,用户可以与各种虚拟 AI 角色进行互动、发现新角色,并探索其潜在故事。通过与虚拟角色聊天,用户可以体验到独特的交流方式,为用户提供全新的虚拟角色交互体验。
FakeYou Celebrity Voice Generator 是一款利用深度伪造技术生成喜爱角色说任何你想说的话的文本到语音生成器。用户可以免费使用该工具来创作独特的声音内容。
The StoryGraph 是一个帮助用户跟踪阅读进度并选择下一本书的平台。用户可以免费使用大部分功能,也提供付费的 Plus 计划获得更加个性化的体验。由 Nadia Odunayo 和 Rob Frelow 创办,始于 Nadia 的个人项目,致力于帮助用户管理阅读列表。用户可以在 App Store 和 Play Store 下载 The StoryGraph 的移动应用,并从 Goodreads 导入阅读数据。
Happy Scribe 提供自动和人工转录服务,将音频转换为文本,准确率达到 85-99%,支持 120 多种语言和 45 多种格式。定位于为用户提供高效的音视频转录及字幕服务。
Product Hunt 是每天最佳新品的精选。发现最新的移动应用程序、网站和技术产品,人人都在谈论。
JanitorAI 是一个集合了各种有趣的聊天机器人的平台,用户可以与各种不同性格和故事背景的虚拟角色进行互动。平台定位于提供娱乐和交流的虚拟角色体验。用户可以选择不同的角色与之互动,体验多样化的聊天和故事情节。平台允许用户创建具有不同个性的NSFW虚构聊天机器人角色。该平台由大型语言模型驱动,包括OpenAI的GPT模型。
ComfyUI-SuperBeasts是一款用于增强图像动态范围和视觉吸引力的图像处理应用程序。它提供了一组可调整的参数,用于根据用户偏好微调HDR效果。该应用程序具有以下特点:调整阴影、高光和整体HDR效果的强度;应用伽马校正以控制整体亮度和对比度;增强对比度和色彩饱和度,使结果更加生动;通过在LAB颜色空间处理图像来保留颜色准确性;利用基于亮度的掩码进行针对性调整;将调整后的亮度与原始亮度进行混合,以实现平衡效果。
Liner 是由 GPT-4 提供支持,旨在提高您的生产力。通过摘要文章、生成代码和撰写电子邮件,优化工作流程。
Adobe GenStudio是一个基于生成式人工智能构建的跨渠道活动工具集,旨在帮助营销团队规划、制作、管理、发布并评估高品质品牌内容。核心功能包括创作、内容中心、活动管理、发布和数据洞察。产品定位于提升营销人员工作效率及品牌形象一致性。
Llanai是一个通过与AI进行聊天和语音交流来帮助学习语言的产品。它根据您的学习目标和兴趣创建个性化的学习计划,并提供即时反馈和纠正。您可以随时随地通过WhatsApp进行学习,提高口语和听力技能。
Ramban AI是一款集成了先进的人工智能能力的全能平台,可用于内容创作、多媒体制作和智能协作。它提供了AI文章生成器、智能编辑器、AI重写工具和抄袭检测器等AI驱动的内容创作工具,让您能够轻松高效地创建高质量、吸引人的内容。AI视频制作、AI图像生成和AI语音合成等功能可提升您的多媒体制作能力。此外,AI聊天、AI视觉、AI文件聊天和AI网页聊天等工具可实现实时团队协作和高效沟通。Ramban AI还提供AI代码助手和品牌声音功能,以简化编码过程并在所有渠道保持一致的品牌声音。用户友好的界面和易用性使所有技术背景的人都能轻松利用AI的力量。解锁无限可能,实现卓越创造力,与Ramban AI一起保持领先。
Knowt 是一款免费的学习工具,受到超过 1 百万学生的信赖。用户可以通过导入 Quizlet 内容,使用无限的学习模式、匹配游戏等功能来学习。除了学生,教师也可以在 Knowt 上上传讲座,创建闪卡。定价策略为免费使用。