首页 > 关键词 > 模型重建最新资讯
模型重建

模型重建

在数字资产创造和3D重建领域,香港大学CVMI实验室与3D大模型公司VAST以及浙江大学的联合研究团队提出了一项突破性成果——SC-GS模型。这一模型不仅在新视角合成领域掀起了革命性浪潮,更在动态场景的实时交互编辑方面展现了巨大潜力。他们期待在2024年看到更多基于高斯溅射技术的创新工作和探索。...

特别声明:本页面标签名称与页面内容,系网站系统为资讯内容分类自动生成,仅提供资讯内容索引使用,旨在方便用户索引相关资讯报道。如标签名称涉及商标信息,请访问商标品牌官方了解详情,请勿以本站标签页面内容为参考信息,本站与可能出现的商标名称信息不存在任何关联关系,对本页面内容所引致的错误、不确或遗漏,概不负任何法律责任。站长之家将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。任何单位或个人认为本页面内容可能涉嫌侵犯其知识产权或存在不实内容时,可及时向站长之家提出书面权利通知或不实情况说明,并提权属证明及详细侵权或不实情况证明(点击查看反馈联系地址)。本网站在收到上述反馈文件后,将会依法依规核实信息,第一时间沟通删除相关内容或断开相关链接。

与“模型重建”的相关热搜词:

相关“模型重建” 的资讯4533篇

  • 港大与浙大联合研发SC-GS模型 鼠标拖拽实时可编辑3D重建

    在数字资产创造和3D重建领域,香港大学CVMI实验室与3D大模型公司VAST以及浙江大学的联合研究团队提出了一项突破性成果——SC-GS模型。这一模型不仅在新视角合成领域掀起了革命性浪潮,更在动态场景的实时交互编辑方面展现了巨大潜力。他们期待在2024年看到更多基于高斯溅射技术的创新工作和探索。

  • 浙大团队推​SIFU模型:单张图像准确重建高质量3D人体模型

    在AR、VR、3D打印、场景搭建以及电影制作等多个领域中,获得高质量穿着衣服的人体3D模型变得至关重要。传统的创建方法耗时且需要专业设备捕捉多视角照片依赖技术熟练的专业人员。SIFU模型为单张图片人体重建提供了一种创新的方法,为未来的研究和实际应用提供了新的思路。

  • 浙大提出SIFU模型 单图即可重建高质量3D人体模型

    浙江大学ReLER实验室的研究人员提出了一项引人瞩目的研究成果:SIFU模型。该模型创新性地使用单张图片进行3D人体模型重建,通过引入侧视图条件隐函数和扩散模型,实现了几何和纹理重建的最先进水平。通过这一研究,浙江大学ReLER实验室为几何纹理重建领域注入了新的SOTA技术,为未来的科研和产业应用提供了坚实的基础。

    3D
  • 中科奥森-3D数字人脸模型重建技术

    随着科技的不断发展,人脸识别技术已经广泛应用于各个领域。将人脸照片转化为3D模型的需求也日益增长,如游戏开发、影视制作、人脸识别门禁系统等。我们有理由相信3D数字人脸模型重建技术在未来将具有更为广阔的发展前景和市场需求。

  • 新型3D生成方法DMV3D:使用基于Transformer的3D大型重建模型进行去噪

    Adobe研究人员与斯坦福大学团队联合提出了一种名为DMV3D的全新3D生成方法。该方法旨在解决增强现实、虚拟现实、机器人技术和游戏等领域中3D资产创建的共同挑战。该研究为通过统一3D重建和生成的2D和3D生成模型的领域之间的鸿沟,以解决3D视觉和图形领域中的各种挑战,提供了新的视角和可能性。

  • 百度调拨3000万支援抗汛救灾 利用大模型等技术支持灾后重建

    8月3日,百度宣布调拨3000万资金,持续用于支援京津冀等地抗汛救灾。台风“杜苏芮”肆虐,京津冀地区因极端降雨引发洪涝灾害,给人民群众生产生活造成重大影响。百度积极参与抗汛救灾、疫情防控、生态保护等公益事业,同时借助领先的AI技术帮助解决社会难题。

  • 云从科技3D人体重建技术新突破!仅凭照片生成精细3D模型

    一千呼万唤始出来!近日,具有人工智能“国家队”称号的云从科技宣布:重大突破!据媒体报道,云从科技已在3D人体重建技术上取得了重大突破,云从准备今年把这款黑科技用在身份影像重建、医疗肢体打印与电影制作等领域上。其实,云从研发3D重建技术已有时日。去年,云从研究院曾提出针对人脸的稠密3D关键点技术PRNet,能够基于一帧人脸图像重建出约4万5千个人脸3D关键点,在多个三维人脸数据集上大幅领先之前的技术。相关论文发表?

  • 华为PixArt-Σ放出模型文件 可在Comfyui使用

    华为的4K图像模型PixArt-Σ放出了模型文件diffusers也支持了这个架构,用户可以在Comfyui上尝试。尽管他们XL-1024版本的模型大小只有2G,但在图像表现和提示词理解方面,它与SD3模型相当接近。PixArt-Σ为用户提供了一种高质量的图像生成工具,能够根据文本提示生成具有特定风格的4K分辨率图像。

  • 支付宝小程序云推出新解决方案 烹饪机器人也用上了大模型

    第135届广交会正在火热进行支付宝小程序云助力合作伙伴田螺云厨,在烹饪机器人上开始用上大模型技术。各类智能产品的亮相,从中国制造迈向中国创造,也成为广交会的一个亮点。CookGPT不仅是菜谱的提供者,更能与用户一同成为“创新者”,让每个用户都能创造出专人专属的膳食解决方案与个性化菜谱创作,体验烹饪乐趣。

  • 写真视频击败Sora?人大自研全新多模态大模型Awaker 1.0震撼登场

    在人工智能领域,人大系初创公司智子引擎近日发布了一款名为Awaker1.0的全新多模态大模型,标志着向通用人工智能迈出了重要一步。该模型在写真视频效果上超越了Sora,展现了其在视觉生成方面的卓越能力。Awaker1.0在理解侧和生成侧都实现了效果突破,有望加速多模态大模型行业的发展,最终让人类实现AGI。

  • 卓世科技闪耀中关村论坛,共绘大模型时代蓝图

    2024年4月25日至29日,北京中关村论坛年会盛大召开,来自全球100多个国家和地区的代表以及国际组织嘉宾共襄盛举。本次论坛以“创新:构筑更美好的世界”为主题,精心组织了论坛会议、技术交易、成果发布等五大核心板块,共计近120场丰富多彩的活动。卓世科技将继续致力于推动AI技术的发展与创新,为实现智能普惠、开源共享、科技平权的目标努力。

  • Humanify:专为Blender设计的插件,一键生成高度逼真的人类模型

    Humanify是一个创新的Blender着色器插件,它通过简化的操作流程,使得在Blender中一键生成高度逼真的人类模型成为可能。无论是3D建模的新手还是经验丰富的艺术家,都能够利用Humanify轻松实现人物模型的真实感渲染。Humanify插件代表了3D建模和渲染技术的一大进步,它通过简化技术流程,让艺术家们能够更加专注于他们的艺术创作,同时保证了作品的质量。

  • LobeChat支持通过网页版直接调用Ollama 本地模型 体验媲美ChatGPT

    LobeChat是一个创新的网页平台,它支持通过网页版直接调用Ollama本地模型。这项服务的推出,为用户提供了一种便捷的方式,通过网页界面直接利用开源大模型的能力。体验地址:https://chat-preview.lobehub.com/chat随着LobeChat等工具的不断发展,我们可以预见未来将有更多集成本地大模型的网页应用出现,为用户提供更丰富的交互体验和更高效的工作流程。

  • AI日报:当前最强国产Sora大模型Vidu发布;Kimi Chat移动端升级;通义千问开源首个千亿参数模型;苹果计划与 OpenAI 合作

    欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解:https://top.aibase.com/1、清华团队发布视频大模型Vidu可生成16秒、1080P视频清华大学与生数科技在中关村论坛未来人工智能先锋论坛上发布了中国首个长时长、高一致性、高动态性视频大模型Vidu,标志�

  • 久其女娲平台2.0全新升级!AI大模型加速,赋能政企数治未来

    4月25日,久其女娲平台2.0发布会在线成功举办。活动以 “数治未来 大模型加速” 为主题,通过专题报告、功能路演等环节,集中介绍了久其女娲平台作为久其新一代政企赋能底座,在以新质生产力为引领、AI大模型加速的新趋势下的全新定位与功能创新。高度聚焦政策导向,以创新引领服务升级,女娲平台2.0的发布彰显了久其软件作为卓越的政企产品与服务提供商的重要价值

  • 每日互动持续增强大模型能力,推出、升级多款大模型应用产品

    人工智能引领的"第四次工业革命"正在到来,特别是2023年以来,以大模型、多模态、生成式为特征的新一轮人工智能浪潮席卷全球,带来新的变革。在这机遇与挑战并存的时期,国内专业的数据智能服务商--每日互动快速响应、积极探索大模型、AIGC等先进数智技术,升级产品性能,驱动业务创新,并储备公司下一条S型曲线。每日互动本身就是优质数据资源的持有方,因此在未来,拥有海量鲜活的数据积累、深厚沉淀的数据治理能力、丰富多元的数据应用场景的每日互动将更有可为。

  • 元象开源首个多模态大模型XVERSE-V 支持任意宽高比图像输入

    元象公司发布了首个多模态大型模型XVERSE-V,并将其开源。这一模型支持任意宽高比的图像输入,并在多个权威评测中取得了优异的成绩。除了图像识别,XVERSE-V还在多个实际应用场景中表现突出,包括信息图理解、视障场景处理、文本生成、教育解题等。

  • 阿里开源千亿参数模型 Qwen1.5-110B,性能超越 Meta-Llama3-70B

    阿里巴巴宣布开源其最新的Qwen1.5系列语言模型-Qwen1.5-110B。这是Qwen1.5系列中规模最大的模型,也是该系列中首个拥有超过1000亿参数的模型。它在与最近发布的SOTA模型Llama-3-70B的性能上表现出色,并且明显优于72B模型。

  • Meta 推出 LayerSkip:提升大语言模型推理速度

    Meta公司最新发布了LayerSkip,这是一款端到端的解决方案,专门设计用于提升大型语言模型的推理速度。这一技术在不同规模的Llama模型上经过了广泛的训练实验,并在多个任务上展现了显著的性能提升。未来展望:随着LayerSkip技术的不断完善和应用,预计将为大语言模型的部署和使用带来更多可能性,特别是在需要快速处理大量语言数据的场合。

  • LLaVA++:为Phi-3和Llama-3模型增加视觉处理能力

    LLaVA项目通过扩展现有的LLaVA模型,成功地为Phi-3和Llama-3模型赋予了视觉能力。这一改进标志着AI在多模态交互领域的进一步发展。LLaVA的推出,预示着未来AI模型将更加智能和灵活,能够更好地服务于需要视觉与文本结合理解的复杂场景。

  • 国际顶尖水平!首个Sora级国产自研视频大模型Vidu发布

    在2024中关村论坛年会未来人工智能先锋论坛上,生数科技联合清华大学发布中国首个长时长、高一致性、高动态性视频大模型Vidu。这也是自Sora发布之后全球率先取得重大突破的视频大模型,性能全面对标国际顶尖水平在加速迭代提升中。除了在时长方面突破,Vidu在视频效果方面也实现了显著提升,主要包括:能够生成细节复杂的场景,且符合真实的物理规律;能够生成真实世界不存在的虚构画面,创造出具有深度和复杂性的超现实主义内容;能够生成复杂的动态镜头,不再局限于简单的推、拉、移等固定镜头是能够围绕统一主体在一段画面里就实现远景、近景、中景、特写等不同镜头的切换;在16秒的时长上保持连贯流畅,随着镜头的移动,人物和场景在时间、空间中能够保持一致;能够生成特有的中国元素,例如熊猫、龙等。

  • 清华团队发布视频大模型Vidu 可生成16 秒、1080P 视频

    生数科技与清华大学在中关村论坛未来人工智能先锋论坛上共同发布了中国首个长时长、高一致性、高动态性视频大模型——Vidu。这款模型是国内首个达到Sora级别的视频大模型,标志着中国在视频生成技术领域的重要进展。开源成就:2023年3月,团队开源了基于U-ViT架构的多模态扩散模型UniDiffuser,这是全球首个此类模型,验证了U-ViT架构的大规模可扩展性。

  • 照片分享平台EyeEm被收购后 将用户照片用于训练人工智能模型

    柏林照片分享社区EyeEm在去年被西班牙公司Freepik收购后,正在采取一项引发争议的举措-将用户上传的照片用于训练人工智能模型。EyeEm最近通过电子邮件通知用户,它正在其条款和条件中添加一项新条款,授予其"训练、开发和改进软件、算法和机器学习模型"的权利。开放社交网络Pixelfed已明确表示,它永远不会使用用户图像来训练AI模型,并以此吸引EyeEm的用户。

  • 终局之战!OpenAI Sora大佬专访:AI视频模型仍处在GPT-1时代

    【新智元导读】Sora一出,谁与争锋!近日,Sora团队的三位负责人AdityaRamesh、TimBrooks和BillPeebles接受了采访,解读了Sora在模拟现实、预测结果和丰富人类体验等方面带来的变革。对于视频生成领域,大家一致的看法就是:Sora一出,谁与争锋!然,身处于风口浪尖的Sora团队成员怎么看?近日,Sora的三位领导者,Aditya、Tim和Bill接受了专访。「这是令人兴奋的时刻,我们期待未来模型的�

  • 中国首个Sora级大模型Vidu:文本生成16秒,1080p高清视频

    4月27日,在2024中关村论坛-未来人工智能先锋论坛上,清华大学联合生数科技正式发布了,中国首个长时间、高一致性、高动态性视频大模型——Vidu。Vidu采用了原创的Diffusion与Transformer融合的架构U-ViT,支持文本生成长达16秒、分辨率高达1080P的高清视频内容。生数科技致力打造世界领先的多模态大模型,融合文本、图像、视频、3D等多模态信息,探索生成式AI在艺术设计、游戏�

  • 通义千问团队开源首个千亿参数模型Qwen1.5-110B

    通义千问团队开源的首个千亿参数模型,Qwen1.5-110B。该模型在基础能力和Chat评估中表现出色,与其他同类模型相比有显著提升。团队将继续探索模型规模提升和扩展预训练数据规模两种方法带来的优势。

  • 清华团队国产“Sora”火了:生数科技发布视频大模型「Vidu」

    在中关村论坛的未来人工智能先锋论坛中,生数科技与清华大学携手,正式推出了中国首个具备长时长、高一致性及高动态性的视频大模型——“Vidu”。这款引领时代的视频大模型,其核心在于团队原创的Diffusion与Transformer融合的U-ViT架构。作为通用视觉模型,Vidu能够生成更加多样化、更长时长的视频内容,其灵活的架构也将为未来兼容更广泛的模态、拓展多模态通用能力的�

  • 震撼!GPT-4 Turbo级国产大模型登场,周冠宇F1赛事数据秒分析惊呆国际大佬

    中国的大模型,已经震惊了外国科技圈。这几天商量大模型的更新,直接让外国网友惊呼:太疯狂了,中国的AI界究竟还有多少我们不知道的巨变?不怪这些网友太大惊小怪——最近全新升级的日日新·商量大模型5.0,在基础能力上再次重大更新,直接把大模型能力升级到新的阶段,直观印象可感的那种。还真是有点期待日日新6.0的诞生了。

  • 字节发布视觉基础模型ViTamin,多项任务实现SOTA,入选CVPR2024

    视觉语言模型屡屡出现新突破,但ViT仍是图像编码器的首选网络结构。字节提出新基础模型——ViTamin,专为视觉语言时代设计。更多大模型算法相关岗位开放中。

  • 聚焦AI大模型 激发城市新活力 城市云数字领军人才研修班·东莞站成功举办

    新一代人工智能发展如火如荼,大模型如何落地推动数字转型赋能城市发展?4月25日,以“AI大模型打造城市新质生产力”为主题的城市云数字领军人才研修班在东莞举办。国家信息中心信息化和产业发展部主任单志广、东莞市发展与改革局副局长魏亚东、中国信息通信研究院云计算与大数据研究所政企数字化转型部主任徐恩庆、广东工业大学机电工程学院院长刘强、华为云中国区副总裁刘少华,全国20多个省市城市数字化建设相关负责人等政府、高校、研究院以及企业的专家、学者参加了此次活动。“城市云数字领军人才研修班”将针对不同层级、领域、区域的数字化建设者,建立差别化的课程体系,紧扣智慧城市、数字政府、数字化转型实际需要,增强学员的数字思维和专业素质,为全面增强数字城市建设效能提供重要人才保障。