首页 > 关键词 > AI视觉技术最新资讯
AI视觉技术

AI视觉技术

AIRLOOK与百度视觉技术部联合发布了中国地信领域的第一个大空间高精度3DGS解决方案,率先实现了测绘级SfM与3DGaussianSplatting逆渲染技术的完美融合,为行业提供更强大的显式编辑能力和更低算力需求的实时渲染能力,进一步降低开发和部署门槛,在双方的合作下,将加快创新性技术在地理信息领域的应用。GIR重建及重光照渲染效果打造数字孪生城市的“新引擎”随着数字经济的快速发展,地理信息数据已经成为数字经济的重要组成部分,对于推动经济发展和提升社会治理水平具有重要意义。3DGS-PBR的引入,让重建的3DGS结果可无缝与其他CG渲染内容融合。...

特别声明:本页面标签名称与页面内容,系网站系统为资讯内容分类自动生成,仅提供资讯内容索引使用,旨在方便用户索引相关资讯报道。如标签名称涉及商标信息,请访问商标品牌官方了解详情,请勿以本站标签页面内容为参考信息,本站与可能出现的商标名称信息不存在任何关联关系,对本页面内容所引致的错误、不确或遗漏,概不负任何法律责任。站长之家将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。任何单位或个人认为本页面内容可能涉嫌侵犯其知识产权或存在不实内容时,可及时向站长之家提出书面权利通知或不实情况说明,并提权属证明及详细侵权或不实情况证明(点击查看反馈联系地址)。本网站在收到上述反馈文件后,将会依法依规核实信息,第一时间沟通删除相关内容或断开相关链接。

与“AI视觉技术”的相关热搜词:

相关“AI视觉技术” 的资讯1098篇

  • AIRLOOK携手百度视觉技术部联合发布国内首个大空间高精度3DGS逆渲染成果

    AIRLOOK与百度视觉技术部联合发布了中国地信领域的第一个大空间高精度3DGS解决方案,率先实现了测绘级SfM与3DGaussianSplatting逆渲染技术的完美融合,为行业提供更强大的显式编辑能力和更低算力需求的实时渲染能力,进一步降低开发和部署门槛,在双方的合作下,将加快创新性技术在地理信息领域的应用。GIR重建及重光照渲染效果打造数字孪生城市的“新引擎”随着数字经济的快速发展,地理信息数据已经成为数字经济的重要组成部分,对于推动经济发展和提升社会治理水平具有重要意义。3DGS-PBR的引入,让重建的3DGS结果可无缝与其他CG渲染内容融合。

  • 前字节跳动视觉技术负责人王长虎加入AI创业大军

    前字节跳动视觉技术负责人王长虎即将离职龙湖集团,他计划组建一支新的创业团队。值得一提的是,他的创业方向将聚焦于生成式AI的视觉多模态算法平台。字节跳动的官方介绍也显示,王长虎于2017年加入字节跳动人工智能实验室担任总监一职,主要研究方向包括计算机视觉、视频理解、多媒体检索和机器学习等。

  • 创新奇智斩获MIT场景解析世界冠军,彰显AI视觉技术实力

    近日,创新奇智凭借突破性的AInnoSeg全景分割算法,刷新MIT Scene Parsing Benchmark 场景解析任务世界最好成绩,领先商汤科技( 2020 年 3 月、 5 月为该基准测试的世界冠军)、北京大学、南京大学、腾讯等众多知名公司和研究机构,以绝对优势获得冠军。关于ADE20K数据集MIT Scene Parsing Benchmark 致力于为场景感知、场景解析、实例分割和语义理解等计算机视觉技术提供训练和性能标准化评估平台。该基准测试的数据来自ADE20K数

  • AI视觉技术突破创新,国际学术权威CVPR收录多篇联发科论文

    近日,世界人工智能大会(WAIC)正在如火如荼的举办,而全球另一个极负盛名的AI学术盛会也在每年年中时备受关注,那就是国际计算机视觉与模式识别会议(IEEE Conference on Computer Vision and Pattern Recognition,简称CVPR)。该会议是由IEEE举办的一年一度的学术性会议,在各种学术会议统计中,CVPR被认为有着很强的影响力和很高的排名,是国际最有影响力的年度AI盛事之一。作为全球顶级学术会议,CVPR每年吸引全球数千位计算

  • AI人工智能野蛮发展,2020年3D视觉技术将更上一个台阶!

    阿里巴巴达摩院发布白皮书,AI将有大突破2020新年伊始,阿里巴巴达摩院对外发布《2020十大科技趋势白皮书》,作为国内顶尖的的互联网科技企业,自然备受各界关注。回望2019年科技领域发展历程,达摩院成功预测AI芯片崛起、智能城市的诞生、5G催生全新应用场景等趋势。今年,新的爆发点将围绕AI、芯片、云计算、区块链、工业互联网、量子计算等领域展开,并将出现颠覆性技术突破。其中,AI人工智能无疑是未来最重要的算力需求方和技

  • 2019科博会丨INDEMIND三大AI视觉技术方案实力吸睛

    10月27日,第22届中国(北京)国际科技产业博览会在中国国际展览中心正式落下帷幕。本届科博会以“推动科技创新中心建设 引领产业高质量发展”为主题,共有来自33个国家和地区的1200余家企业、机构参展,集中展示了科技前沿的自主创新成果, 4 天展会共吸引6.5万人次观众前来参观。作为行业领先的立体视觉方案提供商,INDEMIND受邀参加了本届科博会,并携多款AI视觉行业解决方案亮相“人工智能”展区,集中向大众展现了INDEMIND的A

  • AI视觉技术+大数据动态推荐 美图“美力推荐引擎”赋能美业

    10 月 17 日,第十二届金投赏国际创意节期间,美图公司举办以“社交新秀场,增长新势力”为主题的专场论坛,全球顶尖商业创意企业及专家大咖齐聚一堂,共同探讨大数据驱动下的社交媒体赋能颜力市场的增长之路。美图营销副总裁邹巍受邀出席活动,向现场嘉宾详细介绍了“美图新商业营销生态”下在数据赋能、技术革新等方面的思考。今天的品牌们已经普遍意识到,种草营销是场持久战。在海量平台信息和带货达人的加持下,今天的消费者?

  • 5G+AI搭台3D视觉技术 大兴机场刷脸登机引发新趋势

    北京大兴国际机场刷脸登机,一度成为民众关切的热点事件。在大兴机场备受关注的背后,除了涉及大众出行的基础民生建设之外,诸多黑科技落地应用亦是其最大亮点,从值机到登机,仅凭“一张脸”就能走遍机场。解析3D刷脸登机背后:仅凭一张脸何以行走天下?事实上,首次在大兴机场应用的“黑科技”并非只有刷脸值机、刷脸登机,基于5G、AI、3D视觉等前沿技术,诸如行李追踪、精准寻人、AR眼镜旅客识别、人群密度热力图等曾经只存在科

  • AI+VSLAM视觉技术 瑞芯微助力第四代扫地机器人升级

    日前,瑞芯微Rockchip向业界发布四款“AI人工智能扫地机器人”芯片级解决方案:RK3399、RV1108、RK3326、及RK3308,支持从AI到VSLAM及激光导航等功能,全面覆盖从高端到入门级别扫地机器人产品,并实现快速量产,突破传统行业瓶颈,助力第四代AI人工智能扫地机器人定位导航的标准定义及升级。 近年扫地机器人行业发展迅速,经随机式、规划式、导航式三代发展,目前仍需较多人工干预操作,交互方式、智能规划、硬件能耗等痛点无法?

  • VIVO搭载百度视觉技术 智能手机AI再升级

    2017 年中国手机用户已突破 11 亿的体量,智能手机亦成为主流的选择。随着手机像素的不断提高,拍照逐渐变成日常高频使用功能,然而拍照一时爽,要找时却看花双眼,智能检索功能日益重要。苹果、谷歌也都在通过时间、人脸等不同的自动分类方式帮助用户更好的检索庞大的个人照片库。今天,VIVO和百度合作,利用百度在视觉领域的强大嵌入式技术——图像分类和OCR技术,让图片分类检索变得更加精准快捷。最新发布的VIVO X21 搭载的全?

  • 采用AI与机器学习提升视觉效果:索尼PS5 Pro有望采用专属DLSS技术

    索尼旗下的PS5Pro能会在明年9月发布。该知情人士还透露了PS5Pro正在研发的新技术。如果传闻为真的话,PS5Pro的性能将与AMDRadeonRX7700XT显卡的性能相当这款显卡并没有以4K为卖点销售。

  • 用AI技术开启穿越时空的视觉盛宴 腾讯优图亮相第八届世界互联网大会

    9 月 26 日,第八届世界互联网大会乌镇峰会(以下简称“大会”)在浙江乌镇正式开幕,大会以“迈向数字文明新时代——携手构建网络空间命运共同体”为主题,邀请各国政府、中外互联网企业、高校智库等代表,聚焦热点议题,展示前沿科技成果,共同探索数字经济下的互联网发展新技术、新模式和新业态。据了解,大会除常规论坛外,还设置了“互联网之光”博览会、“直通乌镇”全球互联网大赛等三大板块。作为腾讯旗下顶级的人工智能实验

  • 腾讯优图视觉AI技术亮相进博会,“我与新中国”同框照为新中国点赞

    11 月 5 日,第二届中国国际进口博览会在上海开幕,来自 150 多个国家(地区)的 3000 多家企业参展,全方位展现家用电器、消费电子、智能硬件、人工智能、互联网等多个领域全球前沿发展趋势和创新产品。在国家展中国馆,由腾讯云和优图实验室联合提供技术支持,微信团队展示了由国家商务部外贸发展事务局携手腾讯微信团队推出的小程序——“我与新中国”,以线上线下互动AI体验的方式向各国政要以及来自世界各地的参会者展示中国领

  • 解读视觉AI应用未来 虹软科技多项技术赋能互联网大会智慧化提升

    当古朴的水乡乌镇再次被科技萦绕,互联网领域一年一度的盛会也正式揭开了帷幕。 10 月 20 日- 22 日,第六届世界互联网大会在浙江乌镇召开。全球范围内的新技术、新成果、新产品、新应用在这里汇聚,5G、人工智能、互联网等新兴技术无一例外地成了本届互联网大会“重头戏”,科技创造美好生活的图景在这里生动演绎。大会期间,科创板首批挂牌企业虹软科技携众多AI“黑科技”走进乌镇,为互联网大会的多个智慧化项目提升给予技术保

  • 猎户星空语音+视觉多模态交互技术助力佳都科技打造全球首座AI智慧车站!

    9 月 9 日,全球首座AI智慧车站广州地铁 21 号线天河智慧城示范站正式落成!正值“中国城轨交通业主领导人峰会 2019 广州年会”举办期间,广州地铁举行了“智慧地铁现场观摩会”,来自全国各城市轨道交通公司领导,广州地铁集团党委书记、董事长丁建隆、佳都科技董事长刘伟、新加坡国家工程院院士、佳都科技副总裁兼全球智能技术研究院院长李德紘等领导来宾共同参观体验了天河智慧城示范站,共同见证广州“智慧地铁”建设的崭新成果

  • 虹软视觉开放平台亮相开源技术与人工智能峰会,推动AI赋能百业

    8 月 21 日- 22 日,国际开源技术与人工智能产业生态创新峰会在苏州吴中区举办,本届峰会旨在把握智能制造与机器人行业新趋势,提升业内对人工智能的认知,促进开源技术发展与产业的融合,虹软作为视觉AI技术的开源开放代表受邀参加峰会。据相关机构对中国开源开放技术应用现状的调研显示,国内应用开源开放技术的企业占比达80%以上。在尚未应用开源开放技术的企业中,“缺少适合的解决方案”和“出于安全性考虑”是主要原因。该数

  • ​虹软打破视觉AI“高技术”门槛 免费平台加速商业化落地

    虹软打破视觉AI“高技术”门槛 免费平台加速商业化落地尽管人工智能正在悄然改变人们的生活,从刷脸支付到无人零售、从提醒司机疲劳驾驶到小区进入刷脸识别等遍及多个领域,但并未真正实现大规模商业化落地,仍是困扰整个行业发展的难题,似乎人工智能仍正处于“雷声大,雨点小”的尴尬境地。据业内人士透露,之所以出现这种状况,是因为人工智能技术不管是在研发上,还是在使用上,进入门槛都很高。由于人工智能算法研发周期长,?

  • AAAI 2018快报:京东公布基于计算机视觉的电商推荐技术

    AAAI会议(Association for the Advancement of Artificial Intelligence)是人工智能领域的顶级学术会议,是中国计算机学会(CCF)推荐的A类会议。AAAI专注于推进人们对思想、智力背后机理的科学认识及其在机器中的实现。第 32 届AAAI会议将于 2018 年 2 月 2 日- 7 日在美国新奥尔良举行。京东重大战略“无界零售”提出了零售基础设施智能化的要求,推荐系统作为现代电商零售基础设施的核心技术之一,在京东的各个购物入口都将发

  • AI附能行业 — 他免费开放视觉人工智能技术

    腾讯携着王者荣耀席卷全国,马云带着新零售再创先机,百度用阿波罗掀起无人驾驶之热潮,人工智能站在风口浪尖,虹软在行业+人工智能的大浪潮头,在 2017 创业邦 100 未来领袖峰会暨创业邦年会上,虹软副总裁徐坚畅谈如何用“视觉人工智能,为行业附能”。徐坚首先介绍虹软:“只要是安卓系统的智能手机,相信里面都有用虹软的产品。现在搭载虹软的计算机视觉技术的产品在全球已经累计超过 100 亿台设备,这是过去 23 年的一个累计?

  • VQAScore官网体验入口 AI文本到视觉生成评估工具使用地址

    VQAScore是一种新的评估指标,旨在更好地评估复杂的文本到视觉生成效果。这一指标结合了CLIP-FlanT5模型,能够在文本到图像/视频/3D生成评估中实现最佳性能,是评估和优化文本到视觉生成模型的强大工具。如果您希望了解更多信息并开始使用VQAScore进行评估,请访问VQAScore官方网站。

  • VAR官网体验入口 自回归式AI视觉生成工具使用地址

    VAR是一种新的视觉自回归建模方法,能够超越扩散模型,实现更高效的图像生成。它建立了视觉生成的幂律scalinglaws,并具备零shots的泛化能力。想要了解更多关于VAR的信息并开始您的图像生成之旅,请访问VAR官方网站。

    VAR
  • 对焦 | AI赋能,国控广东物流联合旷视科技MEGVII部署业内首例药械视觉复核项目

    由国控广东物流和旷视联合研发的“药械自动识别和数据采集系统”在国控广东物流佛山物流中心进入运作使用。在药械收货环节,该系统通过人机协作,数秒内就能完成单批产品的多轮信息复核和数据自动采集,实现高准确率的同时,整体工作效率提升超50%。对此,国控广东物流总经理梁颖康表示:“国控广东物流佛山物流中心的视觉复核项目,是医药行业首例通过AI视觉识�

  • Mini-Gemini:简单有效的AI框架,增强多模态视觉语言模型

    中国香港中文大学和SmartMore的研究人员推出了一种名为Mini-Gemini的新颖框架,通过增强多模态输入处理来推动VLMs的发展。Mini-Gemini采用了双编码器系统和一种新颖的补丁信息挖掘技术,结合一个特别策划的高质量数据集,使其能够有效处理高分辨率图像并生成内容丰富的视觉和文本内容,从使其脱颖出。正如研究人员所承认的那样,Mini-Gemini在视觉理解和推理能力方面仍有改进�

  • 高分辨率AI模型Griffon v2:通过文本和视觉提示提供灵活的对象引用

    大型视觉语言模型在需要文本和图像理解的任务中表现出色。特别是在区域级任务,如引用表达理解中,经过图像文本理解和推理的发展之后,这一进展变得明显。该模型在定量和定性目标计数方面均优于专家模型,证明了其在感知和理解方面的优越性。

  • Katalist官网体验入口 生成式AI视觉故事板工具软件免费使用地址

    Katalist是一款面向电影制片人、广告商和内容创作者的在线工具,利用生成式AI技术帮助用户可视化创意构思,轻松创建故事板、视频创意和创意推介。Katalist的核心功能是分析剧本,自动提取人物、场景和活动,一键生成相应的视觉素材。Katalist的产品特色和功能一键生成剧本故事板保持人物场景一致性快速切换角色场景元素导入剧本自动生成视觉素材定制视觉元素的细节想要了解更多关于Katalist的信息并开始体验这一工具,请访问官方网站。

  • 研究人员推新AI框架CyberDemo:通过视觉观察让机器人模仿学习

    加利福尼亚大学圣地亚哥分校和南加利福尼亚大学的研究人员最近推出了一种名为CyberDemo的新型人工智能框架,旨在通过视觉观察进行机器人模仿学习。传统的模仿学习方法通常需要大量高质量的示范数据来教导机器人完成复杂任务,特别是对于需要高度灵巧的任务来说。虽然为每个任务设计模拟环境需要额外的工作,但减少了数据收集的人为干预,并避免了复杂的奖励设计�

  • 又给Sora“找茬” LeCun放出「视觉世界模型」论文:这才是AI学习物理世界的关键

    LeCun在「视觉世界模型」论文中详细介绍了世界模型在AI学习物理世界中的关键作用。世界模型相比自回归学习范式能更好地理解世界,掌握物理世界的关键。LeCun的「视觉世界模型」论文有望成为AI学习物理世界的关键里程碑。

  • VSP-LLM官网体验入口 视觉语音处理AI模型免费使用下载地址

    VSP-LLM是一个结合视觉语音处理与大型语言模型的框架,旨在通过LLMs的强大能力最大化上下文建模能力。VSP-LLM设计用于执行视觉语音识别和翻译的多任务,通过自监督视觉语音模型将输入视频映射到LLM的输入潜在空间。该框架通过提出一种新颖的去重方法和低秩适配器,可以高效地进行训练。

  • 谷歌AI视频再出王炸!全能通用视觉编码器VideoPrism,性能刷新30项SOTA

    【新智元导读】谷歌团队推出「通用视觉编码器」VideoPrism,在3600万高质量视频字幕对和5.82亿个视频剪辑的数据集上完成了训练,性能刷新30项SOTA。AI视频模型Sora爆火之后,Meta、谷歌等大厂纷纷下场做研究,追赶OpenAI的步伐。尽管对比基线已经在K400上取得了有竞争力的结果,但所提出的全局蒸馏和token洗牌进一步提高了准确性。

  • YOLOv8官网体验入口 AI计算机视觉目标检测模型免费在线使用地址

    YOLOv8是YOLO系列目标检测模型的最新版本。它能够在图像或视频中准确快速地识别和定位多个对象,并实时跟踪它们的移动。利用YOLOv8分析医学影像,帮助医生进行疾病诊断。