11.11云上盛惠!海量产品 · 轻松上云!云服务器首年1.8折起,买1年送3个月!超值优惠,性能稳定,让您的云端之旅更加畅享。快来腾讯云选购吧!
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
中山大学HCP实验室联合SeaAILab和哈佛大学等单位开展的一项研究,成功地让大型人工智能模型通过讲笑话的方式,探索多模态大模型的创造力,并因此获得了计算机视觉和模式识别领域的顶级会议CVPR的认可。这项研究的关键在于使用来自日本的“大喜利”创新响应游戏作为数据源。此次研究的成功,不仅展示了该实验室在AI领域的创新能力,也为未来的人工智能研究提供了新的
SamAltman最近在世界经济论坛上发言,称达到人类级别的AI很快就会降临。正如LeCun一直以来所言,如今的AI连猫狗都不如。他还曾与何恺明大神共同提出了用于图像分类的简单、高度模块化的网络结构ResNeXt,这篇论文发表在了CVPR2017上。
MagicVideo-V2是一款集成了文本到图像模型、视频运动生成、参考图像嵌入以及帧插值技术的端到端视频生成管道,提供高质量、高分辨率视频内容的生成能力,尤其适合于影视制作、广告创意和艺术创作等领域的需求。点击前往「MagicVideo-V2」体验入口使用场景示例电影特效制作:可用于制作复杂的电影特效。为了体验「MagicVideo-V2」的强大功能,请访问AIbase网站查看更多介绍。
MagicVideo-V2是一种革命性的视频生成技术,集成了文本到图像模型、视频运动生成器、参考图像嵌入模块和帧插值模块,用于生成外观美观、高分辨率的视频,提供出色的保真度和平滑性。📰🤖📢AI新鲜事OpenAI推出自定义GPT商店OpenAI在官网正式发布了自定义GPT商店,用户可以分享和寻找最流行、最好用的自定义ChatGPT助手。Amphion音频生成工具包开源上海AI实验室、香港中文大学�
MagicVideo-V2是一个集成了文本到图像模型、视频运动生成器、参考图像嵌入模块和帧插值模块的端到端视频生成管道。其架构设计使得MagicVideo-V2能够生成外观美观、高分辨率的视频,具有出色的保真度和平滑性。点此查看更多AI工具集介绍。
UC伯克利的CV三巨头推出首个无自然语言的纯视觉大模型,第一次证明纯CV模型也是可扩展的。更令人震惊的是,LVM竟然也能做对图形推理题,AGI火花再次出现了?计算机视觉的GPT时刻,来了!最近,来自UC伯克利的计算机视觉「三巨头」联手推出了第一个无自然语言的纯视觉大模型,并且第一次证明了纯视觉模型本身也是可扩展的。下图展示了一些不容易用语言描述的提示——这是LVM可能最终胜过LLM的任务类型。
没有资金的支持,开源项目的开发与维护步步艰辛,甚至有时看不到未来。在一张「KeepOpenSourceComputerVision&AIAlive」海报背后,老牌开源计算机视觉和机器学习软件库OpenCV团队发出求助,以「世界上最大的计算机视觉库有史以来最大规模的发布,支持开源」为主题,在募资网站Indiegogo上开展一项众筹活动,希望能够为OpenCV下一个版本——OpenCV5筹集所需的资金。距离其发布众筹过去了10天的时间,截至目前,OpenCV仅筹集到了50万美元目标的4%,即22740美元,维护开源项目的众筹之路依然任重道远。
10 月 13 日- 15 日,第六届中国模式识别与计算机视觉大会(简称“PRCV大会”)在厦门举办。蝉大师受邀参展,并在大会主论坛分享了主题为“CV及多模态技术在蝉大师产品中的应用与创新”的演讲,展示了包含视频智能剪辑、图像智能生成和处理等多种相关的AI技术,在商业应用上的场景和潜力,引发了业界和高校专家的关注。本届大会汇聚国内模式识别和计算机视觉理论与应
计算机视觉巅峰大会ICCV2023,在法国巴黎正式“开奖”!今年的最佳论文奖,简直是“神仙打架”。获得最佳论文奖的两篇论文中,就包括颠覆文生图AI领域的著作——ControlNet。来自MIT的TedAdelson教授则获得了终身成就奖。
用上扩散模型,3D物体生成纹理一句话就能搞定!像是输入“一张带有棕色和黑色几何图案的椅子”,扩散模型就能立刻给它复个古,贴上颇具年代感的纹理:甚至只是丢给它一张看不出桌面长啥样的“截图”,AI也能立刻凭借想象力,给桌面加上木质的细节纹理:要知道,给3D物体加上纹理,可不只是“变变颜色”这么简单。它包含粗糙度、反射、透明、漩涡、泛光等大量参数,�
ICCV论文收录名单近日「开奖」,其中就包括这个港科大一作的图像分割模型!它能以更低的训练成本实现更好的效果,哪怕遇到未知物体也能迎刃解。此外据作者介绍,它还是第一个拥有基于boxprompts的分割能力的AI模型,比Meta的SAM还要早实现。在COCO和ADE20K的全景分割以及ADE20K和Cityscapes的实例分割上,OpenSeeD的性能也与现有最佳模型相当。
荣耀宣布新一代折叠屏荣耀MagicV2定档7月12日,目前手机已经上架开启预约,预约界面显示有四款配色。预热海报暗示,荣耀MagicV2与直板机、iPhone4智能手机一样,将开启折叠屏体验的革命性时刻。”荣耀赵明专门发文称,荣耀MagicV2,挑战的不是现有的折叠屏手机,要打破折叠屏和直板机的边界!
一篇最佳论文,一篇最佳论文候选,共计54篇论文被接收,商汤科技及联合实验室交出CVPR2023闪亮的成绩单。6月18日-22日,全球计算机视觉盛会CVPR2023在加拿大温哥华举行。商汤将继续与产学研各界共同拥抱和探索大模型带来的范式革新,为AI的前沿探索开拓新方向和新路径。
矩阵世界是AI精心设计的模拟世界!普林斯顿用Infinigen这把钥匙,打开矩阵大门,AI生成的大自然比真实世界还真!尼奥在「黑客帝国」中发现自己生活的世界并非真实存在是被精心设计的模拟现实。有没有那么一瞬间,认为我们生活的世界,就是模拟的矩阵世界。目前的研究重点是多视图3D重建和程序数据生成。
英伟达一出手,3D建模师都馋哭了。制作一个纹理超细致的大卫3D模型,需要几步?刚刚靠着AI,市值一度飚破万亿美元的英伟达给出最新答案:给AI投喂一段普通视频,它就能自动搞定。他还曾在Meta的RealityLabs实习。
+2023+中国智能网联汽车科技周暨第十届国际智能网联汽车技术年会圆满召开。超星未来CTO陈忠民出席“协同创新,共筑软硬融合开放型生态”主题峰会,重磅发布基于惊蛰R1+芯片面向多场景打造的全新NOVA-ADCU智能驾驶参考方案,并亮相科技成果展。目前超星未来已经与二十余家汽车领域的合作伙伴及客户展开具体合作,期待能和产业链上下游的伙伴企业更多交流、更多合作,构建开放共赢的新生态,共同为中国的智能网联汽车事业发展助力。
4+月+14+日当贝投影举办了春季新品线上发布会,发布了最+新+2+款激光投影——当贝X5+和当贝D5X+Pro,其中当贝X5直接将国产旗舰版激光投影仪带上了新高度!下面就来抢先了解一下,当贝X5+有什么特点?激光投影仪天花板!盘点当贝X5+八大亮点超高亮度——全新一代ALPD激光光机+2450CVIA流明当贝X5+搭载全新一代ALPD激光光机,为中影高端影厅同款光源技术。先进的ALPD激光技术不仅带来了超高的亮度,2450CVIA流明再次刷新家用投影亮度天花板;还带来了高清晰的画质,对比散斑问题严重的三色激光,ALPD激光无散斑、观感更舒适。总结:可以看到当贝X5+激光投影综合性能强劲,2450CVIA流明高亮度、ALPD激光光机、原生1080P+超清画质、XSuper超分辨率,带来真正的高亮度与高画质,真实感受高质观影体验;全新MT9679+芯片带来真WiFi-+6+和USB3.+0+体验,大大提升了投影仪性能;3D+ToF模组更是真正做到了“快准狠”的智能化全局自动对焦和全向梯形校正;搭配资源丰富的当贝交互系统4.0,这款投影足以让我感到惊喜。
4+月+8+日至+9+日,由中国人工智能学会主办的人工智能大模型技术高峰论坛将在杭州萧山举办。会议议程显示,华为云人工智能领域首席科学家田奇将介绍「盘古大模型的进展及其应用」。在开始打造盘古大模型的时候,团队确立了三项最关键的核心设计原则:一是模型要大,可以吸收海量数据;二是网络结构要强,能够真正发挥出模型的性能;三是要具有优秀的泛化能力,可
由上海市车联网协会主办的+2023+第三届ICVS中国自动驾驶感知融合技术峰会在苏州隆重举办。大会聚集了国内外知名车企厂商、技术服务提供商、投资机构等行业大咖,共同探讨自动驾驶行业发展趋势。标贝AI数据平台已经支持大多数主流数据格式,同时支持扩展更多客户定制化数据结构,致力于用更高质量的训练数据,赋能更优质的智能驾驶解决方案。
华为旗下的盘古系列AI大模型即将上线,该系列AI大模型中的NLP大模型、CV大模型、科学计算大模型已经标记为即将上线状态。盘古大模型采用了深度学习和自然语言处理技术,并使用了大量的中文语料库进行训练。借助创新的3DEST网络结构以及分层时间聚合算法,盘古气象大模型在气象预报的关键要素和常用时间范围上精度均超过当前最先进的预报方法,同时速度相比传统方法
计算机视觉三大顶 级会议之一CVPR正式公布了2023 年的接收结果,如视首席科学家潘慈辉带领团队提交的最 新研究成果《TexIR: Multi-view Inverse Rendering for Large-scale Real-world Indoor Scenes》成功入围。在真实空间的更深层次数字化层面取得突破进展。本届CVPR有效投稿 9155 篇,比去年增加了 12%,创下新纪录;收录2360 篇,接收率为 25.78%。
NAS技术在金融行业的运用,为金融行业创新发展提供了科技支撑。作为金融科技企业,度小满非常注重对新兴技术的创新应用,早已围绕NAS展开了深入研究和探索,以期通过前沿技术攻克金融服务的众多难题。度小满早已布局各大前沿技术,将推动先进技术与金融服务融合发展,持续助力行业转型升级!
开发商Resolution Games日前公布了其即将推出的多人VR体育游戏《Ultimechs》的官方价格和发布日期。《 Ultimechs》将于9月15日登陆MetaQuest 2、PCVR和Pico VR头显。《Ultimechs》是一款快节奏未来主义VR体育游戏,将让玩家在机械驱动的足球比赛中正面交锋。该游戏还将采用季节性战斗通行证系统,其中包含新的外观增强功能和油漆工作,使机甲个性化。值得一提的是,Resolution Games将于8月25日至28日在Steam上举办《Ultimechs》季前预览,在此期间大家可以与其他玩家进行1v1或2v2对决。其他有关内容和定价的详细信息将在游戏发布之前公布
在德克萨斯州举办的 Vision 2022 活动期间,英特尔也抽空于本周二公布了新一批安全补丁。可知在本月的 16 条新公告,涵盖了影响其软硬件的 41 个漏洞,且其中 76% 都是由英特尔工程师发现的。不过本文要为大家介绍的,主要是 INTEL-SA-000617 / CVE-2022-21151 。截图(来自:Intel Security Center) 作为一个严重程度为“中等”(5.3 / 10)的安全隐患,其源于 Intel CPU 的相关安全缺陷,或导致通过本地访问泄露信息。 庆幸的是,今日新发布的 CPU 微码更新,已经堵上了这个漏洞。官方解释称:优化删除或修改某些 Intel 处理器的安全关
计算机视觉三大顶级会议之一CVPR2022 正式放榜,如视首席科学家潘慈辉带领团队研发的一项针对性研究成果成功入选CVPR 2022,团队论文《PhyIR: Physics-based Inverse Rendering for Panoramic Indoor Images》强势上榜...如视CEO惠新宸表示,如视将持续投身于数字空间相关领域的技术研究,结合AI技术,重塑线下商业行为,为各行业带来效率革命...
本论文基于交互式的图像生成,提出基于全景布局(Panoptic Layout)辅助图像生成的方法,即PLGAN(Panoptic Layout Generation)算法,提高了交互场景下生成图像的质量及其稳定性...语义图层在空间布局上逐像素对应生成的图像,可以很好的控制需要合成的图像,但其构建比较复杂,因此大多数多模态图像生成和交互场景采用实例图像布局(Instance Layout)......
xMEMS实验室今天推出了Montara Pro,这是世界上第一款集成了DynamicVent的单片MEMS微扬声器,结合了闭合式和开放式耳塞的优点,可用于智能TWS耳塞和助听器,创造出两全其美的用户体验。Montara Pro采用DynamicVent专利技术,由耳塞系统DSP根据麦克风检测到的环境噪音水平或运动传感器检测到的听众活动情况智能地打开或关闭。当通风口关闭时,Montara Pro创造了一个具有最佳被动隔离效果的聆听环境,适合音乐和媒体消费,或在有背景
Bleeping Computer 报道称:惠普已证实旗下大批打印机型号易受到 CVSS 评级为 9.3 的“严重”缓冲区溢出漏洞,并且分配了 CVE-2021-39238 这个编号。惠普官方表示:“某些 HP LaserJet、LaserJet Managed、PageWide、PageWide Managed 产品,可能容易受到潜在的缓冲区溢出漏洞的影响”。截图(来自:HP 官网)据悉,当内存缓冲区被其难以应付的更多数据所淹没时,就会导致缓冲区溢出(buffer overflow / overrun)事件的发生。轻则
近日,在ICCV2021 举办的LVIS Challenge Workshop比赛中,腾讯优图实验室荣获冠军,同时被授予该项目的最佳创新奖。LVIS Challenge2021 是大规模长尾数据的实例分割任务,是本届ICCV的重磅比赛之一,吸引了众多国内外知名企业和高校参加。此次竞赛的核心技术方案也将应用于工业AI质检的场景中,进一步地提高缺陷检测与分割的精准度,用最核心的技术支持产业落地。图1 比赛最终榜单,腾讯优图排名第一LVIS是包含1k+类别的大规模长尾