11.11云上盛惠!海量产品 · 轻松上云!云服务器首年1.8折起,买1年送3个月!超值优惠,性能稳定,让您的云端之旅更加畅享。快来腾讯云选购吧!
今晚全新徕卡SL3-S相机正式发布,售价39200元。在像素方面,它拥有2400万像素原生分辨率,同时还搭载了4800万像素和9600万像素Multi-Shot高分辨率模式。机身具备IP54级防尘防溅认证,适应各种复杂环境。
据报道,谷歌发布了最新的AI视频生成模型Veo2。Veo2模型能够生成最高4K分辨率、时长达到2分钟的视频片段,相较于OpenAI的Sora模型,分辨率提升了4倍,视频时长增加了6倍。除了Veo2之外,Google这波还推出了改进版的AI绘图Imagen3模型,生图细节更好、光照更丰富、干扰更少。
经过七年的等待,HDMI2.1的继任者HDMI2.2标准有望在CES2025前夕公布。HDMI标准制定机构HDMIForum计划在2025年1月6日,即CES开幕前一天,公布新一代视频信号传输协议规范HDMI2.2。随着视频技术的进步,8K视频正朝着120Hz和240Hz的方向发展,HDMI2.1已无法满足这些需求,因此HDMI2.2。
苹果正在打造廉价版的Vision头显设备,这款新品的屏幕分辨率会降配。苹果已经收到了JDI提供的OLED显示屏样品,像素密度是1500PPI,相比之下,VisionPro的屏幕像素密度是3391PPI,前者连后者的一半都不到。目前该设备还处于开发早期阶段,苹果需要两到三年的时间才会进入大规模量产。
在昨晚举行的“PS5技术展示会”上,索尼公司正式揭晓了其最新游戏机——PS5Pro。PS5Pro游戏机的主要亮点包括:-搭载“PlayStationSpectralSuperResolution”AI超分辨率技术,旨在通过AI算法提升图像清晰度和细节。对于希望玩实体游戏的玩家,需要额外购买光驱。
【新智元导读】Mini-Monkey是一个轻量级的多模态大型语言模型,通过采用多尺度自适应切分策略和尺度压缩机制,有效缓解了传统图像切分策略带来的锯齿效应,提升了模型在高分辨率图像处理和文档理解任务的性能。它在多项基准测试中取得了领先的成绩,证明了其在多模态理解和文档智能领域的潜力。作者也验证了多尺度自适应切分策略在别的架构的多模态大模型上的有效性,为缓解由切分增大分辨率导致的「后遗症」提供了一种简单有效的解决方案。
提升多模态大模型处理高分辨率图像的能力越来越引起这个领域的关注。绝大多数方法致力于通过对图像进行切分再融合的策略,来提升多模态大模型对图像细节的理解能力。作者也验证了多尺度自适应切分策略在别的架构的多模态大模型上的有效性,为缓解由切分增大分辨率导致的「后遗症」提供了一种简单有效的解决方案。
全球多媒体巨头Adobe与马里兰大学的研究人员合作推出了新的超分辨率视频模型VideoGigaGAN。该模型兼顾帧率连贯性和丰富细节,解决了当前超分辨率视频模型的难题。光流引导模块利用光流来预测视频帧中的像素级运动,保持特征的空间一致性,生成清晰的超分辨率视频。
海外产品viva近期推出了一个基于Sora架构的视频生成模型,这是首个向所有用户开放的同类工具,目前阶段免费使用。这一工具的发布对于希望快速制作视频内容的普通人来说是一个重大利好。随着技术的进步和工具的普及,我们可以预见视频内容创作将变得更加多样化和丰富。
Open-Sora在开源社区悄悄更新了,现在,该项目不仅支持长达16秒的单镜头视频生成视频分辨率最高可达720p,能够处理各种宽高比的文本到图像、文本到视频、图像到视频、视频到视频以及无限长视频的生成需求。技术报告与模型架构:Open-Sora技术报告已在GitHub上发布,详细介绍了新功能和模型架构。作者团队将在下一版本中优先解决这些挑战。