首页 > 业界 > 关键词  > 正文

小米13 Ultra获1.0.9.0版更新 新增大师人像、AISP功能

2024-05-11 14:57 · 稿源:站长之家

站长之家(ChinaZ.com)5月11日 消息:小米13Ultra手机迎来了澎湃HyperOS1.0.9.0的系统更新,这次更新不仅融入了2024年4月的安全补丁,加强了系统安全性,更在相机应用上实现了显著的功能升级,引入了备受期待的“大师人像”功能以及全新的“Xiaomi AISP”AI模型计算摄影平台。

在相机功能方面,新增的“大师人像”功能最初在小米14Ultra手机上亮相,支持大师人像和徕卡人像双画质风格,为用户提供了更为丰富的人像拍摄选择。通过AI人像大模型的加持,该功能可以实现AI去颈纹、AI肤色统一、AI白牙亮眼等效果,让拍摄的人像照片更加自然、生动。

小米13 Ultra (3)

除了“大师人像”功能,更新的另一大亮点是全新的“Xiaomi AISP”AI大模型计算摄影平台。该平台由小米影像大脑升级而来,深入整合了CPU、GPU、NPU和ISP的算力,总算力高达60TOPS。

这一平台的推出,标志着小米在AI摄影领域迈出了坚实的一步。通过AISP,小米13Ultra能够实现更高效、更智能的图像处理,为用户带来更为出色的拍摄体验。

值得一提的是,AISP还拥有ULTRA SNAP“超级抓拍”功能,支持全算法抓拍150张照片。这一功能的加入,使得小米13Ultra在捕捉瞬间美景时更加得心应手,让用户不再错过任何精彩瞬间。

举报

  • 相关推荐
  • 大家在看
  • Eloquence:无需编码,基于数据做出决策。

    Eloquence是一个使决策基于数据的商业智能工具。它允许用户无需编码即可通过结构化的自然语言提出问题,快速连接数据库,过滤所需数据,并立即获得结果。Eloquence注重安全性,采用行业标准的加密技术保护数据,支持在线使用或部署在公司防火墙内,并且承诺不保存任何数据。

  • Vagabond:轻松规划,沉浸式旅行体验

    Vagabond是一个致力于提供个性化旅行规划服务的网站。它通过精心设计,为用户打造一个难忘的行程,满足用户的个性化旅行需求。

  • 橙篇AI:智能写作助手,一键生成内容,提升写作效率。

    橙篇AI是一款针对写作领域的智能工具,旨在通过AI技术提升用户的写作效率和质量。它拥有一键生成长文、资料搜索、文档总结、全文校正等功能,帮助用户快速整理思路、搜集资料和校对文本。橙篇AI的背景是随着AI技术的发展,越来越多的行业开始利用AI来提高工作效率,尤其是在内容创作领域。产品定位于辅助用户进行高效写作,无论是学术论文、商业报告还是日常笔记,都能通过橙篇AI得到快速生成和优化。目前产品提供免费试用,具体价格未在页面上明确标注。

  • LearnerOn:AI驱动的智能学习平台

    LearnerOn是一个面向企业,特别是人才领导者的先进学习体验平台(Learning eXperience Platform),提供高度个性化的学习和发展体验,技能和知识进度跟踪,以及支持公司成功转型为学习型组织。它通过集成学习资源目录、技能和职业,以及学习管理,简化了学习与发展(L&D)流程。LearnerOn利用AI技术提供个性化和吸引人的学习体验,并通过用户自助服务、同行学习和自上而下的模式,轻松跟踪学习进度。

  • Park Here:通过拍照停车标志,快速找到合适的停车位。

    Park Here 是一款旨在简化停车过程的移动应用程序。它通过让用户拍照停车标志,利用图像识别技术来提供用户当前位置的停车选项。该应用程序的背景是解决城市停车难题,帮助用户节省寻找停车位的时间,提高停车效率。

  • Supermaven:好用的GitHub Copilot 的平替

    Supermaven 是一个 AI 代码补全工具,利用 300,000 标记的上下文窗口,为开发者提供高质量的代码自动补全。它的主要优点在于速度快、准确度高、上下文理解能力强。Supermaven 的背景信息是基于深度学习模型,旨在提高编程效率。

  • ElevenLabs Text to Sound Effects:AI生成音效,从文本描述到声音效果的创新工具。

    Text to Sound Effects是ElevenLabs开发的最新AI音频模型,能够根据文本提示生成各种音效、短音乐曲目、音景和角色声音。它代表了音频制作领域的重大创新,为电影电视工作室、视频游戏开发者和社交媒体内容创作者提供了快速、经济、大规模生成丰富沉浸式音景的工具。该产品通过与Shutterstock的合作,利用其丰富的音频库中的授权曲目,经过精细调整,为现代创作者创造了一个多功能的新工具。

  • Video-MME:首个全面评估多模态大型语言模型在视频分析中的性能基准。

    Video-MME是一个专注于多模态大型语言模型(MLLMs)在视频分析领域性能评估的基准测试。它填补了现有评估方法中对MLLMs处理连续视觉数据能力的空白,为研究者提供了一个高质量和全面的评估平台。该基准测试覆盖了不同长度的视频,并针对MLLMs的核心能力进行了评估。

  • Fixie.ai:构建自然人类交流的实时人工智能

    Fixie.ai致力于开发能够像人类一样自然交流的人工智能模型。我们认为,有用的、高效的、易获取的通用人工智能(AGI)将需要能够在快节奏、模糊不清的自然人类交流世界中运作的模型。我们正在解决的问题是构建Ultravox,一个开源的、最先进的语音到语音模型;构建处理WebRTC上LLMs实时通信的最佳堆栈;在Town上构建新体验;在TheFastest.ai上跟踪模型和提供商的延迟;以及在AI领域探索可能性的边界。

  • ComfyUI Animated Optical Illusions:将炫酷的视错觉动画引入ComfyUI

    ComfyUI Animated Optical Illusions 是一款为ComfyUI用户界面设计的视觉插件,它通过动画视错觉效果,增强了用户的视觉体验,为界面设计带来了创新和趣味性。该插件采用Python语言开发,具有高度的可定制性和互动性,适合那些寻求在界面设计中添加新颖元素的开发者和设计师。

  • Outlines:强大的结构化文本生成工具

    Outlines是一个用于生成结构化文本的开源库,它支持多种模型集成,如OpenAI、transformers等,并提供了基于Jinja模板引擎的简单而强大的提示原语。它通过多种方式控制语言模型的生成,使输出更加可预测,从而提高模型效率并减少所需的示例数量。Outlines是提高包含大型语言模型的系统可靠性的第一步,通过确保模型输出与用户定义的代码之间有明确定义的接口。

  • Riffo:AI助手,简化文件重命名和组织流程

    Riffo是一款旨在帮助用户简化文件重命名和组织流程的AI助手。它通过智能技术,减少了文件管理中的猜测工作,使得文件组织变得简单快捷。Riffo支持多种文件格式,包括图片、Word文档、PDF等,并通过并行处理技术,能够快速完成大量文件的批量重命名。

  • RB-Modulation:无需训练的扩散模型个性化定制

    RB-Modulation是谷歌发布的一种基于随机最优控制的新型训练免费个性化扩散模型解决方案。它通过终端成本编码所需属性,实现风格和内容的精确提取与控制,无需额外训练,即可生成与参考图像风格一致且遵循给定文本提示的图像。该技术在无需训练的情况下,通过新颖的注意力特征聚合(AFA)模块,保持对参考图像的高保真度,并遵循给定的提示,具有重要的研究和应用价值。

  • Consistent character:创建不同姿势的给定角色图像

    cog-consistent-character 是一个基于 AI 的图像生成模型,允许用户创建给定角色在不同姿势下的图像。它利用了 Stable Diffusion 技术,通过 ComfyUI 提供了一个用户友好的界面,使得即使是没有编程背景的用户也能轻松生成高质量的图像。

  • Omost:将大型语言模型的编码能力转换为图像生成能力。

    Omost是一个旨在将大型语言模型(LLM)的编码能力转化为图像生成(更准确地说是图像组合)能力的项目。它提供了基于Llama3和Phi3变体的预训练LLM模型,这些模型能够编写代码以使用Omost的虚拟Canvas代理来组合图像视觉内容。Canvas可以由特定的图像生成器实现来实际生成图像。Omost项目背后的技术包括Direct Preference Optimization (DPO)和OpenAI GPT4o的多模态能力。

  • FastGPT:基于LLM大模型的开源AI知识库构建平台

    FastGPT是一个开源的AI知识库构建平台,提供数据处理、模型调用、RAG检索、可视化AI工作流编排等能力,帮助用户轻松构建复杂的AI应用。它支持特定领域AI客服的构建,自动化数据预处理,工作流编排,以及强大的API集成。FastGPT的优势在于其开源性、独特的QA结构、可视化工作流、无限扩展性、便于调试,并支持多种模型。

  • EasyAnimate:生成高分辨率和长视频的端到端解决方案

    EasyAnimate 是一个基于 transformer 架构的流水线,可以用于生成 AI 照片和视频,训练基线模型和 Lora 模型以用于 Diffusion Transformer。支持直接从预训练的 EasyAnimate 模型进行预测,生成不同分辨率、约 6 秒(24fps)的视频。用户还可以训练自己的基线模型和 Lora 模型以执行特定风格转换。

  • NVIDIA ACE:是一套用于创建数字人类、AI非玩家角色和交互式头像的生成式AI技术套件。

    NVIDIA ACE提供了一套先进的生成式AI模型和微服务,易于部署且性能优越。这些AI模型基于商业安全、负责任许可的数据进行训练,并通过微调和防护措施确保无论用户输入如何,都能提供准确、恰当、切题的结果。ACE支持灵活的部署选项,可以在云端或NVIDIA RTX AI PC上部署和运行。此外,ACE还提供了数字人类工作流程,允许开发者将ACE NIMs集成到他们的产品、工具、服务或游戏中,用于特定领域的AI工作流程,如NPC和客户服务助手。NVIDIA还与Inworld AI合作,展示了将NVIDIA ACE集成到一个端到端NPC平台中的示例,该平台在Unreal Engine 5中提供了尖端的视觉效果。

  • Illuminate:将学术论文转化为AI生成的音频讨论。

    Illuminate是谷歌推出的一个创新的教育工具,它利用人工智能技术将复杂的学术论文转化为易于理解的音频讨论,帮助用户以更直观、互动的方式学习和理解学术内容。该产品通过简化学习过程,提高了学习效率,尤其适合快节奏和多样化的学习需求。

  • JobCopilot:自动化求职助手,提升面试机会

    JobCopilot是一款在线求职自动化工具,旨在帮助求职者通过自动化技术提高求职效率,节省时间,增加面试机会。它通过人工智能技术,帮助用户自动搜索和申请工作,跟踪申请进度,并提供AI简历和求职信的构建服务。JobCopilot的背景是现代求职者需要面对大量的职位申请,手动填写申请表既耗时又重复,而JobCopilot通过自动化服务,简化了这一过程,帮助用户专注于更重要的事情,如面试准备和职业发展。

今日大家都在搜的词: