字节跳动获“分屏方法”相关专利授权，可丰富图像显示方式

2021-06-01 15:28 · 稿源：站长之家

站长之家(ChinaZ.com) 6月1日消息:企查查APP显示，近日，北京字节跳动网络技术有限公司获得“分屏方法、装置、电子设备和计算机可读存储介质”专利授权，公开号为CN111352560B。

专利摘要显示，本公开实施例通过用户的触发动作对显示画面进行分屏，并在分屏后的各个分屏中分别显示图像，既能够丰富图像的显示方式，又能够方便快捷的为用户提高分屏方式，从而提高了用户体验效果。

相关推荐
大家在看

关键词：

【腾讯云】11.11云上盛惠！云服务器首年1.8折起，买1年送3个月！

11.11云上盛惠！海量产品 · 轻松上云！云服务器首年1.8折起，买1年送3个月！超值优惠，性能稳定，让您的云端之旅更加畅享。快来腾讯云选购吧！

Docker容器镜像
去看看

Docker容器镜像 60元/15天

爆款产品组合购
去看看

爆款产品组合购低至1元

腾讯云x NVIDIA加速计划
去看看

腾讯云x NVIDIA加速计划最高获赠10万元扶持基金

2核2G云服务器
去看看

2核2G云服务器 112元/1年

查看更多相关信息>>

腾讯云 12-20

广告
字节跳动发布图像模型蒸馏算法Hyper-SD 推理速度更快更完美

字节跳动的Lightning团队发布的新图像模型蒸馏算法Hyper-SD，是一项在图像处理和机器学习领域的重要进展。这项技术通过创新的方法提升了模型在不同推理步骤下的性能，同时保持了模型大小的精简。随着进一步的研究和开发，Hyper-SD及其衍生技术有望在多个领域内推动AI技术的发展和应用。

Hyper AI头条
字节跳动加大员工激励：最高可拿15％

在大环境和行业疲软的情况下，这两年大量企业都缩减了员工奖励，各大互联网厂商也不例外，不过今天，字节跳动宣布了一项额外的员工激励。根据字节跳动发布的全员信，2023全年综合绩效在M及以上的员工，将在实际评定奖金月数的基础上，额外获得期权激励。其中，综合绩效为M的额外获得5%的激励，M 的为10%，E及以上的为15%。所有激励都将以期权/RSU形式的发放，激励价值不足4股的发放对应现金。字节跳动内部全员信如下：大家好，2023全年绩效评估已经结束，感谢大家的认真参与。之前我和大家沟通过几项重要的绩效和激励政策调整，主要变化点

员工激励绩效评估期权激励
字节跳动称没有出售TikTok计划

市场上出现了有关字节跳动有意出售TikTok的传闻，甚至传闻称沃尔玛可能成为潜在买家。字节跳动迅速做出回应，通过官方声明坚决否认这些报道，并明确表示没有任何出售TikTok美国业务多数股权的计划。事实和法律将站在我们这一边，我们也必将取得最终的胜利。

字节跳动 TikTok 沃尔玛
字节跳动 “AI作业助手” Gauth在美国教育应用下载量排名第二

字节跳动旗下子公司GauthTech推出的“AI作业助手”应用Gauth在美国教育应用市场蓬勃发展，成为苹果iOS设备上第二下载量最高的教育应用，仅次于语言学习平台Duolingo。另一款自称为“AI作业助手”的应用Question.AI也在Data.ai的调查中排名第三，这款应用由北京在线教育服务初创公司作业帮支持。根据Diandian的数据，今年3月，该应用最活跃的用户来自印尼和菲律宾。

字节跳动 AI作业 AI头条
北大字节提出图像生成新范式VAR 超越Sora核心组件DiT

北大与字节跳动AILab联合提出了一种图像生成新范式——VAR，这一新方法的核心在于预测下一级分辨率非传统的预测下一个token。VAR的提出不仅在图像生成质量上超越了Sora的核心组件DiffusionTransformer在推理速度上也实现了20倍以上的提升。VAR的开源也体现了学术界与工业界合作的积极成果，有助于推动整个AI领域的发展和创新。

VAR AI头条
ZeST：可将一图像的材质迁移到另一图像上

在计算机视觉和图形学领域，材质迁移技术一直是研究的热点之一。牛津大学、StabilityAI和MITCSAIL的研究团队共同开发了一种名为ZeST的创新方法，它能够在无需任何先前训练的情况下，实现从一张图像到另一张图像中对象的材质迁移。研究团队将继续探索如何将ZeST扩展到更广泛的应用领域，并进一步提升其性能和效果。

ZeST AI头条
荐北大字节开辟图像生成新范式，超越Sora核心组件DiT，不再预测下一个token

北大和字节联手搞了个大的:提出图像生成新范式，从预测下一个token变成预测下一级分辨率，效果超越Sora核心组件DiffusionTransformer。并且代码开源，短短几天已经揽下1.3k标星，登上GitHub趋势榜。他硕士毕业于浙江大学，目前的研究重点是视觉基础模型、深度生成模型和大语言模型。

图像生成预测分辨率
AI图像编辑工具Facet AI 实时图像生成，可精确控制图像元素

Facet AI是一款创新的图像编辑工具，它以其独特的功能和用户友好的操作界面，为广告制作和产品图像设计领域带来了革命性的变化。这款工具的核心优势在于其精确控制图像元素的能力，使得用户可以轻松地对图像进行实时编辑和调整。官网地址：https://facet.ai/Facet AI的直观画布操作是其一大亮点。用户可以通过简单的拖拽和调整，实现对图像

Facet AI头条
Adobe图像生成AI “Firefly” 训练集中约有5%为AI图像

Adobe的图像生成AI“Firefly”以其训练集来源自AdobeStock中的图片和视频闻名。美国经济报纸彭博社报道称，Firefly的数据集实际上包含由Midjourney等公司生成的图像。”然，Tushnett教授指出，Firefly学习自Midjourney生成的图像的事实与其声称与其他图像生成AI不同的说法相矛盾。

Firefly Adobe AI头条
图像转文字工具2txt 可识别图像中文字并转换为可编辑文本

2txt是一个基于AI的图像转文字工具，使用ClaudeHaiku和VercelAISDK创建。这个工具不仅可以将任意图像上的文字识别出来能将其转换成可编辑的文本格式。用户只需上传图片，系统就会自动识别图片中的文字，并将其转换成可编辑的文本格式，极大地提高了工作效率。

2txt AI头条

RAGFlow:开源的基于深度文档理解的RAG（检索增强生成）引擎

RAGFlow是一个开源的RAG（Retrieval-Augmented Generation）引擎，基于深度文档理解，提供流线型的RAG工作流程，适用于各种规模的企业。它结合了大型语言模型（LLM）提供真实的问答能力，支持从各种复杂格式数据中引用确凿的引文。

自然语言处理机器学习信息检索

EmojiTell:使用表情组合翻译器，让沟通更有趣且富有表现力。

EmojiTell是一个创新的在线服务，可以将文本翻译成表情组合，增加沟通的趣味性和表现力。它由一支对表情符号充满热情的开发者和设计师团队开发，旨在通过表情符号的力量，让信息传递更加生动和个性化。

表情符号翻译沟通

Perplexica:一个开源的AI驱动搜索引擎，提供深入网络的答案。

Perplexica是一个开源的AI驱动搜索引擎，它不仅搜索网络，还理解您的问题。它使用先进的机器学习算法，如相似性搜索和嵌入，来优化结果，并提供引用来源的清晰答案。使用SearxNG保持最新和完全开源，确保您始终获得最新信息，同时不损害您的隐私。

搜索引擎机器学习人工智能

FaceChain:深度学习工具链，用于生成你的数字孪生体。

FaceChain是一个深度学习工具链，由ModelScope提供支持，能够通过至少1张肖像照片生成你的数字孪生体，并在不同设置中生成个人肖像（支持多种风格）。用户可以通过FaceChain的Python脚本、熟悉的Gradio界面或sd webui来训练数字孪生模型并生成照片。FaceChain的主要优点包括其生成个性化肖像的能力，支持多种风格，以及易于使用的界面。

深度学习数字孪生个性化

Huggingface 镜像站:一个公益项目，致力于帮助国内AI开发者快速、稳定的下载模型、数据集。

HuggingFace镜像站是一个非盈利性项目，旨在为国内的AI开发者提供一个快速且稳定的模型和数据集下载平台。通过优化下载过程，减少因网络问题导致的中断，它极大地提高了开发者的工作效率。该镜像站支持多种下载方式，包括网页直接下载、使用官方命令行工具huggingface-cli、本站开发的hfd下载工具以及通过设置环境变量来实现非侵入式下载。

AI 机器学习数据集

WebLlama:构建能够根据指令浏览网页并和您对话的强大代理

WebLlama是一个基于Meta Llama 3构建的代理，专门为网页导航和对话进行了微调。它旨在构建有效的以人为中心的代理，帮助用户浏览网页，而不是取代用户。该模型在WebLINX基准测试中超越了GPT-4V（零样本）18%，展示了其在网页导航任务中的卓越性能。

网页导航对话代理机器学习

Infra Copilot:利用机器学习自动生成基础设施代码，提高开发效率。

GitHub Copilot for Infrastructure as Code（简称Infra Copilot）是一个利用机器学习技术帮助基础设施专业人员自动生成精确基础设施代码的工具。它通过理解基础设施任务的上下文，允许专业人员使用自然语言表达需求，并接收相应的代码建议。Infra Copilot不仅简化了基础设施即代码（IaC）的开发过程，还确保了跨环境和项目的一致性，加速了新团队成员的上手和学习过程，显著提高了工作效率并节约了时间。

基础设施即代码自动化机器学习

LLaVA++:扩展LLaVA模型，集成Phi-3和LLaMA-3，提升视觉与语言模型的交互能力。

LLaVA++是一个开源项目，旨在通过集成Phi-3和LLaMA-3模型来扩展LLaVA模型的视觉能力。该项目由Mohamed bin Zayed University of AI (MBZUAI)的研究人员开发，通过结合最新的大型语言模型，增强了模型在遵循指令和学术任务导向数据集上的表现。

人工智能自然语言处理机器学习

PhysDreamer:通过视频生成实现基于物理的3D对象交互

PhysDreamer是一个基于物理的方法，它通过利用视频生成模型学习到的对象动力学先验，为静态3D对象赋予交互式动力学。这种方法允许在缺乏真实物体物理属性数据的情况下，模拟出对新颖交互（如外力或代理操作）的真实反应。PhysDreamer通过用户研究评估合成交互的真实性，推动了更吸引人和真实的虚拟体验的发展。

3D交互视频生成物理模拟

AI快站:专注于提供HuggingFace模型免费加速下载服务的平台

AI快站是一个为AI开发者设计的服务平台，提供HuggingFace模型的免费加速下载，解决大模型下载缓慢和断开的问题，支持高达4M/s的下载速度，大幅减少等待时间，提高开发效率。

HuggingFace模型加速下载断点续传

Llama-3 8B Instruct 262k:一款由Gradient AI团队开发的高性能文本生成模型。

Llama-3 8B Instruct 262k是一款由Gradient AI团队开发的文本生成模型，它扩展了LLama-3 8B的上下文长度至超过160K，展示了SOTA（State of the Art）大型语言模型在学习长文本操作时的潜力。该模型通过适当的调整RoPE theta参数，并结合NTK-aware插值和数据驱动的优化技术，实现了在长文本上的高效学习。此外，它还基于EasyContext Blockwise RingAttention库构建，以支持在高性能硬件上的可扩展和高效训练。

字节跳动获“分屏方法”相关专利授权，可丰富图像显示方式

今日大家都在搜的词：

热文

站长商机