首页 > 业界 > 关键词  > 正文

B站新专利可生成有声弹幕

2023-09-19 15:53 · 稿源:站长之家

站长之家(ChinaZ.com)9月19日 消息:天眼查App显示,9月19日,B站关联公司上海幻电信息科技有限公司申请的“有声弹幕生成、播放方法和系统”专利公布。

B站

专利摘要显示,该申请提供了一种有声弹幕生成、播放方法、系统、计算机设备及计算机可读存储介质,方法包括:获取基于预置的虚拟乐器输入的第一音频数据,根据第一音频数据生成有声弹幕数据,播放有声弹幕。

据悉,通过该专利,用户可以在观看视频或浏览页面内容时,输入个性化的有声弹幕,形成有声评论,在其他用户播放视频时进行输出,达到播放有声弹幕的效果。

举报

  • 相关推荐
  • 武汉核心点包装设计机构,货架无声,让包装有声!

    本文强调包装设计在品牌竞争中的关键作用。货架是无声的战场,消费者短暂驻足的三秒是产品突围的关键时机。包装需具备亮点,能“说话”,成为品牌最直接的竞争力。专业设计机构应立足用户视角,精准匹配品牌需求,通过专业设计与细致服务,让包装打破货架沉寂,既有声量更有亮点,助力品牌在同质化竞争中抢占先机。核心设计理念是“以包装为载体,让品牌有记忆、有亮点”,坚持先有核心策划,后有合心设计,立足品牌定位与目标人群需求,将品牌核心价值融入设计细节。好的包装不仅是产品的“保护壳”,更是品牌与消费者沟通的桥梁,用视觉传递价值,用细节承载温度,用亮点占领心智,让产品在无声的货架上主动吸引目光、传递品牌内涵,真正实现“先动心,后动销”。

  • 谷歌Gemini再升级!解锁新玩法:输入提示词即可生成交互式3D模型

    近日,谷歌Gemini AI推出最新升级,用户只需输入提示词,就能让聊天机器人生成交互式3D模型和实时模拟。 这一新功能支持多种互动操作,包括旋转模型、拖动滑块调整参数或输入数值改变模拟结果。 例如,用户询问月球绕地球轨道时,Gemini会创建一个3D模型,并提供轨道速度滑块、路径线切换开关以及暂停按钮。

  • Soul CEO张璐团队开源SoulX-LiveAct:从“能生成”到“能长时间稳定生成”

    Soul CEO张璐团队开源实时数字人生成模型SoulX-LiveAct,旨在解决长时连续生成难题。模型基于AR Diffusion框架,采用分块生成与上下文传递机制,结合Neighbor Forcing和ConvKV Memory优化性能与一致性。在多项基准测试中表现优异,支持数字人直播、AI教育等在线场景。该模型与团队此前开源的SoulX-FlashTalk、SoulX-FlashHead共同完善技术布局,推动AI应用生态发展。

  • 腾讯混元3D世界模型2.0发布 一句话生成3D资产

    今日,腾讯正式发布并开源混元3D世界模型2.0(HY-World 2.0)。 官方表示,该模型一句话就能生成3D资产,并直接导入到游戏制作或具身仿真引擎,实现真正的可玩、可用。 具体来说,用户完全不需要懂任何复杂的3D软件,只要像平时说话一样输入一句文字描述,或者直接上传一张图片,模型就能精准解析复杂的语义。 随后,它会一键生成混合了3D高斯泼溅(3DGS)与Mesh表征的�

  • 视频生成每秒仅需1元!字节Seedance2.0正式上线API服务

    今日,字节旗下火山引擎正式上线Seedance 2.0系列API服务,企业和个人用户现在可以调用其视频生成能力。 作为全球SOTA模型,Seedance 2.0支持文字、图片、音频、视频四种模态输入;同时它在复杂交互和运动场景下的可用率更高,更加贴合工业级创作场景的需求。 此外,火山引擎还为Seedance 2.0建立了肖像与版权安全标准,覆盖视频生成涉及的各种模态和创作前后的全部流程。 �

  • 某平台多部AI生成短剧换脸易烊千玺 后者工作室发声明将追责

    近段时间以来,AI侵权事件逐渐多发,除了盗用声音外,甚至还出现盗用形象的事件。 近日,某短剧平台的多部AI作品被曝换脸知名演员易祥千玺,针对此事,后者工作室发布声明: 近日,我工作室发现部分网络平台传播擅自使用易烊千玺先生肖像等生成的AI剧集,易烊千玺先生未曾参演相关剧集,也未授权第三方将其肖像等进行AI合成。

  • 3天生成,全网获赞180万,抖音如何托举AI创作者的“电影梦”?

    ​“AI就该拍这样的片子”,“这才是AI的意义”。 这些评论,来自一部名为《纸手机》的清明节AI短片。 视频中,一个小男孩攥着皱巴巴的15块钱,站在纸扎店柜台前,想买一部能打视频电话的手机。店里的手机动辄六七十块钱,老板看着男孩手里仅有的15元,只好撕下一个纸板,卖给小男孩一部自己“手搓”的纸手机。

  • 2026年3月全球网络威胁态势:勒索软件与生成式AI数据泄露风险持续升级

    Check Point Research发布的2026年3月全球威胁情报报告显示,网络攻击活动正经历策略转变。尽管全球机构平均每周遭受攻击次数环比小幅下降5%,但攻击者正调整目标与手法,勒索软件攻击月度环比上升,业务中断风险持续强化。生成式AI的普及加剧了敏感数据泄露风险,约每28个提示词中就存在1个高风险数据泄露问题。教育、政府与电信行业仍承受主要压力,而旅游相关行业攻击量激增。勒索软件生态呈现头部集中与底层碎片化并存格局,成熟勒索软件即服务平台驱动攻击规模扩大,威胁态势表现出极强的韧性与适应性。

  • B站新专利可听弹幕

    企查查APP显示,9月6日,上海哔哩哔哩科技有限公司专利“弹幕的播放方法及装置”公开...摘要显示,本申请基于所述弹幕获取规则中的弹幕筛选条件,在所述目标直播间接收的弹幕中筛选待播放弹幕,并确定所述待播放弹幕对应的弹幕音频,所述弹幕筛选条件包含弹幕类型、弹幕长度、弹幕发送者类型中的至少一个...

  • 智谱发布GLM-5V-Turbo模型:编程告别纯文本 一张图片就能生成代码

    智谱AI于4月2日发布GLM-5V-Turbo多模态编程模型,专为视觉编程打造。该模型深度融合视觉与文本能力,能看懂设计稿、截图、网页界面并生成可运行代码,实现“看得懂画面、写得出代码”。其三大核心特性包括:原生多模态编程基座,支持图片、视频、设计稿等多模态输入;兼顾视觉与编程能力,在多模态编程、GUI+Agent等基准上表现领先;深度适配Claude Code与龙蜥场景,可实现环境规划与动作执行的完整闭环。实测显示,该模型在设计稿还原、视觉代码生成等任务中表现优异,在AndroidWorld、WebVoyager等GUI操控测试中同样突出,纯文本编程能力稳定。目前已落地图像即代码、龙蜥视觉赋能等典型场景。

今日大家都在搜的词: