首页 > 传媒 > 关键词  > 虚拟人实时通话最新资讯  > 正文

Soul App语音大模型“伶伦”升级,上线“异世界回响”支持跨次元“打电话”

2024-06-18 11:34 · 稿源: 站长之家用户

和喜欢的虚拟人实时通话是一种什么样的体验?

近日,社交平台Soul App(以下简称“Soul”)语音生成大模型上线,同时自研语音大模型“伶伦”正式升级,现阶段,Soul语音大模型“伶伦”包括了语音生成大模型、语音识别大模型、语音对话大模型、音乐生成大模型等,可支持真实音色生成、语音DIY、多语言切换多情感拟真人实时对话等能力。目前,“伶伦”已应用于Soul “AI苟蛋”、站内狼人游戏“狼人魅影”AI语音实时互动、独立新产品“异世界回响”等场景。

Soul上线于2016年,依托技术和产品模式创新,平台持续推出受用户欢迎的社交玩法和多元社交场景,例如,多对多语音实时互动场景“群聊派对”、一对一互动场景“语音匹配”等,帮助用户基于兴趣相遇同好,提升关系发现的质量和效率,沉淀深度社交网络。

一直以来,声音都是传递信息和情感的重要媒介,也最能在沟通中赋予“情绪温度”和“陪伴感”。在Soul,用户积极通过语音实时互动,表达自我、分享交流,收获新关系,“语音社交”也成为平台颇具代表性的标签之一。

与此同时,作为率先将AI引入社交关系的平台,Soul不断思考如何将AI应用于社交具体场景,进一步实现交互效率、交互质量、交互体验、交互对象等多方面的提升和拓展。2020年,Soul系统启动AIGC的技术研发工作,并在智能对话、图像生成、语音技术、虚拟人等方面拥有前沿的技术积累。

其中,在语音探索方面,Soul基于平台沉淀丰富且多风格的高质量公域语音数据,推出自研语音大模型“伶伦”,在深度融入站内“AI苟蛋”等场景提供多模态互动体验外,还推出了系列趣味社交玩法和活动。

如Soul于2023年上线了“Soul次元歌手”活动,帮助每个人打造自己的AI歌手分身,让很多热爱音乐但不一定会唱歌的人,也能实现“唱歌自由”;“懒人KTV”活动则在音色克隆的基础上,创新性实现多人UGC“AI合唱”。基于音乐模型个性化的创作能力,平台的“AI帮你出灵魂专辑“活动,使用户自由输入任意作曲的主题关键词,即可一键完成词曲创作。

此次,新升级的“伶伦”在训练数据规模和模型架构上均实现了拓展和创新,实现了更真实自然、更多样性和更细颗粒度的控制效果以及流式超低延迟的生成。特别是上线的语音生成大模型在多风格多情感可控、超自然人声生成、多语言切换等方面表现出色。

具体来说,在多情感可控上,“伶伦”能够实现对情绪的深度理解和模拟,在语音生成和对话中表现出不同情感;在声音颗粒度上,支持包括吸气、喘气、笑声、结巴/重复、咳嗽 、叹气、哭声等一系列副语言语音合成,声音效果更真实生动。

值得一提的是,基于新升级的“伶伦”,Soul站内应用场景中多模态互动体验显著提升,例如狼人游戏“狼人魅影”中AI可实现实时发言,流畅完成刀人、悍跳等玩法交互。

此外,独立新产品“异世界回响”,提供多种场景、风格的虚拟人角色,每个虚拟角色具备形象、声音、人设对话能力,用户可与虚拟角色进行沉浸式即时交流。新上线的“语音通话”功能,在“伶伦”支持下,能够让用户体验与虚拟人实时语音通话效果,延迟时间少于行业平均水平,更快响应用户互动需求,提供即时的AI交流和陪伴。

根据Soul发布的《2024Z世代AIGC态度报告》,三分之一的年轻人表示愿意和AI成为朋友,人机互动已然成为年轻人中的社交新趋势。大模型应用深入人机互动场景,发力语音、视觉等多维度,无疑将进一步提升用户社交体验。

当下,大模型竞赛的焦点正从模型参数延伸至具体应用场景。Soul App CTO陶明在接受媒体采访时表示,“新一轮AI发展中,关注场景和交互体验将会是必然的趋势。”

基于对社交场景的深刻理解,Soul将围绕用户的实际使用场景和核心社交需求,不断提升技术能力,从AI推荐关系到AI辅助对话,从降低表达门槛到提升互动体验,推进AIGC技术与社交场景的深度融合,实现AI原生社交场景创新。

推广

特别声明:以上内容(如有图片或视频亦包括在内)均为站长传媒平台用户上传并发布,本平台仅提供信息存储服务,对本页面内容所引致的错误、不确或遗漏,概不负任何法律责任,相关信息仅供参考。站长之家将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。任何单位或个人认为本页面内容可能涉嫌侵犯其知识产权或存在不实内容时,可及时向站长之家提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明(点击查看反馈联系地址)。本网站在收到上述法律文件后,将会依法依规核实信息,沟通删除相关内容或断开相关链接。

  • 相关推荐
  • 大家在看
  • Soul App再携手三丽鸥家族,推出“大耳狗的Soul星环游记”数字文创系列

    新型社交平台SoulApp与三丽鸥家族共同推出“大耳狗的Soul星环游记”数字文创系列。该系列数字文创以大耳狗这一经典角色为蓝本,融合现代年轻人的审美偏好,打造出既美观又酷炫的虚拟形象,发行18000份。Soul将不断满足用户需求,持续通过AIGC等技术不断拓展社交新边界,为更多用户打造了一个自由表达兴趣、结识同好的温暖社交空间。

  • Soul App 携手郭采洁,开启兴趣社交新篇章

    从抱着吉他,唱出「我的未来式由我做主」宣言的优格女孩,到留着精致短发,说出「爱情像一盘散沙」箴言的顾里,再到如今在音乐节现场,唱出灵魂乐句的「莫拉怪乐」乐队主唱Birdy.k...现在,郭采洁又添新身份。开放式兴趣社交平台SoulApp官宣演员、歌手郭采洁成为SoulApp品牌音乐大使。SoulApp将利用在AI技术方面的深厚积累,推动其在音乐领域的进一步发展,探索音乐与社交的下一步可能,为用户提供更加精准和高质量的社交体验。

  • 郭采洁成为Soul品牌音乐大使,与Soul一同书写社交新故事

    开放式兴趣社交平台SoulApp官宣演员、歌手郭采洁成为SoulApp品牌音乐大使。双方秉承着对音乐的共同热爱,将一同在音乐社交领域,书写新的故事。SoulApp将利用在AI技术方面的深厚积累,进一步推动其在音乐领域的发展,探索音乐社交的更多新可能,致力于为用户打造的充满差异化的音乐交流和创作平台,为用户提供更加有趣、新颖的社交体验。

  • Soul重构多维附近,回归真实世界拓宽社交场域

    随着网络技术的飞速发展,线上空间已经演变成为年轻人建立人际网络、探索自我认同的核心平台。新型社交平台SoulApp认为,真正的情感共鸣与深刻连接,最终仍需落地于现实生活,与真实世界中的个体和经历建立起更为紧密的联系。这种以兴趣为链的社交模式,不仅让年轻人重新找到了生活的乐趣和动力,也实现了线上虚拟世界与线下真实世界的深度链接,不断拓宽着用户的社交场域。

  • 六年之后,Soul再帮老朋友一回

    皖皖又下载回Soul,这次是真死马当活马医了。她刚被实习单位裁员,“这我得解释一下哈,不是因为能力不行,就是不需要我们这批实习生了”,现在当务之急,是赶快找到新的实习要找到新的实习,她亟需拿下眼前的课题。有条评论说,皖皖的这条瞬间是“六度空间”理论的具体案例,通过社交网络,链接到天涯海角的同好,链接到民国时期的电影活动家,链接到2018年的回忆,皖皖说这次她应该不会再卸载,因为周剑云,她结识了一些热心的知音,对中文心怀热爱的同好,他们在北京,在浙江,在中国台湾,在澳大利亚...周剑云曾在1922年创办“明星影片股份有限公司”,在公司出品电影中,最为人熟知的当数《马路天使》,《马路天使》有一首著名的插曲《天涯歌女》,它是这么唱的:天涯呀海角,觅呀觅知音。

  • 小米健康研究APP上线支持睡眠呼吸暂停研究 仅新品可用

    据博主缪特_”爆料,小米运动健康App更新至3.31.0版后,睡眠页面新增健康研究APP的睡眠呼吸暂停研究入口。睡眠呼吸暂停研究系由北京大学第三医院发起的应用可穿戴设备对人体心肺、睡眠及运动功能情况进行监测及评估的研究”。小米手环9在前代基础上升级了金属机身,质感大大加强,功能性方面也有所升级。

  • AI社交引爆市场,Soul坚持做满足用户需求的事

    ChatGPT横空出世,大模型赋能聊天机器人,“AI社交”率先以对话形式引爆市场,众多公司入局并都希望在社交领域通过大模型落地获得红利。Soul作为较早探索AI在社交场景应用的平台,坚持从用户需求出发,自研垂类语言大模型SoulX、语音大模型等多模态大模型,应用于平台上多元社交互动场景,以达到提升用户社交体验,通过科技升级社交的目的。Soul仍将继续探索AI的规模应用,加强AI辅助社交关系破冰,致力于进一步降低用户社交门槛,提升用户社交体验。

  • 微软开源GraphRAG:极大增强大模型问答、摘要、推理

    7月3日,微软在官网开源了基于图的RAG——GraphRAG。为了增强大模型的搜索、问答、摘要、推理等能力,RAG已经成为GPT-4、Qwen-2、文心一言、讯飞星火、Gemini等国内外知名大模型标配功能。同时GraphRAG对tokens的需求很低,也就是说可以帮助开发者节省大量成本。

  • 大模型会自己“盗图”?这些坑OpenAI已经踩过了

    360创始人周鸿祎,涉及“AI盗图”风波,最终上演了大结局。就在上周五,网络创作者DynamicWang在社交媒体控诉,360公司和周鸿祎本人对侵权时间不作为,于是委托律师进行维权相关的工作。类似周鸿祎和DynamicWang的罗生门事件,会越来越少。

  • 国产大模型第一梯队玩家,为什么pick了CPU?

    AI一天,人间一年。现在不论是大模型本身,亦或是AI应用的更新速度简直令人直呼跟不上——Sora、Suno、Udio、Luma……重磅应用一个接一个问世。我们希望通过这个专栏,让更多的人了解CPU在AI推理加速,甚至是整个AI平台或全流程加速上的实践成果,重点就是如何更好地利用CPU来提升大模型应用的性能和效率。

  • hattl:AI驱动的招聘软件,提供个性化职业指导。

    hattl是一个AI驱动的招聘软件,它通过游戏化的个人资料评估和智能筛选,为求职者和企业提供个性化的匹配服务。产品背景信息显示,hattl与Product Crawl合作,并在2024年6月发布了候选人平台。产品的主要优点包括提供真实的技能评估、全面的候选人资料和白标职业门户,以及通过AI技术进行智能人才搜索和筛选。

  • Cherry Studio:Windows/macOS GPT 客户端

    Cherry Studio 是一款适用于 Windows 和 macOS 的 GPT 客户端软件,支持 Intel 和 Apple Silicon 架构。它通过提供高效的 GPT 交互体验,帮助用户在多种场景下提升工作效率。

  • 智海流光AI:一站式AI创作平台,提升写作与创意效率。

    智海流光AI在线写作助手是一款集成了多种AI工具的在线平台,采用国内领先的生成型预训练变换模型(GPT),与Kimi、百度文心一言等合作伙伴共同开发。它支持AI写作、AI绘画、AI视频生成等功能,致力于提升用户的创作效率和质量。

  • Animate3D:3D模型动画生成

    Animate3D是一个创新的框架,用于为任何静态3D模型生成动画。它的核心理念包括两个主要部分:1) 提出一种新的多视图视频扩散模型(MV-VDM),该模型基于静态3D对象的多视图渲染,并在我们提供的大规模多视图视频数据集(MV-Video)上进行训练。2) 基于MV-VDM,引入了一个结合重建和4D得分蒸馏采样(4D-SDS)的框架,利用多视图视频扩散先验来为3D对象生成动画。Animate3D通过设计新的时空注意力模块来增强空间和时间一致性,并通过多视图渲染来保持静态3D模型的身份。此外,Animate3D还提出了一个有效的两阶段流程来为3D模型生成动画:首先从生成的多视图视频中直接重建运动,然后通过引入的4D-SDS来细化外观和运动。

  • 有道小P:AI全科学习助手

    有道小P是一款基于有道子曰大模型的AI全科学习助手,致力于为用户提供个性化的学习体验和高效的学习工具。它结合了先进的人工智能技术,能够针对不同学科和学习需求,提供定制化的学习方案和辅助。

  • 钉钉宜搭:云钉原生低代码平台,让企业构建专属应用更简单

    钉钉宜搭是一款云钉原生低代码平台,具备页面编排、业务模型编排、业务流程编排、服务编排、数据展现及分析等多项核心能力。该产品以简单的拖拽和配置完成业务应用的搭建,并天然具备云原生和钉原生特性。

  • Nero AI:AI图像和视频增强工具

    Nero AI 是一款利用人工智能技术来增强图像和视频质量的在线工具。它通过先进的AI算法,能够提升图像的分辨率和清晰度,修复旧照片,去除背景,甚至生成卡通化或动漫风格的头像。Nero AI 的主要优点包括操作简便、处理速度快、效果显著,适合需要快速提升图像质量的用户。

  • 爬爬飞记:记录你生活中的一切,成为你的完美记忆助手

    爬爬飞记是一款致力于提高用户生活记录效率的应用程序。它通过简洁的用户界面和强大的记录功能,帮助用户捕捉生活中的每一个瞬间,无论是文字、图片还是视频。产品背景信息显示,爬爬飞记注重用户隐私,只有在用户允许的情况下,才会使用大语言模型访问用户数据。

  • 论文智匠:AI助力,轻松搞定论文写作

    论文智匠—AI论文写作大师是一个面向大学生的AI写作平台,通过输入论文题目,AI能够自动生成千字大纲,编辑大纲后,进一步生成论文初稿以及全文。该平台支持多种论文类型,包括毕业论文、期刊论文等,覆盖了广泛的学科领域,如哲学、经济学、法学等。它通过降低AI查重率,帮助用户快速完成论文写作,提高写作效率,同时确保论文的原创性。

  • BRICK.PHOTOS:将照片转化为砖块艺术,提升社交媒体存在感。

    BRICK.PHOTOS是一个在线服务,使用户能够将他们的个人照片转换成具有多种风格的砖块艺术图片。这项技术不仅增加了照片的趣味性和创意,还为社交媒体内容创作提供了新的可能性。产品由@janbuilds设计和构建,提供了快速的转换服务,通常在一小时内完成,并且每张图片都是独一无二的。

  • Praison AI:低代码多代理系统框架

    Praison AI 是一个低代码的集中式框架,旨在简化各种大型语言模型(LLM)应用的多代理系统的创建和编排。它强调易用性、可定制性和人机交互。Praison AI 利用 AutoGen 和 CrewAI 或其他代理框架,通过预定义的角色和任务来实现复杂的自动化任务。用户可以通过命令行界面或用户界面与代理进行交互,创建自定义工具,并通过多种方式扩展其功能。

  • RunwayML App :AI视频创作神器

    RunwayML是一款领先的下一代创意套件,提供了丰富的工具,让用户能够将任何想法转化为现实。该应用通过其独特的文本到视频生成技术,让用户仅通过文本描述即可在手机上生成视频。其主要优点包括: 1. 文本到视频生成:用户只需输入文本描述,即可生成视频。 2. 实时更新:定期推出新功能和更新,确保用户始终能够使用最新的AI视频和图片工具。 3. 无缝资产转移:用户可以在手机和电脑之间无缝转移资产。 4. 多种订阅选项:提供标准、专业和每月1000次生成信用的订阅选项。

  • Sourcer AI:AI驱动的事实核查工具

    Sourcer AI 是一款利用人工智能技术进行在线信息评估的工具。它通过分析文章的语言,即时揭示在线来源的可信度和政治偏见,帮助用户在充满虚假信息的世界中做出明智的决策。该工具的主要优点包括实时评估、透明度高、易于使用等。

  • WeInstaReply:AI驱动的Microsoft Teams消息自动回复平台

    WeInstaReply是一个与Microsoft Teams集成的平台,使用人工智能技术自动化回复收到的消息。用户可以上传自己的知识和业务流程,确保回复的准确性和相关性。该平台支持57种语言,提供7天免费试用,月费3.99英镑,包括200次AI自动回复,不限用户数和内容上传量,还提供客服支持和功能请求优先权。

  • Clean Inbox for Gmail:Gmail插件,使用GPT技术过滤垃圾邮件。

    Clean Inbox for Gmail™ 是一款专为Gmail设计的插件,利用GPT技术帮助用户过滤垃圾邮件,提高邮件管理效率。用户可以一键浏览并安装公共分类,对整个邮件类别进行标签化处理。此外,用户还可以创建自定义的过滤类别,插件能够识别邮件内容并建议过滤规则,避免类似邮件再次进入收件箱。Clean Inbox for Gmail™ 强调隐私保护,保证不会读取用户邮件内容,过滤的邮件不会被删除,只会被标记。

  • 闪念贝壳:用语音记录想法,AI助手辅助思考和行动

    闪念贝壳是一款以语音记录为核心的思考笔记应用,通过AI技术帮助用户捕捉灵感、整理思绪,并指导行动。它支持声音、图片、文本等多种记录方式,能够自动整理、格式化内容,并添加标签和标题。此外,用户可以与AI进行讨论,获取阅读建议和行动指导,从而提升思维认知。产品设计背后强调随时随地自由记录,帮助用户从0到1开启创作,并将初稿导入其他应用进行进一步编辑。

  • Mathstral-7B-v0.1:专注于数学和科学任务的模型

    Mathstral 7B 是一个专注于数学和科学任务的模型,基于 Mistral 7B。该模型在数学和科学领域的文本生成和推理方面表现出色,适用于需要高度精确和复杂计算的应用场景。模型的开发团队包括多位专家,确保了其在行业内的领先地位和可靠性。

  • Mamba-Codestral-7B-v0.1:高性能的开源代码模型

    Mamba-Codestral-7B-v0.1 是 Mistral AI Team 开发的基于 Mamba2 架构的开源代码模型,性能与最先进的基于 Transformer 的代码模型相当。它在多个行业标准基准测试中表现出色,提供高效的代码生成和理解能力,适用于编程和软件开发领域。

  • financial datasets:为开发者设计的股市API

    financial datasets是一个为开发者设计的股市API,提供超过15000家公司的基本数据。用户只需为实际使用的数据付费,无需订阅、签订合同或受到使用限制。

  • Qwen2-Audio:阿里云推出的大型音频语言模型

    Qwen2-Audio是由阿里云提出的大型音频语言模型,能够接受各种音频信号输入,并根据语音指令进行音频分析或直接文本回复。该模型支持两种不同的音频交互模式:语音聊天和音频分析。它在13个标准基准测试中表现出色,包括自动语音识别、语音到文本翻译、语音情感识别等。

今日大家都在搜的词:

热文

  • 3 天
  • 7天