首页 > 传媒 > 关键词  > 虚拟化身最新资讯  > 正文

自研多模态大模型,Soul App亮相2024 GITEX GLOBAL

2024-10-18 14:38 · 稿源: 站长之家用户

通过理解自身的行为方式、记忆、偏好等内容,复刻一个专属于自己的虚拟化身,实现打破次元壁的互动,结识好友,获得陪伴......如今,科幻电影中描绘的场景正走向现实。

2024 年 10 月 14 日- 18 日, GITEX GLOBAL海湾信息技术博览会在迪拜举办。在这个全球范围颇具影响力的科技盛会上,新型社交平台Soul App携比较新自研的多模态大模型参展,该模型具备多模态理解、真实拟人、文字对话、语音通话、多语种等特性。在活动现场,观众可以通过数字装置,即时生成3D虚拟数字分身,通过实时动作捕捉与还原,体验自然、流畅、沉浸式的多模态互动。

Soul App CTO 陶明表示,“在受全球关注的科技大会上,我们期待与来自国内外的创新企业、科技公司共同交流,展现中国企业在社交领域的比较新应用实践和数字娱乐的创新方案,共同探索社交发展的新可能。”

3D数字孪生,虚拟与现实的创新交互

GITEX GLOBAL至今已举办至第 44 届,自诞生以来,始终聚焦于以技术为驱动的创新,吸引了来自大型科技企业、全球政府、创新初创公司、专业投资者等的广泛关注和参与。目前,GITEX GLOBAL已发展成为中东地区规模比较大、最成功的计算机通讯及消费性电子产品展,同时也是全球三大IT展之一。

自ChatGPT横空出世,标志着人工智能发展至新阶段,在世界进入全面拥抱人工智能的新时代的当下,今年,GITEX GLOBAL2024 规模再次升级,横跨两个大型场馆 —— 迪拜世界贸易中心和迪拜港,有全球超过 6700 家科技巨头和创新公司参展,展示AI领域较具突破性的科技发展、智能互联新发现、以及来自数字娱乐、社交、教育、健康等各大领域的应用落地标杆案例,汇聚最前沿的先进技术思潮,引领行业变革的新风向。

作为国内较早将AI引入社交关系的互联网平台代表之一,Soul 携比较新自研的多模态大模型参展GITEX GLOBAL 2024,展示AI技术积累以及在社交场景的比较新落地实践。此次也是Soul初次亮相国际大型展会,大会上,现场观众可以重点体验到Soul集成3D虚拟人能力的多模态AI交互方案。

为了降低用户社交压力,Soul自 2016 年上线之初便不支持用户上传真实头像,年轻人通过平台提供的捏脸系统,自主创造个性化虚拟形象,在不强调颜值、地理位置等物理因素的情况下,自在表达,分享热爱,相遇同好。

2022 年,Soul集成AI、渲染和图像处理等技术,推出自研的NAWA引擎,为用户创建个性化的3D社交形象和场景提供技术加持。基于该引擎,用户可以自主创作生动的虚拟形象,塑造网络世界的化身,并能灵活地配合声音、文字等各种信息,展现每个人鲜明的个性,准确传递情绪温度,在各种虚实融合的场景中与他人自在交流、互动,感受全新的社交体验。

集合过往的技术储备以及大模型研发进展的突破,现阶段,Soul 3D虚拟人能力全面升级,形成了成熟的集成3D虚拟人能力的多模态AI交互方案——即集合文字、语音、动作交互的多模态大模型方向,实现更接近人类模式的互动体验和更有效、自然、丰富维度的信息传递。

在大会现场,参与体验的用户可以实现高相似度的3D虚拟人的AI建模,通过包含人脸的 90 余个形状参数和 6 个属性参数,于几秒钟内,快速在3D世界精细化还原真实人脸的特征 ,打造专属的虚拟化身。

同时,基于实时的人体动作识别、数字还原以及多模态对话交互能力,现场可以实现3D虚拟人与真人的沉浸式互动。

多模态端到端大模型,超拟人的情感体验

事实上,包括语言、对话、3D虚拟人等维度在内,Soul聚焦于多模态大模型方向持续深耕。

在推出智能推荐引擎“灵犀”、以AI算法助力社交关系的发现沉淀环节后, 2020 年,Soul正式启动对AIGC的技术研发工作,系统推进在智能对话、语音技术、3D虚拟人等AIGC关键技术能力研发工作,并推动AI能力在社交场景的快速落地。

目前,Soul已先后上线了自研语言大模型Soul X,以及语音生成大模型、语音识别大模型、语音对话大模型、音乐生成大模型等语音大模型能力。今年 6 月,Soul还在社交行业中较早推出了自研端到端全双工语音通话大模型,具备超低交互延迟、快速自动打断、超真实声音表达和情绪感知理解能力等特点,能够直接理解丰富的声音世界,支持超拟人化的多风格语言,实现更接近生活日常的交互对话和“类真人”的情感陪伴体验。

2024 年,Soul AI大模型能力整体升级为了多模态端到端大模型,支持文字对话、语音通话、多语种、多模态理解、真实拟人等特性。

多模态端到端大模型的推出标志着Soul对人机交互体验的创新突破,同时,从文字、语音到视觉的模态升级,也意味着交互方式的颠覆式改变。

例如,Soul已基于自研AI能力推出了“数字分身”功能,用户可以直接授权平台基于聊天记录、发帖内容,或者以自定义方式,设置数字分身的形象和特征,在表征层(形象、声音、文字风格),身份层(社交关系、长期记忆、人设信息)和认知层(决策、观点、偏好),使数字分身达到较大程度复刻真人的效果。而“数字分身”不仅能实现更个性化、更千人千面的智能回复推荐,帮助用户进行社交破冰,还能在助力人设搭建和认知决策中,提升社交沟通效率。

接下来,通过比较新集成的3D虚拟人能力和多模态端到端大模型的AI交互方案,Soul用户自主打造的3D虚拟人,可以作为数字世界的多模态全能助手,在平台群聊派对、瞬间广场等丰富社交场景中全面赋能用户的关系发现、建立、沉淀环节,拓展新关系的同时,提供高质量、趣味性、沉浸式的人机交互体验,反馈真实、自然的情感陪伴。

Soul App CTO陶明表示,“作为天然的流量聚集地和交互入口,社交被视为AI率先落地的理想场景之一。我们将围绕用户的实际社交需求和具体社交场景,持续加大对AI技术的投入,给用户带来长期的可持续的价值。预计今年年底,Soul多模态端到端大模型将再次升级,推出全双工视频通话能力,让用户可以真正便捷、自然的体验到包括文字、语音、视觉在内的多模态创新交互。”

推广

特别声明:以上内容(如有图片或视频亦包括在内)均为站长传媒平台用户上传并发布,本平台仅提供信息存储服务,对本页面内容所引致的错误、不确或遗漏,概不负任何法律责任,相关信息仅供参考。站长之家将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。任何单位或个人认为本页面内容可能涉嫌侵犯其知识产权或存在不实内容时,可及时向站长之家提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明(点击查看反馈联系地址)。本网站在收到上述法律文件后,将会依法依规核实信息,沟通删除相关内容或断开相关链接。

  • 相关推荐
  • 寒武纪智能芯片赋能多模态大模型应用

    大模型快速发展推动人工智能技术迈向新阶段,从解决特定任务的弱人工智能向处理通用复杂任务的强人工智能演进。IDC报告显示,2024年中国大模型开发平台市场规模达16.9亿元,人工智能算力市场约190亿美元,预计2025年将达259亿美元。寒武纪等企业专注AI芯片研发,推出多款处理器及加速卡产品,支持大模型训练推理及多模态任务,并与产业链合作共同推进人工智能产业发展。

  • Just So Soul发布《2025 年轻人减肥报告》:近1成年轻人减肥第一步是在社交平台立Flag

    Soul App发布的《2025年年轻人减肥报告》显示,超八成年轻人有减肥意愿,其中Z世代是主力。外貌焦虑仍是减肥首要原因,但近半数为健康而减。六成人选择运动减肥,平均花费1487元。减肥成功标准从体重数字转向更自信健康。报告指出,年轻人通过减肥重获生活掌控感,社交平台成为重要支持来源。

  • 降低创作门槛!爱诗科技新一代生成式大模型加速AI视频大众化

    爱诗科技8月27日发布新一代AI视频生成模型PixVerse V5,实现秒级高质量视频生成,支持360P至1080P分辨率。新模型在真实度、灵活性及生成速度上显著提升,覆盖人物、二次元、商业广告等多场景创作。同步上线Agent创作助手,降低使用门槛,用户无需专业技巧即可一键生成专业级视频。该技术推动AI视频从专业工具走向大众化应用,加速行业落地。

  • Soul以AI重构社交体验,打造有温度的“Gen AI 社交游乐园”

    Soul 作为新型社交平台,自成立以来便积极探索AI技术在社交领域的应用落地,持续优化AI社交体验,致力于重塑数字时代的连接方式,为社交产品注入新的可能性,打造一个突破传统社交边界的“Gen AI社交游乐园”。前不久,在第二十二届ChinaJoy(中国国际数码互动娱乐展览会)上,Soul App以“Soul树洞情绪疗愈酒吧”为展台主题亮相,重磅推出原创IP“莫比乌斯·第三弹”ChinaJoy

  • 虚拟资产落地香港:从政策突破到合规通道的实践者 HKTWeb3

    过去十年虚拟资产快速发展,但面临合规与安全落地的核心痛点。投资者难以将BTC、ETH等直接用于购房购车,跨境流转不透明、税务复杂等问题制约发展。香港自2023年6月立法引入AML/KYC机制,为行业打开合规大门。HKTWeb3平台通过链上信托架构实现资产合规托管,结合身份隔离与税务优化方案,打通虚拟资产与现实金融的壁垒,让数字货币真正成为可配置实体资产的财富工具。

  • 飞渡科技再度登顶数字孪生平台市场,空间智能引领产业变革新浪潮

    IDC报告显示,飞渡科技以25.1%的市场份额蝉联中国数字孪生平台市场第一。其自主研发的DTS数字孪生平台集成多源数据治理、实时渲染与AI仿真等关键技术,实现全技术链覆盖,广泛应用于智慧城市、工业制造等领域。公司通过空间智能技术突破,推动数字孪生向“可知、可智、可决”演进,标志着行业进入以空间智能为核心驱动的新阶段。

  • AI日报:B站测试AI视频工具花生AI;腾讯发布多模态模型Large-Vision;昆仑万维开源Skywork UniPic 2.0

    【AI日报】主要内容: 1. B站测试"花生AI"视频工具,3分钟可成片,同时推进自研大模型和多语言翻译功能 2. 昆仑万维开源多模态模型Skywork UniPic 2.0,实现高效统一的多模态生成能力 3. 马斯克指责苹果偏袒OpenAI,苹果回应称平台设计公平公正 4. 腾讯混元发布52B参数多模态理解模型Large-Vision,支持任意分辨率输入 5. DeepSeek官方否认8月发布R2模型的传闻 6. OpenAI推出超值ChatGPT Go套餐,仅399卢比降低使用门槛 7. AI新贵Perplexity豪掷345亿美元收购谷歌Chrome 8. Anthropic的Claude Sonnet 4模型支持100万token上下文 9. ChatGPT重大更新:恢复GPT-4o默认模式,为GPT-5引入多模式选择,优化交互体验

  • DTCC2025丨达梦以智算多模与AI创新引领行业变革

    近日,IT168联合旗下ITPUB、ChinaUnix两大技术社区主办的第十六届中国数据库技术大会(DTCC2025)在京隆重召开。大会以“智能创新 数赢未来”为主题,汇聚超百位行业专家及上千名嘉宾,聚焦数据库领域前沿技术。达梦数据作为领军企业受邀参会,重点展示了其在多模数据处理与AI+数据库融合方面的突破,推出“智算多模”引擎,实现统一存储与智能查询,为行业智能化发展注入新动能。

  • 迷你LABUBU开售后卖爆 多平台已售罄:电商平台销量破百万

    昨晚22时整,泡泡玛特旗下备受瞩目的迷你版LABUBU系列新品正式开售,迅速点燃了消费者的热情。该系列单个盲盒定价79元,若整套购买则需1106元。其中,主打款心底密码系列搪胶毛绒挂件盲盒更是成为抢购焦点,上线瞬间即被抢购一空。 不少网友提前守候在购买页面,准备第一时间抢购。然而,当时间一到,小程序页面迅速显示“太火爆了”,随后便提示商品已售罄,让众�

  • 飞渡科技以25.1%的市场份额蝉联数字孪生平台榜首 引领空间智能新浪潮

    IDC最新报告显示,飞渡科技凭借25.1%的市场份额蝉联中国数字孪生平台首位。其自主研发的DTS平台融合空间智能技术,突破行业瓶颈,在智慧城市、工业制造、水利水务等领域实现深度应用。报告指出,数字孪生市场正经历技术融合创新,飞渡科技通过垂直深耕战略,推动产业数字化升级。未来将持续加大AI融合研发,助力千行百业实现数字化转型。

今日大家都在搜的词: