首页 > 传媒 > 关键词  > 多模态AI最新资讯  > 正文

GITEX GLOBAL2024开展,Soul 多模态大模型引关注

2024-10-19 21:59 · 稿源: 站长之家用户

如今的 AI 看起来已经无所不能,不仅能够胜任感知、学习、推理、决策等不同层面的任务,甚至可以打造虚拟数字分析,为人类带来多模态AI交互体验。近日, 新型社交平台Soul App 在GITEX GLOBAL海湾信息技术博览会上展出了其比较新自研的多模态大模型,该模型具备多模态理解、真实拟人、文字对话、语音通话、多语种等特性,实现打破次元壁的互动,让现场的观众们惊艳不已。

3D数字孪生,虚拟与现实的创新交互

Soul作为国内较早将AI引入社交关系的互联网平台代表之一,此次携比较新自研的多模态大模型参展GITEX GLOBAL2024,向世界展现了中国企业在社交领域的比较新应用实践和数字娱乐的创新方案。此次是Soul初次亮相国际大型展会,其自研的多模态大模型集合文字、语音、动作交互等多模态方向,实现更接近人类模式的互动体验和更有效、自然、丰富维度的信息传递。

大会上,现场观众可以实现高相似度的3D虚拟人的AI建模,通过包含人脸的90余个形状参数和6个属性参数,于几秒钟内,快速在3D世界精细化还原真实人脸的特征 ,打造专属的虚拟化身。同时,基于实时的人体动作识别、数字还原以及多模态对话交互能力,实现3D虚拟人与真人的沉浸式互动。

多模态端到端大模型,超拟人的情感体验

事实上,自成立以来Soul便一直聚焦于多模态大模型方向持续深耕。

在推出智能推荐引擎“灵犀”、以AI算法助力社交关系的发现沉淀环节后,2020年,Soul正式启动对AIGC的技术研发工作,系统推进在智能对话、语音技术、3D虚拟人等AIGC关键技术能力研发工作,并推动AI能力在社交场景的快速落地。

目前,Soul已先后上线了自研语言大模型Soul X,以及语音生成大模型、语音识别大模型、语音对话大模型、音乐生成大模型等语音大模型能力。今年6月,Soul还在社交行业中较早推出了自研端到端全双工语音通话大模型,具备超低交互延迟、快速自动打断、超真实声音表达和情绪感知理解能力等特点,能够直接理解丰富的声音世界,支持超拟人化的多风格语言,实现更接近生活日常的交互对话和“类真人”的情感陪伴体验。

多模态端到端大模型的推出标志着Soul对人机交互体验的创新突破,同时,从文字、语音到视觉的模态升级,也意味着交互方式的颠覆式改变。在未来,Soul将持续加大对AI技术的投入,致力于通过AI技术更好地帮助用户进行社交破冰,助力人设搭建和认知决策,提升社交沟通效率。

推广

特别声明:以上内容(如有图片或视频亦包括在内)均为站长传媒平台用户上传并发布,本平台仅提供信息存储服务,对本页面内容所引致的错误、不确或遗漏,概不负任何法律责任,相关信息仅供参考。站长之家将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。任何单位或个人认为本页面内容可能涉嫌侵犯其知识产权或存在不实内容时,可及时向站长之家提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明(点击查看反馈联系地址)。本网站在收到上述法律文件后,将会依法依规核实信息,沟通删除相关内容或断开相关链接。

  • 相关推荐
  • 寒武纪智能芯片赋能多模态大模型应用

    大模型快速发展推动人工智能技术迈向新阶段,从解决特定任务的弱人工智能向处理通用复杂任务的强人工智能演进。IDC报告显示,2024年中国大模型开发平台市场规模达16.9亿元,人工智能算力市场约190亿美元,预计2025年将达259亿美元。寒武纪等企业专注AI芯片研发,推出多款处理器及加速卡产品,支持大模型训练推理及多模态任务,并与产业链合作共同推进人工智能产业发展。

  • 问道未有穷期 星海即是归途 | 2025百度商业AI技术创新大赛圆满收官

    2025百度商业AI技术创新大赛圆满落幕,聚焦AI技术与商业实践深度融合。赛事吸引2500多支队伍参与,覆盖广告生成式序列化推荐、视频生成推理优化等三大赛道。高校团队表现亮眼,重庆邮电大学、西安电子科技大学等获一等奖。大赛推动产教融合,展现AI在商业应用的前沿突破,助力青年创新者实现技术思维转变,共同期待AI赋能个性化表达与创意平权未来。

  • 寒武纪:聚焦技术创新 持续深耕智能芯片领域

    寒武纪在投资者平台声明,网上传播的公司订单、收入预测、新产品、客户及供应链等信息均为不实,提醒投资者提高信息辨别能力,以官方披露为准。公司专注AI芯片研发,产品覆盖云服务器、边缘计算及终端设备芯片,2024年营收增长65.56%,2025年一季度同比增230.22%,连续两季度盈利。研发投入持续加大,优化芯片架构与软件生态,提升产品竞争力,未来将聚焦技术创新,推动芯片向大模型及垂直领域延伸。

  • Soul以AI重构社交体验,打造有温度的“Gen AI 社交游乐园”

    Soul 作为新型社交平台,自成立以来便积极探索AI技术在社交领域的应用落地,持续优化AI社交体验,致力于重塑数字时代的连接方式,为社交产品注入新的可能性,打造一个突破传统社交边界的“Gen AI社交游乐园”。前不久,在第二十二届ChinaJoy(中国国际数码互动娱乐展览会)上,Soul App以“Soul树洞情绪疗愈酒吧”为展台主题亮相,重磅推出原创IP“莫比乌斯·第三弹”ChinaJoy

  • Soul深耕AI社交,最新技术成果亮相WAIC 2025

    2025世界人工智能大会圆满落幕,Soul+App携自研端到端全双工语音通话大模型等创新成果亮相,展示AI重塑社交体验的潜力。该技术打破传统对话模式,支持多人语音互动,提升群聊参与度。Soul还展示多模态交互突破,包括实时视频生成能力,推动社交向“情感共生”进化。未来Soul将继续以“AI+社交”为核心,打造更智能、真实的社交体验,在AI社交赛道持续领跑。

  • DTCC2025丨达梦以智算多模与AI创新引领行业变革

    近日,IT168联合旗下ITPUB、ChinaUnix两大技术社区主办的第十六届中国数据库技术大会(DTCC2025)在京隆重召开。大会以“智能创新 数赢未来”为主题,汇聚超百位行业专家及上千名嘉宾,聚焦数据库领域前沿技术。达梦数据作为领军企业受邀参会,重点展示了其在多模数据处理与AI+数据库融合方面的突破,推出“智算多模”引擎,实现统一存储与智能查询,为行业智能化发展注入新动能。

  • AI日报:GPT-5正式发布;百度将推文心5.0大模型;知网发布AIKBase V2.0多模态数据管理系统

    《AI日报》精选AI领域最新动态:1)OpenAI发布GPT-5模型,具备强大多模态能力但推理任务仍有局限;2)知网推出AIKBase V2.0多模态数据管理系统;3)Ideogram新增"角色"功能实现图像风格统一;4)Cursor发布CLI版本支持终端AI编程;5)百度即将推出全新推理模型和文心5.0大模型;6)dots.ocr推出1.7B参数多语言文档解析工具;7)特斯拉解散Dojo超算团队转向英伟达合作;8)谷歌Pixel 10引入AI相�

  • AI日报:B站测试AI视频工具花生AI;腾讯发布多模态模型Large-Vision;昆仑万维开源Skywork UniPic 2.0

    【AI日报】主要内容: 1. B站测试"花生AI"视频工具,3分钟可成片,同时推进自研大模型和多语言翻译功能 2. 昆仑万维开源多模态模型Skywork UniPic 2.0,实现高效统一的多模态生成能力 3. 马斯克指责苹果偏袒OpenAI,苹果回应称平台设计公平公正 4. 腾讯混元发布52B参数多模态理解模型Large-Vision,支持任意分辨率输入 5. DeepSeek官方否认8月发布R2模型的传闻 6. OpenAI推出超值ChatGPT Go套餐,仅399卢比降低使用门槛 7. AI新贵Perplexity豪掷345亿美元收购谷歌Chrome 8. Anthropic的Claude Sonnet 4模型支持100万token上下文 9. ChatGPT重大更新:恢复GPT-4o默认模式,为GPT-5引入多模式选择,优化交互体验

  • 最新AI资讯哪里看?AI技术人员如何从论文到产业应用全覆盖?

    文章指出,ArXiv、ACL和NeurIPS等论文库是AI开发者获取前沿技术的重要来源,但仅依赖论文库已不足以构建完整竞争力。作者强调需要超越论文本身,关注技术落地、产业应用及生态动态。推荐利用AIbase等技术资讯平台作为补充,提供筛选整合、趋势解读和产业视角,帮助开发者高效把握技术动态,避免闭门造车,构建复合型信息摄入体系。

  • AI大模型费用计算器:新手如何不再为选择工具而头疼

    文章探讨了AI工具选择困境,推荐使用AIbase.cn导航站。该站通过分类筛选、标签过滤和对比功能,帮助用户快速找到合适工具,避免信息过载。强调技术应服务于人,好的工具应降低使用门槛,而非增加困惑。

今日大家都在搜的词:

热文

  • 3 天
  • 7天