首页 > 传媒 > 关键词  > 人工智能最新资讯  > 正文

声网发布Linux Server SDK 支持大模型Python与Go语言

2024-07-29 10:56 · 稿源: 站长之家用户

AIGC 和 大语言模型 LLM 的快速发展正推动人工智能领域的进步和创新,LLM 作为 AIGC 的核心模块,其发展尤为引人注目。随着技术的不断进步,大语言模型的能力也不断进化,一方面,训练数据量与算力的提升,AI 的生成内容更准确、更智能;另一方面,大模型的交互方式,也从文本升级为音频、视频的多模态,可以支持人与AI的语音对话等。

在多模态大模型的趋势下,RTC 成为了人与 AI 交互中的重要一环,越来越多的企业与开发者纷纷探索在大语言模型或者 AI 应用场景中快速集成有效的音视频能力,构建 AI陪聊、AI口语老师等一系列场景。

对此,声网推出 Linux Server SDK,支持当下大模型编程最主流的两类语言 Python 与 Go ,企业可基于声网 Linux SDK ,快速接入大模型,上线具备 RTC 传输能力的 AI 应用场景,如 AI 语音助手、AI 口语老师、虚拟恋人、多人语音游戏等。

声网 Linux Server SDK 以 API 的形式提供了一系列的功能,例如 Linux Server SDK for Go 可支持连接管理、信令发送、音频订阅与推送、事件回调通知等,其中信令传输能力不仅可应用于创建 DataStream 数据流,并发送信令,也能应用在大模型中发送数据流消息,例如将 TTS、STT 和 LLM 的结果发送给客户端。

此外,Linux Server SDK 还提供了使用时序的教程,从建立连接、订阅远端用户的音频、获取远端用户的音频数据、推送音频数据、发送文字信令、断开连接等不同流程的详细描述,帮助开发者快速上手。

声网 Linux Server SDK 客户集成实践图

凭借在 RTC 行业日积月累的深耕细作,声网 Linux Server SDK 在 RTC 的低延时、抗弱网、跨国传输、并发等方面具备优秀的性能。

·        低延时与全球部署:声网自研的 SD-RTN™ 实时传输网络覆盖了全球200多个国家与地区,音视频的全球端到端延迟平均达到200ms。声网还通过优化网络传输协议和算法,进一步降低音视频传输的延迟。

·        智能路由与抗弱网:针对网络环境的波动,声网的智能路由技术能够根据用户的网络状况自动选择特出的网络路径,确保通话的稳定性和流畅性。声网的抗弱网传输与抗丢包算法,结合网络探测、抗丢包技术、自适应jitter buffer、网络拥塞控制策略等,为用户在各种网络环境下提供流畅的互动体验。

·        30000+终端机型适配:由于不同的设备可能对于语音处理效果产生影响,声网的 RTC SDK 支持30000+终端机型适配,中低端机型覆盖广,帮助大模型与客户解决了多设备兼容性的后顾之忧。

·        并发性能:客户集成声网 Linux Server SDK 后可支持上百路的音视频并发。

·        支持多频道多路流:声网 SDK 支持用户同时加入多个频道,同一时间可以在多个频道中接收和发布音视频流。

目前声网 Linux Server SDK 为 Alpha 版,如您想进一步了解或接入,可在声网微信公众号找到这篇文章,扫描文章底部的二维码咨询。

推广

特别声明:以上内容(如有图片或视频亦包括在内)均为站长传媒平台用户上传并发布,本平台仅提供信息存储服务,对本页面内容所引致的错误、不确或遗漏,概不负任何法律责任,相关信息仅供参考。站长之家将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。任何单位或个人认为本页面内容可能涉嫌侵犯其知识产权或存在不实内容时,可及时向站长之家提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明(点击查看反馈联系地址)。本网站在收到上述法律文件后,将会依法依规核实信息,沟通删除相关内容或断开相关链接。

  • 相关推荐
  • 首届央国企数智化与转型战略成果发布会在京召开,TencentOS Server展示应用成果

    6月26日,首届央国企数智化转型战略成果发布会在京举行,发布《央国企数智化发展研究报告》等重要成果。腾讯云受邀参会,其自研操作系统TencentOS Server凭借"西游四件套"等创新技术方案获得关注。该系统已实现超1000万套部署,支撑金融、政务等行业国产化需求,具备三大优势:1)性能提升方面,CPU利用率提升15-45%,整机能耗降低5-10%;2)技术创新方面,独创qGPU虚拟化技术可降低60%硬件成本;3)生态适配方面,已完成与国产主流硬件的互认证。目前该系统已助力农业银行等金融机构实现5%-25%性能提升,并成为金融、党政领域首选方案。作为国内三家具备Linux研发能力的厂商之一,腾讯云将持续打磨技术,支撑企业数字化转型需求。

  • MCP server资源网站去哪找?国内MCP服务合集平台有哪些?

    在人工智能飞速发展的今天,AI模型与外部世界的交互变得愈发重要。一个好的工具不仅能提升开发效率,还能激发更多的创意。今天,我要给大家介绍一个宝藏平台——AIbase(<https://mcp.aibase.cn/>),一个专注于MCP(Model Context Protocol)服务的全球集合平台,它正在悄然改变AI应用开发的格局。 平台精心挑选了全球最受欢迎的MCP服务进行推荐。这些服务经过了市场的检验,具�

  • MCP协议资源服务去哪找?国内MCP server资源网站推荐

    ​在人工智能技术飞速发展的今天,AI模型与外部工具和服务的交互需求日益增长。为了满足这一需求,一个名为 AIbase 的全球MCP服务器集合平台(https://mcp.aibase.cn/)应运而生,为开发者和企业提供了前所未有的便利和强大的功能支持。

  • AI日报:阿里通义推Qwen-TTS模型;Cursor已支持网页和手机端;字节发布图像合成技术XVerse

    【AI日报】今日AI领域7大突破:1)阿里通义Qwen-TTS实现方言语音合成重大突破;2)Cursor发布Web版AI编程工具;3)字节XVerse技术实现多对象精准图像生成;4)NoteGen跨平台AI笔记工具革新知识管理;5)ManimML动画库可视化Transformer架构;6)TEN+Agent开源语音交互技术降低延迟;7)Chai-2抗体设计模型将药物研发周期缩短至两周。淘宝同时上线RecGPT推荐模型提升购物体验。

  • AI日报:智谱上线PPT生成功能AI Slides;可灵 AI 发布可图2.1模型

    本文介绍了AI日报栏目及近期AI领域多项突破性进展:1)智谱推出免费AI Slides工具,基于GLM模型快速生成高质量PPT;2)可灵AI发布可图2.1模型,支持180多种风格图像生成;3)NVIDIA推出DiffusionRenderer技术,实现视频到可编辑3D场景转换;4)墨刀AI新增30秒生成高保真原型功能;5)Higgsfield推出Soul ID工具,10张照片即可生成虚拟形象;6)谷歌DeepMind开源GenAI Processors工具库;7)谷歌Veo新增图像转视频功能;8)Mistral AI发布专为代码建模的Devstral2507系列模型。这些创新展示了AI在内容生成、3D建模、产品设计等领域的快速发展。

  • 华为8.8英寸小平板本季度发布!支持蜂窝网络

    据博主定焦数码透露,华为小尺寸平板预计将在Q3末月发布,也就是9月份。 新机拥有8.8英寸黄金小尺寸,采用16:9比例,预计支持蜂窝网络。

  • Nothing Phone 3发布:最具个性的骁龙8系手机 5700元起

    Nothing正式发布新一代旗舰Nothing Phone 3,起售价是799美元(12GB 256GB,约合人民币5700元)。 作为新一代旗舰,Nothing Phone 3最大的变化是外观设计,正面是一块6.67英寸AMOLED屏幕,分辨率为FHD ,刷新率为120Hz,峰值亮度为4500尼特,支持2160Hz高频PWM调光,前置5000万像素摄像头。 背部右上角嵌入了一块副屏,官方称之为Glyph Matrix”,这是一块单色LED屏幕,由由489颗独立发光的LED灯组�

  • AI日报:腾讯混元推3D生成大模型Hunyuan3D-PolyGen;钉钉AI表格重磅来袭;阿里推多模态大语言模型HumanOmniV2

    本文介绍了AI领域多项重要进展:1)腾讯推出首个美术3D生成大模型Hunyuan3D-PolyGen,显著提升建模效率;2)阿里发布多模态大模型HumanOmniV2,准确率达69.33%;3)钉钉AI表格实现1小时处理千项任务;4)百度PaddleOCR3.1版本在多语种识别和文档翻译方面升级;5)微软推出Deep Research智能体,自动化研究流程;6)香港理工与OPPO联合开源视频超清框架DLoRAL;7)谷歌开源MCP工具箱简化AI与数据库集成;8)Win11将推出AI动态壁纸功能。这些创新展示了AI在3D生成、多模态理解、办公效率、视觉处理等领域的突破性进展。

  • A日报:月之暗面开源大模型Kimi K2;智源全面开源RoboBrain2.0;通义千问发布Qwen Chat桌面客户端

    本期AI日报重点报道了多项AI领域突破性进展:1.月之暗面推出万亿参数开源大模型Kimi K2,展现强大智能能力;2.智源研究院开源RoboBrain2.0和RoboOS2.0机器人系统;3.通义千问发布桌面客户端Qwen Chat;4.IndexTTS2实现影视级语音合成;5.HuggingFace开源机器人Reachy Mini热销;6.Meta推出实时视频生成模型StreamDiT;7.PixVerse新增多关键帧视频生成功能;8.特斯拉推出仅支持AMD处理器的Grok AI助手;9.OpenAI推迟开源大模型发布以加强安全测试;10.Liquid AI开源边缘AI模型LFM2;11.AI"时间穿越"特效在社交媒体走红。

  • 国内有哪些ai大模型?一文看懂中国核心AI大模型全景

    近两年中国AI大模型发展迅猛,已形成"通用+行业"双轨并进的生态格局。百度文心一言、阿里通义千问等通用大模型在中文理解、多模态生成等方面表现突出;深度求索DeepSeek以1/10参数实现GPT-4级推理能力;月之暗面Kimi以20万汉字上下文窗口领跑长文本处理;智谱AI的GLM-4成为首个支持视频对话的国产千亿模型。医疗、金融等垂直领域涌现出百川智能等专业模型,覆盖超1000家医院。开源生态加速国产芯片适配,15家厂商完成深度优化。行业应用方面,工程文档效率提升60%,24小时拟人化客服等案例凸显价值。未来趋势呈现模型蒸馏、端侧部署和开源生态三大方向,中国AI正从实验室走向产业变革前沿。