首页 > 传媒 > 关键词  > 科大讯飞最新资讯  > 正文

星火大模型V3.5上新:全面提升AI处理长文本、长图文及长语音能力

2024-05-24 11:27 · 稿源: 站长之家用户

4月26日,科大讯飞发布了最 新版本的星火大模型V3.5,旨在解决用户在获取知识时面临的效率与准确性问题。这款前沿模型融合了长文本、长图文及长语音处理能力,针对招投标和合同管理等场景进行了深度优化,显著提升了AI在复杂信息处理上的能力。特别值得一提的是,其首创的多情感超拟人合成技术,为交互式AI带来了更丰富的表情和声音,增强了用户体验的真实感。同时,星火智能体平台的推出,为企业提供了便捷的AI解决方案,有效促进了人工智能技术的实际应用,加速了行业的智能化进程。

会上,科大讯飞董事长刘庆峰介绍,星火大模型通用长文本能力达到GPT-4Turbo在4月最 新长文本版本97%的水平,在垂直领域知识问答任务上总体水平超过GPT-4Turbo。值得注意的是,科大讯飞通过不断进步的技术,致力于解决用户的真实需求,其推出的讯飞星火App在安卓端下载量已超过9600万次,在同类App中排名首位。

为了满足用户在工作中有效获取知识的需求,科大讯飞针对长文本、长图文、长语音的处理能力进行了深入研究。考虑到用户在日常工作和生活中接触到的信息形式多种多样,如文本、图片、语音等,科大讯飞开发了支持这些多源信息处理的大模型。

全新升级的讯飞星火长文本功能已具备与GPT-4Turbo相近的能力,在信息抽取、知识问答、归纳总结、文本生成等方面表现优异,且在多个专业领域知识问答上超越了GPT-4Turbo。这一创新满足了用户在真实场景中多源信息的获取需求,进一步提升了用户体验和工作效率。

长文本功能的落地需要解决信息有效处理的问题:面对上百万甚至上千万文字,长文本大模型消耗的运算资源非常大。为了解决大模型应用效率和准确率问题,刘庆峰谈到,基于讯飞星火V3.5对长文本的理解、学习、回答能力,科大讯飞进行了重要的模型剪枝和蒸馏,从而推出业界性能领先的130亿参数的大模型,在效果损失仅3%以内的情况下,使得星火在文档上传、解析处理、知识问答的首响时间以及文字生成方面都获得了极大的效率提升。测试显示,在保障长文本效果的情况下,无论是10K、64K、128K token,还是更长的文本,星火大模型的性能都做到业界领先。

目前,讯飞星火大模型V3.5的星火图文识别大模型相比传统模型有三大优势:处理复杂版面、融合上下文识别和专业领域符号识别,覆盖31个场景,效果领先业界。科大讯飞还推出了长语音功能,满足音视频信息有效获取需求。在万物互联时代,科大讯飞通过超拟人对话功能提升了AI语音交互的真实度,受到用户欢迎。此外,科大讯飞还推出“一句话声音复刻”功能,让AI助手声音更个性化、有温度。星火智能体平台实现了新智能体的快速创建与多智能体协作,解决了大模型应用企业落地的“最后一公里”问题。

据刘庆峰透露,科大讯飞将在6月27日发布讯飞星火大模型V4.0,进一步解放生产力、释放想象力。

科大讯飞的新版星火大模型V3.5以其卓越的长文本处理能力、有效的图文识别能力和个性化的语音交互技术,正重塑人工智能应用的新格局。其在行业内取得的显著成就,不仅体现在用户下载量的领先,更在于其技术的实用性和前瞻性。随着V4.0版本的预告,可以预见科大讯飞将持续推动AI技术的边界,为用户提供更全面的知识获取解决方案,开启智能化新篇章,引领行业发展至新的高度。

推广

特别声明:以上内容(如有图片或视频亦包括在内)均为站长传媒平台用户上传并发布,本平台仅提供信息存储服务,对本页面内容所引致的错误、不确或遗漏,概不负任何法律责任,相关信息仅供参考。站长之家将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。任何单位或个人认为本页面内容可能涉嫌侵犯其知识产权或存在不实内容时,可及时向站长之家提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明(点击查看反馈联系地址)。本网站在收到上述法律文件后,将会依法依规核实信息,沟通删除相关内容或断开相关链接。

  • 相关推荐
  • AI日报:阿里开源长文本深度思考模型QwenLong-L1;GPT-4o语音模式上线唱歌功能;秘塔AI搜索推出新“极速”模型

    本文汇总了AI领域最新动态:1)中国信通院发布智能体开发标准,推动AI商业化进程;2)阿里推出QwenLong-L1-32B长文本推理模型,性能媲美Claude-3;3)GPT-4o语音模式升级,新增唱歌功能;4)秘塔AI搜索推出极速模型,响应速度达400tokens/秒;5)谷歌发布LMEval评估框架,统一大模型评测标准;6)Chrome浏览器集成Gemini AI助手;7)阿联酋全民免费使用ChatGPT Plus;8)苏州成立60亿元AI产业基金;9)法国Kyutai实验室推出10秒定制语音的Unmute系统;10)UAV-Flow项目实现无人机语音精准控制;11)Claude将升级支持百万字上下文和记忆功能;12)百度心响iOS版上线;13)夸克推出高考深度搜索功能;14)Chrome v137开发者工具升级;15)美团AI业务接近GPT-4o水平;16)Direct3D-S2实现3D生成速度提升10倍;17)OpenAI计划2026年推出首款AI硬件。

  • 火山引擎推出豆包·语音播客模型文本秒变双人对话播客,5 秒生成热点音频!

    5月20日,火山引擎推出豆包·语音播客模型,实现文本秒转专业播客内容。该模型三大优势:1)自然流畅的双人对话效果,语音拟真度高;2)支持热点话题即时生成,5秒产出最新资讯播客;3)提供端到端创作链路,支持超长文本/网页链接转播客。相比传统AI播客,解决了内容重复、机械感强等问题。模型即将登陆豆包APP及PC端,6月11日将在火山引擎大会上展示更多功能。

  • AI日报:谷歌推最强AI全家桶Google AI Ultra;腾讯混元宣布模型矩阵全面升级;豆包·语音播客模型发布

    本文汇总了近期AI领域的重要动态:1)谷歌推出249.99美元/月的AI Ultra订阅计划,提供最强AI模型和高级功能;2)腾讯混元模型升级,新增视觉推理T1-Vision和语音对话模型;3)美图获阿里2.5亿美元投资,将在电商和AI领域合作;4)豆包推出语音播客模型,实现文本快速转音频;5)百度文心X1 Turbo获信通院最高评级;6)谷歌发布Flow AI剪辑工具,集成Veo3等三大模型;7)谷歌Veo3支持4K视频生成;8)Imagen4图像模型发布;9)Gemini2.5 Pro新增并行推理功能;10)谷歌推出虚拟试衣工具;11)公测AI编程助手Jules;12)苹果计划在iOS19开放AI模型;13)京东云推五大免费AI营销工具;14)字节开源多模态模型BAGEL;15)英伟达发布物理推理模型Cosmos-Reason1。

  • 一场文心大模型的「AI马拉松」

    对于百度而言,既要保持长期主义的战略定力,也要在技术路径上灵活应变,这种「变与不变」的平衡或许正是其在这轮科技革命中的制胜之道。 2025年,模型能力的重要性依然无需多言。 从预训练的角度来看,虽然连 OpenAI 前首席科学家 Ilya Sutskever 都说,预训练数据即将用尽,但海量的图像、视频等多模态数据资源依然有待挖掘。 从后训练的角度来看,强化学习新范式正�

  • 秀秀桌面版AI能力接入鸿蒙电脑,开启高效适配新范式

    5月8日,华为在深圳召开鸿蒙电脑技术与生态沟通会,首次展示鸿蒙操作系统在电脑端的应用。美图秀秀桌面版成为首批深度适配鸿蒙电脑的影像处理软件,仅用一个月完成核心功能开发,功能覆盖度达Windows平台的98%,带来更流畅的交互体验。美图展示了四大AI修图功能在鸿蒙电脑端的适配成果:AI消除、智能抠图、AI变清晰、无痕改字,修图效率与表现力双提升。鸿蒙电脑从内核层自主研发,助力软件深度优化。未来双方将围绕鸿蒙的智能图片处理能力展开联合创新,从"兼容适配"转向"联合共创",共同拓展软件创新边界,推动鸿蒙应用规模化落地。

  • 超越OpenAI、拿下球双料第一,“AI吴彦祖”背后大模型SOTA了!

    超越OpenAI! 国产大模型突袭,AI语音生成天花板被重新定义了。 MiniMax最新发布Speech-02,同时拿下Artificial Analysis Speech Arena和Hugging Face TTS Arena两项全球权威语音基准测评第一!

  • 球首个女性肿瘤AI大模型 “木兰”正式进入临床应用

    快科技5月14日消息,华中科技大学宣布,全球首个女性肿瘤AI大模型木兰”,正式进入临床应用阶段。目前,公众可通过华中科技大学同济医院”公众号或掌上同济”APP,在互联网医院下的同济木兰AI咨询”栏目中获得免费服务。未来,该模型还将通过更多手机端线上平台、电脑端应用以及各级医疗机构等多种渠道,向公众开放。据介绍,木兰”由华中科技大学同济医学院附属同济医院主导研发,该模型以国内外权威的女性肿瘤医疗指南和高质量专家共识为基础,融合了同济医院近20年来的高质量病例数据。还整合了中国工程院院士、同济医院妇产科学系主任

  • 音箱智商史诗升级 AI大模型渗透率已超20%

    目前上市的新品已经全面搭载AI大模型技术,例如小度大金刚Pro和小米智能音箱等搭载大模型技术的新品在4月上市,兼顾了声学、美学和语音技术的多方面升级。

  • AI日报:阿里通义千问Qwen3问鼎全球开源模型;Kimi思考模型API发布;OpenAI发布新一代GPT-4.1模型

    【AI日报】汇总了近期AI领域重要动态:1)阿里通义千问3开源模型上线7天即登顶全球开源模型榜首,在指令遵循和推理能力上超越闭源模型;2)月之暗面推出Kimi长思考模型API,可解决复杂代码和数学问题;3)OpenAI发布GPT-4.1模型,性能提升显著;4)Google推出Gemini2.5Pro模型,提升开发者编码能力;5)联想发布"天禧超级智能体",具备多模态感知能力;6)腾讯元宝上线"对话分

  • 中文大模型忠实性幻觉评测:豆包大模型幻觉率仅4%,位居球收之首

    SuperCLUE+最新评测显示,豆包大模型1.5Pro以仅4%的幻觉率和96%的准确率位居全球榜首,超越DeepSeek、Gemini-2.5-pro和GPT-4o等主流模型。该模型在文本摘要、多文本问答等关键任务中表现优异,尤其在中文理解任务上国内领先。基于MoE架构设计,其综合性能超过多款超大规模预训练模型,推理成本显著降低。截至2025年3月,豆包大模型日均调用量达12.7万亿tokens,是一年前的106倍。IDC报告指出火山引擎以46.4%市场份额领跑中国公有云大模型市场。据悉,6月11日将发布豆包大模型最新升级进展。