首页 > 热点 > 关键词  > 科大讯飞最新资讯  > 正文

讯飞星火大模型V3.5升级 推出长文本、长图文、长语音大模型

2024-04-26 10:06 · 稿源:站长之家

站长之家(ChinaZ.com)4月26日 消息:科大讯飞今日发布重大更新,讯飞星火大模型V3.5升级,不仅推出了首个长文本、长图文、长语音大模型,还首次多情感超拟人合成技术引入市场,并同步推出了星火智能体平台。这一系列创新举措,旨在为招投标应用和合同应用提供更为强大的技术支持。

科大讯飞董事长刘庆峰在发布会上自豪地表示,星火大模型在通用长文本处理方面的能力已经达到了GPT-4Turbo在4月最新长文本版本的97%水平,这一成绩令人瞩目。更值得一提的是,在垂直领域知识问答任务上,星火大模型的整体表现甚至超越了GPT-4Turbo,展现了其卓越的性能和强大的应用潜力。

此外,星火app也受到了广大用户的热烈追捧。据最新数据显示,截至今日,星火app在安卓平台上的下载量已经高达9600万次,这一数字不仅证明了科大讯飞产品的受欢迎程度,也反映了市场对于智能语音技术的强烈需求。

讯飞星火、科大讯飞

据悉,讯飞星火大模型是科大讯飞推出的新一代认知智能大模型,具有跨领域的知识和语言理解能力。该大模型可以基于自然对话方式理解和执行任务,提供多种能力,包括语言理解、知识问答、逻辑推理、数学题解答和代码理解与编写等。其具备以下七大能力:

1. 多模理解:上传图片素材,大模型完成识别理解,返回关于图片的准确描述。

2. 视觉问答:围绕上传图片素材,响应用户的问题,大模型完成回答。

3. 多模生成:根据用户的描述,生成符合期望的合成音频和视频。

4. 虚拟人视频:描述期望的视频内容,整合 AI 虚拟人,快速生成匹配视频。

5. 大模型语音识别:支持主流语种全球领先,提高语音识别准确度,支持37种语种,实现自动语种判断和指定语种识别。

6. 大模型语音合成:提供超拟人语音合成能力,实现高准确率的语音合成。

7. 大模型代码:实现代码理解与生成能力,达到96% 的水平。

讯飞星火大模型还可以通过 API 接入,快速拥有跨领域的知识和强大的自然语言理解能力。同时,星火助手提供多种智能助手应用,如 PPT 大纲助手、商业文案生成、模拟面试助手等,让每一个场景都能找到开箱即用的大模型应用。此外,插件市场和原生应用也为开发者和用户提供更多功能和工具选择,共同构建讯飞星火大模型生态。

体验地址:https://top.aibase.com/tool/xunfeixinghuorenzhidamoxing

举报

  • 相关推荐
  • AI日报:阿里开源长文本深度思考模型QwenLong-L1;GPT-4o语音模式上线唱歌功能;秘塔AI搜索推出全新“极速”模型

    本文汇总了AI领域最新动态:1)中国信通院发布智能体开发标准,推动AI商业化进程;2)阿里推出QwenLong-L1-32B长文本推理模型,性能媲美Claude-3;3)GPT-4o语音模式升级,新增唱歌功能;4)秘塔AI搜索推出极速模型,响应速度达400tokens/秒;5)谷歌发布LMEval评估框架,统一大模型评测标准;6)Chrome浏览器集成Gemini AI助手;7)阿联酋全民免费使用ChatGPT Plus;8)苏州成立60亿元AI产业基金;9)法国Kyutai实验室推出10秒定制语音的Unmute系统;10)UAV-Flow项目实现无人机语音精准控制;11)Claude将升级支持百万字上下文和记忆功能;12)百度心响iOS版上线;13)夸克推出高考深度搜索功能;14)Chrome v137开发者工具升级;15)美团AI业务接近GPT-4o水平;16)Direct3D-S2实现3D生成速度提升10倍;17)OpenAI计划2026年推出首款AI硬件。

  • 音箱智商史诗升级 AI大模型渗透率已超20%

    目前上市的新品已经全面搭载AI大模型技术,例如小度大金刚Pro和小米智能音箱等搭载大模型技术的新品在4月上市,兼顾了声学、美学和语音技术的多方面升级。

  • 火山引擎推出豆包·语音播客模型文本秒变双人对话播客,5 秒生成热点音频!

    5月20日,火山引擎推出豆包·语音播客模型,实现文本秒转专业播客内容。该模型三大优势:1)自然流畅的双人对话效果,语音拟真度高;2)支持热点话题即时生成,5秒产出最新资讯播客;3)提供端到端创作链路,支持超长文本/网页链接转播客。相比传统AI播客,解决了内容重复、机械感强等问题。模型即将登陆豆包APP及PC端,6月11日将在火山引擎大会上展示更多功能。

  • 中文大模型忠实性幻觉评测:豆包大模型幻觉率仅4%,位居全球收之首

    SuperCLUE+最新评测显示,豆包大模型1.5Pro以仅4%的幻觉率和96%的准确率位居全球榜首,超越DeepSeek、Gemini-2.5-pro和GPT-4o等主流模型。该模型在文本摘要、多文本问答等关键任务中表现优异,尤其在中文理解任务上国内领先。基于MoE架构设计,其综合性能超过多款超大规模预训练模型,推理成本显著降低。截至2025年3月,豆包大模型日均调用量达12.7万亿tokens,是一年前的106倍。IDC报告指出火山引擎以46.4%市场份额领跑中国公有云大模型市场。据悉,6月11日将发布豆包大模型最新升级进展。

  • 从课堂到诊室,国计民生领域为何总有讯飞星火身影?

    2023 年,美国奥数队总教练罗博教授曾预言:“GPT对人类社会最为根本的改变,将发生在教育领域。”历经两年发展,以GPT为代表的的大模型,不仅极大程度改变乃至重塑了各行各业,更引发了官产学研各界对人工智能时代应该培养什么样人才的思考。

  • 一场文心大模型的「AI马拉松」

    对于百度而言,既要保持长期主义的战略定力,也要在技术路径上灵活应变,这种「变与不变」的平衡或许正是其在这轮科技革命中的制胜之道。 2025年,模型能力的重要性依然无需多言。 从预训练的角度来看,虽然连 OpenAI 前首席科学家 Ilya Sutskever 都说,预训练数据即将用尽,但海量的图像、视频等多模态数据资源依然有待挖掘。 从后训练的角度来看,强化学习新范式正�

  • 持续霸榜!可灵2.0模型登顶全球视频生成大模型榜单

    快手旗下可灵AI 2.0模型在权威AI评测中表现优异,以1124分超越自研1.6版本,连续三个月蝉联全球图生视频领域冠军。4月15日发布的2.0大师版在视频质量、语义理解和画面美学等核心指标持续领先行业。数据显示,自2023年6月上线以来,可灵AI全球用户突破2200万,月活激增25倍,累计生成视频1.68亿个、图片3.44亿张。商业化方面,其单月流水已超千万元,并与伊利、vivo等头部品牌达成深度合作,展现出AI视频生成技术的广阔商业前景。

  • 大模型时代:内容产业智变新浪潮

    腾讯研究院院长司晓在第15届中国(深圳)国际文化产业博览交易会上发表演讲,指出大模型技术正推动文化内容生产从"专业主导"转向"全民共创"。大模型已从工具赋能升级为生态重构,显著提升内容生产效率和质量,如腾讯混元模型支持实时图像生成与调整。AI技术加速影视、音乐等内容创作,如上海民族乐团与腾讯音乐合作的AI音乐会《零·壹 | 中国色》。同时,大模型在理解与交互能力上取得突破,如GPT-4o能准确识别物体细节。腾讯通过"探元计划"推动科技与文化融合,如"云游敦煌"等项目。未来,AI将实现"智力即服务",大幅提升创作效率和质量,推动文化内容产业进入"千人千面"新时代。

  • 李想:理想VLA司机大模型 就是从动物进化到人类

    预训练相当于人类学习物理世界和交通领域的常识,通过大量高清2D和3D Vision(视觉)数据、交通相关的Language(语言)语料,以及与物理世界相关的VL(Vision-Language,视觉和语言)联合数据,训练出云端的VL基座模型,并通过蒸馏转化为在车端高效运行的端侧模型。

  • 东风汽车奕派007接入豆包大模型

    东风汽车旗下电动品牌奕派推出2025款奕派007,全面接入豆包大模型,实现三大智能化创新:1)毫秒级响应的全场景语音交互,支持10个高频指令同时处理;2)"情绪管家"模式可主动提供娱乐内容调节驾乘情绪;3)结合AIGC技术实现旅途画面一键艺术化创作分享。该车型通过智能决策能力和个性化服务重构人车关系,定位为Z世代"AI搭子"。未来将与火山引擎合作探索更多智能出行场景,构建差异化竞争力。