首页 > 热点 > 关键词  > 科大讯飞最新资讯  > 正文

讯飞星火大模型V3.5升级 推出长文本、长图文、长语音大模型

2024-04-26 10:06 · 稿源:站长之家

站长之家(ChinaZ.com)4月26日 消息:科大讯飞今日发布重大更新,讯飞星火大模型V3.5升级,不仅推出了首个长文本、长图文、长语音大模型,还首次多情感超拟人合成技术引入市场,并同步推出了星火智能体平台。这一系列创新举措,旨在为招投标应用和合同应用提供更为强大的技术支持。

科大讯飞董事长刘庆峰在发布会上自豪地表示,星火大模型在通用长文本处理方面的能力已经达到了GPT-4Turbo在4月最新长文本版本的97%水平,这一成绩令人瞩目。更值得一提的是,在垂直领域知识问答任务上,星火大模型的整体表现甚至超越了GPT-4Turbo,展现了其卓越的性能和强大的应用潜力。

此外,星火app也受到了广大用户的热烈追捧。据最新数据显示,截至今日,星火app在安卓平台上的下载量已经高达9600万次,这一数字不仅证明了科大讯飞产品的受欢迎程度,也反映了市场对于智能语音技术的强烈需求。

讯飞星火、科大讯飞

据悉,讯飞星火大模型是科大讯飞推出的新一代认知智能大模型,具有跨领域的知识和语言理解能力。该大模型可以基于自然对话方式理解和执行任务,提供多种能力,包括语言理解、知识问答、逻辑推理、数学题解答和代码理解与编写等。其具备以下七大能力:

1. 多模理解:上传图片素材,大模型完成识别理解,返回关于图片的准确描述。

2. 视觉问答:围绕上传图片素材,响应用户的问题,大模型完成回答。

3. 多模生成:根据用户的描述,生成符合期望的合成音频和视频。

4. 虚拟人视频:描述期望的视频内容,整合 AI 虚拟人,快速生成匹配视频。

5. 大模型语音识别:支持主流语种全球领先,提高语音识别准确度,支持37种语种,实现自动语种判断和指定语种识别。

6. 大模型语音合成:提供超拟人语音合成能力,实现高准确率的语音合成。

7. 大模型代码:实现代码理解与生成能力,达到96% 的水平。

讯飞星火大模型还可以通过 API 接入,快速拥有跨领域的知识和强大的自然语言理解能力。同时,星火助手提供多种智能助手应用,如 PPT 大纲助手、商业文案生成、模拟面试助手等,让每一个场景都能找到开箱即用的大模型应用。此外,插件市场和原生应用也为开发者和用户提供更多功能和工具选择,共同构建讯飞星火大模型生态。

体验地址:https://top.aibase.com/tool/xunfeixinghuorenzhidamoxing

举报

  • 相关推荐
  • 豆包语音合成模型 2.0 重磅升级,语义理解 + 情感演绎双突破

    10月16日,火山引擎升级豆包语音合成模型2.0与声音复刻模型2.0。新模型基于大语言模型架构,具备深度语义理解能力,实现从文本朗读到情感表达的进化。对话式合成支持多轮交互,声音复刻仅需5秒即可还原音色。针对教育场景优化,复杂公式符号朗读准确率达90%,覆盖数学、化学等全学科。目前模型已在火山引擎语音平台上线,为OPPO、Keep等客户提供多场景语音服务。

  • 从“职场效率工具”到“校园成长伙伴”!讯飞星火的“年轻化”破圈

    9月19日,讯飞星火在华东政法大学举办“闯关乐园”校园活动,通过AI简历修改、模拟面试等互动环节,吸引大学生体验产品。这标志着讯飞星火启动品牌年轻化战略,将目标用户从职场人士扩展至高校学生群体。当前AI工具赛道竞争激烈,开拓年轻用户成为差异化突围关键。品牌选择呼兰与小鱼作为代言人,以“智慧+趣味”形象组合强化认知,并通过全国校园巡回活动深化场景化实践,精准切入学生求职痛点,构建情感连接,旨在提前培养用户习惯,抢占未来市场先机。

  • 保时捷女销冠被合成AI不雅视频:称被造黄谣已报案

    近日,连续两年蝉联青岛保时捷中心销售冠军的女销售牟倩文,因遭遇AI伪造视频恶意诽谤事件引发广泛关注。这位在2023年、2024年累计售出170台保时捷的销冠,通过个人社交账号发布声明称,近期发现大量利用AI技术合成的虚假视频在网络传播,这些视频内容纯属伪造,已对其个人名誉及正常生活造成严重影响。 据牟女士介绍,不法分子不仅通过AI技术制作与其面部特征相似�

  • 保时捷女销冠称被合成AI不雅视频 本人:坚决追究涉案人员的法律责任

    近日青岛保时捷销售中心的工作人员牟女士称,近期发现由AI恶意合成的虚假视频和不良视频,对其进行诽谤和侮辱,她已报案。当事人表示,她坚决追究所有涉案人员的民事及刑事责任。 牟女士在接受采访时表示,她之前曾经历过被人造黄谣,但这次不太一样,造谣视频在不断发酵,可能有900多万浏览量,还有人给我打电话,说一些不合适的话。 公开报道显示,牟女士今�

  • AI日报:阿里发布紧凑型Qwen3-VL模型;科大讯飞AI翻译耳机全球首发;Gemini代码惊现Veo3.1

    阿里巴巴发布紧凑型Qwen3-VL多模态模型,推动边缘设备AI应用;科大讯飞推出全球首款AI翻译耳机,支持60种语言实时翻译;谷歌NotebookLM集成图像生成功能,可将笔记转为动态视频;ChatGPT将于12月向成人开放限制内容并推出自定义交互功能;谷歌Gemini代码泄露Veo3.1视频模型升级迹象;马斯克宣布X平台将全面转向AI推荐系统;巨人网络与清华联合开源多方言语音合成框架DiaMoE-TTS;vivo公布X200系列影像升级计划;字节跳动开源文本驱动高保真人脸生成模型FaceCLIP。

  • 青岛保时捷女销冠被人用AI合成不雅视频 涉事男子被行拘 手写悔过书

    日前,青岛保时捷中心销售冠军牟倩文发文称,近期发现有人利用AI技术恶意合成虚假、不良视频,这些视频是百分之百伪造的”,并表示对造谣者宣战”。 今日,牟倩文在社交平台再发文,晒出青岛市公安局李沧分局行政处罚决定书。 行政处罚决定书显示,一男子在群内转发牟某文照片图文并搭配不雅视频,对其侮辱,后被查获。

  • 墨刀AI Agent:更懂产品经理的超级智能体上线

    2025年AI将进入"智能体时代",从被动工具升级为能理解意图、辅助决策的伙伴。墨刀AI+Agent专为产品经理打造,具备三层核心能力:懂逻辑(理解需求生成原型)、懂场景(熟悉全流程工作)、懂协作(跨角色沟通优化)。它能贯穿调研、原型、文档、评审等环节,解放重复劳动,让产品经理专注高价值决策,实现从效率提升到决策升级的人机协作新模式。

  • 寒武纪深耕智能芯片技术与软件生态 助力大模型应用落地

    良好的软件环境能降低AI应用开发门槛,增强用户粘性,对AI芯片发展至关重要。寒武纪专注AI芯片研发,掌握处理器架构、SoC设计等硬件技术及编程框架、编译器、驱动等软件技术。通过芯片、硬件板卡、基础软件三大团队协同,为产品提供全链条技术支持,并构建开发者生态。未来将通过开放生态推动云计算、金融、医疗等行业的智能化升级,以市场为导向保持技术领先。

  • 数据智能体 TabTabAI 正式上线,零门槛上手,让 “数据分析” 人人可用

    AI数据智能体TabTabAI正式上线,以“零门槛交互+全流程自主处理”为核心优势,打破数据分析技术壁垒。该工具通过自然语言对话,支持多源数据采集、智能处理、深度洞察与可视化,让普通职场人无需编程背景即可完成复杂分析任务。其多智能体协同架构与自动化能力,覆盖从数据收集到决策建议的全链路,助力用户将原始数据高效转化为精准决策依据,真正实现“人人都是数据分析师”。

  • 告别税务焦虑:领星ERP以业财一体化,引领跨境合规新篇章

    跨境电商面临复杂税务合规挑战,全球税务规则收紧使合规成为生存关键。传统手工记账方式易导致数据错误、申报失误,引发巨额罚款和法律风险。领星ERP提供智能化解决方案:内置税务引擎自动计算多国税费,业财一体化构建完整数据链,确保每笔交易可追溯。系统已服务超70万跨境企业,帮助降低合规风险、优化业务流程,实现安全高效的全球化扩张。

今日大家都在搜的词: