首页 > 传媒 > 关键词  > 科大讯飞最新资讯  > 正文

用科大讯飞语音技术创业:他的梦想是让2000万听障者张口说话

2018-10-29 09:27 · 稿源: 站长之家用户

2018 年 10 月 24 日,距离人工智能领域标志性事件—— 2016 年 3 月Alphago战胜李世石,已经过去了 30 个月。今年的科大讯飞全球 1024 开发节,一场属于开发者们的盛典,刚刚落下帷幕。 过去 30 个月间的每一天,开发者们用键盘日夜兼程,与时间赛跑。 根据科大讯飞提供的数据,

......

111本文由站长之家用户投稿发布于站长之家平台,本平台仅提供信息索引服务。为了保证文章信息的及时性,内容观点的准确性,平台将不提供完全的内容展现,本页面内容仅为平台搜索索引使用。需阅读完整内容的用户,请查看原文,获取内容详情。

推广

特别声明:以上内容(如有图片或视频亦包括在内)均为站长传媒平台用户上传并发布,本平台仅提供信息存储服务,对本页面内容所引致的错误、不确或遗漏,概不负任何法律责任,相关信息仅供参考。站长之家将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。任何单位或个人认为本页面内容可能涉嫌侵犯其知识产权或存在不实内容时,可及时向站长之家提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明(点击查看反馈联系地址)。本网站在收到上述法律文件后,将会依法依规核实信息,沟通删除相关内容或断开相关链接。

  • 相关推荐
  • 共创欧美本土品牌破局之路:科大讯飞×出海启明星品牌游学圆满收官

    8月15日,由讯飞AI营销联合出海启明星、万里汇WorldFirst主办的"走进科大讯飞"品牌游学活动在深圳圆满收官。活动聚焦"共创欧美本土品牌营销的破局之路"主题,40余家出海头部品牌负责人通过深度洞察、实战分享与圈层交流,探讨中国品牌全球化进程中的核心痛点。讯飞AI营销展示了其AI驱动的程序化广告平台GrowOne、红人营销平台iFLYTalent等解决方案,已服务1800+客户,覆盖20亿用户和100个国家。活动通过行业大咖实战经验分享,为出海企业提供了从产品营销到品牌落地的全链路策略,助力中国品牌突破全球化壁垒,实现从本土品牌到"全球爆款"的跨越。

  • OpenAI和科大讯飞,瞄准了同一件事

    OpenAI正式发布GPT-5大模型,距离GPT-4推出已29个月。GPT-5虽仍是当前最全面的模型,但性能提升未与主流模型拉开显著差距,部分场景甚至被Grok4和Claude+Opus4.1超越。OpenAI强调此次升级重点在于减少幻觉、提升指令遵循能力和降低模型谄媚性,而非单纯追求性能突破。与此同时,国产大模型代表星火X1也在7月25日升级,同样聚焦解决幻觉问题,在事实性幻觉和忠诚性幻觉治理上取得突破。全球顶尖大模型正从"能用"向"好用"转变,OpenAI和科大讯飞都通过多目标奖励机制和思维链监控等技术手段改善模型可靠性。星火X1已全面赋能教育、医疗、企业应用等行业,在复杂场景任务上满足用户核心需求。大模型产业已进入规模化落地关键期,中国人工智能产业正从追赶走向领先阶段。

  • 从多语破壁到生态共建 科大讯飞如何以全栈自主可控大模型赋能中国AI出海?

    2025世界人工智能大会(WAIC)上,科大讯飞展区成为焦点,展示20余款AI产品,呈现技术创新与产业赋能成果。其星火语音大模型支持37种主流语言,效果超越OpenAI Whisper v3,并覆盖130+语种和8万专业词汇。讯飞还举办多语言国际研讨会,汇聚20国30位专家,构建亚欧学术交流平台。作为中国AI领军企业,讯飞坚持自主可控技术路线,打造开放共赢生态,已在新加坡等地建立站点,拥有52.4万海外开发者。从大阪世博会到WAIC,讯飞正推动中国AI技术走向全球舞台中央,展现中国智慧。

  • 大模型技术赋能声音创作:逗哥配音引领AI语音合成新浪潮‌

    逗哥配音作为国内领先的AI配音平台,凭借自主研发的语音合成大模型技术,已服务超千万创作者,累计生成音频量突破270亿次。其核心技术突破包括:1)支持40种语言,语音质量MOS分提升0.25,拟人度超83%;2)首创"AI分角功能",将多角色配音效率提升90%以上;3)建成覆盖近千款发音人的全球声库,包含方言、外语及影视角色音;4)创新"真人声纹+AI增强"模式,

  • 昇腾助力中科大团队实现MoE 稀疏大模型并行推理提速超30%

    中国科学技术大学张燕咏团队在昇腾算力支持下,成功研发出基于专家选择分布预测的专家负载均衡和all2all通信均衡框架。该框架通过“三步走”策略,有效解决了MoE稀疏大模型推理中的专家负载不均和通信开销大两大难题,显著提升推理性能。实验显示,该方案在多项指标上较主流方案提升超30%,为昇腾技术优化MoE模型推理提供了宝贵借鉴,将加速其在各领域的落地应用。

  • 重磅!标贝科技推出「十万音色·自然语音数据集」 重构AI语音训练基础设施

    标贝科技发布"十万音色·自然语音数据集",覆盖中英双语,包含10万种音色样本(中文5万、英文5万),基于近百万小时原始数据经智能生产线精细打磨。该数据集在规模、真实性和准确性三大核心指标实现突破,支持多情感表达和跨场景应用,涵盖基础情绪到特定风格,话题涉及多个领域。通过音频质量筛选、文本转写校正、说话人分离等技术,从海量数据中甄选出高质量样本,为语音识别、合成等AI模型训练提供坚实基础,助力实现更自然、真实的语音交互体验。

  • 科密声盾「防录音会谈室」:构建空间级语音保密新范式

    本文介绍了"防录音会议室"相比传统防护手段的核心价值:通过中型会议及设备组合,实现空间大小与防护强度的精准匹配。专业版采用矩阵式分布实现大型空间均匀覆盖,既满足政企合规要求,又能让会谈双方专注沟通本身。该系统为政务级涉密场景(如涉密信息交流室、信访接待室等)提供隐私保护解决方案,通过提升隐私保护等级增强客户信任感。"防录音会�

  • AI日报:即梦上线智能多帧功能;可灵2.1首尾帧升级;钉钉推语音识别大模型Fun-ASR

    AI日报栏目汇总近期AI领域重要进展:腾讯元宝接入DeepSeek V3.1提升智能助手能力;即梦AI推出多帧功能简化视频制作;可灵AI首尾帧功能升级效果提升235%;钉钉与通义实验室联合发布Fun-ASR语音识别大模型;腾讯CodeBuddy IDE国内版公测;Vercel发布AI Gateway简化模型调用;Anthropic整合Claude Code强化企业开发;阿里发布Mobile-Agent-v3突破GUI自动化;Qoder平台革新编程模式;清华团队GUAVA框架实现0.1秒3D化身生成;谷歌搜索新增AI Agent功能;VAST推出Tripo 3.0推动3D内容创作。

  • 寒武纪:聚焦技术创新 持续深耕智能芯片领域

    寒武纪在投资者平台声明,网上传播的公司订单、收入预测、新产品、客户及供应链等信息均为不实,提醒投资者提高信息辨别能力,以官方披露为准。公司专注AI芯片研发,产品覆盖云服务器、边缘计算及终端设备芯片,2024年营收增长65.56%,2025年一季度同比增230.22%,连续两季度盈利。研发投入持续加大,优化芯片架构与软件生态,提升产品竞争力,未来将聚焦技术创新,推动芯片向大模型及垂直领域延伸。

  • 从数据穿透到模型迭代,攀智资本:重新定义技术驱动投资

    攀智资本(香港)有限公司以技术驱动投资为核心,在全球金融市场调整与中国金融业蓬勃发展的背景下,通过AI与量化交易深度融合,构建高效数据分析、量化模型、智能风控和自动化交易系统。公司精准锚定中国市场机遇,布局多元资产,挖掘政策红利与技术创新带来的投资机会。未来将拓展ESG投资与全球化业务,持续完善量化基础设施,推动行业技术转型,展现技术驱动投资的新范式。

今日大家都在搜的词:

热文

  • 3 天
  • 7天