首页 > 动态 > 关键词  > 语音识别最新资讯  > 正文

语义识别难住中国Siri 商用前景仍不明朗

2012-04-05 11:17 · 稿源:TechWeb

Siri最难的技术不是语音,而是语义识别。(TechWeb配图)

【TechWeb报道】4月5日消息,“Siri是催化剂,但是能否修成正果尚需时日。” 小i机器人董事长袁斌对TechWeb表示。

自从去年10月,借助发布iPhone 4S之势推出Siri语音问答系统以来,全世界都掀起了一场语音技术热潮,这些长期被边缘化的公司瞬间成为了市场关注的焦点。前有Ciriis和Airi,后有科大讯飞的“语点”。

被资本市场高度热捧的是市场是机会还是陷阱?目前下定论显然有点早。

过去的一个月,TechWeb走访了国内众多从事语音技术的公司,发现这些Siri的跟随者们都面临的共同问题是,听得懂你在说什么,却不理解你在说什么。至少目前来看,语音市场距离大规模商用依然有不小的距离。

这个问题的出现并不意外,因为即便是苹果的Siri同样困扰于此。近日,Siri在国外遭到了多起诉讼,原因是Siri无法准确理解用户的问题,苹果涉嫌夸大宣传。由此可见,如果Siri尚且不够完美,那么中国的Siri必定还有更多的路要走。

“最后的礼物”不完美

2011年10月,苹果iPhone 4S发布,虽然iPhone 4S无甚亮点,但其配备的语音控制助手Siri一经发布便艳惊全球。被称为乔布斯送给这个世界“最后的礼物”。

这是苹果唯一一款打上Beta标签的产品,但却承载了巨大的期望。苹果可以借此机会创建一个人工智能程序的生态系统,将Siri做成平台,让Siri与其他程序结合,Siri本身将成为入口。其结果是谷歌的搜索形式将被颠覆,用户可以通过更自然的交互方式直接获得答案。《纽约时报》撰文称:Siri代表着苹果的商业未来,也预示着未来“搜索”的形态。

虽然苹果有长远的规划,但Siri的发布还是略显仓促,实现这些美好愿景尚需时日。Siri所具有的发电子邮件、播放音乐、安排会议等诸多功能用户使用频率并不高。最新的一项调查显示,30%的用户从未使用Siri来发送电子邮件,32%的用户分别表示自己从未使用Siri播放音乐。对Siri表示非常满意的用户只有55%。

本月早些时候,纽约iPhone 4S用户弗兰克·法齐奥(Frank M. Fazio)在加州联邦法院提起诉讼,指控苹果发布的广告中对Siri功能的描述存在“误导性和欺骗性信息”。另一位iPhone 4S用户大卫·琼斯(David Jones)在美国加州库珀蒂诺对苹果提起诉讼,指控苹果错误地描述了Siri功能。“Siri要么无法理解原告所提出的问题,要么在经过长时间等待后提供了错误的答案。”

语义识别之难

为什么Siri会有这些不完美?国内从事了十年智能网络机器人研究的小i机器人董事长袁斌解释称,Siri最难的技术不是语音,而是语义识别。

我们现在看到的Siri实际上由两部分组成,一部分是语音识别,一部分是语义识别。当用户对Siri讲一句话时,语音识别分析出这句话说的是什么,语义识别分析出这句话是什么意思。语音和语义两部分技术在Siri中所占的比例分别是20%和80%。也就是说,要正确理解用户的意思并作出反应,语义识别实际上更为关键。

脱胎于美国国防部技术的Siri真正擅长的是语义识别。语音识别部分,Siri选择跟语音识别引擎Nuance合作。Siri现在的任务是不断加强其语义识别能力,建立更加庞大的数据库。据说苹果已经在印度招大量工程师进行数据库的梳理。

语义识别的另外一个挑战是,内容越多,对智能识别的挑战越大,需要的算法更强。

从事了多年语音技术研究的李开复也表达过类似的观点,他说:“人们一旦开使用语音跟你交流了,就会把你当做一个人,这个带来的超级高的期望值会给语音带来很大的挑战。”

Siri不适合创业公司

Siri的火爆让不少国内的创业者非常兴奋,因为它代表着一个可以探索的新方向。但是不少业内人士对此表示怀疑态度。

李开复曾在微博中称:“‘中国Siri’创业计划不太适合中国创业公司,需要解决的问题很多也很棘手,主要是新的智能语音控制技术如何引导用户行为,再是克服海量数据学习门槛和应用整合困难等。”

国内现在已有的类Siri应用,Ciriis和Airi,尚且都停留在娱乐层面。而前段时间科大讯飞高调发布的“讯飞语点”也并未有实质性突破,如果一句话中间增加停顿,它便无法正确理解。

袁斌认为,要做中国的Siri,第一需要语料库,第二需要人工智能的算法。讯飞拥有前者的优势,但后者仍需积累摸索。“需要长期的、系统的平台去处理每天进来的海量的知识,经过长期的集聚,形成工程化的产品,最后才能对每天进来的知识进行去重、筛选,同时能够学习新的知识点。”

在这一点上,袁斌的小i机器人有值得借鉴的经验。

小i机器人是一款网络机器人,主要应用于运营商、银行等的网络客服系统。小i机器人从2001年开始开发,最终以IM聊天机器人的形式推出,经历了个人用户激增、产品线众多、用户满意度下降、公司负担过重等一系列问题,最终艰难转型。而这些问题与今天的Siri以及类Siri应用面临的问题非常相似。

袁斌认为,无论谁做语音控制技术或者智能识别技术,这些问题都无法绕开。解决了,则柳暗花明,解决不了,只有死路一条。(张睿)

举报

  • 相关推荐
  • 看重全球化前景,海尔智家同时跻身港股两大指数TOP10

    2025年消费投资呈现新趋势:A股消费仍聚焦白酒,港股则转向国货出海和Z世代崛起。国证港股通消费指数年初至今上涨20%,恒生消费指数累计涨幅超15%,而中证消费指数仍下跌。泡泡玛特、安踏体育、海尔智家等新消费龙头获南向资金青睐,其中南向持有海尔智家占比提升3个百分点。这些企业全球化前景被看好:泡泡玛特预计2025年海外收入占比超30%;安踏体育全球市占率将超15%;海尔智家海外营收占比已超50%。东南亚市场表现亮眼,海尔在泰国、越南、印尼白电销量均居第一并逆势增长。企业通过差异化产品满足全球需求,如针对东南亚推出洗头巾洗衣机等创新产品。海尔近期回购A股和H股员工持股计划,彰显管理层信心。华泰证券建议关注具备"产业出海+全球运营"优势的企业。

  • 自研大模型遥遥无期!苹果Siri考虑用外援:转向OpenAI合作

    据媒体报道,知名爆料人马克古尔曼透露,苹果正重新评估其人工智能发展策略,考虑放弃自研大语言模型(LLM)计划,转而与OpenAI展开合作谈判。 若合作达成,苹果原定于2026年推出的基于自研Apple Foundation Models”的Siri升级计划可能被搁置,这一变动或引发行业广泛关注。 目前,由苹果AI负责人约翰詹南德雷亚(John Giannandrea)主导的LLM Siri”项目仍在进行中,但进展不及预�

  • 技诺商用全自动咖啡机亮相东京CAFERES:四大场景方案重塑咖啡未来

    技诺咖啡机亮相东京CAFERES展,以"一杯好咖啡,连接世界"为主题,展示了家用、商用、办公及自助四大场景解决方案。重点展品包括采用双锅炉双炉设计的商用机型JL36,60秒快速出品且支持奶路自动清洁;配备10.1寸触控屏的现磨咖啡机JL31,3秒可拆卸酿造单元;以及支持SAAS平台的JL33机型,日均出杯量达200杯。展会通过沉浸式场景布置,让观众直观体验全自动咖啡解决方案。技诺强调其不仅是卖设备,更是提供可接入各类系统的咖啡生态,助力全球咖啡场景基础设施建设。

  • 技诺商用咖啡机亮剑欧洲WOC展,擎起中国智造硬核实力

    中国咖啡设备制造商技诺智能携全系列现磨咖啡机亮相瑞士日内瓦世界咖啡博览会(WOC),其商用全自动咖啡机JL33A入围展会最佳新品大赛。该机型采用双锅炉双泵系统、20g双层滤网等创新技术,日产能达200杯,覆盖家庭、办公、商用等多场景需求。技诺产品以技术创新打破欧美品牌垄断,成为首家加入精品咖啡协会(SCA)的中国企业,展现"中国智造"实力。通过国际展会平台,技诺正推动中国咖啡设备制造走向世界舞台中央,以科技实力重塑全球咖啡行业格局。

  • LiblibAI 重磅发布「星流 Agent」:中文语义 + 图片视频3D全能生成,中国最强设计 Agent

    LiblibAI推出Lovart中文版"星流Agent",这是一款专为中国市场深度优化的AI设计工具。该产品在保留Lovart全球版"生成-编辑-排版-交付"全链路能力基础上,针对中文语义、国风审美和本土使用场景进行了全面重构。星流Agent支持从创意构思到设计交付的全流程自动化,可处理平面设计、视频生成和3D建模等跨模态创作,内置符合中国文化的视觉风格库。该产品的推出标�

  • 249元 小米室外摄像机4发布:4K画质 AI人车识别

    今日,小米室外摄像机4发布,售价249元,购买赠送价值59元的64GB固速视频监控存储卡,赠完即止。 据了解,小米室外摄像机4配备800万像素镜头,分辨率达3840 x 2160,呈现清晰细腻的4K画质,f/1.6大光圈,夜间画面明亮清晰。 支持新一代HDR动态调校,智能应对复杂光源。

  • 谭章熹博士出席 RISC-V 中国峰会 详解开源架构全球征程与中国机遇

    2025年7月16日,第五届RISC-V中国峰会在上海张江科学会堂举行。作为中国大陆规格最高、规模最大的RISC-V专业会展,峰会吸引了全球专家与产业领袖参与。RISC-V国际基金会董事谭章熹博士发表主题演讲,回顾了RISC-V从伯克利起步到全球发展的历程,强调其开源、免费、无专利限制的特性推动了技术创新和生态繁荣。他指出,RISC-V基础指令集仅40余条,结构简洁但高度模块化,适用于从嵌入式设备到高性能计算领域。中国正积极建设RISC-V生态,预计2030年中国高性能RISC-V芯片市场规模将达2000-3000亿元,占全球20%-30%。谭博士表示,RISC-V发展重心正向AI加速、数据中心等高性能场景迈进,将与x86、ARM展开竞争,成为数字时代承载国家技术主权与产业升级的重要基础。

  • 英伟达Blackwell Ultra芯片商用落地,微美全息以“算力+开源”领航AI科技新程

    英伟达与CoreWeave合作推出新一代AI芯片Blackwell Ultra,该芯片已实现商业部署,采用液冷技术,包含72个GPU和36个CPU。Blackwell Ultra的AI内容生成能力是前代产品的50倍,预计今年批量出货。英伟达凭借高性能AI芯片近乎垄断市场,年利润超5000亿元,市值逼近4万亿美元,有望成为全球市值最高公司。微软推迟自研AI芯片发布,转向过渡性设计方案。微美全息专注AI芯片技术布局,构建多元化技术生态,推动产业协同,成为全球AI芯片竞赛重要参与者。当前AI产业进入大规模商业化关键阶段,算力需求持续高涨,推动企业向算力数智化迁移。消费电子领域,AI赋能传统智能终端,新型智能硬件结合AI创造增量需求,关注算力产业链技术创新配套机遇。

  • Alo真能在中国火起来?

    ​“哪里能买到Alo?”这是今年小红书上时常出现的问题。 在相关话题的评论区,用户们的热情远超普通商品讨论:有人分享自己刚在泰国专柜购买的款式和价格,有资深买家推荐“月销上万件的淘宝高仿店铺”,更有专职代购直接打出“韩国帮代,私询价”的广告。 尽管Alo Yoga尚未在中国大陆开设任何官方门店,这个来自洛杉矶的高端瑜伽品牌却以惊人的速度渗透进都市女性

  • 粉色没了!曝iPhone 17/17 Air共有9款配色

    ,配件制造商正在生产适用于iPhone 17和iPhone 17 Air的摄像头保护圈,这些保护圈的颜色与手机发布时的机身配色相匹配,由此可以确定iPhone 17以及17 Air的新配色。 据爆料,iPhone 17提供黑色、白色、蓝色、绿色和紫色等配色,iPhone 17 Air提供黑色、白色、金色和蓝色等配色,两款机型配色加起来共计有9款。 作为对比,iPhone 16以及iPhone 16 Plus提供群青色、深青色、粉色、白色和黑�