首页 > 动态 > 关键词  > 科大讯飞最新资讯  > 正文

科大讯飞胡国平:语音将成为AIoT时代最重要的交互方式

2020-10-23 13:56 · 稿源: TechWeb.com.cn

【TechWeb】10月23日消息,在2020科大讯飞全球开发者大会上,科大讯飞高级副总裁胡国平发表演讲,并与艾瑞咨询联合发布《中国人工智能API经济白皮书》。以下节选自胡国平演讲:

“从2010年开始的,在深度学习的框架的引领下一系列的技术突破,推动的人工智能的核心技术从不可用到可用、到好用的这样一个持续的跨越而在人工智能的创新产品方面,包括2011年iPhone4s所推出的Siri,包括2014年亚马逊所推出的,以及科大讯飞在过去10年所推出来的讯飞输入法、讯飞翻译机、听见会议系统、智能录音笔智能办公版的一系列的创新的产品使得我们整个人工智能技术被广大的普通老百姓所认识和认可,也使得语音交互技术成为AIoT万物互联时代最重要的交互方式。”

史无前例的疫情,确实给我们的工作和生活产生了非常多的变数或者说不确定性。我们访问收集了1024份AI开发者和70位企业的CTO,对AI当前的应用的现状应用的状况进行了观点的发表,形成了一份专题报告,也就是我们今天联合发布的2020中国人工智能经济白皮书。这份白皮书里面我们也关注了4个重要的观点。 ”

第一,疫情加速了企业数字化、智能化的转型人工智能已经成为企业转型的关键技术力量,这对我们的AI开发者和筑生态平台来说都是极大的利好。

另外一方面,AI开放平台。作为一种API经济是广大AI开发者获取人工智能的这篇节最低成本的方式,也是AI技术厂商最能够实现技术迭代更新的推广模式因此,开放平台作为连接价值的桥梁,已经成为人工智能时代的基础设施。也成为各大AI厂商的必争之地。

第三,2019年左右,整个人工智能开放平台的市场规模大概在100多亿未来随着AI技术的持续进步,云计算5G的这样一个助推之下,我们认为人工智能的开放平台将保持高速增长,预计仅2020年整个的市场规模就能达到200亿。

第四,从进一步发展来看,在AI技术的大浪潮中,我们需要不断的跨界融合,与各行业的场景融合,共同赋能传统行业是大趋势也是必由之路。因此在AI通用能力的平台之上,我们需要更多的众多的AI开发者一起合作。不断的不论是传统行业中的AI人才,还是中小的AI创业团队,都将是整个AI生态的关键参与者和贡献者现在大家可以扫码免费下载这份白皮书。我们也非常希望这样一份白皮书能够为对各位的业务思考和业务规划有所帮助。

今天,越来越多的开发者加入到科大讯飞的生态环境中。以解决视听障人群痛点功能为例,开放平台已经创建了22,459个无障碍应用,这些应用每天为我们的视听障人群提供了超过5000万次的AI服务,累计服务障碍人群超过1087万。

举报

  • 相关推荐
  • 大家在看
  • Reka Core:强大的多模态LLM,商业解决方案

    Reka Core是一个GPT-4级别的多模态大型语言模型(LLM),具备图像、视频和音频的强大上下文理解能力。它是目前市场上仅有的两个商用综合多模态解决方案之一。Core在多模态理解、推理能力、编码和Agent工作流程、多语言支持以及部署灵活性方面表现出色。

  • 2txt:快速将图片中的文字转换为可编辑文本

    2txt是一个在线OCR工具,能够将图片中的文字内容快速识别并转换成可编辑的文本格式。它支持多种语言的识别,并且操作简单,用户只需上传图片即可获得结果。该工具不存储用户上传的图片,保证了用户数据的隐私安全。

  • 法行宝:AI智能法律分析工具

    法行宝是一款集成了人工智能技术的法律服务平台,旨在为用户提供专业的法律意见和文书参考。通过预设问题引导用户提供必要信息,结合《中华人民共和国民法典》等相关法律法规,生成详细的法律意见书。法行宝不仅提供离婚流程指导、文书模板下载,还包含人性化的行动建议和扩展资料,帮助用户全面理解并应对法律问题。

  • Adobe Acrobat AI Assistant:AI智能助手,文档快速理解与生成

    Adobe Acrobat的AI助手是一个集成在Acrobat中的创新功能,它可以帮助用户通过提问来理解文档内容,快速获取信息并生成内容。这项功能特别适合需要从文档中提取关键信息并快速创建电子邮件、演示文稿、会议记录等的用户。AI助手可以生成文档摘要,提供基于文档内容的建议问题,帮助用户更有效地探索和理解内容。此外,Adobe Acrobat的AI助手遵循Adobe的AI伦理原则,确保用户数据的安全和透明。

  • AI Voice Generator Bot:使用人工智能将文本转换为音频

    AI语音生成器是一个简单易用的产品,它使用人工智能技术将文本转换为音频。它提供了多达25种不同的声音,完美演绎英语。您只需在Telegram上输入文本,我们即可回复相应的音频,无需等待。立即试用,快速将文本转换为语音。

  • Glaze:保护艺术家风格的AI工具

    Glaze是一个旨在保护人类艺术家免受AI风格模仿的系统。通过机器学习算法对艺术作品进行微小改动,使其对人类眼睛看起来不变,但对AI模型则呈现出完全不同的艺术风格。这样,当有人试图模仿特定艺术家的风格时,AI生成的结果将与预期大相径庭。Glaze不是永久解决方案,但是一个必要的第一步,为艺术家提供抵抗AI模仿的工具。

  • FastBots:无需编码,快速创建AI聊天机器人

    FastBots.ai是一个强大的AI聊天机器人平台,允许用户通过上传自己的数据,如网站内容、文档、PDF文件等,来训练并创建定制化的聊天机器人。这些机器人可以无缝集成到网站中,提供24/7的客户支持、销售辅助、个人助理等多种功能。FastBots.ai支持95种语言,提供军事级别的数据加密,无需编程即可通过简单的复制粘贴代码嵌入聊天机器人,还支持与超过5000个应用程序通过Zapier集成。

  • Limitless:超越思维限制的个性化AI助手

    Limitless是一款由人工智能驱动的生产力工具,旨在帮助用户突破思维限制,通过保存对话和提供个性化AI问答来增强记忆力和专注力。产品形态包括可穿戴设备和应用程序,支持会议准备、实时转录、自动笔记和会议总结等功能,无需额外的机器人加入会议,且提供无限存储空间。

  • Adobe Premiere Pro:AI驱动的视频编辑软件

    Adobe Premiere Pro是一款功能强大的视频编辑软件,集成了AI技术,旨在简化复杂的编辑任务并加速编辑流程。软件提供了文本基础编辑、音频分类标签、语音转文字、增强语音、场景检测、自动色彩调整、形态变换、颜色匹配、音频自动调节、自动重构等功能,大大提高了编辑效率和创作可能性。Premiere Pro适用于社交媒体短视频制作到长片电影的编辑,帮助用户节省时间,专注于创意和故事讲述。今年晚些时候,Adobe Premiere Pro计划推出第三方AI模型功能,使编辑人员能够选择最适合其素材的模型,从而提升编辑体验。这些AI模型包括OpenAI的Sora模型、Runway AI和Pika的视频模型。此外,Premiere Pro还将提供内容验证功能,帮助用户了解他们是否使用了AI以及使用了哪个模型来进行媒体创作。

  • SuperMemory:用打造你的第二大脑

    supermemory是一个帮助用户整理和回顾互联网上保存内容的工具,类似于为书签打造的ChatGPT。用户可以通过导入推文或使用Chrome扩展保存网站和内容。它包含三个主要模块:主Web UI、Chrome扩展和AI后端处理。旨在帮助用户更有效地管理和回顾信息,提高生产力。

  • Pile-T5:基于Pile数据集训练的T5模型

    Pile-T5是EleutherAI推出的一款自然语言处理模型,它在原有的T5模型基础上,采用了Pile数据集和LLAMA分词器进行训练,以改善对代码任务的理解能力。该模型经过了2万亿个token的训练,是原T5模型训练量的两倍。Pile-T5在多项下游任务中表现出色,尤其是在代码相关任务上。此外,EleutherAI还提供了中间检查点,以便研究人员研究模型随时间的演变。

  • SoraPix AI:创建您梦想中的动漫女孩

    SoraPix是一个AI驱动的图片生成工具,内置多种独特模型,通过简单的几步操作,您可以创建您梦想中的动漫女孩。SoraPix提供衣橱、动漫和图片生成等功能,具有4K高清图像质量和更快的服务速度。您可以通过购买宝石来解锁更多功能和选择。

  • PostHunt:写病毒式推特,AI辅助

    PostHunt是一款通过AI辅助撰写病毒式推特的工具。用户可以描述内容、选择模板,快速在Twitter上获得病毒式传播。PostHunt结合了GPT 4、Claude 3和Gemini 1.5 Pro的强大功能,使用者可以通过三个简单步骤,在15秒内撰写一条病毒式推特。100多位创作者选择了PostHunt,用于撰写病毒式推特,其强大的功能和简单易用的界面备受好评。

  • MejoraImagen:提升图片质量

    MejoraImagen是一个在线图片增强工具,使用智能算法提升像素化、低分辨率、光线不佳等问题的图片质量。只需上传图片到我们的表单,几秒钟内就能得到100%增强的结果。

  • Azyri:AI医疗助手,为您的医疗团队提供最佳支持

    Azyri是一款AI医疗助手,通过骨龄测量和分析,为医疗团队提供准确的诊断和治疗建议。优势包括减轻医疗团队工作负担,提高工作效率,定价根据服务套餐而定。主要功能包括骨龄测量、诊断X射线、医学影像和机器智能分析。

  • Rhea:生成高质量的短视频

    Rhea是一款由人工智能驱动的短视频生成平台。它可以通过文本输入生成高质量、快速、引人入胜的短视频。Rhea还可以为您的视频生成字幕,使其更具可访问性。您还可以自定义字幕的样式,以与您的品牌相匹配。您可以根据需要定制视频的风格,例如使用定制的配色方案和字体。Rhea适用于各种用途的视频生成,从教育内容到营销视频不一而足。

  • LIDO:一键生成独特的AI音乐,为您的歌曲、TikToks、Reels等创作无版权的音乐。

    LIDO是一款AI音乐生成器,可以快速生成带有自定义歌词和风格的独特歌曲。无论您是新手音乐人还是想要探索音乐无限可能性的人,LIDO都是您释放创造力的一站式解决方案。它生成的音乐具有无版权,可以用于您的歌曲、TikToks、Reels等。定价信息请访问官网了解。

  • IceburgCRM:智能创建任意类型的CRM

    IceburgCRM是一个智能创建CRM的平台,使用AI技术,可以快速转换现有的MySQL数据库为全面的CRM系统。用户可以通过描述需求、选择预设模板或上传现有数据库来创建自己的CRM。IceburgCRM提供了各种预设模板,包括收藏品目录、葡萄酒管理、健身工作室、职业网络、手工艺品供应商、咖啡爱好者、养蜂等。IceburgCRM还提供AI辅助填写和数据导入导出功能,以及多种主题、工作流等特点。IceburgCRM有免费和付费版本可供选择。

  • Mynt:免费AI写作工具

    Mynt是一个免费的AI写作工具,提供单一界面生成各种内容。用户可以导入数据、讨论想法,生成各种文档和内容。Mynt使用先进的语言模型,帮助用户以更高效的方式生成高质量的内容。Mynt有不同的付费计划,包括免费试用和按需付费,满足不同团队的需求。

  • emojiu.cc:搜索和复制粘贴 iPhone 表情符号

    Emoji Copy Paste 是一个可以搜索和复制粘贴 iPhone 表情符号的工具。用户可以通过简单的点击,探索各种表情符号,包括心形、笑脸、骷髅、书呆子、悲伤、iPhone、眼睛、星星、点赞、亲吻和手心等表情符号。增强您的在线沟通,轻松表达自己。

今日大家都在搜的词: