首页 > 业界 > 关键词  > 科大讯飞最新资讯  > 正文

!讯飞星火认知大模型可自动创作 生成虚拟人朗读

2023-05-06 15:15 · 稿源: 快科技

快科技5月6日消息,今天下午科大讯飞在发布会上推出了星火认知大模型,并公开进行了展示。

星火大模型拥有多种能力,包括多风格多任务长文本生成生成能力、语言理解能力、泛领域开放式知识问答、情境式思维链逻辑推理、多题型可解析数学能力、多功能多语言代码能力、以及多模态输入和表达能力等。

科大讯飞董事长刘庆峰直言,目前星火认知大模型在国内明显遥遥领先,中文已经超越ChatGPT,英文已接近。

值得一提的是,星火认知大模型不仅仅是能进行文字创作、逻辑推理、代码生成等简单功能,研发中的版本甚至还能直接生成虚拟人来进行展示。

在发布会的现场展示上,星火认知大模型完成了一整套创作链条:散文创作生动朗读生成虚拟人朗读。

而且不论是虚拟人的形象还是朗读语音,都非常的自然生动,能够结合文风和语义来进行内容输出。

遥遥领先!讯飞星火认知大模型可自动创作 生成虚拟人朗读

遥遥领先!讯飞星火认知大模型可自动创作 生成虚拟人朗读

遥遥领先!讯飞星火认知大模型可自动创作 生成虚拟人朗读

举报

  • 相关推荐
  • ppt自动生成工具最好用的3个

    文章介绍了当前AI生成PPT工具的发展现状,重点推荐了"秒出PPT"这一专业平台。该平台具有三大特色功能:1)智能对话式生成,支持中途修改需求;2)提供三种编辑模式(纯文本、纯设计和文本+设计);3)支持导入文档自动排版,提供"保持原文"和"AI智能修改"两种模式。平台还拥有丰富的模板库,支持在线更换颜色、字体等设计元素。虽然需要购买会员,但相比市面上质量参差不齐的同类产品,该工具在交互体验和功能完整性上表现突出。

  • 荣耀Magic V5顶配首发全新青海湖刀片电池 硅含量遥遥领先

    荣耀Magic V5新一代折叠屏旗舰将于7月2日发布,新机号称折叠机皇。 今日,荣耀终端股份有限公司产品线总裁方飞发布长文,介绍荣耀如何将Magic V5做成最高硅”格的全球最薄”折叠旗舰。 据方飞介绍,荣耀Magic V51TB版本首次使用6100mAh青海湖刀片电池版,硅含量首次最高达到25%,达到了手机电池领域最高硅”格,能量密度远远领先行业。 此外,该机还采用荣耀AI都江堰电源管

  • 国内有哪些ai大模型?一文看懂中国核心AI大模型全景

    近两年中国AI大模型发展迅猛,已形成"通用+行业"双轨并进的生态格局。百度文心一言、阿里通义千问等通用大模型在中文理解、多模态生成等方面表现突出;深度求索DeepSeek以1/10参数实现GPT-4级推理能力;月之暗面Kimi以20万汉字上下文窗口领跑长文本处理;智谱AI的GLM-4成为首个支持视频对话的国产千亿模型。医疗、金融等垂直领域涌现出百川智能等专业模型,覆盖超1000家医院。开源生态加速国产芯片适配,15家厂商完成深度优化。行业应用方面,工程文档效率提升60%,24小时拟人化客服等案例凸显价值。未来趋势呈现模型蒸馏、端侧部署和开源生态三大方向,中国AI正从实验室走向产业变革前沿。

  • 主流AI多模态大模型有哪些?超全的多模态大模型指南分享

    2024年多模态大模型成为AI领域最具前景的技术方向之一。文章全面分析了主流多模态大模型的特点、应用场景和发展趋势。多模态大模型能同时处理文本、图像、音频、视频等多种数据,实现更智能的人机交互。重点介绍了GPT-4V、Claude3.5、Gemini、通义千问等代表性模型,对比了它们在视觉理解、编程能力、中文处理等方面的优势。应用场景涵盖智能客服、内容创作、教育医疗等领域。未来发展趋势包括模型规模扩大、支持更多模态、实时交互能力提升等。选择模型需考虑应用需求、语言支持、性能成本等因素。

  • 共探AI视频新纪元:讯飞“绘镜开放麦”全回顾

    7月12日,科大讯飞与WaytoAGI联合主办的"绘镜开放麦"活动在杭州举行,汇聚全国百余位AI视频创作者探讨AI视频创作潜力。活动发布了"讯飞绘镜共创者计划",邀请视频爱好者参与AI创作。多位创作者分享了AI赋能视频创作的经验,讯飞工程师详解了AI视频生成技术原理,强调精准提示词的重要性。讯飞绘镜平台通过精细化提示词优化、角色DNA赋予等技术,提升视频生成质量。活动还展示了AI视频挑战赛优秀作品,6位获奖者获颁荣誉。WaytoAGI作为最大AI开源社区,将持续推动AI创作生态发展。

  • 自研大模型遥遥无期!苹果Siri考虑用外援:转向OpenAI合作

    据媒体报道,知名爆料人马克古尔曼透露,苹果正重新评估其人工智能发展策略,考虑放弃自研大语言模型(LLM)计划,转而与OpenAI展开合作谈判。 若合作达成,苹果原定于2026年推出的基于自研Apple Foundation Models”的Siri升级计划可能被搁置,这一变动或引发行业广泛关注。 目前,由苹果AI负责人约翰詹南德雷亚(John Giannandrea)主导的LLM Siri”项目仍在进行中,但进展不及预�

  • 颠覆认知!推客时间线大起底

    文章梳理了"推客"概念的发展历程:新浪早在2009年就注册相关商标,但未能普及;2018年苏宁首次提出"苏宁推客"概念,但影响力有限。2025年1月9日成为转折点,微信公开课首次将"推客"概念推向台前,同日沸点会宣布将举办首届推客大会。随后发展迅猛:3月3日杭州推客大会成功举办;5月微信成立电商产品部加速生态建设;5月28日沸点会提出2025年实现2000家推客小程序上线、影响13亿消费者的目标。文章指出推客模式成熟的三大基础:高效信息流(推客传播)、物流(极速配送)、资金流(便捷支付)。沸点会通过资源对接和内容创作解决了早期传播力不足的问题,推动推客从企业项目发展为行业共识。

  • “晓妙”产业大模型——AI驱动的产业变革

    7月4日,安徽数智建材研究院在长城工程科技会议上发布"晓秒"产业大模型。该模型由傲林科技投资支持,采用"1+1+N"架构,融合数据、机理和业务模型,实现生产运营全流程实时闭环优化。中国建材集团董事长周育先表示,该模型已在水泥板块试点应用,吨水泥成本降低1%以上,能耗电耗下降2%以上。会议指出,AI落地制造业需突破三大关键:建立数字化体系、夯实数据基础、实现工艺与数据融合。未来将拓展至新能源、钢铁等十余个行业,推动产业智能化升级。

  • AI日报:腾讯混元推3D生成大模型Hunyuan3D-PolyGen;钉钉AI表格重磅来袭;阿里推多模态大语言模型HumanOmniV2

    本文介绍了AI领域多项重要进展:1)腾讯推出首个美术3D生成大模型Hunyuan3D-PolyGen,显著提升建模效率;2)阿里发布多模态大模型HumanOmniV2,准确率达69.33%;3)钉钉AI表格实现1小时处理千项任务;4)百度PaddleOCR3.1版本在多语种识别和文档翻译方面升级;5)微软推出Deep Research智能体,自动化研究流程;6)香港理工与OPPO联合开源视频超清框架DLoRAL;7)谷歌开源MCP工具箱简化AI与数据库集成;8)Win11将推出AI动态壁纸功能。这些创新展示了AI在3D生成、多模态理解、办公效率、视觉处理等领域的突破性进展。

  • 马斯克xAI推出Grok - 4 大模型将至,Meta/微美全息深耕开源AI融合加速

    埃隆·马斯克旗下xAI即将发布Grok-4大模型,该模型将在语言、数学和推理方面超越OpenAI和谷歌最新AI产品。同时苹果低调收购两家AI公司TrueMeeting和WhyLabs,加速布局Vision Pro头显和Apple Intelligence领域。Meta计划投入数百亿美元扩建AI基础设施,扎克伯格亲自招募顶尖AI人才。微美全息聚焦高性能算力与多模态模型,推动AI产业升级。当前AI赛道竞争激烈,大模型正向通用多模态演进,商业化落地成为关键。