首页 > 业界 > 关键词  > 生成式AI最新资讯  > 正文

比OpenAI的Whisper快50%,开源语音模型

2024-08-04 08:36 · 稿源: AIGC开放社区公众号

生成式AI初创公司aiOla在官网开源了最新语音模型Whisper-Medusa,推理效率比OpenAI开源的Whisper快50%。aiOla在Whisper的架构之上进行了修改采用了“多头注意力”机制的并行计算方法,允许模型在每个推理步骤中预测多个token,同时不会损失性能和识别准确率。开源地址:https://git

......

本文由站长之家合作伙伴自媒体作者“AIGC开放社区公众号”授权发布于站长之家平台,本平台仅提供信息索引服务。由于内容发布时间超过平台更新维护时间,为了保证文章信息的及时性,内容观点的准确性,平台将不提供完全的内容展现,本页面内容仅为平台搜索索引使用。需阅读完整内容的用户,请查看原文,获取内容详情。

举报

  • 相关推荐
  • OpenAI发布最强模型o1满血版!史上最贵订阅费1450元/月

    在12天12场直播”活动首日,OpenAI推出了其最强推理模型o1满血版本,同时宣布了史上最贵的订阅服务ChatGPTPro,每月订阅费用高达200美元。此次发布的满血版o1模型在速度、性能和准确性上相较于预览版有了显著提升,同时新增了多模态输入功能,允许用户上传图片以获得更准确的回答。如果是一名科学研究人员或程序员,且o1模型的推理能力不足以满足需求,那么可以考虑氪金”进阶模式。

  • 刚刚,OpenAI公开o1模型测试方法,人机协作时代!

    OpenAI分享了两篇关于o1、GPT-4、DALL-E3等前沿模型的安全测试方法。一份是OpenAI聘请外部红队人员的白皮书,另外一份是通过AI进行多样化、多步骤强化学习的自动化安全测试论文。通过这种方式,OpenAI不断改进模型的鲁棒性和安全性,确保其在实际应用中能够更好地服务用户。

  • 重磅!OpenAI发布满血o1、无限使用,最强大模型来了

    今天凌晨两点,OpenAI正式开启了12天技术分享直播,并发布了最新产品ChatGPTPro。ChatGPTPro可以无限使用完整版o1和Pro模式,同时可以使用高级语音和图片上传功能。这只是OpenAI的连续12天分享技术的第一天,后续「AIGC开放社区」将会继续为大家介绍。

  • 对话李彦宏:大模型进化变慢是好事,百度从来没对标过OpenAI

    2024年11月12日,在“百度世界大会”期间,百度创始人、CEO李彦宏与硅星人创始人骆轶航、甲子光年创始人张一甲进行了一场对谈。以下是对话实录:1为什么“应用来了”?张一甲:过去一两年,人工智能是全行业很火的赛道和技术方向,每天我们都看到非常多的产品和技术进展,今年世界大会为什么主题定为“应用来了”?李彦宏:因为我从去年开始不断讲,模型本身不产生直接价

  • 外媒:OpenAI 、Anthropic、谷歌新模型表现均不及预期

    谷歌、Anthropic、微软和OpenAI都是AI领域的顶尖玩家,但现在看来,这些公司在开发更先进的AI大模型时都遇到了不小的困难。OpenAI曾接近一个重要的里程碑。有意思的是,尽管说需要这么多投入,Altman却又声称用现有的硬件就能实现AGI。

  • OpenAI变深,百度变宽

    距离ChatGPT发布整整两年后,中美两地的大模型代表厂商,仍在完善模型产品功能和使用体验上不断发力:11月初,OpenAI在ChatGPT中上线了AI搜索;11月中旬,百度则推出了一系列智能体应用,尝试构建AI应用生态。行业领头羊的不同思考,得以让外界一窥它们在大模型领域的共识和分歧。当用的人逐渐变多,李彦宏口中“智能体即将迎来爆发点”的判断,才有望越早到来。

  • 国产模型炸裂登场,国外赞不绝口!OpenAI-o1级性能,免费使用

    国产大模型平台DeepSeek发布了,全新推理模型DeepSeek-R1-Lite预览版。这个模型的最大特色便是深度思维链推理,尤其是在数学、代码以及各种复杂推理任务上,可以生成数万字的推理流程,让用户深度了解模型生成内容的全过程。R1每天免费提供50次深度思维链推理,有兴趣的小伙伴可以试试。

  • OpenAI放王炸!Sora、满血o1,连续12天发布最新技术!

    OpenAI首席执行官SamAltman宣布,从太平洋时间明天上午10点开始,将进行为期12天的OpenAI活动。在每个工作日,都会有一个直播,包括最新技术或产品演示,有些是重要的发布,有些是小惊喜。「AIGC开放社区」将在这12天里,为大家持续介绍OpenAI的最新技术和产品展示。

  • 炸裂!OpenAI的Sora惨遭泄露,有人用上了!

    OpenAI的王牌文生视频模型,全球用户最期待的生成式AI应用——Sora,被人在huggingface上恶意泄露了API,使其短暂的开放了1小时左右。即便是如此短的时间,也有人通过Sora生成了大量视频,整体效果非常惊艳。生成我的世界游戏视角视频一只猴子正在玩拼图魔方期待Sora正式公测的到来,让我们见到更多惊艳的视频,改变影视行业的制作流程。

  • 对标OpenAI o1!Kimi发布新一代推理模型:中考高考考研全第一

    日前,国内人工智能公司月之暗面推出的Kimi国产大模型正式发布k0-math。k0-math是Kimi推出的首款推理能力强化模型,采用全新强化学习和思维链推理技术,通过模拟人脑的思考和反思过程,大幅提升解决数学难题的能力。月之暗面表示,这些局限性既是机遇,也是挑战,预计将在下一阶段的模型迭代中逐步得到改善。

热文

  • 3 天
  • 7天