首页 > 业界 > 关键词  > 微软最新资讯  > 正文

微软携手Project Gutenberg利用AI语音技术制作5000本免费有声书

2023-09-12 10:22 · 稿源:站长之家

站长之家(ChinaZ.com)9月12日 消息:美国 IT 巨头微软公司近日与古Project Gutenberg合作,利用人工智能技术为该计划的电子书库制作了超过5000本高质量的有声书。这一项目中,研究人员结合了机器学习、自动文本选择和自然语音合成等多项 AI 技术,实现了电子书自动转化为语音的全流程。

AI机器人写论文

图源备注:图片由AI生成,图片授权服务商Midjourney

项目团队首先开发出一种算法,可以自动分析电子书的结构,区分正文和非关键部分的页码、表格等,然后使用 WaveNet、Tacotron 和 FastSpeech 等前沿的文本转语音技术,生成类似真人的自然朗读语音。此外,该团队还使系统能够辨别书中叙述者、对话和不同角色,并相应调整语音,实现故事情节的语音表达。

据悉,此次计划已收集整理了超过35000小时的有声书语音数据,涵盖了各类经典文学、戏剧、传记等作品,这些语音数据都将以开源方式免费提供。用户甚至可以用自己录制的少量语音,生成用自己的声音朗读整本书的效果。这一项目能极大地丰富有声书的内容,也为视障人士提供了便利。

Project Gutenberg是免费数字图书馆计划,用户可以在其网站免费阅读和下载超过7万本电子书。此次与微软合作制作有声书,将大幅拓展其免费有声书数量,为公众提供便捷的知识获取渠道。

举报

  • 相关推荐
  • AI最新资讯在哪里看?AIbase:高效获取国内外AI新闻头条与行业动态

    文章探讨了AI时代信息过载的困境:有价值的前沿动态、重磅模型发布和行业解读分散各处,筛选成本高、效率低下。AIbase资讯导航站应运而生,通过四大核心功能解决痛点:1)聚合主流信源,过滤低质噪音;2)结构化分类呈现大模型动态、行业应用等六大板块;3)提炼核心要点,拒绝标题党;4)高频更新确保信息鲜度。该平台致力于成为AI领域的"信息雷达",帮助用户节省70%信息搜集时间,将精力聚焦于思考与创造。适用于技术负责人快速掌握行业动态、产品经理调研案例、投资人捕捉趋势等多元场景。

  • 为应对AI能耗问题 微软耗资17亿美元买“粪便”埋地

    近日,科技圈出现了一个非常有意思的事情,微软花了17亿美元去买粪便”。 这不是什么隐晦的比喻,就是字面意义的屎”粪便”,包括人和动物拉的那种 据悉,微软的AI业务,包括Copilot、必应AI搜索和OpenAI的ChatGPT等,能耗巨大。 GPT-4训练一次需消耗五六千万度电,排放1.2万到1.5万吨二氧化碳,相当于3000多辆油车一年的排放量。 2024财年,微软的碳排放比2020年增加了23.4%,

  • 一夜变天!GitHub CEO辞职:微软全面接管

    2018年的时候,微软以75亿美元收购GitHub,当时承诺其将保持独立运营。 GitHub CEO Thomas Dohmke宣布即将离职,Thomas Dohmke表示:在担任CEO近四年后,我将厉害GitHub,再次成为一名初创公司的创始人。”

  • AI火花集|AI火花先锋添新力,拆解保险、客服、物联网AI落地实战

    AI正加速渗透产业,2025年全球AI投资预计达2000亿美元,年增长近翻倍。保险、电商客服、智能家居成为落地先锋。暖哇科技、云起未来、蜂助手分别聚焦保险理赔自动化、电商智能客服、5G+AI物联网,通过实战方案推动AI从概念验证走向规模化应用。面临数据价值陷阱、流通壁垒等挑战,企业需构建专业知识库并优化人机协同。未来AI将深入产业毛细血管,汇聚零散创新火花,�

  • 将AI大模型费用计算器作为战略工具:企业如何规避AI项目的成本陷阱

    AI项目规模化应用面临不可预测的运营成本挑战,尤其是大模型API调用费用难以精准预测,导致项目ROI计算失效。成本失控源于计费维度复杂、价格变动频繁及用户行为影响。领先企业通过成本管控前移,在项目可行性分析阶段引入AIbase等成本计算工具,实现成本可视化,支持技术选型和预算建模,从被动应对转向主动管理,提升AI应用的经济性和可持续竞争力。

  • 处暑养生指南:三星AI神 冰箱9系以AI之力 护航家庭健康饮食

    三星AI神·冰鲜9系冰箱通过AI智能大屏实现食材管理、天气提醒、食谱推荐等功能,搭载AI食材识别技术自动同步食材清单,支持语音交互简化操作。创新保鲜技术与UV净化系统确保食材新鲜卫生,631L大容量分区存储满足全家多样化需求。智能控温与节能设计提升使用体验,让秋季饮食更健康便捷。

  • 省心还是添乱?AI旅游助手在争议中前进

    AI对在线旅游行业的改造,正在提速。 今年上半年,各大平台争相推出面向用户的各类AI旅游助手,刮起了一阵AI旋风: 马蜂窝在2025世界人工智能大会上带来了AI旅游助手APP,计划将其打造成目的地“专属管家”,不久前还上线了个性化攻略定制产品“AI路书”; 途牛在4月推出“AI助手小牛”,随后陆续更新多项功能; 飞猪则推出“飞猪AI问一问”,并第一时间接入DeepSeek-R1大模

  • AI应用太烧钱?我们用一款精准的AI大模型费用计算器做出了清晰预算

    初创团队“智询未来”在开发AI问答应用时面临核心模型选择困境:GPT-4-turbo能力强但价高,Claude-3长文本处理优,Llama-3成本低但性能稍弱。通过AIbase成本计算器精准测算,发现Claude-3-Sonnet性价比最优,每月可省近4000元,还能通过优化提示词进一步降本15%。数据驱动的决策让团队将节省预算投入数据安全和提示词优化,凸显成本测算对初创企业技术选型的重要性。

  • 真补贴、真落地!阿里云发布AI应用先锋计划,助力企业跑通AI第一程

    阿里云AI应用先锋计划通过“云+AI+行业适配”模式,助力企业突破AI落地瓶颈。该计划提供云资源补贴、POC服务、专家咨询及联合品牌推广等支持,降低企业AI应用门槛。结合端云协同架构,解决算力成本高、模型部署难等问题,已在智能硬件、教育、政务等领域实现案例落地,推动AI从技术尝鲜走向常态化应用。

  • Soul以AI重构社交体验,打造有温度的“Gen AI 社交游乐园”

    Soul 作为新型社交平台,自成立以来便积极探索AI技术在社交领域的应用落地,持续优化AI社交体验,致力于重塑数字时代的连接方式,为社交产品注入新的可能性,打造一个突破传统社交边界的“Gen AI社交游乐园”。前不久,在第二十二届ChinaJoy(中国国际数码互动娱乐展览会)上,Soul App以“Soul树洞情绪疗愈酒吧”为展台主题亮相,重磅推出原创IP“莫比乌斯·第三弹”ChinaJoy

今日大家都在搜的词: