首页 > 原创 > 关键词  > AI最新资讯  > 正文

AI日报:小红书发布对话合成模型 FireRedTTS-2;百度文心新模型登顶Hugging Face榜首;xAI将裁员500人

2025-09-15 16:22 · 稿源:站长之家

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解https://app.aibase.com/zh

1、小红书发布新一代对话合成模型 FireRedTTS-2,助力 AI 播客制作

FireRedTTS-2是小红书智创音频技术团队推出的新一代对话合成模型,显著提升了合成效果和自然度。该模型具备音色克隆能力,只需少量样本即可生成自然的多说话人对话,并支持多种语言和低帧率的离散语音编码器,提高合成速度与稳定性。

image.png

【AiBase提要:】

🎤 FireRedTTS-2是小红书智创音频技术团队推出的新一代对话合成模型,旨在提升合成效果和自然度。

🗣️ 模型具备音色克隆能力,只需少量样本即可生成自然的多说话人对话。

🌐 支持多种语言和低帧率的离散语音编码器,提高合成速度与稳定性,适应多场景应用。

详情链接:https://github.com/FireRedTeam/FireRedTTS2

2、百度文心新模型ERNIE-4.5-21B-A3B-Thinking强势登顶Hugging Face榜首

百度文心大模型家族推出全新开源模型ERNIE-4.5-21B-A3B-Thinking,凭借其高效的推理能力和参数效率,在Hugging Face平台迅速登顶文本生成模型榜单首位。该模型采用MoE架构,支持长上下文处理和多模态任务,展现出强大的技术实力与全球竞争力。

image.png

【AiBase提要:】

🧠 采用Mixture-of-Experts(MoE)架构,总参数21B,但每个token仅激活3B参数,显著降低计算开销。

🌐 支持128K长上下文窗口,适用于逻辑推理、数学求解和学术分析等复杂任务。

🚀 基于飞桨框架训练,提升多模态任务兼容性,并确保高效硬件适配,彰显技术自主性。

3、谷歌Gemini火速登顶:iPhone用户的免费应用新宠

谷歌推出的Gemini应用在美国App Store的免费应用榜单中迅速攀升至第一,成为iPhone用户最受欢迎的免费应用。其核心功能Nano Banana图像编辑模型因其出色的表现而广受好评,吸引了大量用户并推动了谷歌其他应用的排名上升。

【AiBase提要:】

✨ Gemini应用在App Store中迅速登顶,成为iPhone用户最喜爱的免费应用。

🖼️ Nano Banana图像编辑工具因其精准保持人物特征一致性而受到广泛欢迎。

📈 Gemini的成功反映了生成式AI技术在移动端的广泛应用和增长潜力。

4、马斯克xAI将裁员500人 主要涉及数据标注团队

xAI进行战略性转型,从通用AI导师转向专业AI导师,同时裁员500人并计划大幅扩张专业AI导师团队。

【AiBase提要:】

🧠 xAI将裁员500人,主要涉及数据标注团队。

🚀 xAI将战略转型,专注于专业AI导师领域。

📈 xAI计划扩大专业AI导师团队,增加10倍人手。

5、OpenAI 计划将与微软收入分成比例大幅降低,预计新增 500 亿美元收入

OpenAI 正在寻求调整与微软的财务协议,计划将收入分成比例从当前略低于20% 逐步降至2030年的8%,以应对计算开销。此举预计将为 OpenAI 带来超过500亿美元的额外收入,用于 AI 模型训练和扩展。同时,微软将获得新协议下 OpenAI 实体的三分之一股份,但不会在董事会中占有席位。

【AiBase提要:】

🌟 OpenAI 计划将与微软的收入分成比例从20% 降低至8%,以应对高昂的计算开销。

💰 此次调整预计将为 OpenAI 带来超过500亿美元的额外收入,支持其 AI 模型的训练和扩展。

🤝 微软将获得新协议下 OpenAI 实体的三分之一股份,但不在董事会中占有席位。

6、DeepMCPAgent开源炸场:MCP+LangChain一键建神级AI代理,生产力暴增10倍?

DeepMCPAgent是一个开源框架,提供动态MCP工具发现功能,支持开发者基于LangChain和LangGraph快速构建生产级MCP驱动代理,显著提升代理的灵活性和可扩展性。

image.png

【AiBase提要:】

🧠 DeepMCPAgent支持动态MCP工具发现,实现即插即用的代理构建。

🔗 与LangChain和LangGraph无缝集成,兼容多种主流LLM模型。

🚀 提升AI代理灵活性和可扩展性,加速从原型到生产的转型。

详情链接:https://github.com/cryxnet/deepmcpagent

7、开源生态大洗牌!蚂蚁发布AI项目全景图2.0,114个项目见证技术变革浪潮

蚂蚁集团在人工智能开源生态领域发布的全景图2.0版本,展示了当前AI开源项目的最新动态和趋势。通过OpenRank评价体系筛选出114个最具价值的项目,并分析了全球开发者的分布格局以及技术发展的风向标。

【AiBase提要:】

🤖 蚂蚁集团发布AI项目全景图2.0,展示开源生态的最新动态与趋势。

📊 通过OpenRank评价体系筛选出114个最具价值的项目,涵盖22个技术细分领域。

🌐 全球开发者分布显示AI技术已成为全球创新热点,美国与中国占据主要份额。

8、北京1400 多所中小学推行人工智能通识课程

北京市教育部门在新学期全面推出人工智能通识课程,旨在培养学生的AI意识和应用能力。课程涵盖了小学至高中的各个学段,并通过项目实践的方式帮助学生锻炼创新思维和解决问题的能力。

【AiBase提要:】

🧠 课程内容涵盖AI意识、应用能力与伦理责任,培养学生全面素质。

🔧 课程可独立设置或与其他科目融合,注重一体化设计,避免重复交叉。

🌟 北京已有1400多所中小学开设人工智能通识课程,每学年不少于8课时。

举报

  • 相关推荐
  • 这届毕业生,为什么都爱上小红书找工作?

    现在的秋招,情况可太复杂了。 00后应届生“神操作”频现:有人直接把简历打印到衣服上,化身“行走的简历”;有人全家总动员,父母帮投简历、各路亲戚帮着找内推码;还有人反向背调企业,在各个社群潜水、一页页翻看老板的社交账号…… 企业们也不遑多让:理想汽车将校招候选人划分为二十余类,分别进行精细化运营,通过不同的渠道,分发不同的内容;腾讯招聘则制作

  • Soul App开源播客语音合成模型SoulX-Podcast,支持流畅自然多轮语音对话

    Soul App近日开源其播客语音合成模型SoulX-Podcast,专为多人多轮对话场景设计。该模型支持中、英、川、粤等多语言及方言,可生成超60分钟流畅自然、角色切换准确、韵律丰富的语音对话。除播客场景外,在通用语音合成及克隆任务中表现优异,能灵活调节节奏与副语言元素(如笑声),提升语音真实感与表现力。此次开源旨在携手开发者探索AI语音在内容创作与社交生态中的更多可能。

  • 小红书评论区,被麦霸占领了

    原来大家只是不爱去KTV了,不是不爱唱歌了。 最近点开小红书,经常出现一些点赞只有十几个,评论却成百上千条的“点歌帖”。发帖人一句“进来唱两句”,评论区挤满了语音条,各种歌声此起彼伏,宛如一个即时响应的“互联网电子K歌房”。

  • 当小红书和高德坐在同一牌桌

    千团大战后,沉寂多年的「本地生活」赛道战火重燃,新旧玩家再次竞逐万亿市场。 淘宝闪购一夜之间成为阿里最强增长板块,小红书推出「小红卡」以会员制探索新路径,高德「扫街榜」上线首日访问量超4000万。而此前京东高调入局外卖行业,抖音和快手本地生活也在寻求差异化突破。 如果算上原本布局最深的美团,以及借助小程序渗透的微信,本地生活大概是汇聚互联

  • Hugging Face创始人x小红书技术副总裁对谈:开源、AI与技术人的成长

    小红书科技与Red++ Academy在1024程序员节举办直播,技术副总裁凯奇、语音模型负责人风龙与Hugging Face联合创始人Thomas Wolf围绕三大核心观点展开AMA对话:AI编程正成为基础能力;开源是技术发展的核心引擎;实现有"人味"的AGI路径清晰但仍需攻克创造力、复杂环境感知等难题。讨论覆盖开源价值、AGI发展瓶颈、AI人味化实践,强调技术人需提升问题定义与框架性解决能力,并分享了AI编码提效、学习新技术的方法。直播展现小红书从文本模型到语音模型的开源布局,旨在降低技术使用门槛,推动社区共进。

  • 低门槛、0保证金:小红书能“复制”闲鱼吗?

    ​近期,小红书开始内测“快捷售卖”功能,用户只需账号注册时间大于180天并完成个人专业号认证,即可免保证金申请体验这一新功能。 这标志着内容社区起家的小红书正式进军二手电商市场。与以往需要开设店铺并缴纳1000元保证金的复杂流程不同,“快捷售卖”功能更为轻便,相当于为普通用户开放了一个“个人小卖部”。

  • OPPO Find X9系列宣布率先支持小红书8K照片直发 全焦段直出

    今日,OPPO宣布Find X9系列率先支持在小红书平台8K画质直发,全焦段可以直出8K超清照片。 简单来说就是完整的5000万像素模式,不压缩画质。 据了解,OPPO Find X9系列全球首发哈苏2亿超清长焦,全焦段8K超清照片 4K超清实况,搭配丹霞色彩还原镜头 LUMO质感人像视频引擎。 Find X9 Pro主摄采用AOA主动光学校准技术,2亿像素长焦解析力提升15%,进光量提升140%。

  • 又一明星创始人入局AI播客、红杉中国押注,这次能翻出水花吗?

    前字节智慧教育CEO李可佳推出AI播客产品Aibrary,通过将书籍转化为个性化播客服务个人学习场景。产品核心功能包括:1)智能推荐书单和两段式音频(8-10分钟摘要+对话解析);2)创新"分身播客"功能,用户可生成与AI对话的定制播客。该产品定位成人终身学习赛道,与NotebookLM等工具形成差异化,通过播客形式降低学习门槛。目前采用订阅制(年费89.99美元),已获红杉中国等机构投资。

  • 创立不到一年,月度GMV超5千万,这家MCN如何抓住小红书电商红利

    尽管小红书电商规模未知,却是为数不多还有红利机会的平台。前段时间,小红书把电商升级为一级入口,「市集」放入App主界面,同时面向商家发布「百万免佣计划」。这些动作都明示了小红书对电商投入程度不断提升。 不少MCN机构心动但没有头绪——小红书上的MCN多以扶持博主内容变现,直播电商变现经验不足;不同平台调性、电商氛围、推流逻辑不同,又决定了有直播�

  • AI日报:可复刻音色的MiniMax Speech 2.6发布;TikTok推AI剪辑新工具“Smart Split”;Cursor 2.0发布

    本期AI日报聚焦多项技术突破:MiniMax发布低延迟语音合成系统Speech 2.6,实现实时交互;蚂蚁数科与宁波银行打造的金融AI方案入选国际标准;智源推出具身操作能力的Emu3.5多模态模型;Cursor 2.0通过自研模型实现多智能体协同编程;xAI升级Grok新增视频生成功能;OpenAI推出可定制安全模型;TikTok推出AI剪辑工具Smart Split;微软发布强化学习框架Agent Lightning提升大模型训练效率。

今日大家都在搜的词: