AI日报：字节推AI模型社区平台炉米Lumi；神秘大模型“小熊猫”身份揭晓；ChatGPT语音模式登陆Mac

2024-10-31 15:20 · 稿源：站长之家

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解:https://top.aibase.com/

1、字节跳动推出AI模型社区平台:炉米Lumi 类似Liblib和CIvitai

字节跳动最新推出的AI模型分享社区平台炉米Lumi，展示其在AI领域的全面布局策略。平台提供模型上传分享、Workflow搭建和LoRA训练功能，目前仅向白名单用户开放。与LiblibAI相似，炉米Lumi将成为字节跳动在AI领域的重要布局。

【AiBase提要:】
🚀 炉米Lumi是字节跳动最新推出的AI模型分享社区平台，提供模型上传分享和训练功能。
💡 与LiblibAI功能定位相似，炉米Lumi展示了字节跳动在AI领域的全面布局策略。
💥 字节跳动在AI领域已有广泛布局，包括大模型、ChatBot、AI社交、AI虚拟陪伴等多个领域。
产品入口：https://top.aibase.com/tool/lumilumi

2、神秘大模型“小熊猫”身份揭晓:英国AI公司最新图像生成模型Recraft V3

我对最新揭晓的英国AI公司Recraft V3图像生成模型进行了点评。该模型以red_panda化名引起关注，具备强大的长文本图像生成能力，突出的文本布局和样式控制功能让用户可以精确创造专业品质的视觉效果。

【AiBase提要:】
🔍 Recraft V3实为英国AI初创公司Recraft AI推出的最新图像生成模型，以red_panda身份引发关注。
💡 Recraft V3在Artificial Analysis排行榜上以1172的ELO评分领先其他模型，收获超过10万次投票。
🚀 Recraft V3具备强大的长文本图像生成能力，增强的文本布局和样式控制功能，特别适用于品牌推广、营销和复杂图形设计领域。
详情链接:https://www.recraft.ai/

3、OpenAI宣布ChatGPT高级语音模式登陆Windows和Mac平台

OpenAI今日宣布，ChatGPT的高级语音模式（AVM）正式登陆Windows和Mac平台，基于GPT-4o模型开发，提供更自然的实时对话交互体验。用户反馈良好，但部分地区暂时无法使用。系统新增五种语音选项，支持打断和停顿，满足用户更接近人际交流的需求。AI回答准确率高，用户满意度达96%。ChatGPT还推出网页版聊天历史搜索功能，持续突破语音交互技术领域，市场推广效果待观察。

【AiBase提要:】
🔊 ChatGPT的高级语音模式（AVM）正式登陆Windows和Mac平台，提供更自然的实时对话交互体验。
🌐 系统新增五种语音选项，支持打断和停顿，满足用户更接近人际交流的需求。
💬 用户反馈良好，AI回答准确率高，用户满意度达96%。ChatGPT还推出网页版聊天历史搜索功能，持续突破语音交互技术领域。

4、专为苹果AI而生!苹果宣布推出M4Max芯片

苹果公司最新推出的M4Pro和M4Max芯片为Mac电脑带来显著性能提升和先进功能。这些芯片采用领先的制程工艺，优化了性能和能效，为专业和AI任务提供优异表现。

【AiBase提要:】
🚀 M4系列芯片采用第二代3纳米制程工艺，提升性能和能效。
💻 M4Pro和M4Max芯片支持雷雳5和统一内存带宽提升，为Mac带来更强大的功能和速度。
🧠 M4、M4Pro和M4Max芯片搭载神经网络引擎和机器学习加速器，为用户带来全新的智能化体验。

5、OpenAI 重磅升级实时 API:除了降价超50%，还推五种新语音

OpenAI 最新更新了实时 API，推出五种新的语音选项，降低了缓存费用，提供更经济实惠的开发体验。新语音包括生动可调节的 Ash、Verse 和英国风格的 Ballad，提供更自然的交流体验。然而，实时 API仍在测试阶段，无法提供客户端身份验证，且网络条件影响音频处理可靠性。开发者可通过降价和缓存功能吸引更多用户使用。

【AiBase提要:】
🌟 新增五种自然语音，提升语音应用体验
💰 实时 API通过缓存降低输入费用，开发者更划算
⚡ 实时音频处理受网络条件影响，可靠性需关注

6、好莱坞黑科技!Wonder Dynamics发布视频转3D功能

Wonder Dynamics发布了颠覆性的AI工具Wonder Animation测试版，利用人工智能重新定义影视制作流程。这项技术让创作者可以轻松转换素材为包含CG角色的3D动画场景，实现完整虚拟场景编辑。

【AiBase提要:】
✨ 创作者可使用任何相机、在任何场地拍摄，通过AI转换为3D动画场景
🎬 强大的场景重建能力，精确还原摄像机与角色、环境的位置关系和运动轨迹
🚀 让艺术家保持创作控制权，更容易制作全动画电影
详情链接:https://top.aibase.com/tool/wonder-dynamics

7、谷歌重磅升级AI语音技术:2分钟对话3秒生成，将彻底改变人机交互方式

谷歌最新发布的语音生成技术再次刷新了业界标准，突破性技术能在3秒内生成长达2分钟的自然对话，确保多说话人之间的语音连贯性和音质表现。该技术已在多个谷歌产品中得到应用，全球范围内改变着人们与数字助手和AI工具的交互方式。

【AiBase提要:】
✨ 高效语音编解码器，每秒600比特低比特率下压缩音频，保持高质量输出。
🔍 专门的Transformer架构，处理信息层次结构，预训练并微调在高质量对话数据集上。
🌐 SynthID技术整合，为AI生成的音频内容添加水印，确保技术负责任使用。
详情链接:https://deepmind.google/discover/blog/pushing-the-frontiers-of-audio-generation/

8、面壁智能与百度智能云达成合作

面壁智能与百度智能云宣布战略合作，共同致力于开发大模型端云协同解决方案。合作将提升大模型在智能终端、边缘计算等应用场景中的效果，降低推理成本，提升响应速度，提高用户体验和业务效率。面壁智能发布MiniCPM3.0和MiniCPM-V2.6，实现对GPT系列的赶超，引发国内外高度关注。

【AiBase提要:】
🤝 合作共同开发大模型端云协同解决方案，提升模型效果、降低成本、提高响应速度。
🚀 发布MiniCPM3.0，4B模型参数规模赶超GPT-3.5，在多领域脱颖而出。
💡 发布MiniCPM-V2.6，全面对标GPT-4V级水平，实现实时视频、多图联合理解，引发国内外关注。

9、19年亏损终结!Reddit CEO发文感谢AI帮助网站首度盈利

Reddit 经过19年的亏损，终于在上市后迎来了利润。第三季度净收入达到2990万美元，营收348.4亿美元，同比增长68%。CEO 哈夫曼表示，人工智能是实现盈利的关键。未来计划加速产品路线图，提升用户搜索体验。

【AiBase提要:】
🌟 Reddit 首次实现盈利，第三季度净收入2990万美元。
📈 用户增长显著，日活跃用户数达9700万，多次突破1亿。
🤖 人工智能助力翻译功能扩展，预计到2025年将覆盖30个国家。

10、波士顿动力新款Atlas机器人:全电动、完全自主，成功完成复杂任务

波士顿动力公司发布了新一代人形机器人Atlas的精彩视频，展示了其在模拟工厂环境中独立完成分拣任务的能力。视频强调了Atlas利用机器学习和升级传感器实现实时环境反馈与调整的特点，展示了完全自主工作能力。

【AiBase提要:】
🤖 波士顿动力展示了全电动Atlas机器人，能够独立完成复杂的分拣任务。
🔧 Atlas利用机器学习和升级传感器，实现了实时的环境反馈与调整。
💡 视频中显示“完全自主”的水印，强调了其在最少人类干预下的工作能力。

11、清华大学推出突破性音源仿真平台SonicSim

清华大学研究团队发布了名为SonicSim的移动音源仿真平台，解决了语音处理领域移动声源场景下数据缺乏的难题。该平台模拟真实声学环境，为语音分离和增强模型提供优质数据支持。SonicSim有效解决了现有数据集难以满足移动声源场景需求的问题。

【AiBase提要:】
🔊 SonicSim平台基于Habitat-sim构建，模拟真实声学环境
🎙 SonicSet数据集使用多场景移动音源数据，确保数据真实性和多样性
🚀 在SonicSet数据集上训练的模型取得更优异性能，证明SonicSim有效模拟真实声学环境
详情链接:https://arxiv.org/pdf/2410.01481

12、百川智能发布一站式解决方案帮助企业最低成本私有化部署模型

百川智能科技推出的一站式解决方案旨在帮助企业以低成本实现大模型的私有化部署，并提高效率。该解决方案包括全链路优质通用训练数据、Baichuan4-Turbo和Baichuan4-Air两款模型，以及全链路领域增强工具链，能够满足企业在不同场景下的需求。

【AiBase提要:】
🔑 高达96%的多场景可用率，领先行业
🚀 Baichuan4-Turbo在核心能力上有显著提升，部署成本低
💡 Baichuan4-Air采用MoE模型，推理成本极低，降低企业运营成本
详情链接:https://platform.baichuan-ai.com/homePage

（举报）

相关推荐

关键词：

Lumi

荐AI日报：生数科技推出Vidu Q2；火山引擎推出炉米Lumi；通义千问开源300+模型

本文汇总了近期AI领域多项重要进展：生数科技推出Vidu Q2模型，显著提升视频生成中细微表情的真实感；火山引擎发布炉米Lumi平台，支持视觉模型LoRA微调以定制独特风格；阿里云通义千问开源超300个模型，下载量突破6亿次；百度开源多模态视觉理解模型Qianfan-VL，适配不同场景需求；微软在Copilot中引入Anthropic模型，拓展AI助手功能；OpenAI计划在美国新建五个数据中心以加速Stargate项目；英伟达开源Audio2Face模型，提升实时面部动画生成效果；Meta发布具备沙箱推演能力的32B代码世界模型CWM，优化代码调试效率。这些动态展示了AI技术在视觉、多模态、开源生态及硬件支持等方面的快速迭代与创新突破。

AI 视频生成细微表情
声启未来新章 BANG & OLUFSEN 铂傲推出全新Beo grace耳机

Bang & Olufsen推出全新无线耳机Beo Grace，融合纤薄铝制机身与卓越音质，体现品牌对声学创新与永恒设计的追求。耳机灵感源自高级珠宝，采用标志性抛光铝材打造，支持杜比全景声与自适应主动降噪技术，降噪效果较前代提升四倍。配备12毫米钛金属驱动单元，续航达4.5小时（搭配充电盒可达17小时），具备IP57防水防尘。通过NearTap™手势操控与定制电池管理系统，兼顾便捷使用与长效耐用，开启可佩戴声学新纪元。

Bang & Olufsen
华为MatePad mini劲敌！苹果iPad mini 8要来了：A19 Pro+OLED屏

苹果iPad mini系列称霸了多年的小平板，这两年迎来了很多新玩家的挑战，前不久发布的华为MatePad mini就是最具竞争力的一款，凭借着超轻薄、SIM卡等配置收到很多用户青睐。现在苹果的新一代应战者iPad mini 8也要来了，新品将会在明年上半年发布，起售价维持在499美元。根据泄露的代码显示，iPad Mini 8（代号J510/J511）预计搭载A19 Pro芯片，大概率是与iPhone Air同款的阉割版

iPad mini 8
REDMI K90系列10月亮相：REDMI最强旗舰

10月将有多款新机发布，包括vivo X300、荣耀Magic8、OPPO Find X9等。其中Redmi K90系列是Redmi最强高端旗舰，将推出K90和K90 Pro两款，分别搭载骁龙8 Elite和骁龙8 Elite Gen5芯片。后者采用高通自研第三代Oryon核心，安兔兔跑分超400万。K90 Pro还将配备潜望长焦镜头，成为K系列首款搭载该技术的机型，影像大幅升级，通过光学反射原理实现更长焦距，画质更优、拍摄更稳更远。

vivo X300系列荣耀Magic8系列
REDMI K90 Pro参数出炉产品经理：影像大升级

REDMI很快就会推出年度旗舰REDMI K90 Pro，该机对应的海外版本命名为POCO F8 Ultra。据悉，REDMI K90 Pro将会配备一颗5000万像素1/1.3英寸超大底主摄，对比上代K80 Pro的1/1.55英寸主摄，K90 Pro搭载了REDMI史上规格最强的主摄，并且支持OIS光学防抖。除此之外，REDMI K90 Pro还将配备潜望长焦镜头，这是REDMI K系列第一款拥有潜望镜头的旗舰，相较直立长焦，潜望长焦能够放下更大底更高质量�

REDMI K90 Pro
南卡QMic麦克风重磅发布：以专业声学革新，重塑领夹麦行业格局

南卡发布全新旗舰领夹麦克风QMic，凭借录音棚级高清音质与行业领先的AI深度降噪技术，解决了传统麦克风在复杂环境中音质不纯、噪声干扰、爆音失真等痛点。其搭载VLA人声建模引擎与AI-DNN2.5降噪系统，实现98%人声还原度与智能环境噪声分离，三重防爆音专利技术将爆音干扰削减90%以上。双核DSP架构支持毫秒级低延迟与250米超远距离稳定传输，适配短视频、直播、户外创作等多场景需求。QMic以软硬件协同创新重新定义领夹麦克风标准，推动行业从“能用”向“专业、稳定、智能”升级。

南卡领夹麦克风音质
突破 Mini LED！三星 Micro RGB 引航显示进入 Micro 时代

三星在京东方MALL举办“AI的呵护”家电线下体验展，展出全球首款Micro RGB电视115MR95F。该电视采用Micro RGB技术，实现100% BT.2020色域覆盖，色彩精准度与对比度达到新高度。搭载AI芯片优化画质，支持144Hz刷新率与杜比全景声，定价199,999元。三星借此布局超高端市场，展示Micro RGB+QD-OLED+Micro LED三大技术矩阵，重塑显示行业格局。

AI家电 Micro RGB电视
REDMI蓝牙音箱2发布：99元 5小时续航

9月25日，Redmi发布蓝牙音箱2，以99元首销价强势入局。产品提供三款时尚配色，机身采用网布包裹，质感出众且触感柔和。配备防滑脚垫和可拆卸金属挂扣，便于携带。支持IP67防尘防水，适合户外使用。内置2单元声学配置和1.5英寸5W扬声器，低音醇厚，人声清晰。功能上支持microSD卡直插播放、TWS互联立体声、蓝牙5.3稳定连接及USB声卡模式，兼容多设备。内置1000mAh电池，续航达5小时，Type-C充电便捷。集高性价比、丰富功能于一身，有望成为蓝牙音箱市场新选择。

蓝牙音箱 REDMI 高性价比
Miss Pep闪耀TikTok达人赛，以“时尚健康美学”燃爆纽约地标

2025年9月20日，纽约本土健康品牌Miss Pep受邀参加在American Dream Mall举办的“美国梦×TikTok达人明星全美品牌推广赛”。品牌通过产品展示、达人直播互动及宣讲，向日均超18万客流传递“健康与美缺一不可”理念。现场设置互动扫码送定制纹身贴等趣味活动，吸引大量潮流人士。多位顶流明星及达人助阵，结合线上线下联动直播，触达数百万粉丝，强化品牌认知。Miss Pep深耕健康美学30年，产品覆盖养颜、膳食补充等多领域，以“细胞级靶向修护+超天然成分”为核心，正加速全球化布局，覆盖超20国市场，致力成为健康美学的领军者。

品牌推广健康美学 TikTok营销
GMIF2025：慧荣科技展示从云端到边缘的AI存储主控技术

9月25日，第四届GMIF2025创新峰会在深圳湾万丽酒店召开，聚焦“AI应用，创新赋能”主题。慧荣科技总经理苟嘉章发表演讲，指出AI推动存储架构从“分层存储”向“存算融合”演进，存储成为AI计算关键环节。峰会展示了慧荣在数据中心、边缘与AI PC、车载嵌入式等领域的最新存储解决方案，并呼吁产业链协同创新，应对2026年可能出现的存储芯片紧缺局面。慧荣凭借主控芯片技术优势荣获“杰出主控技术创新奖”。

AI应用存算技术产业链协同

今日大家都在搜的词：

热文

3 天
7天

AI日报：字节推AI模型社区平台炉米Lumi；神秘大模型“小熊猫”身份揭晓；ChatGPT语音模式登陆Mac

荐AI日报：生数科技推出Vidu Q2；火山引擎推出炉米Lumi；通义千问开源300+模型

声启未来新章 BANG & OLUFSEN 铂傲推出全新Beo grace耳机

华为MatePad mini劲敌！苹果iPad mini 8要来了：A19 Pro+OLED屏

REDMI K90系列10月亮相：REDMI最强旗舰

REDMI K90 Pro参数出炉产品经理：影像大升级

南卡QMic麦克风重磅发布：以专业声学革新，重塑领夹麦行业格局

突破 Mini LED！三星 Micro RGB 引航显示进入 Micro 时代

REDMI蓝牙音箱2发布：99元 5小时续航

Miss Pep闪耀TikTok达人赛，以“时尚健康美学”燃爆纽约地标

GMIF2025：慧荣科技展示从云端到边缘的AI存储主控技术

今日大家都在搜的词：

热文

微信又更新了撤回消息有大变化：可撤回本次发送的全部消息

雷军：小米17系列首销权益延续至10月31日

比特币价格突破12.5万美元刷新历史最高纪录

小米回应“小米汽车突然自己开走”：排除车辆质量问题

小米17 1TB版明日开售售价5299元

雷军：小米17系列开售仅5天销量破100万台

腾讯混元图像3.0登顶LMArena榜一

乔布斯逝世14周年库克发文缅怀：我们深切怀念你

小米 17 标准版1TB版本 5299 元开售全系列销量同比增超20%

微信又更新了撤回消息有大变化：可撤回本次发送的全部消息

雷军：小米17系列首销权益延续至10月31日

站长商机