AI日报：Claude3.5重磅升级；Runway推生成式角色表演工具Act-One；Ideogram上线图片魔法填充功能；Stable Diffusion3.5发布

2024-10-23 15:31 · 稿源：站长之家

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解:https://top.aibase.com/

1、告别昂贵动捕!Runway推生成式角色表演工具Act-One 视频秒变动画，多风格随意切换!

我被Runway最新推出的Act-One工具深深震撼!这项革命性技术利用生成式AI模型，仅凭演员的视频和语音输入，就能轻松生成栩栩如生的角色动画，彻底颠覆了传统的动画制作流程。无需昂贵设备和繁琐后期制作，任何人都能制作高质量动画作品。操作简单且能生成多种风格的角色动画，为创作者提供了极大的创作自由。

【AiBase提要:】
🎬 革命性技术利用生成式AI模型，仅凭演员视频和语音输入生成栩栩如生的角色动画，彻底颠覆传统制作流程。
💡 操作简单，能生成多种风格的角色动画，为创作者提供极大创作自由。
🌟 处理复杂的多轮对话场景，应用场景广泛，为动画行业带来全新时代。
详情链接:https://top.aibase.com/tool/runway

2、Ideogram上线Canvas功能:实现图片魔法填充、无缝扩展

Ideogram最新推出的Canvas功能为用户提供了强大的图像生成和编辑选项，让用户可以自由展开、对比、调整图像大小和顺序，甚至将多个图像结合成新作品。特别适合营销人员和内容创作者使用，提高创作效率与灵活性。

【AiBase提要:】
🖼️ 新功能 Canvas: Ideogram推出的新功能，支持图像生成与多种编辑选项。
✂️ 创意无限: 用户可以通过输入提示生成四张图像，随心所欲进行修改。
📈 高效创作: 特别适合营销人员和内容创作者，提高创作效率与灵活性。

3、Stability AI发布Stable Diffusion3.5系列文生图模型

Stability AI发布了最强大的模型Stable Diffusion3.5，包含三个版本的全家桶，满足多样化需求。模型具有高定制性、高效性能和多样化输出，可在消费级硬件上运行，支持全球图像生成。

微信截图_20241023082320.png

【AiBase提要:】
🔑 高定制性、高效性能和多样化输出
🔑 模型可在消费级硬件上运行，支持全球图像生成
🔑 宽松的社区许可，允许免费商用
详情链接:https://huggingface.co/spaces/stabilityai/stable-diffusion-3.5-large

4、Claude3.5重磅升级:Sonnet编码能力秒杀o1，Haiku性价比无敌，还会用电脑!

Anthropic发布了升级版Claude3.5Sonnet和全新模型Claude3.5Haiku，在推理、编码和视觉处理方面取得显著进步。Sonnet在业界领先，表现出色，甚至超越了OpenAI o1-preview等公开模型。而Haiku是Anthropic最快的模型，性能与Claude3Opus相当，但成本更低，速度更快。两款模型都具备使用计算机的能力，为自动化流程和个性化体验开辟新可能性。

【AiBase提要:】
🚀 Sonnet编码能力领先业界，超越公开模型，如OpenAI o1-preview。
💡 Haiku是Anthropic最快的模型，性价比高，适合个性化体验生成。
💻 模型具备使用计算机能力，为自动化流程和任务开辟新可能性。

5、Canva推出全新文生图工具Dream Lab，一键生成3D插图!

Canva最新推出的AI功能中，最引人注目的是Dream Lab工具，利用Leonardo.ai的Phoenix模型，用户可以通过描述生成各种风格的图像。除此之外，Canva的Magic AI工具套件也进行了更新，提升了文本生成准确性，并增加了白板和视频编辑的新功能。然而，Canva宣布将提高一些商业客户的订阅价格，引发用户对逐步改进和新功能的价值反应不一。

【AiBase提要:】
🎨 Canva推出的新图像生成工具“Dream Lab”利用Leonardo.ai的Phoenix模型，可以根据描述生成多种风格的图像。
✏️ Canva的“Magic”AI工具套件进行了更新，提升了文本生成准确性，并增加了白板和视频编辑的新功能。
💰 Canva宣布将提高一些商业客户的订阅价格，用户对逐步改进和新功能的价值反应不一。

6、扣子专业版模板商城发布：AI 最佳实践，一键复制

火山引擎推出的模板商城为用户提供了一种简单快捷的方式，让更多用户能够轻松使用AI能力，大幅提升工作效率和质量。商城内置多款源自AI最佳实践的优质模板，涵盖多个业务场景，用户可以一键复制并定制化应用。同时，商城还提供清晰分类和热门推荐，为用户带来更多可能性和灵感。

【AiBase提要:】
⚙️ 模板商城降低AI应用门槛，让更多用户能够轻松使用AI能力，提升工作效率和质量。
💡 商城内置多款源自AI最佳实践的优质模板，涵盖智能客服、内容营销等多个业务场景。
🚀 用户可以一键复制模板并定制化应用，缩短工作准备时间，提高效率。

7、Genmo 重磅开源视频生成模型 Mochi1:高画质、超流畅，家用电脑也能创作好莱坞级大片!

Genmo 公司开源的最新视频生成模型Mochi1在视频生成领域引起了轰动，其高画质、超流畅的特点让家用电脑也能创作好莱坞级大片。Mochi1采用创新的Asymmetric Diffusion Transformer（AsymmDiT）架构，拥有100亿个参数，完全从头开始训练，为开发者提供了极大便利。

【AiBase提要:】
💡 Mochi1采用创新的Asymmetric Diffusion Transformer（AsymmDiT）架构，拥有100亿个参数，是迄今为止公开发布的最大视频生成模型。
💡 Mochi1具有卓越的运动质量和对文本提示的精准遵循，能生成长达5.4秒、帧率高达30帧/秒的流畅视频。
💡 Mochi1能模拟各种物理现象，生成的人物动作自然流畅，为开发者提供了视频生成的新可能性。
详情链接:https://huggingface.co/genmo/mochi-1-preview

8、腾讯推出ima.Co pilot智能工作台产品

腾讯最新推出的ima.Co pilot智能工作台产品由混元大模型提供技术支持，旨在为用户提供全新的搜读写体验。该产品具备知识获取、个人知识库打造和智能写作辅助等核心功能，能够轻松管理和获取知识，提供定制化回答，辅助写作任务。腾讯表示将推出更多版本以满足用户需求，展示了在人工智能领域的深入探索和持续创新，提升工作效率和学习效率，为用户提供智能化辅助工具。

【AiBase提要:】
🔍 知识获取:用户可通过ima.C opilot基于全网信源问答，整合优质内容到个人知识库，轻松获取知识。
📚 个人知识库打造:产品支持用户打造专属知识库，提供定制化回答，激发工作和学习灵感。
✍️ 智能写作辅助:ima.C opilot能理解用户需求，辅助完成论文、作文、文案等写作任务。
详情链接:https://ima.qq.com/

9、PodCastLM来了!轻松将PDF文档转换为音频播客

PodCastLM是一款新推出的工具，旨在帮助用户将PDF文档内容转换为音频播客，提升信息传播的效率和趣味性。通过现代技术结合，用户可以轻松生成原创音频内容，节省时间和精力。

【AiBase提要:】
🔊 用户友好界面和流畅转换过程
🎙️ 转换PDF文档为音频播客
📚 适用于各类用户，如播客主播、内容创作者、教育工作者
详情链接:https://github.com/YOYZHANG/PodCastLM

10、Cohere推出多模态搜索模型Embed3

Cohere最新发布的多模态AI搜索模型Embed3支持通过文本和图像进行企业级检索，大幅提升图像搜索性能，助力企业挖掘数据价值。更新的API简化客户从其他模型切换的过程，提供更灵活的搜索体验。

【AiBase提要:】
🌟 用户可通过图像和文本进行多模态搜索
📈 更新后的模型大幅提升图像搜索性能，助力企业挖掘数据价值
🔄 更新的API简化客户从其他模型切换的过程
详情链接:https://cohere.com/blog/multimodal-embed-3

11、ChatGPT 高级语音模式登陆欧洲!

OpenAI最近将其ChatGPT高级语音模式扩展到欧盟等地区，实现与人类对话相媲美的响应速度。功能不仅在美国、英国用户中开放，还进行了多项改进，包括新增五种语音、自定义指令功能和对话内容记忆。与竞争对手Google的Gemini Live相比，ChatGPT提供更自然的对话体验和更高效的信息交互。

【AiBase提要:】
🚀 ChatGPT高级语音模式扩展到欧盟等地区，响应速度快，与人类对话媲美。
🔊 新增五种语音和自定义指令功能，用户可选择不同语音回应，控制ChatGPT行为。
💡 OpenAI在人工智能领域取得进一步突破，用户可享受更自然的对话体验和高效的信息交互。

12、法国AI创企Les Ministraux发布全新轻量级模型，性能超越Llama3!

Les Ministraux推出的Ministral3B和Ministral8B模型在边缘设备上表现出色，性能媲美开源模型，为用户提供高计算效率、低延迟的解决方案。然而，Mistral公司最近陷入争议，不再像以前那样开放，可能被微软收购。

【AiBase提要:】
🚀 Ministral3B和Ministral8B性能超越Llama38B和Mistral7B，Ministral8B在除代码能力外其他方面优于前者。
💡 Ministral3B和Ministral8B支持高达128k的上下文，为低于10B参数的模型树立新标杆，Ministral8B配备滑动窗口注意机制。
⚙️ Les Ministraux模型可应用于管理AI智能体工作流程、创建任务助手等场景，Ministral8B的价格为每百万token0.1美元，Ministral3B为每百万token0.04美元。
详情链接:https://mistral.ai/news/ministraux/

13、秒杀人类!AI香水调配师来了，几秒钟就能开发高品质香水

NotCo与Cramer联手推出的NotCo生成式AI香水调配师革新产品，简化了香水研发流程，提高效率和创造性。经过盲测验证，AI生成的香水被评为“市场就绪”，展示了其实际应用潜力。AI技术的引入为香水行业注入新活力，展示了未来香水市场的更多可能性。

【AiBase提要:】
🌟 NotCo与Cramer推出了NotCo生成式AI香水调配师，能在几秒钟内快速开发高品质香水。
💡 AI技术的引入极大简化了香水的研发流程，使其更高效且具有创造性。
✅ 经过盲测的AI香水已被专业调香师评估为“市场就绪”产品，展示了其实际应用潜力。

14、AI智能指环L-Ring2来了!集成ChatGPT4o，实时翻译、语音转文本、手势控制通通支持

L-Ring2是一款智能指环，集成了先进的人工智能技术，支持实时翻译、语音转文本、手势控制等功能。它不仅外观时尚，功能强大，而且耐用性高，适用于各种环境。这款智能设备能提供无缝的智能支持，让用户在工作和娱乐中享受便利。

【AiBase提要:】
🌟 L-Ring2集成AI助手，提供实时翻译和会议记录等智能服务。
🌍 作为空气鼠标，方便用户在电脑和幻灯片间自由切换。
📱 手势控制和Air Mouse技术让设备管理变得简单便捷。

（举报）

相关推荐

关键词：

Claude3.5

“无限量”供应Claude，就是AI IDE们的百亿补贴

Anthropic于2025年7月28日宣布，将从8月28日起对Claude Code工具新增每周调用限额——因为少数重度用户全天候高频使用，一次使用成本甚至高达数万美元，远远超过普通订阅预期。同样在上个月，Cursor曾因其“I’ll keep it unlimited”的Pro收费模式悄然变更为计算tokens限制，导致大量用户抱怨“实际上并非无限”，纷纷在社群中吐槽，迫使公司CEO出面道歉、甚至给出退款补偿。这两�

文章搜索核心标签 AI工具
GPT-5和Claude 4 Opus谁更强？用这个AI大模型对比工具一眼明了

OpenAI正式发布GPT-5，与Claude4Opus和Gemini2.5Pro进行对比测试。GPT-5在编程能力(SWE-bench测试74.9%)和数学推理(AIME2025测试94.6%)表现突出；Claude4Opus编程优异(72.5%)但数学较弱(33.9%)；Gemini2.5Pro擅长长文本处理(100万token窗口)和多模态应用。价格方面，GPT-5和Gemini2.5Pro定价相近($1.25-$10)，Claude4Opus较高($15-$75)。建议根据需求选择：GPT-5适合综合应用，Claude4Opus适合专业编程，Gemini2.5Pro适合长文档�

GPT-5发布大语言模型性能对比
GPT-5正式发布：与Claude 4、Gemini 2.5等主流大模型谁更胜一筹？

2025年8月7日，OpenAI正式发布GPT-5，官方称其为"最智能、最快速、最实用"的AI模型。GPT-5在数学推理能力上大幅提升，在AIME2025测试中取得94.6%的高分，处理速度也有明显改善。但与竞争对手相比仍存在差距：Claude4在代码生成和逻辑推理方面表现优异，支持200K token长文本；Gemini2.5具备2M超大上下文窗口和全模态支持；国产模型DeepSeek R1在中文理解和性价比方面具有优势。AI�
荐AI日报：百度推全球首批AI数字员工；Claude Opus4.1出世；谷歌DeepMind发布世界模型Genie 3

AI日报栏目聚焦人工智能领域最新动态：1)Claude Opus4.1发布，编程能力提升74.5%；2)OpenAI开源GPT-OSS-120B和20B模型；3)谷歌DeepMind推出革命性3D世界模型Genie3；4)谷歌Gemini新增AI故事书生成功能；5)ElevenLabs推出商用AI音乐生成器；6)百度智能云发布首批AI数字员工；7)OpenAI估值或达5000亿美元；8)00后创业者推出云端AI协作开发工具Vinsoo；9)腾讯启动2026校园招聘，重点培养AI人才；10)马斯克宣�

人工智能编程能力数据分析
蓝耘元生代MaaS × Kimi K2 × Claude CodeUI，开启编程效率革命

蓝戟元生代MaaS平台推出"Kimi K2×Claude CodeUI"AI编程解决方案，通过国产首个万亿参数MoE架构开源模型Kimi K2驱动Claude Code，实现本地化部署。该方案具有三大优势：1）成本直降90%，免翻墙使用；2）支持128K超长上下文处理，编程能力超越主流模型；3）提供600万token免费额度。平台采用交互式界面设计，支持移动端操作和WebSocket通信，集成文件管理、Git工具和会话追踪功能，�

AI编程 Claude Code
GPT-4.5和Claude4哪家强?一文看懂优劣差异，附最实用AI大模型对比工具!

文章对比分析了GPT-4.5和Claude4两大AI模型的性能差异：GPT-4.5在响应速度、编程能力和生态开放度上占优，适合实时对话和内容创作；Claude4则在长文本处理（200k+上下文）、安全性和企业适配性方面表现突出。推荐使用AIbase的模型对比工具（https://model.aibase.com/zh/compar）进行多维度智能筛选，根据具体场景（如客服、写作、编程等）选择最适合的模型。核心结论：没有绝对优劣，�

AI大模型 GPT-4.5 Claude
小米智能摄像机4C 3.5K发布：支持600万像素售价199元

小米8月8日发布智能摄像机4C 3.5K，售价199元，8月11日开售。该产品搭载600万像素传感器，支持3.5K高清画质，配备8颗940nm红外补光灯，夜间成像清晰。创新性加入物理隐私遮蔽功能，镜头可收入机身实现物理遮挡，支持定时自动遮蔽。内置1T算力AI芯片，支持人形追踪、宠物检测等功能，识别更快更准。支持双频Wi-Fi6技术，内置米家安全芯片保障数据安全。深度接入米家生态，可智能联动空调、灯具等设备，提升家居智能化体验。

小米智能摄像机智能安防隐私保护
荐AI日报：可灵2.1推出全新首尾帧功能；昆仑万维上线AI音乐模型Mureka V7.5；腾讯云推出AI开发工具CloudBase AI CLI

本文介绍了AI领域最新动态：1)快手可灵2.1推出首尾帧功能，提升视频生成效果；2)昆仑万维发布Mureka V7.5音乐模型，优化人声表现；3)腾讯云推出AI开发工具CloudBase AI CLI，可减少80%编码量；4)海外新品MuleRun通过虚拟机和AI Agent带来创新游戏体验；5)Meta开源DINOv3视觉模型，无需标注即可实现卓越性能；6)宇树科技人形机器人H1获1500米赛跑金牌；7)谷歌Gemini新增记忆功能和隐私聊天模式；8)香港大学开源OpenCUA框架，打造个性化电脑助手；9)OpenAI考虑在ChatGPT引入广告；10)谷歌发布超小型开源模型Gemma 3 270M，支持手机端运行。

AI日报快手可灵视频生成
AI大模型选型决策指南：10分钟数据对比 Gemini 2.5 Flash-Lite 与 DeepSeek R1

本文探讨大模型选型困境与解决方案。2025年全球可调用大模型超300个，但选型面临三大难题：单位混乱、定价波动快、87%团队无法量化模型价值。提出三层漏斗筛选法：1)场景刚需筛选80%选项；2)验证核心性能；3)评估边际效益。以Gemini和DeepSeek为例，前者适合常规FAQ场景年省$16,000，后者适用于金融计算场景可降低15%人工复核。建议建立动态评估体系，将3小时选型会议压缩至18分钟，错误率下降40%。核心观点：选型应从参数争论转向场景验证，通过自动化工具为工程师节省时间，聚焦提示词优化而非参数对比。

文章搜索核心标签模型适配
荐越普通越出彩，达成千万级DAU成就的厂商迎来第2个爆款？

自从「Block Blast!」在2023年横空出世，Hungry Studio 一下子跃入了大众视野，在这个时间点将看似普通的方块玩法做出了千万级日活用户，是很难想象的事情（参见文章《“爆发”4千万DAU的“小方块”，背后故事是什么?| 对话一线》）。之前的对话，我们浅显了解了他们的“方法论”，也更加好奇他们的下一次实践。

文章搜索核心标签白鲸出海

今日大家都在搜的词：

热文

3 天
7天

AI日报：Claude3.5重磅升级；Runway推生成式角色表演工具Act-One；Ideogram上线图片魔法填充功能；Stable Diffusion3.5发布

“无限量”供应Claude，就是AI IDE们的百亿补贴

GPT-5和Claude 4 Opus谁更强？用这个AI大模型对比工具一眼明了

GPT-5正式发布：与Claude 4、Gemini 2.5等主流大模型谁更胜一筹？

荐AI日报：百度推全球首批AI数字员工；Claude Opus4.1出世；谷歌DeepMind发布世界模型Genie 3

蓝耘元生代MaaS × Kimi K2 × Claude CodeUI，开启编程效率革命

GPT-4.5和Claude4哪家强?一文看懂优劣差异，附最实用AI大模型对比工具!

小米智能摄像机4C 3.5K发布：支持600万像素售价199元

荐AI日报：可灵2.1推出全新首尾帧功能；昆仑万维上线AI音乐模型Mureka V7.5；腾讯云推出AI开发工具CloudBase AI CLI

AI大模型选型决策指南：10分钟数据对比 Gemini 2.5 Flash-Lite 与 DeepSeek R1

荐越普通越出彩，达成千万级DAU成就的厂商迎来第2个爆款？

今日大家都在搜的词：

热文

苹果iOS 18.6.1正式版发布：美版Apple Watch血氧功能上线

AI日报：腾讯混元开源Hunyuan-GameCraft；最强图像编辑器nano-

华为MatePad Air新款官宣8月15日发布

REDMI Note 15 Pro系列官宣下周发布

华为MatePad Air 12英寸2025发布：售价2799元起

AI日报：可灵2.1推出全新首尾帧功能；昆仑万维上线AI音乐模型M

微信聊天可以引用部分文字了！还可用表情包回复

华为MatePad 11.5 S 2025发布：预装鸿蒙5 首发售价2099元起

苹果正式入驻小红书 iPhone 17系列下月发布

苹果iOS 18.6.1正式版发布：美版Apple Watch血氧功能上线

iPhone17Pro最新外观曝光：苹果调整天线布局

AI日报：昆仑万维发布SkyReels-A3模型；百度搜索PC端全面上线A

全球首款女团机器人10580元拍出接入京东Joy Inside智能体

AI日报：智谱视觉推理模型GLM-4.5V开源；达摩院开源三项具身智

AI日报：腾讯混元开源Hunyuan-GameCraft；最强图像编辑器nano-

REDMI Note 15 Pro系列官宣本月发布

京东养车50亿补贴更名震骨价号称补贴不「唬」

雷军发起小米YU7版本更名投票称小米YU7标准版绝非丐版

REDMI Turbo 5已备案：首发天玑8500处理器

站长商机

AI日报：Claude3.5重磅升级；Runway推生成式角色表演工具Act-One；​Ideogram上线图片魔法填充功能；Stable Diffusion3.5发布

今日大家都在搜的词：

热文

站长商机

AI日报：Claude3.5重磅升级；Runway推生成式角色表演工具Act-One；Ideogram上线图片魔法填充功能；Stable Diffusion3.5发布