首页 > 业界 > 关键词  > Claude3.5最新资讯  > 正文

AI日报:Claude3.5重磅升级;Runway推生成式角色表演工具Act-One;​Ideogram上线图片魔法填充功能;Stable Diffusion3.5发布

2024-10-23 15:31 · 稿源:站长之家

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解:https://top.aibase.com/

1、告别昂贵动捕!Runway推生成式角色表演工具Act-One 视频秒变动画,多风格随意切换!

我被Runway最新推出的Act-One工具深深震撼!这项革命性技术利用生成式AI模型,仅凭演员的视频和语音输入,就能轻松生成栩栩如生的角色动画,彻底颠覆了传统的动画制作流程。无需昂贵设备和繁琐后期制作,任何人都能制作高质量动画作品。操作简单且能生成多种风格的角色动画,为创作者提供了极大的创作自由。

【AiBase提要:】

🎬 革命性技术利用生成式AI模型,仅凭演员视频和语音输入生成栩栩如生的角色动画,彻底颠覆传统制作流程。

💡 操作简单,能生成多种风格的角色动画,为创作者提供极大创作自由。

🌟 处理复杂的多轮对话场景,应用场景广泛,为动画行业带来全新时代。

详情链接:https://top.aibase.com/tool/runway

2、Ideogram上线Canvas功能:实现图片魔法填充、无缝扩展

Ideogram最新推出的Canvas功能为用户提供了强大的图像生成和编辑选项,让用户可以自由展开、对比、调整图像大小和顺序,甚至将多个图像结合成新作品。特别适合营销人员和内容创作者使用,提高创作效率与灵活性。

image.png

【AiBase提要:】

🖼️ 新功能 Canvas: Ideogram推出的新功能,支持图像生成与多种编辑选项。

✂️ 创意无限: 用户可以通过输入提示生成四张图像,随心所欲进行修改。

📈 高效创作: 特别适合营销人员和内容创作者,提高创作效率与灵活性。

3、Stability AI发布Stable Diffusion3.5系列文生图模型

Stability AI发布了最强大的模型Stable Diffusion3.5,包含三个版本的全家桶,满足多样化需求。模型具有高定制性、高效性能和多样化输出,可在消费级硬件上运行,支持全球图像生成。

微信截图_20241023082320.png

【AiBase提要:】

🔑 高定制性、高效性能和多样化输出

🔑 模型可在消费级硬件上运行,支持全球图像生成

🔑 宽松的社区许可,允许免费商用

详情链接:https://huggingface.co/spaces/stabilityai/stable-diffusion-3.5-large

4、Claude3.5重磅升级:Sonnet编码能力秒杀o1,Haiku性价比无敌,还会用电脑!

Anthropic发布了升级版Claude3.5Sonnet和全新模型Claude3.5Haiku,在推理、编码和视觉处理方面取得显著进步。Sonnet在业界领先,表现出色,甚至超越了OpenAI o1-preview等公开模型。而Haiku是Anthropic最快的模型,性能与Claude3Opus相当,但成本更低,速度更快。两款模型都具备使用计算机的能力,为自动化流程和个性化体验开辟新可能性。

【AiBase提要:】

🚀 Sonnet编码能力领先业界,超越公开模型,如OpenAI o1-preview。

💡 Haiku是Anthropic最快的模型,性价比高,适合个性化体验生成。

💻 模型具备使用计算机能力,为自动化流程和任务开辟新可能性。

5、Canva推出全新文生图工具Dream Lab,一键生成3D插图!

Canva最新推出的AI功能中,最引人注目的是Dream Lab工具,利用Leonardo.ai的Phoenix模型,用户可以通过描述生成各种风格的图像。除此之外,Canva的Magic AI工具套件也进行了更新,提升了文本生成准确性,并增加了白板和视频编辑的新功能。然而,Canva宣布将提高一些商业客户的订阅价格,引发用户对逐步改进和新功能的价值反应不一。

image.png

【AiBase提要:】

🎨 Canva推出的新图像生成工具“Dream Lab”利用Leonardo.ai的Phoenix模型,可以根据描述生成多种风格的图像。

✏️ Canva的“Magic”AI工具套件进行了更新,提升了文本生成准确性,并增加了白板和视频编辑的新功能。

💰 Canva宣布将提高一些商业客户的订阅价格,用户对逐步改进和新功能的价值反应不一。

6、扣子专业版模板商城发布:AI 最佳实践,一键复制

火山引擎推出的模板商城为用户提供了一种简单快捷的方式,让更多用户能够轻松使用AI能力,大幅提升工作效率和质量。商城内置多款源自AI最佳实践的优质模板,涵盖多个业务场景,用户可以一键复制并定制化应用。同时,商城还提供清晰分类和热门推荐,为用户带来更多可能性和灵感。

image.png

【AiBase提要:】

⚙️ 模板商城降低AI应用门槛,让更多用户能够轻松使用AI能力,提升工作效率和质量。

💡 商城内置多款源自AI最佳实践的优质模板,涵盖智能客服、内容营销等多个业务场景。

🚀 用户可以一键复制模板并定制化应用,缩短工作准备时间,提高效率。

7、Genmo 重磅开源视频生成模型 Mochi1:高画质、超流畅,家用电脑也能创作好莱坞级大片!

Genmo 公司开源的最新视频生成模型Mochi1在视频生成领域引起了轰动,其高画质、超流畅的特点让家用电脑也能创作好莱坞级大片。Mochi1采用创新的Asymmetric Diffusion Transformer(AsymmDiT)架构,拥有100亿个参数,完全从头开始训练,为开发者提供了极大便利。

【AiBase提要:】

💡 Mochi1采用创新的Asymmetric Diffusion Transformer(AsymmDiT)架构,拥有100亿个参数,是迄今为止公开发布的最大视频生成模型。

💡 Mochi1具有卓越的运动质量和对文本提示的精准遵循,能生成长达5.4秒、帧率高达30帧/秒的流畅视频。

💡 Mochi1能模拟各种物理现象,生成的人物动作自然流畅,为开发者提供了视频生成的新可能性。

详情链接:https://huggingface.co/genmo/mochi-1-preview

8、腾讯推出ima.Co pilot智能工作台产品

腾讯最新推出的ima.Co pilot智能工作台产品由混元大模型提供技术支持,旨在为用户提供全新的搜读写体验。该产品具备知识获取、个人知识库打造和智能写作辅助等核心功能,能够轻松管理和获取知识,提供定制化回答,辅助写作任务。腾讯表示将推出更多版本以满足用户需求,展示了在人工智能领域的深入探索和持续创新,提升工作效率和学习效率,为用户提供智能化辅助工具。

image.png

【AiBase提要:】

🔍 知识获取:用户可通过ima.C opilot基于全网信源问答,整合优质内容到个人知识库,轻松获取知识。

📚 个人知识库打造:产品支持用户打造专属知识库,提供定制化回答,激发工作和学习灵感。

✍️ 智能写作辅助:ima.C opilot能理解用户需求,辅助完成论文、作文、文案等写作任务。

详情链接:https://ima.qq.com/

9、PodCastLM来了!轻松将PDF文档转换为音频播客

PodCastLM是一款新推出的工具,旨在帮助用户将PDF文档内容转换为音频播客,提升信息传播的效率和趣味性。通过现代技术结合,用户可以轻松生成原创音频内容,节省时间和精力。

image.png

【AiBase提要:】

🔊 用户友好界面和流畅转换过程

🎙️ 转换PDF文档为音频播客

📚 适用于各类用户,如播客主播、内容创作者、教育工作者

详情链接:https://github.com/YOYZHANG/PodCastLM

10、Cohere推出多模态搜索模型Embed3

Cohere最新发布的多模态AI搜索模型Embed3支持通过文本和图像进行企业级检索,大幅提升图像搜索性能,助力企业挖掘数据价值。更新的API简化客户从其他模型切换的过程,提供更灵活的搜索体验。

image.png

【AiBase提要:】

🌟 用户可通过图像和文本进行多模态搜索

📈 更新后的模型大幅提升图像搜索性能,助力企业挖掘数据价值

🔄 更新的API简化客户从其他模型切换的过程

详情链接:https://cohere.com/blog/multimodal-embed-3

11、ChatGPT 高级语音模式登陆欧洲!

OpenAI最近将其ChatGPT高级语音模式扩展到欧盟等地区,实现与人类对话相媲美的响应速度。功能不仅在美国、英国用户中开放,还进行了多项改进,包括新增五种语音、自定义指令功能和对话内容记忆。与竞争对手Google的Gemini Live相比,ChatGPT提供更自然的对话体验和更高效的信息交互。

【AiBase提要:】

🚀 ChatGPT高级语音模式扩展到欧盟等地区,响应速度快,与人类对话媲美。

🔊 新增五种语音和自定义指令功能,用户可选择不同语音回应,控制ChatGPT行为。

💡 OpenAI在人工智能领域取得进一步突破,用户可享受更自然的对话体验和高效的信息交互。

12、法国AI创企Les Ministraux发布全新轻量级模型,性能超越Llama3!

Les Ministraux推出的Ministral3B和Ministral8B模型在边缘设备上表现出色,性能媲美开源模型,为用户提供高计算效率、低延迟的解决方案。然而,Mistral公司最近陷入争议,不再像以前那样开放,可能被微软收购。

【AiBase提要:】

🚀 Ministral3B和Ministral8B性能超越Llama38B和Mistral7B,Ministral8B在除代码能力外其他方面优于前者。

💡 Ministral3B和Ministral8B支持高达128k的上下文,为低于10B参数的模型树立新标杆,Ministral8B配备滑动窗口注意机制。

⚙️ Les Ministraux模型可应用于管理AI智能体工作流程、创建任务助手等场景,Ministral8B的价格为每百万token0.1美元,Ministral3B为每百万token0.04美元。

详情链接:https://mistral.ai/news/ministraux/

13、秒杀人类!AI香水调配师来了,几秒钟就能开发高品质香水

NotCo与Cramer联手推出的NotCo生成式AI香水调配师革新产品,简化了香水研发流程,提高效率和创造性。经过盲测验证,AI生成的香水被评为“市场就绪”,展示了其实际应用潜力。AI技术的引入为香水行业注入新活力,展示了未来香水市场的更多可能性。

image.png

【AiBase提要:】

🌟 NotCo与Cramer推出了NotCo生成式AI香水调配师,能在几秒钟内快速开发高品质香水。

💡 AI技术的引入极大简化了香水的研发流程,使其更高效且具有创造性。

✅ 经过盲测的AI香水已被专业调香师评估为“市场就绪”产品,展示了其实际应用潜力。

14、AI智能指环L-Ring2来了!集成ChatGPT4o,实时翻译、语音转文本、手势控制通通支持

L-Ring2是一款智能指环,集成了先进的人工智能技术,支持实时翻译、语音转文本、手势控制等功能。它不仅外观时尚,功能强大,而且耐用性高,适用于各种环境。这款智能设备能提供无缝的智能支持,让用户在工作和娱乐中享受便利。

image.png

【AiBase提要:】

🌟 L-Ring2集成AI助手,提供实时翻译和会议记录等智能服务。

🌍 作为空气鼠标,方便用户在电脑和幻灯片间自由切换。

📱 手势控制和Air Mouse技术让设备管理变得简单便捷。

举报

  • 相关推荐
  • “无限量”供应Claude,就是AI IDE们的百亿补贴

    Anthropic于2025年7月28日宣布,将从8月28日起对Claude Code工具新增每周调用限额——因为少数重度用户全天候高频使用,一次使用成本甚至高达数万美元,远远超过普通订阅预期。 同样在上个月,Cursor曾因其“I’ll keep it unlimited”的Pro收费模式悄然变更为计算tokens限制,导致大量用户抱怨“实际上并非无限”,纷纷在社群中吐槽,迫使公司CEO出面道歉、甚至给出退款补偿。 这两�

  • GPT-5和Claude 4 Opus谁更强?用这个AI大模型对比工具一眼明了

    OpenAI正式发布GPT-5,与Claude4Opus和Gemini2.5Pro进行对比测试。GPT-5在编程能力(SWE-bench测试74.9%)和数学推理(AIME2025测试94.6%)表现突出;Claude4Opus编程优异(72.5%)但数学较弱(33.9%);Gemini2.5Pro擅长长文本处理(100万token窗口)和多模态应用。价格方面,GPT-5和Gemini2.5Pro定价相近($1.25-$10),Claude4Opus较高($15-$75)。建议根据需求选择:GPT-5适合综合应用,Claude4Opus适合专业编程,Gemini2.5Pro适合长文档�

  • GPT-5正式发布:与Claude 4、Gemini 2.5等主流大模型谁更胜一筹?

    2025年8月7日,OpenAI正式发布GPT-5,官方称其为"最智能、最快速、最实用"的AI模型。GPT-5在数学推理能力上大幅提升,在AIME2025测试中取得94.6%的高分,处理速度也有明显改善。但与竞争对手相比仍存在差距:Claude4在代码生成和逻辑推理方面表现优异,支持200K token长文本;Gemini2.5具备2M超大上下文窗口和全模态支持;国产模型DeepSeek R1在中文理解和性价比方面具有优势。AI�

  • AI日报:百度推全球首批AI数字员工;Claude Opus4.1出世;谷歌DeepMind发布世界模型Genie 3

    AI日报栏目聚焦人工智能领域最新动态:1)Claude Opus4.1发布,编程能力提升74.5%;2)OpenAI开源GPT-OSS-120B和20B模型;3)谷歌DeepMind推出革命性3D世界模型Genie3;4)谷歌Gemini新增AI故事书生成功能;5)ElevenLabs推出商用AI音乐生成器;6)百度智能云发布首批AI数字员工;7)OpenAI估值或达5000亿美元;8)00后创业者推出云端AI协作开发工具Vinsoo;9)腾讯启动2026校园招聘,重点培养AI人才;10)马斯克宣�

  • 蓝耘元生代MaaS × Kimi K2 × Claude CodeUI,开启编程效率革命

    蓝戟元生代MaaS平台推出"Kimi K2×Claude CodeUI"AI编程解决方案,通过国产首个万亿参数MoE架构开源模型Kimi K2驱动Claude Code,实现本地化部署。该方案具有三大优势:1)成本直降90%,免翻墙使用;2)支持128K超长上下文处理,编程能力超越主流模型;3)提供600万token免费额度。平台采用交互式界面设计,支持移动端操作和WebSocket通信,集成文件管理、Git工具和会话追踪功能,�

  • GPT-4.5和Claude4哪家强?一文看懂优劣差异,附最实用AI大模型对比工具!

    文章对比分析了GPT-4.5和Claude4两大AI模型的性能差异:GPT-4.5在响应速度、编程能力和生态开放度上占优,适合实时对话和内容创作;Claude4则在长文本处理(200k+上下文)、安全性和企业适配性方面表现突出。推荐使用AIbase的模型对比工具(https://model.aibase.com/zh/compar)进行多维度智能筛选,根据具体场景(如客服、写作、编程等)选择最适合的模型。核心结论:没有绝对优劣,�

  • 小米智能摄像机4C 3.5K发布:支持600万像素 售价199元

    小米8月8日发布智能摄像机4C 3.5K,售价199元,8月11日开售。该产品搭载600万像素传感器,支持3.5K高清画质,配备8颗940nm红外补光灯,夜间成像清晰。创新性加入物理隐私遮蔽功能,镜头可收入机身实现物理遮挡,支持定时自动遮蔽。内置1T算力AI芯片,支持人形追踪、宠物检测等功能,识别更快更准。支持双频Wi-Fi6技术,内置米家安全芯片保障数据安全。深度接入米家生态,可智能联动空调、灯具等设备,提升家居智能化体验。

  • AI日报:可灵2.1推出全新首尾帧功能;昆仑万维上线AI音乐模型Mureka V7.5;腾讯云推出AI开发工具CloudBase AI CLI

    本文介绍了AI领域最新动态:1)快手可灵2.1推出首尾帧功能,提升视频生成效果;2)昆仑万维发布Mureka V7.5音乐模型,优化人声表现;3)腾讯云推出AI开发工具CloudBase AI CLI,可减少80%编码量;4)海外新品MuleRun通过虚拟机和AI Agent带来创新游戏体验;5)Meta开源DINOv3视觉模型,无需标注即可实现卓越性能;6)宇树科技人形机器人H1获1500米赛跑金牌;7)谷歌Gemini新增记忆功能和隐私聊天模式;8)香港大学开源OpenCUA框架,打造个性化电脑助手;9)OpenAI考虑在ChatGPT引入广告;10)谷歌发布超小型开源模型Gemma 3 270M,支持手机端运行。

  • AI大模型选型决策指南:10分钟数据对比 Gemini 2.5 Flash-Lite 与 DeepSeek R1

    本文探讨大模型选型困境与解决方案。2025年全球可调用大模型超300个,但选型面临三大难题:单位混乱、定价波动快、87%团队无法量化模型价值。提出三层漏斗筛选法:1)场景刚需筛选80%选项;2)验证核心性能;3)评估边际效益。以Gemini和DeepSeek为例,前者适合常规FAQ场景年省$16,000,后者适用于金融计算场景可降低15%人工复核。建议建立动态评估体系,将3小时选型会议压缩至18分钟,错误率下降40%。核心观点:选型应从参数争论转向场景验证,通过自动化工具为工程师节省时间,聚焦提示词优化而非参数对比。

  • 越普通越出彩,达成千万级DAU成就的厂商迎来第2个爆款?

    自从「Block Blast!」在2023年横空出世,Hungry Studio 一下子跃入了大众视野,在这个时间点将看似普通的方块玩法做出了千万级日活用户,是很难想象的事情(参见文章《“爆发”4千万DAU的“小方块”,背后故事是什么?| 对话一线》)。 之前的对话,我们浅显了解了他们的“方法论”,也更加好奇他们的下一次实践。

今日大家都在搜的词: