首页 > 业界 > 关键词  > Claude3.5最新资讯  > 正文

AI日报:Claude3.5重磅升级;Runway推生成式角色表演工具Act-One;​Ideogram上线图片魔法填充功能;Stable Diffusion3.5发布

2024-10-23 15:31 · 稿源:站长之家

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解:https://top.aibase.com/

1、告别昂贵动捕!Runway推生成式角色表演工具Act-One 视频秒变动画,多风格随意切换!

我被Runway最新推出的Act-One工具深深震撼!这项革命性技术利用生成式AI模型,仅凭演员的视频和语音输入,就能轻松生成栩栩如生的角色动画,彻底颠覆了传统的动画制作流程。无需昂贵设备和繁琐后期制作,任何人都能制作高质量动画作品。操作简单且能生成多种风格的角色动画,为创作者提供了极大的创作自由。

【AiBase提要:】

🎬 革命性技术利用生成式AI模型,仅凭演员视频和语音输入生成栩栩如生的角色动画,彻底颠覆传统制作流程。

💡 操作简单,能生成多种风格的角色动画,为创作者提供极大创作自由。

🌟 处理复杂的多轮对话场景,应用场景广泛,为动画行业带来全新时代。

详情链接:https://top.aibase.com/tool/runway

2、Ideogram上线Canvas功能:实现图片魔法填充、无缝扩展

Ideogram最新推出的Canvas功能为用户提供了强大的图像生成和编辑选项,让用户可以自由展开、对比、调整图像大小和顺序,甚至将多个图像结合成新作品。特别适合营销人员和内容创作者使用,提高创作效率与灵活性。

image.png

【AiBase提要:】

🖼️ 新功能 Canvas: Ideogram推出的新功能,支持图像生成与多种编辑选项。

✂️ 创意无限: 用户可以通过输入提示生成四张图像,随心所欲进行修改。

📈 高效创作: 特别适合营销人员和内容创作者,提高创作效率与灵活性。

3、Stability AI发布Stable Diffusion3.5系列文生图模型

Stability AI发布了最强大的模型Stable Diffusion3.5,包含三个版本的全家桶,满足多样化需求。模型具有高定制性、高效性能和多样化输出,可在消费级硬件上运行,支持全球图像生成。

微信截图_20241023082320.png

【AiBase提要:】

🔑 高定制性、高效性能和多样化输出

🔑 模型可在消费级硬件上运行,支持全球图像生成

🔑 宽松的社区许可,允许免费商用

详情链接:https://huggingface.co/spaces/stabilityai/stable-diffusion-3.5-large

4、Claude3.5重磅升级:Sonnet编码能力秒杀o1,Haiku性价比无敌,还会用电脑!

Anthropic发布了升级版Claude3.5Sonnet和全新模型Claude3.5Haiku,在推理、编码和视觉处理方面取得显著进步。Sonnet在业界领先,表现出色,甚至超越了OpenAI o1-preview等公开模型。而Haiku是Anthropic最快的模型,性能与Claude3Opus相当,但成本更低,速度更快。两款模型都具备使用计算机的能力,为自动化流程和个性化体验开辟新可能性。

【AiBase提要:】

🚀 Sonnet编码能力领先业界,超越公开模型,如OpenAI o1-preview。

💡 Haiku是Anthropic最快的模型,性价比高,适合个性化体验生成。

💻 模型具备使用计算机能力,为自动化流程和任务开辟新可能性。

5、Canva推出全新文生图工具Dream Lab,一键生成3D插图!

Canva最新推出的AI功能中,最引人注目的是Dream Lab工具,利用Leonardo.ai的Phoenix模型,用户可以通过描述生成各种风格的图像。除此之外,Canva的Magic AI工具套件也进行了更新,提升了文本生成准确性,并增加了白板和视频编辑的新功能。然而,Canva宣布将提高一些商业客户的订阅价格,引发用户对逐步改进和新功能的价值反应不一。

image.png

【AiBase提要:】

🎨 Canva推出的新图像生成工具“Dream Lab”利用Leonardo.ai的Phoenix模型,可以根据描述生成多种风格的图像。

✏️ Canva的“Magic”AI工具套件进行了更新,提升了文本生成准确性,并增加了白板和视频编辑的新功能。

💰 Canva宣布将提高一些商业客户的订阅价格,用户对逐步改进和新功能的价值反应不一。

6、扣子专业版模板商城发布:AI 最佳实践,一键复制

火山引擎推出的模板商城为用户提供了一种简单快捷的方式,让更多用户能够轻松使用AI能力,大幅提升工作效率和质量。商城内置多款源自AI最佳实践的优质模板,涵盖多个业务场景,用户可以一键复制并定制化应用。同时,商城还提供清晰分类和热门推荐,为用户带来更多可能性和灵感。

image.png

【AiBase提要:】

⚙️ 模板商城降低AI应用门槛,让更多用户能够轻松使用AI能力,提升工作效率和质量。

💡 商城内置多款源自AI最佳实践的优质模板,涵盖智能客服、内容营销等多个业务场景。

🚀 用户可以一键复制模板并定制化应用,缩短工作准备时间,提高效率。

7、Genmo 重磅开源视频生成模型 Mochi1:高画质、超流畅,家用电脑也能创作好莱坞级大片!

Genmo 公司开源的最新视频生成模型Mochi1在视频生成领域引起了轰动,其高画质、超流畅的特点让家用电脑也能创作好莱坞级大片。Mochi1采用创新的Asymmetric Diffusion Transformer(AsymmDiT)架构,拥有100亿个参数,完全从头开始训练,为开发者提供了极大便利。

【AiBase提要:】

💡 Mochi1采用创新的Asymmetric Diffusion Transformer(AsymmDiT)架构,拥有100亿个参数,是迄今为止公开发布的最大视频生成模型。

💡 Mochi1具有卓越的运动质量和对文本提示的精准遵循,能生成长达5.4秒、帧率高达30帧/秒的流畅视频。

💡 Mochi1能模拟各种物理现象,生成的人物动作自然流畅,为开发者提供了视频生成的新可能性。

详情链接:https://huggingface.co/genmo/mochi-1-preview

8、腾讯推出ima.Co pilot智能工作台产品

腾讯最新推出的ima.Co pilot智能工作台产品由混元大模型提供技术支持,旨在为用户提供全新的搜读写体验。该产品具备知识获取、个人知识库打造和智能写作辅助等核心功能,能够轻松管理和获取知识,提供定制化回答,辅助写作任务。腾讯表示将推出更多版本以满足用户需求,展示了在人工智能领域的深入探索和持续创新,提升工作效率和学习效率,为用户提供智能化辅助工具。

image.png

【AiBase提要:】

🔍 知识获取:用户可通过ima.C opilot基于全网信源问答,整合优质内容到个人知识库,轻松获取知识。

📚 个人知识库打造:产品支持用户打造专属知识库,提供定制化回答,激发工作和学习灵感。

✍️ 智能写作辅助:ima.C opilot能理解用户需求,辅助完成论文、作文、文案等写作任务。

详情链接:https://ima.qq.com/

9、PodCastLM来了!轻松将PDF文档转换为音频播客

PodCastLM是一款新推出的工具,旨在帮助用户将PDF文档内容转换为音频播客,提升信息传播的效率和趣味性。通过现代技术结合,用户可以轻松生成原创音频内容,节省时间和精力。

image.png

【AiBase提要:】

🔊 用户友好界面和流畅转换过程

🎙️ 转换PDF文档为音频播客

📚 适用于各类用户,如播客主播、内容创作者、教育工作者

详情链接:https://github.com/YOYZHANG/PodCastLM

10、Cohere推出多模态搜索模型Embed3

Cohere最新发布的多模态AI搜索模型Embed3支持通过文本和图像进行企业级检索,大幅提升图像搜索性能,助力企业挖掘数据价值。更新的API简化客户从其他模型切换的过程,提供更灵活的搜索体验。

image.png

【AiBase提要:】

🌟 用户可通过图像和文本进行多模态搜索

📈 更新后的模型大幅提升图像搜索性能,助力企业挖掘数据价值

🔄 更新的API简化客户从其他模型切换的过程

详情链接:https://cohere.com/blog/multimodal-embed-3

11、ChatGPT 高级语音模式登陆欧洲!

OpenAI最近将其ChatGPT高级语音模式扩展到欧盟等地区,实现与人类对话相媲美的响应速度。功能不仅在美国、英国用户中开放,还进行了多项改进,包括新增五种语音、自定义指令功能和对话内容记忆。与竞争对手Google的Gemini Live相比,ChatGPT提供更自然的对话体验和更高效的信息交互。

【AiBase提要:】

🚀 ChatGPT高级语音模式扩展到欧盟等地区,响应速度快,与人类对话媲美。

🔊 新增五种语音和自定义指令功能,用户可选择不同语音回应,控制ChatGPT行为。

💡 OpenAI在人工智能领域取得进一步突破,用户可享受更自然的对话体验和高效的信息交互。

12、法国AI创企Les Ministraux发布全新轻量级模型,性能超越Llama3!

Les Ministraux推出的Ministral3B和Ministral8B模型在边缘设备上表现出色,性能媲美开源模型,为用户提供高计算效率、低延迟的解决方案。然而,Mistral公司最近陷入争议,不再像以前那样开放,可能被微软收购。

【AiBase提要:】

🚀 Ministral3B和Ministral8B性能超越Llama38B和Mistral7B,Ministral8B在除代码能力外其他方面优于前者。

💡 Ministral3B和Ministral8B支持高达128k的上下文,为低于10B参数的模型树立新标杆,Ministral8B配备滑动窗口注意机制。

⚙️ Les Ministraux模型可应用于管理AI智能体工作流程、创建任务助手等场景,Ministral8B的价格为每百万token0.1美元,Ministral3B为每百万token0.04美元。

详情链接:https://mistral.ai/news/ministraux/

13、秒杀人类!AI香水调配师来了,几秒钟就能开发高品质香水

NotCo与Cramer联手推出的NotCo生成式AI香水调配师革新产品,简化了香水研发流程,提高效率和创造性。经过盲测验证,AI生成的香水被评为“市场就绪”,展示了其实际应用潜力。AI技术的引入为香水行业注入新活力,展示了未来香水市场的更多可能性。

image.png

【AiBase提要:】

🌟 NotCo与Cramer推出了NotCo生成式AI香水调配师,能在几秒钟内快速开发高品质香水。

💡 AI技术的引入极大简化了香水的研发流程,使其更高效且具有创造性。

✅ 经过盲测的AI香水已被专业调香师评估为“市场就绪”产品,展示了其实际应用潜力。

14、AI智能指环L-Ring2来了!集成ChatGPT4o,实时翻译、语音转文本、手势控制通通支持

L-Ring2是一款智能指环,集成了先进的人工智能技术,支持实时翻译、语音转文本、手势控制等功能。它不仅外观时尚,功能强大,而且耐用性高,适用于各种环境。这款智能设备能提供无缝的智能支持,让用户在工作和娱乐中享受便利。

image.png

【AiBase提要:】

🌟 L-Ring2集成AI助手,提供实时翻译和会议记录等智能服务。

🌍 作为空气鼠标,方便用户在电脑和幻灯片间自由切换。

📱 手势控制和Air Mouse技术让设备管理变得简单便捷。

举报

  • 相关推荐
  • GPT5.5:更贵不更烧,主角给到Codex,逼Claude慌忙修复降智问题

    ​GPT-5.5来了。API定价$5/$30每百万token,GPT-5.4的两倍。 但它并不更烧token。 Sam Altman在公布定价的同一条推文里补了一句:"Remember, you will need less tokens per task than5.4!" 贵一倍,但每个任务token更少——"其实更划算"。OpenAI总裁Greg Brockman在发布会上给了更大的词:"a new class of intelligence."

  • AI日报:Kimi K3将于第三季度推出;英伟达发布多模态“全能模型”;Claude深度集成Adobe、Blender

    本期AI日报聚焦八大热点:月之暗面将推2.5万亿参数Kimi K3大模型,长文本处理能力突破;英伟达发布多模态模型Nemotron-3 Nano Omni,推理效率提升9倍;蚂蚁集团开源百灵Ling-2.6-flash模型;商汤推出原生多模态统一模型SenseNova U1;Claude深度集成Adobe等八大软件;字节TRAE SOLO上线语音输入;科大讯飞发布星火X2-Flash模型;ima上线知识Agent copilot,内置记忆系统。

  • AI日报:Claude推出Claude Design;DeepSeek开启首轮外部融资;蚂蚁灵光App闪应用突破3000万个

    本期AI日报聚焦多项AI领域动态:Anthropic推出Claude Design,通过文字描述生成专业设计稿,降低非设计师创作门槛;国产大模型DeepSeek开启首轮外部融资,估值超百亿美元;蚂蚁灵光App闪应用突破3000万个,投入1亿元激励创作者。此外,Moonshot AI与清华大学发布PrfaaS架构提升大模型推理效率,NVIDIA开源Lyra 2.0支持单图生成可探索3D场景,德国法院裁定AI二次创作漫画不一定侵权。同时,Anthropic的MCP协议被曝存在重大安全漏洞,而其推出的桌面宠物Claude Buddy硬件由深圳制造,展现了AI与硬件的创新结合。

  • AI日报:Claude Opus 4. 7发布;阿里开源 Qwen3.6-35B-A3B;Perplexity推出Mac端AI助手

    本期AI日报聚焦多领域技术进展:Anthropic发布Claude Opus 4.7,强调模型可靠性与任务执行稳定性;阿里开源MoE模型Qwen3.6-35B-A3B,以300亿激活参数实现高效编程能力;OpenAI升级Codex,增强Mac桌面操控与多智能体并行;Opera推出“浏览器连接器”,集成多款AI助手;英伟达Lyra2.0实现单图生成90米3D环境;谷歌Gemini接入个人相册推动图像生成个性化;Perplexity发布Mac端AI助手,支持系统级操作;iOS 27 Beta曝光多项Apple Intelligence功能,涵盖营养标签解析与智能照片管理。

  • OpenClaw接入DeepSeek V4:支持实时语音通话

    DeepSeek-V4发布后,全球顶级Agent开源项目OpenClaw迅速完成对其Flash和Pro版本的全面适配。这标志着DeepSeek-V4正式成为智能体开发的主流底层基座。V4在自主决策、工具调用、长链任务执行等关键能力上深度优化,上下文承载、逻辑推理与复杂编码能力显著提升,更适配自动化工作流等前沿场景。此次适配将扩大DeepSeek在开源生态的渗透率,压缩海外大模型市场优势,并大幅降低开发者构建高性能AI智能体的成本与门槛,推动国产大模型在Agent赛道话语权持续提升。

  • AI日报:阿里推开放世界模型Happy Oyster;Claude Opus 4.7即将发布;腾讯开源混元3D 世界模型2.0

    本期AI日报聚焦多领域进展:阿里巴巴推出开放世界模型Happy Oyster,支持实时交互;腾讯开源混元3D世界模型2.0,可一键生成可编辑3D资产;谷歌发布Gemini-TTS模型,支持近70种语言,语音更自然;蚂蚁灵波科技开源LingBot-Map,实现单摄像头实时三维重建。同时关注Anthropic即将发布Claude Opus 4.7及AI设计工具,以及湖南广电AI转型成果。安全方面,报告揭示MCP协议漏洞或致超20万台AI服务器面临风险,而OpenAI更新Agents SDK,引入沙箱功能以提升智能代理安全性。

  • 小艺Claw上线自进化能力越用越懂你,接入DeepSeek V4逻辑推理跃迁

    小艺Claw上线30天内完成10余次架构迭代与20余项核心能力交付,成为首个获国家级智库认证的终端厂商Claw类智能体。4月29日重磅更新引入自进化能力,可记忆用户偏好与技能,越用越懂你;同时接入DeepSeek+V4模型,实现百万级超长上下文处理与逻辑推理跃迁。此外,Skills市场不断丰富,涵盖金融、生活、开发等场景,并基于鸿蒙星盾架构确保数据安全。用户无需部署,在HarmonyOS 6及以上设备上打开小艺APP即可预约体验。

  • 华为小艺Claw重磅更新!正式接入DeepSeek V4、支持自进化

    华为宣布鸿蒙版龙虾小艺Claw重磅更新,新版本号为11.6.3.300。 此次升级最大亮点是上线自进化能力,小艺能够自主学习并记忆用户使用习惯、创作风格与日常指令偏好,无需反复重复同类要求,长期使用后适配度和响应精准度持续提升,形成专属化智能助手体验。

  • 时隔一个月又崩了!DeepSeek网页及API服务出现异常 官方称正在修复

    今日,多名用户在社交平台反馈DeepSeek服务异常,平台对话页面提示服务器繁忙,请稍后重试”。官方服务状态网站显示DeepSeek网页及API服务不可用。今日下午,官方状态页面更新信息,确认问题已定位,正在实施修复。

  • 极光月狐亮相Neudata香港峰会:另类数据透视中国市场的“隐形信号”

    近日,全球另类数据顶级盛会Neudata香港峰会落幕。中国另类数据领军者月狐数据受邀参展,与全球顶尖投行、对冲基金及量化巨头交流,展示其在复杂市场挖掘Alpha的硬实力。峰会核心演讲中,月狐数据产品总监刘洋航分享了如何利用高频底层信号在财报发布前精准预测企业表现,并展示了从注意力、使用度到转化的分层模型,穿透流量泡沫直达经营本质。基于另类数据构建的因子在A股和港股市场表现出卓越超额收益。月狐数据通过线上、线下、支付及社交舆情四大维度,覆盖600+上市公司,将碎片化信号转化为金融指标,助力投资者在财报发布前建立精准预期,传递了以高频、精准、全维度数据锁定中国市场确定性的清晰信号。

今日大家都在搜的词: