首页 > 业界 > 关键词  > ComfyUI0.2.0最新资讯  > 正文

AI日报:ComfyUI0.2.0全新版本发布;混合现实插画模型FLUX.1-dev-LoRA;Playground V3生图模型发布

2024-09-03 15:17 · 稿源:站长之家

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解https://top.aibase.com/

1、全新ComfyUI 0.2.0版本重磅来袭,为设计师带来工作流程革命

ComfyUI 0.2.0版本带来了设计工作流程的变革,引入了Flux ControlNets技术和优化队列管理功能,大幅提升了设计师的创作工具和工作效率。用户体验得到全面优化,提供了更简化的设计流程。升级后的执行错误对话框也提供了高效的问题搜索功能,为设计师们带来前所未有的工作效率与创作灵感。

【AiBase提要:】

✨ 引入Flux ControlNets技术,提供更精细的图像处理能力

⚙️ 优化队列管理功能,包括Go-to Node快速定位和任务输出文件夹视图

🔍 节点库功能大幅增强,包括书签功能、递归展开/折叠和增强的搜索过滤器

示例工作流程:https://comfyanonymous.github.io/ComfyUI_examples/flux/

官方公告:https://blog.comfy.org/comfyui-v0-2-0-release/

2、FLUX.1-dev-LoRA: 令人惊艳的混合现实与插画风格的图像生成模型

FLUX.1-dev-LoRA是一款令人惊艳的混合现实与插画风格的图像生成模型,独特之处在于巧妙结合现实与插画元素,创造出独特的视觉效果。用户可以轻松生成超酷的图片,展现旅行场景而不需要露脸,是聪明又时尚的选择。该模型在艺术风格方面表现卓越,无缝融合现实与插画元素,带来耳目一新的视觉体验。

image.png

【AiBase提要:】

⚡ 混合现实与插画风格的独特结合,创造独特视觉效果。

✨ 擅长描绘前景角色为插画风格,背景呈现现实主义风格。

🎨 用户提供场景描述和角色动作提示,生成符合需求的图像。

详情链接:https://huggingface.co/Shakker-Labs/FLUX.1-dev-LoRA-blended-realistic-illustration

3、小白用了直呼牛!Playground AI推最新生图模型Playground V3

Playground是一款超级棒的AI设计工具,无论你是设计小白还是设计高手,都能让你的创意一触即发。它提供海量模板、简单易用的编辑界面、高度自定义、高分辨率导出和多平台支持,让用户轻松创建自定义设计和图形。

截图1.jpg

【AiBase提要:】

⭐ Playground是一款AI设计工具,支持海量模板,让用户轻松找到心仪的设计风格。

⭐ Playground拥有简单易用的编辑界面,即使没有设计基础也能轻松上手,创作专业水准的作品。

⭐ Playground支持高度自定义,用户可以修改文字、颜色,上传图片,展现个性化设计,并导出高清格式保持最佳效果。

详情链接:https://www.playground.com

4、MiniMax大模型日均与用户交互30亿次 将发布多模态模型abab7

MiniMax稀宇科技近日公布数据显示,公司已构建万亿参数的MoE文本、语音和图像大模型,推出了多款原生应用,为企业和开发者提供开放平台API服务。在过去996天里,公司大模型与用户交互频繁,展示了在人工智能领域的快速进步和广泛影响。尽管取得显著进展,MiniMax仍致力于实现全球人口100%的智能连接目标,将继续专注于技术创新。

image.png

【AiBase提要:】

🚀 MiniMax构建万亿参数的MoE文本、语音和图像大模型,推出原生应用和开放平台API服务。

💡 公司大模型与用户日均交互30亿次,处理超过3万亿文本token,生成2000万张图像和7万小时语音。

🔮 MiniMax发布视频模型abab-video-1、音乐模型abab-music-1,更新语音模型abab-speech-1,未来将发布多模态模型abab7。

5、SparkLabs新设5000万美元基金,致力支持全球AI初创企业

SparkLabs宣布关闭了一项新基金AIM AI Fund,规模达5000万美元,旨在进一步投资AI领域的初创企业。该基金将支持沙特阿拉伯的AIM-X加速器内的AI初创公司,并关注全球其他地方的AI创业项目。随着生成式AI的兴起,全球AI领域的投资热情急剧增加,市场上涌现大量新创公司,吸引众多投资者的目光。

【AiBase提要:】

🌍 SparkLabs关闭了一项5000万美元的新基金,旨在支持全球AI初创企业。

📈 新基金的资金约35%将用于加速器参与者,其余65%用于A轮和B轮投资。

🚀 SparkLabs已在14家初创公司上完成投资,涵盖多个行业和地区。

6、OpenAI成为台积电新款1.6nm芯片主要客户,计划于2026年投产

OpenAI与台积电合作,将成为1.6nm芯片的主要客户,展示了对人工智能硬件发展的重视。此举将使OpenAI在人工智能领域保持技术领先地位,特别是在视频生成技术方面。同时,与博通、Marvell合作开发适合AI应用的ASICs,展现了OpenAI在硬件投资方面的战略规划。苹果可能对OpenAI进行重大投资,估值或达1000亿美元,这将对科技行业产生深远影响。

【AiBase提要:】

🌟 OpenAI成为台积电1.6nm芯片的主要客户,计划于2026年投产。

📈 OpenAI与博通、Marvell合作,开发适合AI应用的ASICs。

🤝 苹果可能对OpenAI进行重大投资,估值或达1000亿美元。

7、Cursor开源平替来了!AI编程工具Melty让编程效率提升 10 倍

Melty是一款开源的AI代码编辑器,能够实时理解开发者的需求,帮助写出高质量的代码。创始团队在Y Combinator的支持下快速迭代,经过28天开发,Melty能自动编写一半的代码。它不仅提升编程效率,还能帮助你更好地理解代码变化。

image.png

【AiBase提要:】

🚀 Melty是一款开源的AI代码编辑器,能够实时理解开发者的需求,帮助写出高质量的代码。

💡 创始团队在Y Combinator的支持下快速迭代,经过28天开发,Melty能自动编写一半的代码!

🤖 它不仅提升编程效率,还能帮助你更好地理解代码变化。

详情链接:https://top.aibase.com/tool/melty

8、游戏场景的智能助手来了!开源大模型 VideoGameBunny 让你玩得更嗨

在游戏开发领域,VideoGameBunny(简称VGB)是一款开源大模型,为游戏开发提供智能助手。它支持多种语言、高度可定制、具有强大的文本生成能力,适用于游戏对话系统、教育应用和客服聊天机器人等场景。VGB基于Bunny模型,结合了多种先进模型,提供了丰富的游戏内容理解和指令生成能力。

image.png

【AiBase提要:】

🌟 支持多种语言,适合国际化应用,提供多语言处理和生成能力。

🔧 高度可定制,可根据需求调整模型参数和配置文件,适用于不同项目需求。

💬 强大的文本生成能力,生成连贯自然的对话,提升游戏互动性和沉浸感。

详情链接:https://huggingface.co/VideoGameBunny/VideoGameBunny-V1/tree/main

9、AI时代的金矿!揭秘Reddit的AI数据授权业务如何实现691%收入增长

Reddit利用其丰富的用户生成数据开辟了新的收入来源,通过数据许可与大型科技公司合作,预计2024年可获得6640万美元的收入。数据许可业务实现了惊人的691%增长,为公司贡献了2810万美元的收入。然而,数据使用引发了法律争议,Reddit承诺将积极维护自身权益。

【AiBase提要:】

📊 Reddit通过数据许可与大型科技公司合作,预计2024年可获得6640万美元的收入。

🚀 数据许可业务增长迅猛,第一季度收入增长了691%。

⚖️ 数据使用引发法律争议,Reddit承诺将积极维护自身权益。

10、钉钉推出多款“超级助理” 包括超级工单助理、超级评价助理等

钉钉推出的多款融合人工智能能力的新产品,其中“超级工单助理”引人注目。这款助理简化企业工单管理,无需代码开发能力,提高工作效率。员工可通过自然语言或截图与助理互动,助理自动生成工单并沉淀知识。产品线还包括“超级评价助理”、“超级舆情助理”等,助力企业提升服务质量和效率。

微信截图_20240903134043.png

【AiBase提要:】

🤖 简化工单管理,无需代码开发能力,提高工作效率。

🔍 员工可通过自然语言或截图与助理互动,助理自动生成工单并沉淀知识。

🚀 产品线丰富,包括“超级评价助理”、“超级舆情助理”等,助力企业提升服务质量和效率。

11、钉钉宜搭发布低代码+AI新产品 包括仓库通、任务通等

钉钉宜搭发布的低代码+AI新产品旨在帮助中小企业快速实现AI落地应用,降低门槛加速数字化进程。产品包括面向中小企业的“AI精品应用”和针对中大型企业的“行业方案中心”。钉钉低代码和AI融合加速,应用数已突破1000万,显示领先地位。

image.png

【AiBase提要:】

🚀 低代码+AI新产品助力中小企业实现AI落地应用,加速数字化进程。

💼 面向中小企业的“AI精品应用”提供便捷体验和高性价比,整合文本和图像识别等AI能力。

🔧 钉钉上线“行业方案中心”提供12大行业解决方案,结合低代码和AI能力,快速定制适配。

详情链接:https://www.aliwork.com/home/

12、上海人工智能实验室发布智能数据提取工具MinerU

MinerU是一款全新智能数据提取工具,旨在简化AI数据处理流程,帮助研究者从海量文档中提取高质量数据。该工具包含Magic-PDF和Magic-Doc两大部分,能快速转化多模态PDF文档为Markdown格式,提取网页内容并支持多种格式转换。技术上采用多模型实现高质量文档数据提取,推动大模型研发与应用工具体系升级。

image.png

【AiBase提要:】

✨ MinerU是全新智能数据提取工具,简化AI数据处理流程,提高数据提取质量。

🔍 包含Magic-PDF和Magic-Doc两大部分,支持多模态PDF文档转化为Markdown,网页内容提取与格式转换。

⚙️ 利用LayoutLMv3、YOLOv8、UniMERNet和PaddleOCR等模型实现高质量文档数据提取。

详情链接:https://modelscope.cn/studios/OpenDataLab/MinerU

举报

  • 相关推荐
  • AI日报:xAI 震撼发布Grok4;微软开源全新Phi-4-mini版本;上海累计82款大模型通过备案

    AI日报栏目聚焦人工智能领域最新动态:1)xAI发布旗舰模型Grok4,在数学推理和代码生成表现突出,同时推出开发者专用Grok4Code;2)微软开源Phi-4-mini模型,推理效率提升10倍,适合边缘设备;3)上海82款大模型完成备案,垂直领域应用取得突破;4)Hugging Face推出开源桌面机器人Reachy Mini,支持Python编程;5)Perplexity发布AI浏览器Comet挑战Chrome;6)OpenAI将首次发布开放权重模型,打破闭源惯例;7)谷歌医疗AI模型MedGemma系列上新,单个GPU即可运行;8)OpenAI以约65亿美元收购AI硬件公司io Products,正式进军硬件市场。

  • AI日报:智谱上线PPT生成功能AI Slides;可灵 AI 发布可图2.1模型

    本文介绍了AI日报栏目及近期AI领域多项突破性进展:1)智谱推出免费AI Slides工具,基于GLM模型快速生成高质量PPT;2)可灵AI发布可图2.1模型,支持180多种风格图像生成;3)NVIDIA推出DiffusionRenderer技术,实现视频到可编辑3D场景转换;4)墨刀AI新增30秒生成高保真原型功能;5)Higgsfield推出Soul ID工具,10张照片即可生成虚拟形象;6)谷歌DeepMind开源GenAI Processors工具库;7)谷歌Veo新增图像转视频功能;8)Mistral AI发布专为代码建模的Devstral2507系列模型。这些创新展示了AI在内容生成、3D建模、产品设计等领域的快速发展。

  • AI日报:阿里通义开源音频生成模型ThinkSound;谷歌Veo3支态图片生成视频;昆仑万维发布 Skywork-R1V 3.0

    【AI日报】今日AI领域重要动态:1)阿里开源支持链式推理的音频生成模型ThinkSound,实现高保真空间音频生成;2)谷歌Veo3升级,支持静态图片生成生动视频;3)Hugging Face发布30亿参数小模型SmolLM3,性能优于Llama-3.2-3B;4)阿里开源网络智能体WebSailor,展现强大推理和检索能力;5)Moonvalley发布原生1080P视频生成模型Marey Realism v1.5;6)Vidu Q1支持最多七张参考图像生成一致性视频;7)苹果�

  • AI日报:腾讯混元推3D生成大模型Hunyuan3D-PolyGen;钉钉AI表格重磅来袭;阿里推多模态大语言模型HumanOmniV2

    本文介绍了AI领域多项重要进展:1)腾讯推出首个美术3D生成大模型Hunyuan3D-PolyGen,显著提升建模效率;2)阿里发布多模态大模型HumanOmniV2,准确率达69.33%;3)钉钉AI表格实现1小时处理千项任务;4)百度PaddleOCR3.1版本在多语种识别和文档翻译方面升级;5)微软推出Deep Research智能体,自动化研究流程;6)香港理工与OPPO联合开源视频超清框架DLoRAL;7)谷歌开源MCP工具箱简化AI与数据库集成;8)Win11将推出AI动态壁纸功能。这些创新展示了AI在3D生成、多模态理解、办公效率、视觉处理等领域的突破性进展。

  • AI日报:阿里通义推Qwen-TTS模型;Cursor已支持网页和手机端;字节发布图像合成技术XVerse

    【AI日报】今日AI领域7大突破:1)阿里通义Qwen-TTS实现方言语音合成重大突破;2)Cursor发布Web版AI编程工具;3)字节XVerse技术实现多对象精准图像生成;4)NoteGen跨平台AI笔记工具革新知识管理;5)ManimML动画库可视化Transformer架构;6)TEN+Agent开源语音交互技术降低延迟;7)Chai-2抗体设计模型将药物研发周期缩短至两周。淘宝同时上线RecGPT推荐模型提升购物体验。

  • A日报:月之暗面开源大模型Kimi K2;智源全面开源RoboBrain2.0;通义千问发布Qwen Chat桌面客户端

    本期AI日报重点报道了多项AI领域突破性进展:1.月之暗面推出万亿参数开源大模型Kimi K2,展现强大智能能力;2.智源研究院开源RoboBrain2.0和RoboOS2.0机器人系统;3.通义千问发布桌面客户端Qwen Chat;4.IndexTTS2实现影视级语音合成;5.HuggingFace开源机器人Reachy Mini热销;6.Meta推出实时视频生成模型StreamDiT;7.PixVerse新增多关键帧视频生成功能;8.特斯拉推出仅支持AMD处理器的Grok AI助手;9.OpenAI推迟开源大模型发布以加强安全测试;10.Liquid AI开源边缘AI模型LFM2;11.AI"时间穿越"特效在社交媒体走红。

  • 一个月更新4次 鸿蒙版微信再推新版本:四大新功能

    鸿蒙版微信凭借高频次的更新优化,持续为用户带来惊喜。近一个月内,鸿蒙版微信已正式上架4个新版本。 如今,其又马不停蹄推出全新版本,带来四项实用新功能。 此次更新后,图库操作便利性大幅提升。用户如今可直接在图库中选中视频及多张图片,一键转发至微信。 消息管理也变得更加高效。多选消息功能上线后,用户能对多条消息进行批量选中,无论是清理无用�

  • A日报:B站升级动漫视频生成模型AniSora V3;字节开源4D视频生成框架EX-4D;DeepSWE开源AI Agent系统强势登顶

    AI日报栏目汇总了近期AI领域的重要进展:1)字节跳动开源EX-4D框架,可将单目视频转换为多视角4D视频;2)B站开源动漫视频生成模型AniSora V3,支持多种风格;3)DeepSWE+开源基于Qwen3-32B的AI Agent系统;4)字节开源3亿参数图像编辑模型VINCIE-3B;5)Stability AI推出移动端音频生成模型Stable Audio Open Small;6)谷歌发布免费教育AI工具套件Gemini for Education;7)Topview推出革命性AI数字人带货技术Avatar

  • 鲁大师2025年手机半年报:ColorOS蝉联流畅霸主,小米玄戒杀入性能前五

    2025年上半年手机市场迎来旗舰芯片大战:骁龙8至尊版领衔版与天玑9400+旗舰芯片成为主流,红魔10S Pro+凭借超频至4.47GHz的骁龙8至尊版和液金散热技术,以1912990分登顶性能榜。系统流畅度方面,ColorOS15以226.76分连续四季夺冠,OriginOS紧随其后。AI性能榜被搭载骁龙8至尊版的机型包揽,vivo X200 Ultra凭借蓝心大模型以276423分居首。芯片榜中骁龙8至尊版以1295851分封王,小米玄戒O1采用台积电N3E工艺,以四丛集十核架构杀入前五,成为最大黑马。随着第二代骁龙8至尊版和天玑9500即将量产,下半年旗舰之争将重塑行业格局。

  • AI日报:百度发布“绘想”平台与MuseSteamer;阿里音频驱动全身数字人模型OmniAvatar

    【AI日报】今日AI领域重要动态:1.开源语音大模型Step-Audio-AQAA发布,实现音频到语音的端到端自然转换;2.百度推出"绘想"平台与MuseSteamer,通过AI一键生成专业级视频;3.浙大与阿里联合发布OmniAvatar,音频驱动数字人技术取得突破;4.百度搜索迎十年来最大改版,新增智能框、百看和AI助手功能;5.xAI开发者控制台新增Grok4及Grok4Code引用,预示新一代AI模型即将发布;6.Gemin