AI日报：ComfyUI0.2.0全新版本发布；混合现实插画模型FLUX.1-dev-LoRA；Playground V3生图模型发布

2024-09-03 15:17 · 稿源：站长之家

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解：https://top.aibase.com/

1、全新ComfyUI 0.2.0版本重磅来袭，为设计师带来工作流程革命

ComfyUI 0.2.0版本带来了设计工作流程的变革，引入了Flux ControlNets技术和优化队列管理功能，大幅提升了设计师的创作工具和工作效率。用户体验得到全面优化，提供了更简化的设计流程。升级后的执行错误对话框也提供了高效的问题搜索功能，为设计师们带来前所未有的工作效率与创作灵感。

【AiBase提要:】
✨ 引入Flux ControlNets技术，提供更精细的图像处理能力
⚙️ 优化队列管理功能，包括Go-to Node快速定位和任务输出文件夹视图
🔍 节点库功能大幅增强，包括书签功能、递归展开/折叠和增强的搜索过滤器
示例工作流程:https://comfyanonymous.github.io/ComfyUI_examples/flux/
官方公告：https://blog.comfy.org/comfyui-v0-2-0-release/

2、FLUX.1-dev-LoRA: 令人惊艳的混合现实与插画风格的图像生成模型

FLUX.1-dev-LoRA是一款令人惊艳的混合现实与插画风格的图像生成模型，独特之处在于巧妙结合现实与插画元素，创造出独特的视觉效果。用户可以轻松生成超酷的图片，展现旅行场景而不需要露脸，是聪明又时尚的选择。该模型在艺术风格方面表现卓越，无缝融合现实与插画元素，带来耳目一新的视觉体验。

【AiBase提要:】
⚡ 混合现实与插画风格的独特结合，创造独特视觉效果。
✨ 擅长描绘前景角色为插画风格，背景呈现现实主义风格。
🎨 用户提供场景描述和角色动作提示，生成符合需求的图像。
详情链接:https://huggingface.co/Shakker-Labs/FLUX.1-dev-LoRA-blended-realistic-illustration

3、小白用了直呼牛！Playground AI推最新生图模型Playground V3

Playground是一款超级棒的AI设计工具，无论你是设计小白还是设计高手，都能让你的创意一触即发。它提供海量模板、简单易用的编辑界面、高度自定义、高分辨率导出和多平台支持，让用户轻松创建自定义设计和图形。

截图1.jpg

【AiBase提要:】
⭐ Playground是一款AI设计工具，支持海量模板，让用户轻松找到心仪的设计风格。
⭐ Playground拥有简单易用的编辑界面，即使没有设计基础也能轻松上手，创作专业水准的作品。
⭐ Playground支持高度自定义，用户可以修改文字、颜色，上传图片，展现个性化设计，并导出高清格式保持最佳效果。
详情链接:https://www.playground.com

4、MiniMax大模型日均与用户交互30亿次将发布多模态模型abab7

MiniMax稀宇科技近日公布数据显示，公司已构建万亿参数的MoE文本、语音和图像大模型，推出了多款原生应用，为企业和开发者提供开放平台API服务。在过去996天里，公司大模型与用户交互频繁，展示了在人工智能领域的快速进步和广泛影响。尽管取得显著进展，MiniMax仍致力于实现全球人口100%的智能连接目标，将继续专注于技术创新。

【AiBase提要:】
🚀 MiniMax构建万亿参数的MoE文本、语音和图像大模型，推出原生应用和开放平台API服务。
💡 公司大模型与用户日均交互30亿次，处理超过3万亿文本token，生成2000万张图像和7万小时语音。
🔮 MiniMax发布视频模型abab-video-1、音乐模型abab-music-1，更新语音模型abab-speech-1，未来将发布多模态模型abab7。

5、SparkLabs新设5000万美元基金，致力支持全球AI初创企业

SparkLabs宣布关闭了一项新基金AIM AI Fund，规模达5000万美元，旨在进一步投资AI领域的初创企业。该基金将支持沙特阿拉伯的AIM-X加速器内的AI初创公司，并关注全球其他地方的AI创业项目。随着生成式AI的兴起，全球AI领域的投资热情急剧增加，市场上涌现大量新创公司，吸引众多投资者的目光。

【AiBase提要:】
🌍 SparkLabs关闭了一项5000万美元的新基金，旨在支持全球AI初创企业。
📈 新基金的资金约35%将用于加速器参与者，其余65%用于A轮和B轮投资。
🚀 SparkLabs已在14家初创公司上完成投资，涵盖多个行业和地区。

6、OpenAI成为台积电新款1.6nm芯片主要客户，计划于2026年投产

OpenAI与台积电合作，将成为1.6nm芯片的主要客户，展示了对人工智能硬件发展的重视。此举将使OpenAI在人工智能领域保持技术领先地位，特别是在视频生成技术方面。同时，与博通、Marvell合作开发适合AI应用的ASICs，展现了OpenAI在硬件投资方面的战略规划。苹果可能对OpenAI进行重大投资，估值或达1000亿美元，这将对科技行业产生深远影响。

【AiBase提要:】
🌟 OpenAI成为台积电1.6nm芯片的主要客户，计划于2026年投产。
📈 OpenAI与博通、Marvell合作，开发适合AI应用的ASICs。
🤝 苹果可能对OpenAI进行重大投资，估值或达1000亿美元。

7、Cursor开源平替来了！AI编程工具Melty让编程效率提升 10 倍

Melty是一款开源的AI代码编辑器，能够实时理解开发者的需求，帮助写出高质量的代码。创始团队在Y Combinator的支持下快速迭代，经过28天开发，Melty能自动编写一半的代码。它不仅提升编程效率，还能帮助你更好地理解代码变化。

【AiBase提要:】
🚀 Melty是一款开源的AI代码编辑器，能够实时理解开发者的需求，帮助写出高质量的代码。
💡 创始团队在Y Combinator的支持下快速迭代，经过28天开发，Melty能自动编写一半的代码!
🤖 它不仅提升编程效率，还能帮助你更好地理解代码变化。
详情链接:https://top.aibase.com/tool/melty

8、游戏场景的智能助手来了！开源大模型 VideoGameBunny 让你玩得更嗨

在游戏开发领域，VideoGameBunny（简称VGB）是一款开源大模型，为游戏开发提供智能助手。它支持多种语言、高度可定制、具有强大的文本生成能力，适用于游戏对话系统、教育应用和客服聊天机器人等场景。VGB基于Bunny模型，结合了多种先进模型，提供了丰富的游戏内容理解和指令生成能力。

【AiBase提要:】
🌟 支持多种语言，适合国际化应用，提供多语言处理和生成能力。
🔧 高度可定制，可根据需求调整模型参数和配置文件，适用于不同项目需求。
💬 强大的文本生成能力，生成连贯自然的对话，提升游戏互动性和沉浸感。
详情链接:https://huggingface.co/VideoGameBunny/VideoGameBunny-V1/tree/main

9、AI时代的金矿！揭秘Reddit的AI数据授权业务如何实现691%收入增长

Reddit利用其丰富的用户生成数据开辟了新的收入来源，通过数据许可与大型科技公司合作，预计2024年可获得6640万美元的收入。数据许可业务实现了惊人的691%增长，为公司贡献了2810万美元的收入。然而，数据使用引发了法律争议，Reddit承诺将积极维护自身权益。

【AiBase提要:】
📊 Reddit通过数据许可与大型科技公司合作，预计2024年可获得6640万美元的收入。
🚀 数据许可业务增长迅猛，第一季度收入增长了691%。
⚖️ 数据使用引发法律争议，Reddit承诺将积极维护自身权益。

10、钉钉推出多款“超级助理” 包括超级工单助理、超级评价助理等

钉钉推出的多款融合人工智能能力的新产品，其中“超级工单助理”引人注目。这款助理简化企业工单管理，无需代码开发能力，提高工作效率。员工可通过自然语言或截图与助理互动，助理自动生成工单并沉淀知识。产品线还包括“超级评价助理”、“超级舆情助理”等，助力企业提升服务质量和效率。

微信截图_20240903134043.png

【AiBase提要:】
🤖 简化工单管理，无需代码开发能力，提高工作效率。
🔍 员工可通过自然语言或截图与助理互动，助理自动生成工单并沉淀知识。
🚀 产品线丰富，包括“超级评价助理”、“超级舆情助理”等，助力企业提升服务质量和效率。

11、钉钉宜搭发布低代码+AI新产品包括仓库通、任务通等

钉钉宜搭发布的低代码+AI新产品旨在帮助中小企业快速实现AI落地应用，降低门槛加速数字化进程。产品包括面向中小企业的“AI精品应用”和针对中大型企业的“行业方案中心”。钉钉低代码和AI融合加速，应用数已突破1000万，显示领先地位。

【AiBase提要:】
🚀 低代码+AI新产品助力中小企业实现AI落地应用，加速数字化进程。
💼 面向中小企业的“AI精品应用”提供便捷体验和高性价比，整合文本和图像识别等AI能力。
🔧 钉钉上线“行业方案中心”提供12大行业解决方案，结合低代码和AI能力，快速定制适配。
详情链接:https://www.aliwork.com/home/

12、上海人工智能实验室发布智能数据提取工具MinerU

MinerU是一款全新智能数据提取工具，旨在简化AI数据处理流程，帮助研究者从海量文档中提取高质量数据。该工具包含Magic-PDF和Magic-Doc两大部分，能快速转化多模态PDF文档为Markdown格式，提取网页内容并支持多种格式转换。技术上采用多模型实现高质量文档数据提取，推动大模型研发与应用工具体系升级。

【AiBase提要:】
✨ MinerU是全新智能数据提取工具，简化AI数据处理流程，提高数据提取质量。
🔍 包含Magic-PDF和Magic-Doc两大部分，支持多模态PDF文档转化为Markdown，网页内容提取与格式转换。
⚙️ 利用LayoutLMv3、YOLOv8、UniMERNet和PaddleOCR等模型实现高质量文档数据提取。
详情链接:https://modelscope.cn/studios/OpenDataLab/MinerU

（举报）

相关推荐

关键词：

ComfyUI0.2.0

以数字引擎驱动未来——太平洋电信数字化平台E-com正式上线

太平洋电信推出数字化服务平台E-com，通过模块化架构将复杂云网安方案拆解为标准化组件，实现可视化配置管理。该平台提供方案设计、在线采购、售后服务全流程支持，内置模板降低技术门槛，让企业用户可自主搭建专属方案。同时整合e-Go在线商城实现快速下单，推动行业从价格竞争转向服务价值竞争，构建开放服务生态。

数字化创新企业
Uber与Checkout.com官宣战略合作伙伴关系，为全球企业平台提供高速可靠支付服务

英国数字支付服务商Checkout.com与出行平台Uber达成全球战略合作，将为Uber在全球主要市场的网约车及外卖平台提供收单和网关服务。凭借其全球覆盖能力与本地化专长，Checkout.com将助力Uber每日处理数百万笔交易，并通过AI技术优化支付流程，提升交易成功率与安全性。此次合作将强化Uber的全球支付体验，支持其数字出行领域的持续创新。

全球收单网关服务支付解决方案
端侧AI驱动产业链变革，elexcon2026聚焦芯片/存储/嵌入式核心器件创新

近期华为、三星、追觅、阿里巴巴等科技企业密集发布智能穿戴新品，推动设备从“手机配件”向“独立智能终端”转型。这一趋势正深刻影响上游技术路径与产业格局，在AI芯片、存储与嵌入式领域引发新一轮技术升级与价值重构。中国成为全球创新引擎，2025年第二季度全球腕戴设备出货量同比增长12.3%，中国市场增速达33.8%，占据全球近半份额。端侧AI驱动技术升级，供应�

智能穿戴 AI芯片市场增长
航天员同款耳机出圈！能抗住太空噪音的声阔（soundcore）耳机，背后究竟有哪些硬科技？

11月3日，央视新闻发布中国航天员在空间站佩戴声阔耳机享受烧烤的视频，展现中国航天科技的成熟与自信。声阔耳机通过严苛太空环境测试，代表中国制造业最高水准，其卓越降噪与音质技术为航天员创造宁静空间。作为安克创新旗下品牌，声阔产品已覆盖全球超56个市场，2024年实现中国音频品牌无线耳机全球出货量第一，彰显"中国智造"从技术追赶到创新引领的转型。

中国空间站航天科技声阔耳机
创业者“奥斯卡”！卓世科技荣膺 HICOOL2025全球创业大赛二等奖

10月16日，HICOOL2025全球创业者峰会在京开幕。卓世科技的“璇玑玉衡大模型+MaaS训练平台+零代码Agent平台”三位一体AI全栈方案，从全球万余项目中脱颖而出，荣获大赛二等奖。该方案在模型性能、易用性及商业化闭环方面展现世界级水准，为大模型产业化落地提供标杆路径。五年来，HICOOL累计吸引167国3.4万项目参赛，孵化16家独角兽，赛后融资总额超500亿元，已成为全球最具影响力的创业赛事之一。

HICOOL2025 全球创业者峰会卓世科技
OPPO ColorOS 16正式版11月升级机型公布：支持23款机型

ColorOS 16正式版11月升级计划公布，涵盖OPPO Find X7/N3系列、一加Ace 5系列等23款机型。系统引入极光引擎、潮汐引擎及自研繁星编译器，显著提升流畅度并降低功耗。新增一键闪记功能，支持复杂图文与超长视频录制。生态互联实现突破，全面打通Apple Watch生态，支持打车、外卖等信息跨设备显示。通过软硬协同优化，为用户打造更流畅持久的操作体验。

ColorOS16 OPPO Find
佳能R50V双十一钜惠：漫展COS/汉服Vlog/直播带货一机搞定！

佳能R50V微单相机以6000元内惊喜价格亮相双十一，配备全像素双核CMOS与智能对焦系统，支持人物/动物/车辆追踪。轻巧机身仅323克，优化握持设计便于外拍。具备6K超采4K录制、14种滤镜及美肤模式，竖拍界面完美适配短视频平台。USB直连实现4K60P直播供电，特写模式自动切换焦点，适合带货与教学。多档套餐覆盖从三脚架到专业滤镜，满足动漫COS、国风Vlog等多场景创作需求，是降低门槛提升品质的优选工具。

佳能R50V 双十一微单轻巧微单
科灯跨境黑五超值建站季：WordPress/Woo标准版八折 Shopify免费建站

科灯跨境在双十一期间推出两大建站方案：WordPress/Woo标准版享八折优惠，原价3980元折后3180元；WooCommerce建站版原价5980元活动价4780元，均含域名、SSL证书等基础配置。另针对Shopify用户提供免费建站服务，含账号注册、主题安装等全流程支持及一年免费售后。活动持续至11月30日，旨在降低外贸商家独立站搭建成本，提供一站式出海解决方案。

双十一购物黑五建站跨境电商
OPPO ColorOS 16正式版推送：首批适配11款机型

ColorOS 16正式版于10月30日启动推送，首批覆盖11款OPPO和一加热门机型。该系统引入极光引擎、潮汐引擎与繁星编译器三大流畅技术，实现感官、性能与底层的全方位提升。极光引擎打造业内首个“无缝隙架构”，确保全场景丝滑交互；潮汐引擎首发芯片级动态追帧技术，系统重载流畅度提升37%，功耗降低13%；繁星编译器首创安卓跨级融合编译技术，大幅提升低算力芯片性能。此次升级将增强品牌市场竞争力，为用户带来更出色的使用体验。

ColorOS16 OPPO Find
信锐助力TCL获 “2025中国IDC未来企业大奖联接领军者”优秀奖！

10月17日，TCL空调办公网络智能连接与体验升级项目在IDC中国CIO峰会获“2025未来企业连接领军者”优秀奖。该项目依托信锐“AI+网络自动驾驶”理念，通过全网智能2.0与小信GPT方案重构企业网络管理模式，实现从感知、分析到决策的智能闭环，助力TCL实现20+维度数据采集、7*24小时AI调优及自然语言交互运维，推动企业数字化转型升级。

IDC中国CIO峰会数字化转型 TCL空调

今日大家都在搜的词：

热文

3 天
7天

AI日报：ComfyUI0.2.0全新版本发布；混合现实插画模型FLUX.1-dev-LoRA；Playground V3生图模型发布

以数字引擎驱动未来——太平洋电信数字化平台E-com正式上线

Uber与Checkout.com官宣战略合作伙伴关系，为全球企业平台提供高速可靠支付服务

端侧AI驱动产业链变革，elexcon2026聚焦芯片/存储/嵌入式核心器件创新

航天员同款耳机出圈！能抗住太空噪音的声阔（soundcore）耳机，背后究竟有哪些硬科技？

创业者“奥斯卡”！卓世科技荣膺 HICOOL2025全球创业大赛二等奖

OPPO ColorOS 16正式版11月升级机型公布：支持23款机型

佳能R50V双十一钜惠：漫展COS/汉服Vlog/直播带货一机搞定！

科灯跨境黑五超值建站季：WordPress/Woo标准版八折 Shopify免费建站

OPPO ColorOS 16正式版推送：首批适配11款机型

信锐助力TCL获 “2025中国IDC未来企业大奖联接领军者”优秀奖！

今日大家都在搜的词：

热文

iPhone 18 Pro或缩小灵动岛苹果正测试特殊挖孔方案

AI日报：上海首例涉AI提示词著作权案宣判；Kimi K2 Thinking发

OPPO Reno15系列官宣11月10日发布

曝折叠屏iPhone配2400万屏下摄像头预计2026年秋亮相

特斯拉股东批准马斯克万亿美元薪酬包

华为鸿蒙智行新款享界S9开启预订：预售价31.8万起

OPPO Find X9 Pro卫星通信版开启预售：6999元

何小鹏再回应机器人里藏真人质疑：现场展示内部结构

小鹏机器人会走猫步太像人了！小鹏发布新一代人形机器人IRON

女性人形机器人里藏真人？何小鹏回应：并亲自证清白

iPhone 18 Pro或缩小灵动岛苹果正测试特殊挖孔方案

阿里回应饿了么更名：正处于灰度测试阶段

马斯克称若发现外星人证据就公开

AI日报：昆仑万维SkyReels V3模型上线；月之暗面推Kimi Linear

小米YU7全网首拆上热搜雷军回应：欢迎同行和专家指点

AI日报：Sora正式登陆Android；网易云音乐推AI调音大师；谷歌将

vivo Y500 Pro官宣11月10日发布：同档首发2亿HP5主摄

华为Mate70 Air官宣今日开启预售

站长商机