今日AI：华为发布4K图像模型PixArt-Σ；这个ComfyUI插件可以还原梦境；Pika把音效视频一锅端了；公众号可以一键集成多种AI功能了

2024-03-11 15:33 · 稿源：站长之家

欢迎来到【今日AI】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解：https://top.aibase.com/

QQ截图20240311154433.png

🤖📱💼AI应用

华为发布图像生成模型PixArt-Σ可直出4K图像

【AiBase提要:】
⭐采用DiT架构，可直接生成4K图像
⭐借助PixArt-alpha基础预训练，实现弱到强训练
⭐结合高质量训练数据和高效Token压缩，生成高分辨率图像
项目地址:https://top.aibase.com/tool/pixart

ComfyUI-Dream-Interpreter:还原梦境的ComfyUI工作流输入梦境描述生成全景图

【AiBase提要:】
⚙️可通过GitHub克隆项目进行使用
🌌项目结合了梦境解析器和ComfyUI，提供梦境输入、解析和生成功能
🖼️生成全景图像，让用户交互式探索梦境，创新结合梦境解析与交互画面。

Pika发布SoundEffects功能生成的视频可以自动配音效了

【AiBase提要:】
⭐用户可以通过描述prompt或让AI自动生成音效为视频增添氛围
⭐SoundEffects操作简单，用户只需一个prompt或简单描述就能生成音效
⭐功能目前仅对特定用户开放测试，未来将向所有用户推出

AIwechat-Vercel:无需服务器即可将AI功能集成到公众号中

【AiBase提要:】
⭐️集成多种AI服务（如GPT、星火、通义千问、Gemini等），允许微信公众号通过文本消息与用户进行智能对话。
⭐️支持连续问答，实现了超时回复和记忆对话内容（最长30分钟）
⭐️具备图床功能和被关注时的自定义回复功能
项目地址:https://top.aibase.com/tool/aiwechat-vercel
教程:https://www.bilibili.com/video/BV1Ct421b7xz/

OptimizerAI:可为AI视频自动配音还将支持立体声

【AiBase提要:】
⭐️通过文字提示创造适用于各种场景的声音和音效。
⭐️支持声音效果生成、变声、风格标签指定，保持生成一致性。
⭐️即将支持文本到声音效果转换、立体声、高质量音频生成。
官网地址:https://www.optimizerai.xyz/
在线体验地址:https://discord.com/invite/bgfnVaaU2n

EasyDiffusionOnline:一款免费的AI绘画工具

【AiBase提要:】
⭐用户可以免费使用图像生成器和提示生成器。
⭐EasyDiffusionOnline提供多种创作类型，适合不同用户。
⭐平台功能强大，用户可以实现创意想法并分享作品。
体验地址:https://top.aibase.com/tool/easydiffusion-online

图片编辑技术StableDrag发布拖动锚点即可编辑图像同时保持高质量

【AiBase提要:】
⭐新技术StableDrag基于Diffusion模型，拖动锚点编辑图片。
⭐提供两种类型的图像编辑模型:StableDrag-GAN和StableDrag-Diff。
⭐目前只上线了论文，试玩页面和代码暂未放出
项目地址:https://top.aibase.com/tool/stabledrag

AI实时绘图工具ImgPilot一键将草图转为艺术作品

【AiBase提要:】
⭐支持实时绘图，随手涂几笔就能变成好看的画
⭐ImgPilot项目基于LeptonAI技术开发，结合多种技术提高效果
⭐提供前后端代码，用户可自由定制部署
项目地址:https://github.com/leptonai/imgpilot
试玩页面:https://top.aibase.com/tool/imgpilot

MIT博士生用VisionPro实时训练机器狗开源项目TrackingSteamer火了

【AiBase提要:】
⭐MIT博士生开源项目VisionPro实时训练
⭐应用程序利用VisionPro追踪人类动作实时传输到其他机器人设备
⭐人类可以为机器人提供精准训练数据，促进人机交互技术的发展
项目地址:https://github.com/Improbable-AI/VisionProTeleop

📰🤖📢AI新鲜事

每年电费2亿?ChatGPT每天竟然要消耗1.7万个家庭的用电量

【AiBase提要:】
🔋OpenAI旗下ChatGPT每日消耗超过50万千瓦时电力，约为1.7万个家庭的用电量。
🔌AI数据中心用电量未来或与小国相当，谷歌等公司搜索请求也消耗大量能耗。
💡AI技术发展需节约能源，监管机构监督企业用电行为，促进可持续发展。

Nvidia因使用侵权作品训练NeMoAI平台被作者起诉

【AiBase提要:】
📚三位作者控告Nvidia未经许可使用其版权图书训练NeMoAI平台。
🚫作者指称Nvidia在NeMo训练后撤下他们的作品。
💡该案或成AI领域版权和数据使用重要先例，影响行业规范和公司行为。

新AI框架H2O:将人类动作实时转换为机器人动作可行走、后空翻、踢球等

【AiBase提要:】
🔄采用可扩展的“从模拟到实际”处理，构建大规模的重定目标运动数据集。
🔄通过训练鲁棒的全身机器人模仿者，成功实现了在真实场景中的动态全身运动遥操作。
🔄通过特权模仿者选择可行动作，确保人形机器人对人类运动高度还原。
项目入口:https://top.aibase.com/tool/human-to-humanoid-h2o-

微软AI研究推数学LLMOrca-Math:通过对Mistral-7B模型进行微调的7B参数小模型

【AiBase提要:】
⭐Orca-Math通过合成数据集和迭代学习重新定义数学问题教学方法。
⭐Orca-Math在GSM8K基准上取得显著成就，展示SLM在教育中的潜力。
⭐Orca-Math利用迭代学习机制取得成功，在解决数学问题方面取得显著进步。
论文地址:https://arxiv.org/abs/2402.14830

谷歌发布Gemini1.5Pro模型技术报告长文记忆能力惊人

【AiBase提要:】
⭐Gemini1.5Pro模型架构、训练数据与基础设施介绍
⭐长篇信息检索任务中完美的记忆回溯能力
⭐长篇信息处理任务准确率达到99%以上
论文地址:https://arxiv.org/pdf/2403.05530.pdf

全球AI人才报告曝光:清华第三，北大第六!

【AiBase提要:】
⭐中国培养出的AI人才占全球近1/2
⭐美国码农面试需12场，薪资压低，面试题难
⭐Meta压低薪资，裁员潮下AI人才需求狂涨42%

谷歌称GeminiNanoAI大模型暂不支持Pixel8手机

【AiBase提要:】
🌟GeminiNano是谷歌旗下Gemini大模型的移动版本。
🌟由于硬件限制，GeminiNano目前无法在Pixel8手机上运行。
🌟但谷歌表示未来将在其他高端设备上推出GeminiNano。

网络安全模型WhiteRabbitNeo发布可识别安全威胁和漏洞

【AiBase提要:】
⭐WhiteRabbitNeo发布了新模型，利用Transformers和PyTorch技术，专注于网络安全领域。
⭐这款模型可识别各种安全威胁和漏洞，如开放端口、未加密服务、API漏洞等。
⭐WhiteRabbitNeo模型还可应用于编程和代码生成领域，帮助解决编程问题。

————————————

今日Midjourney提示词分享:梨花树下的女孩

垫图+ masterpiece，best quality，A beautiful Chinese girl wearing a beige suit jacket，black hair，short hair，round face，detailed facial details，natural light，glasses，solo，photo background，outdoors，shirt，realistic，looking at viewer，tree，a tree full of pear blossoms，teeth，crossed arms，white shirt，long hair，smile，round eyewear，long sleeves，day，jacket，upper body，high definition photography，Captured by Canon camera --ar 3:4 --s 750 --style raw --v 6.0

ai2023__masterpiecebest_qualityA_beautiful_Chinese_girl_wearing_0bbb5df0-c909-4b66-a2cc-53cb3740eda7.png

（举报）

相关推荐

关键词：

ComfyUI

快手进军AI Coding，开发工具、模型和Maas平台齐登场

10月23日，快手StreamLake发布全新AI编程产品矩阵，以“工具+模型+平台”三位一体战略布局AI Coding领域。核心产品包括智能开发助手CodeFlicker、自研高性能编码模型KAT-Coder系列及企业级服务平台快手万擎。CodeFlicker提供全流程开发支持，KAT-Coder在权威测试中性能超越GPT-5，平台保障99.95%服务可用性。该生态旨在通过技术普惠，为企业与开发者提供颠覆性研发体验，推动AI编程普及。

AI编程快手StreamLake CodeFlicker
斩获G-Mark优良设计奖，RingConn智能戒指凭创新设计与技术实力获国际认可

中国智能戒指品牌RingConn凭借突破性设计、精准健康监测及卓越用户体验，荣获2025年G-Mark优良设计奖，实现年内连夺iF、IDEA、G-Mark三大国际顶级设计奖项的佳绩。产品以2克超轻机身融合医疗级技术，首创睡眠呼吸暂停监测功能，通过指尖光电容积脉搏波信号实现无感佩戴下的精准健康管理。其人性化设计兼顾12天超长续航与时尚佩戴体验，彰显中国智能穿戴设备在技术创新与实用美学融合领域的国际领先地位。

G-Mark奖智能戒指国际设计大奖
AI日报：阿里夸克“C计划”曝光；Veo3.1将增加视频“精确编辑”功能；Anthropic推出Claude Code网页版

今日AI领域动态：阿里夸克启动"C计划"布局对话式AI应用，剑指字节"豆包"；Anthropic推出Claude Code网页版，支持浏览器直接编码；谷歌Veo新增视频"精确编辑"功能，提升创作效率；Fish Audio升级S1语音克隆模型，10秒即可复刻真人声音；AWS美东故障影响ChatGPT等多项服务；DeepSeek-OCR推出"视觉记忆压缩"机制破解AI记忆瓶颈；Adobe推出AI Foundry服务，支持企业定制品牌AI模型；Anthropic发布Claude for Life Sciences，加速生命科学研究。

AI 对话式AI 阿里巴巴
Checkout.com正式推出Flow Remember Me：一键支付，全球通用

Checkout.com推出嵌入式支付产品Flow的"记住我"功能，消费者仅需存储一次银行卡信息即可在全球商户网络实现跨平台快捷支付。测试数据显示，该功能最高可缩短70%付款时间并提升7%支付成功率。同时公司升级AI分析套件、支付优化工具及收单网络，并与Visa、Mastercard和Google达成AI智能体合作，助力商户在数字支付领域保持领先地位。

支付产品 Remember Me
AI日报：腾讯发布全新ima2.0;微软发布 Copilot 一系列重磅更新；阿里夸克AI眼镜开启预售

本文汇总近期AI领域重要动态：月之暗面再获数亿美元融资，显示资本对国产大模型的信心；Anthropic为Claude推出记忆功能，兼顾个性化与隐私保护；中科大与字节发布MoGA长视频生成模型，实现分钟级高质量生成；腾讯ima2.0升级任务模式，可自主拆解复杂流程；阿里夸克AI眼镜开启预售，融合拍摄与智能功能；微软Copilot新增群聊、记忆与Edge AI模式；Opera推出深度研究代理ODRA提升�

AI 大模型 Kimi
霍涛推动开放战略落地，白山云接入快手KAT-Coder赋能开发者

白山云科技与快手StreamLake合作，在其“白山智算”平台上线闭源编程大模型KAT-Coder。该模型在SWE-Bench测试中解决率达73.4%，性能媲美全球顶尖模型，支持端到端代码生成。白山云通过“顶尖模型能力+全球边缘算力”整合，为开发者提供低于300ms超低延时代码生成服务，仅需一行代码即可调用，大幅降低AI开发门槛。此次合作是白山云完善AI工具链布局的关键一步，未来将持续深化开放协作，优化模型与边缘算力服务模式。

白山智算 KAT-Coder AI技术
OPPO ColorOS 16发布：Find X9等机型将全球首发

10月15日，OPPO正式发布ColorOS 16系统，由Find X9系列、一加15、一加Ace6及OPPO Pad5等机型首发。系统在流畅度、AI功能和生态互联实现重大突破：三大引擎提升流畅度，系统重载流畅度提升37%，功耗降低13%；新增一键闪记、智能场景识别等便捷功能；小布助手升级，提供个性化推荐；AI实景对话支持声纹识别；生态互联打通与Apple Watch壁垒，实现跨设备信息显示与操作迁移，全面提升用户体验。

ColorOS16 OPPO Find
elexcon官宣定档｜深圳国际电子展 2026年8月25-27日福田启幕

第23届Elexcon深圳国际电子展暨嵌入式展将于2026年8月25-27日在深圳举办。展会以"链接全球电子与嵌入式生态圈"为主题，聚焦电子元器件、嵌入式系统、AI硬件及存储等创新技术。在电子产业面临供应链波动与重构的背景下，展会将汇聚500余家优质供应商及3万余名工程师，通过五大同期活动推动产业对接。往届展会满意度超85%，平台将持续助力企业把握AI、汽车电子、工�
ColorOS 16正式版升级计划公布：OPPO Find X8系列率先尝鲜

据ColorOS官微消息，OPPO全新系统ColorOS 16正式版升级适配计划今日公布，OPPO Find X8系列、一加13系列会在本月率先升级ColorOS 16正式版，具体如下。 2025年10月30日 OPPO Find N5、OPPO Find N5卫星通信版、OPPO Find X8 Ultra、OPPO Find X8 Ultra卫星通信版、OPPO Find X8s 、OPPO Find X8s、OPPO Find X8 Pro、OPPO Find X8 Pro卫星通信版、OPPO Find X8、一加13、一加13T。 2025年11月

ColorOS 16 OPPO
“你好BOE”再度携非遗与当代设计亮相米兰以科技之力向世界展现东方美学 http://news.cnmtpt.com/?Sid=0_765W618634033&date=20251009

10月3日，“新生万物”中国非遗与当代设计展暨“你好BOE”品牌巡展在米兰开幕。BOE（京东方）作为首席显示技术合作伙伴，通过透明屏、万境屏等前沿产品，生动呈现茶酒论、唐人宫乐图等非遗文化，展现科技与艺术的深度融合。展览正值中意建交55周年，成为两国文化交流的重要见证，体现BOE以创新科技推动文化传承、拓展全球品牌影响力的战略实践。

中国非遗当代设计展 BOE(京东方)

今日大家都在搜的词：

热文

3 天
7天

今日AI：华为发布4K图像模型PixArt-Σ；这个ComfyUI插件可以还原梦境；Pika把音效视频一锅端了；公众号可以一键集成多种AI功能了

快手进军AI Coding，开发工具、模型和Maas平台齐登场

斩获G-Mark优良设计奖，RingConn智能戒指凭创新设计与技术实力获国际认可

AI日报：阿里夸克“C计划”曝光；Veo3.1将增加视频“精确编辑”功能；Anthropic推出Claude Code网页版

Checkout.com正式推出Flow Remember Me：一键支付，全球通用

AI日报：腾讯发布全新ima2.0;微软发布 Copilot 一系列重磅更新；阿里夸克AI眼镜开启预售

霍涛推动开放战略落地，白山云接入快手KAT-Coder赋能开发者

OPPO ColorOS 16发布：Find X9等机型将全球首发

elexcon官宣定档｜深圳国际电子展 2026年8月25-27日福田启幕

ColorOS 16正式版升级计划公布：OPPO Find X8系列率先尝鲜

“你好BOE”再度携非遗与当代设计亮相米兰以科技之力向世界展现东方美学 http://news.cnmtpt.com/?Sid=0_765W618634033&date=20251009

今日大家都在搜的词：

热文

兰博基尼联名！REDMI K90 Pro Max冠军版官宣

华为nova Flip S小折叠开售：首发3388元起

雷军回应K90定价：最近内存涨价太多希望大家理解这份诚意

REDMI K90标准版12+512GB降价300元小米回应：可退差价

苹果首款2nm手机芯片上热搜 A20由iPhone 18系列首发

小米汽车发布跨年购置税补贴方案至高不超15000元

卢伟冰：REDMI K90标准版12+512首销月直降300 售价2899元

五大升级！红米REDMI K90标准版采用6.59英寸黄金中尺寸

AI日报：阿里夸克“C计划”曝光；Veo3.1将增加视频“精确编辑”

华为FreeClip 2耳夹耳机正式开售：售价1299元搭载NPU AI处理器

iOS 26液态玻璃效果能关了苹果iOS 26.1 Beta 4新增液态玻璃开

兰博基尼联名！REDMI K90 Pro Max冠军版官宣

微信三大更新放出上热搜涉及群聊消息处理、消息撤回等

AI日报：OpenAI发布浏览器Atlas；通义Qwen3-VL新增2B、32B两个

余承东官宣华为路由X3 Pro 采用“日照金山”设计

华为nova Flip S小折叠开售：首发3388元起

真我GT8发布：售价2899元起骁龙8至尊版双芯

站长商机