首页 > 业界 > 关键词  > ComfyUI最新资讯  > 正文

今日AI:华为发布4K图像模型PixArt-Σ;这个ComfyUI插件可以还原梦境;Pika把音效视频一锅端了;公众号可以一键集成多种AI功能了

2024-03-11 15:33 · 稿源:站长之家

欢迎来到【今日AI】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解https://top.aibase.com/

QQ截图20240311154433.png

🤖📱💼AI应用

华为发布图像生成模型PixArt-Σ可直出4K图像

image.png

【AiBase提要:】

⭐采用DiT架构,可直接生成4K图像

⭐借助PixArt-alpha基础预训练,实现弱到强训练

⭐结合高质量训练数据和高效Token压缩,生成高分辨率图像

项目地址:https://top.aibase.com/tool/pixart

ComfyUI-Dream-Interpreter:还原梦境的ComfyUI工作流输入梦境描述生成全景图

【AiBase提要:】

⚙️可通过GitHub克隆项目进行使用

🌌项目结合了梦境解析器和ComfyUI,提供梦境输入、解析和生成功能

🖼️生成全景图像,让用户交互式探索梦境,创新结合梦境解析与交互画面。

Pika发布SoundEffects功能生成的视频可以自动配音效了

image.png

【AiBase提要:】

⭐用户可以通过描述prompt或让AI自动生成音效为视频增添氛围

⭐SoundEffects操作简单,用户只需一个prompt或简单描述就能生成音效

⭐功能目前仅对特定用户开放测试,未来将向所有用户推出

AIwechat-Vercel:无需服务器即可将AI功能集成到公众号中

【AiBase提要:】

⭐️集成多种AI服务(如GPT、星火、通义千问、Gemini等),允许微信公众号通过文本消息与用户进行智能对话。

⭐️支持连续问答,实现了超时回复和记忆对话内容(最长30分钟)

⭐️具备图床功能和被关注时的自定义回复功能

项目地址:https://top.aibase.com/tool/aiwechat-vercel

教程:https://www.bilibili.com/video/BV1Ct421b7xz/

OptimizerAI:可为AI视频自动配音还将支持立体声

image.png

【AiBase提要:】

⭐️通过文字提示创造适用于各种场景的声音和音效。

⭐️支持声音效果生成、变声、风格标签指定,保持生成一致性。

⭐️即将支持文本到声音效果转换、立体声、高质量音频生成。

官网地址:https://www.optimizerai.xyz/

在线体验地址:https://discord.com/invite/bgfnVaaU2n

EasyDiffusionOnline:一款免费的AI绘画工具

image.png

【AiBase提要:】

⭐用户可以免费使用图像生成器和提示生成器。

⭐EasyDiffusionOnline提供多种创作类型,适合不同用户。

⭐平台功能强大,用户可以实现创意想法并分享作品。

体验地址:https://top.aibase.com/tool/easydiffusion-online

图片编辑技术StableDrag发布拖动锚点即可编辑图像同时保持高质量

image.png

【AiBase提要:】

⭐新技术StableDrag基于Diffusion模型,拖动锚点编辑图片。

⭐提供两种类型的图像编辑模型:StableDrag-GAN和StableDrag-Diff。

⭐目前只上线了论文,试玩页面和代码暂未放出

项目地址:https://top.aibase.com/tool/stabledrag

AI实时绘图工具ImgPilot一键将草图转为艺术作品

image.png

【AiBase提要:】

⭐支持实时绘图,随手涂几笔就能变成好看的画

⭐ImgPilot项目基于LeptonAI技术开发,结合多种技术提高效果

⭐提供前后端代码,用户可自由定制部署

项目地址:https://github.com/leptonai/imgpilot

试玩页面:https://top.aibase.com/tool/imgpilot

MIT博士生用VisionPro实时训练机器狗开源项目TrackingSteamer火了

【AiBase提要:】

⭐MIT博士生开源项目VisionPro实时训练

⭐应用程序利用VisionPro追踪人类动作实时传输到其他机器人设备

⭐人类可以为机器人提供精准训练数据,促进人机交互技术的发展

项目地址:https://github.com/Improbable-AI/VisionProTeleop

📰🤖📢AI新鲜事

每年电费2亿?ChatGPT每天竟然要消耗1.7万个家庭的用电量

【AiBase提要:】

🔋OpenAI旗下ChatGPT每日消耗超过50万千瓦时电力,约为1.7万个家庭的用电量。

🔌AI数据中心用电量未来或与小国相当,谷歌等公司搜索请求也消耗大量能耗。

💡AI技术发展需节约能源,监管机构监督企业用电行为,促进可持续发展。

Nvidia因使用侵权作品训练NeMoAI平台被作者起诉

【AiBase提要:】

📚三位作者控告Nvidia未经许可使用其版权图书训练NeMoAI平台。

🚫作者指称Nvidia在NeMo训练后撤下他们的作品。

💡该案或成AI领域版权和数据使用重要先例,影响行业规范和公司行为。

新AI框架H2O:将人类动作实时转换为机器人动作可行走、后空翻、踢球等

【AiBase提要:】

🔄采用可扩展的“从模拟到实际”处理,构建大规模的重定目标运动数据集。

🔄通过训练鲁棒的全身机器人模仿者,成功实现了在真实场景中的动态全身运动遥操作。

🔄通过特权模仿者选择可行动作,确保人形机器人对人类运动高度还原。

项目入口:https://top.aibase.com/tool/human-to-humanoid-h2o-

微软AI研究推数学LLMOrca-Math:通过对Mistral-7B模型进行微调的7B参数小模型

【AiBase提要:】

⭐Orca-Math通过合成数据集和迭代学习重新定义数学问题教学方法。

⭐Orca-Math在GSM8K基准上取得显著成就,展示SLM在教育中的潜力。

⭐Orca-Math利用迭代学习机制取得成功,在解决数学问题方面取得显著进步。

论文地址:https://arxiv.org/abs/2402.14830

谷歌发布Gemini1.5Pro模型技术报告长文记忆能力惊人

【AiBase提要:】

⭐Gemini1.5Pro模型架构、训练数据与基础设施介绍

⭐长篇信息检索任务中完美的记忆回溯能力

⭐长篇信息处理任务准确率达到99%以上

论文地址:https://arxiv.org/pdf/2403.05530.pdf

全球AI人才报告曝光:清华第三,北大第六!

【AiBase提要:】

⭐中国培养出的AI人才占全球近1/2

⭐美国码农面试需12场,薪资压低,面试题难

⭐Meta压低薪资,裁员潮下AI人才需求狂涨42%

谷歌称GeminiNanoAI大模型暂不支持Pixel8手机

【AiBase提要:】

🌟GeminiNano是谷歌旗下Gemini大模型的移动版本。

🌟由于硬件限制,GeminiNano目前无法在Pixel8手机上运行。

🌟但谷歌表示未来将在其他高端设备上推出GeminiNano。

网络安全模型WhiteRabbitNeo发布可识别安全威胁和漏洞

【AiBase提要:】

⭐WhiteRabbitNeo发布了新模型,利用Transformers和PyTorch技术,专注于网络安全领域。

⭐这款模型可识别各种安全威胁和漏洞,如开放端口、未加密服务、API漏洞等。

⭐WhiteRabbitNeo模型还可应用于编程和代码生成领域,帮助解决编程问题。

————————————

今日Midjourney提示词分享:梨花树下的女孩

垫图+ masterpiece,best quality,A beautiful Chinese girl wearing a beige suit jacket,black hair,short hair,round face,detailed facial details,natural light,glasses,solo,photo background,outdoors,shirt,realistic,looking at viewer,tree,a tree full of pear blossoms,teeth,crossed arms,white shirt,long hair,smile,round eyewear,long sleeves,day,jacket,upper body,high definition photography,Captured by Canon camera --ar 3:4 --s 750 --style raw --v 6.0

ai2023__masterpiecebest_qualityA_beautiful_Chinese_girl_wearing_0bbb5df0-c909-4b66-a2cc-53cb3740eda7.png

举报

  • 相关推荐
  • 硅谷最新估值5亿的文档产品Mintlify:以AI为上帝重构,1000万ARR

    如果说“App正在消失”的观点略有夸张,那么一个更明确的趋势是:App的使用方式正在发生变化。用户不再总是打开应用、逐层点击、自己完成操作,而是直接表达需求,由AI在后台完成调用和执行。 这带来了新的问题和机会。 拿餐饮场景来说,如果有一天越来越多的客人不再亲自翻菜单,而是让AI助手根据自己的口味、预算和忌口推荐菜品,那么问题就变成:你的菜单是否以�

  • Check Point公司在Miercom 2026年混合网状网络安全评估中位居第一

    Miercom《2026年混合网状网络安全评估报告》显示,Check Point以99.8%的综合安全有效性得分连续第四年领跑行业。在AI加速网络攻击的背景下,该公司实现100%钓鱼攻击检测率、99.9% AI驱动恶意软件防御率,并较竞争对手减少97%已知可利用漏洞。其威胁防护能力在攻击早期阶段即可拦截新兴恶意软件,同时保持网络性能与用户体验,全面满足企业级混合网状架构安全需求。

  • 国际家庭日|阿里斯顿COZY系列冷凝炉:以舒适与安心温暖每一个家:

    5月15日是第33个国际家庭日,主题为“守护家庭幸福、传递居家温暖”。阿里斯顿秉持“一直有温度的家”理念,推出COZY系列冷凝炉,通过人性化设计守护家庭:针对长辈,零冷水功能与±1℃恒温技术提供便捷舒适;针对儿童,严格安全测试与环保燃烧技术保障健康;针对全家,高效节能与耐用设计降低开支,打造绿色居家环境。品牌深耕家庭舒适领域,以用户需求为核心,持续创新产品与服务,守护每个家庭的温暖与安心。

  • 牛客AI Coding考试正式上线!重写技术招聘标准

    AI时代下,技术岗评估标准已从“编码与发现bug的能力”转向“AI协作下的工程能力”。企业若沿用旧评估方式,会面临面试合格者实际交付不稳、沟通成本高、工程难闭环等问题。牛客推出的AI+Coding考试,通过模拟真实研发协作环境,从需求理解、任务拆解、AI协同、结果校验到风险识别,全面评估候选人能力。考试采用“结果+过程”双维度模型,结果分聚焦任务完成度,过程分评估AI对话质量和Token效率,确保考核科学性和可解释性,帮助企业精准识别真正能干的AI协作型技术人才。

  • 谷粒 GuliKit Joy-Con 2 TMR 电磁摇杆正式发售

    谷粒科技发布全球首款采用TMR电磁摇杆技术的Joy-Con 2替换摇杆,专为Nintendo Switch 2设计,解决传统碳膜摇杆漂移问题。产品1:1结构设计,无需改动电路即可安装,具备防漂移、长寿命、高精度、低功耗等优势,并通过抗磁干扰优化确保稳定体验。售价国内69元,海外19.99美元起,2026年5月13日起全球发售。

  • 豆包输入法macOS版正式上线:苹果电脑也能用嘴打字 支持中英混说

    今日,豆包宣布,豆包输入法macOS版本正式上线,苹果电脑用户也能体验语音输入用嘴打字”。 据介绍,豆包输入法macOS版基于豆包App同款语音模型,支持在任意输入框中实时语音转文字,用户边说话边出字,输入过程更直观,并且不设语音输入时长限制。

  • RingConn Gen 3发布:以血管健康AI洞察,定义智能戒指新品类

    5月5日,全球智能戒指领导品牌RingConn发布年度旗舰新品RingConn Gen3血管健康AI智能戒指。该产品以长期血管健康洞察为核心突破,搭载AI震动提醒、超长续航及多维度健康监测能力,通过个性化基线模型和深度学习算法,实现从单点测量到长期趋势管理的跃升,为用户提供无感、连续、智能的慢病防控新方案。

  • 告别CityWalk,这届年轻人又迷上ColorWalk

    ​春天来了,这届年轻人又整新活儿了。 不是特种兵式旅行,也不是飞去某个“网红”城市打卡,玩法简单质朴:出门前在心里选定一个颜色,然后就这么走出去,走进日常街道,不设目的地,只寻找与这个颜色有关的一切。 一朵粉樱、一辆蓝单车、一块橙色招牌,甚至一个红色垃圾桶,都算“找到了”。 这就是席卷社交平台的ColorWalk。小红书上相关话题浏览量突破4.6亿次�

  • 屡获国际金奖的机器人咖啡馆COFE+登陆美国亚特兰大

    上海氦豚机器人科技的全智能咖啡机器人COFE+正式登陆美国佐治亚州首府亚特兰大,这是继哈佛大学、麻省总医院等之后,中国智造对美国市场的又一次深度拓展。COFE+搭载AI智慧大脑,精准控制300余项参数,实现92.5°C±0.1°C水温和9巴±0.2巴萃取压力,40秒出品卡布奇诺,比人类咖啡师提速2倍。产品支持8大类饮品、超5000种个性化定制,获FDA等15大国际认证,可在-20°C至40°C环境稳定运行。其“轻店模式”实现零人工、零店铺,运营成本降低90%以上,投资回报周期仅4-8个月,重新定义了美国咖啡市场的效率与品质标准。

  • iSlide 上线 macOS 插件版,进一步完善 AI 时代的 PPT 制作体验

    iSlide推出macOS插件版,直接嵌入PowerPoint,实现AI生成PPT、模板资源、图示图表及设计排版等功能的原生融合。这解决了Mac用户需在多个工具间切换的痛点,提供从内容生成到视觉呈现的一体化高效工作流,覆盖模板、图示、图片等核心资源场景,并配备矩阵布局等设计工具,显著提升PPT制作效率与专业度。

今日大家都在搜的词: