首页 > 业界 > 关键词  > ComfyUI最新资讯  > 正文

今日AI:华为发布4K图像模型PixArt-Σ;这个ComfyUI插件可以还原梦境;Pika把音效视频一锅端了;公众号可以一键集成多种AI功能了

2024-03-11 15:33 · 稿源:站长之家

欢迎来到【今日AI】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解https://top.aibase.com/

QQ截图20240311154433.png

🤖📱💼AI应用

华为发布图像生成模型PixArt-Σ可直出4K图像

image.png

【AiBase提要:】

⭐采用DiT架构,可直接生成4K图像

⭐借助PixArt-alpha基础预训练,实现弱到强训练

⭐结合高质量训练数据和高效Token压缩,生成高分辨率图像

项目地址:https://top.aibase.com/tool/pixart

ComfyUI-Dream-Interpreter:还原梦境的ComfyUI工作流输入梦境描述生成全景图

【AiBase提要:】

⚙️可通过GitHub克隆项目进行使用

🌌项目结合了梦境解析器和ComfyUI,提供梦境输入、解析和生成功能

🖼️生成全景图像,让用户交互式探索梦境,创新结合梦境解析与交互画面。

Pika发布SoundEffects功能生成的视频可以自动配音效了

image.png

【AiBase提要:】

⭐用户可以通过描述prompt或让AI自动生成音效为视频增添氛围

⭐SoundEffects操作简单,用户只需一个prompt或简单描述就能生成音效

⭐功能目前仅对特定用户开放测试,未来将向所有用户推出

AIwechat-Vercel:无需服务器即可将AI功能集成到公众号中

【AiBase提要:】

⭐️集成多种AI服务(如GPT、星火、通义千问、Gemini等),允许微信公众号通过文本消息与用户进行智能对话。

⭐️支持连续问答,实现了超时回复和记忆对话内容(最长30分钟)

⭐️具备图床功能和被关注时的自定义回复功能

项目地址:https://top.aibase.com/tool/aiwechat-vercel

教程:https://www.bilibili.com/video/BV1Ct421b7xz/

OptimizerAI:可为AI视频自动配音还将支持立体声

image.png

【AiBase提要:】

⭐️通过文字提示创造适用于各种场景的声音和音效。

⭐️支持声音效果生成、变声、风格标签指定,保持生成一致性。

⭐️即将支持文本到声音效果转换、立体声、高质量音频生成。

官网地址:https://www.optimizerai.xyz/

在线体验地址:https://discord.com/invite/bgfnVaaU2n

EasyDiffusionOnline:一款免费的AI绘画工具

image.png

【AiBase提要:】

⭐用户可以免费使用图像生成器和提示生成器。

⭐EasyDiffusionOnline提供多种创作类型,适合不同用户。

⭐平台功能强大,用户可以实现创意想法并分享作品。

体验地址:https://top.aibase.com/tool/easydiffusion-online

图片编辑技术StableDrag发布拖动锚点即可编辑图像同时保持高质量

image.png

【AiBase提要:】

⭐新技术StableDrag基于Diffusion模型,拖动锚点编辑图片。

⭐提供两种类型的图像编辑模型:StableDrag-GAN和StableDrag-Diff。

⭐目前只上线了论文,试玩页面和代码暂未放出

项目地址:https://top.aibase.com/tool/stabledrag

AI实时绘图工具ImgPilot一键将草图转为艺术作品

image.png

【AiBase提要:】

⭐支持实时绘图,随手涂几笔就能变成好看的画

⭐ImgPilot项目基于LeptonAI技术开发,结合多种技术提高效果

⭐提供前后端代码,用户可自由定制部署

项目地址:https://github.com/leptonai/imgpilot

试玩页面:https://top.aibase.com/tool/imgpilot

MIT博士生用VisionPro实时训练机器狗开源项目TrackingSteamer火了

【AiBase提要:】

⭐MIT博士生开源项目VisionPro实时训练

⭐应用程序利用VisionPro追踪人类动作实时传输到其他机器人设备

⭐人类可以为机器人提供精准训练数据,促进人机交互技术的发展

项目地址:https://github.com/Improbable-AI/VisionProTeleop

📰🤖📢AI新鲜事

每年电费2亿?ChatGPT每天竟然要消耗1.7万个家庭的用电量

【AiBase提要:】

🔋OpenAI旗下ChatGPT每日消耗超过50万千瓦时电力,约为1.7万个家庭的用电量。

🔌AI数据中心用电量未来或与小国相当,谷歌等公司搜索请求也消耗大量能耗。

💡AI技术发展需节约能源,监管机构监督企业用电行为,促进可持续发展。

Nvidia因使用侵权作品训练NeMoAI平台被作者起诉

【AiBase提要:】

📚三位作者控告Nvidia未经许可使用其版权图书训练NeMoAI平台。

🚫作者指称Nvidia在NeMo训练后撤下他们的作品。

💡该案或成AI领域版权和数据使用重要先例,影响行业规范和公司行为。

新AI框架H2O:将人类动作实时转换为机器人动作可行走、后空翻、踢球等

【AiBase提要:】

🔄采用可扩展的“从模拟到实际”处理,构建大规模的重定目标运动数据集。

🔄通过训练鲁棒的全身机器人模仿者,成功实现了在真实场景中的动态全身运动遥操作。

🔄通过特权模仿者选择可行动作,确保人形机器人对人类运动高度还原。

项目入口:https://top.aibase.com/tool/human-to-humanoid-h2o-

微软AI研究推数学LLMOrca-Math:通过对Mistral-7B模型进行微调的7B参数小模型

【AiBase提要:】

⭐Orca-Math通过合成数据集和迭代学习重新定义数学问题教学方法。

⭐Orca-Math在GSM8K基准上取得显著成就,展示SLM在教育中的潜力。

⭐Orca-Math利用迭代学习机制取得成功,在解决数学问题方面取得显著进步。

论文地址:https://arxiv.org/abs/2402.14830

谷歌发布Gemini1.5Pro模型技术报告长文记忆能力惊人

【AiBase提要:】

⭐Gemini1.5Pro模型架构、训练数据与基础设施介绍

⭐长篇信息检索任务中完美的记忆回溯能力

⭐长篇信息处理任务准确率达到99%以上

论文地址:https://arxiv.org/pdf/2403.05530.pdf

全球AI人才报告曝光:清华第三,北大第六!

【AiBase提要:】

⭐中国培养出的AI人才占全球近1/2

⭐美国码农面试需12场,薪资压低,面试题难

⭐Meta压低薪资,裁员潮下AI人才需求狂涨42%

谷歌称GeminiNanoAI大模型暂不支持Pixel8手机

【AiBase提要:】

🌟GeminiNano是谷歌旗下Gemini大模型的移动版本。

🌟由于硬件限制,GeminiNano目前无法在Pixel8手机上运行。

🌟但谷歌表示未来将在其他高端设备上推出GeminiNano。

网络安全模型WhiteRabbitNeo发布可识别安全威胁和漏洞

【AiBase提要:】

⭐WhiteRabbitNeo发布了新模型,利用Transformers和PyTorch技术,专注于网络安全领域。

⭐这款模型可识别各种安全威胁和漏洞,如开放端口、未加密服务、API漏洞等。

⭐WhiteRabbitNeo模型还可应用于编程和代码生成领域,帮助解决编程问题。

————————————

今日Midjourney提示词分享:梨花树下的女孩

垫图+ masterpiece,best quality,A beautiful Chinese girl wearing a beige suit jacket,black hair,short hair,round face,detailed facial details,natural light,glasses,solo,photo background,outdoors,shirt,realistic,looking at viewer,tree,a tree full of pear blossoms,teeth,crossed arms,white shirt,long hair,smile,round eyewear,long sleeves,day,jacket,upper body,high definition photography,Captured by Canon camera --ar 3:4 --s 750 --style raw --v 6.0

ai2023__masterpiecebest_qualityA_beautiful_Chinese_girl_wearing_0bbb5df0-c909-4b66-a2cc-53cb3740eda7.png

举报

  • 相关推荐
  • 再次定义行业创新范式 跃然创新推出全球首款端到端 AI 玩具 CocoMate

    8月26日,跃然创新推出全球首款搭载端到端语音模型的AI玩具CocoMate系列。该产品采用可拆卸设计,配备3000mAh电池,支持4G和WiFi网络。依托端到端技术,具备丰富交互表现和拟人化情感能力,支持多重唤醒、主题游戏及聊天室等功能。新品将于8月27日开售,首发包含奥特曼及原创IP“泡泡”等角色,后续还将上线财神爷、塔罗猫等系列,目标人群从儿童延伸至成年人。

  • 网红Coser“若童”因肠癌去世:年仅32岁

    网红Coser若童因肠癌不幸病逝,年仅32岁,抖音账号艾米尔的抹茶拿铁”发布了相关讣告。 讣告中表示,若童于8月27日因病逝世,若童老师待人真诚友善,他非常珍惜这每一段和大家一起度过的时光,非常感谢大家的喜爱和关心,他自始至终心存感激,愿来世还能再相见。 资料显示,肠癌是一种常见的消化道恶性肿瘤,绝大多数由结肠息肉逐渐演变而来,其诱发因素通常包括

  • 七夕“cos委托”走红:年轻人付费请人扮演虚拟恋人

    今天是七夕节,每到七月初七,甜蜜而又浪漫的浪潮奔涌而来。时至今日,七夕节对于现代人的意义依旧重大,随着社会的飞速发展,人们过节的方式似乎悄然发生了改变。 据媒体报道,在今年七夕节,一种名为Cos委托”的七夕约会走红网络,有年

  • WEEX亮相0xConnect线下活动,深化全球化布局与行业伙伴交流

    WEEX交易所受邀出席圣彼得堡0xConnect线下活动,与全球加密品牌共同探讨行业趋势并拓展合作机会。该活动聚集了来自交易所、公链项目、钱包及投资机构的代表,通过面对面交流碰撞出新的合作火花。WEEX团队借此机会向与会者介绍了平台在合规建设、资金安全和用户体验方面的价值理念,展示了打造安全透明交易环境的品牌承诺。未来WEEX将继续参与全球行业活动,以开放姿态推动加密生态健康发展。

  • Matrixport 受邀出席 Bitcoin Asia 2025,共议机构投资新趋势

    Bitcoin Asia 2025峰会将于8月28-29日在香港举行,由BTC Media主办。预计吸引超1.5万名与会者,涵盖主题演讲、圆桌讨论及展览等活动,突显香港在全球数字资产领域的战略地位。会议将探讨亚太市场潜力、机构化进程及多元化投资机会,并邀请200余位全球重量级嘉宾参与。Matrixport作为亚洲领先加密金融服务平台,将持续推动资产数字化及Web3基础设施落地,助力行业创新与发展。

  • OPPO ColorOS宣布升级无网畅聊 没网也能发图片、语音

    日前,OPPO ColorOS宣布无网畅聊全新升级,在无网状态下,不仅能打语音电话,还能发送图片、文字和语音。 使用路径:打开设置”-选择移动网络”-开启无网畅聊”,选择你想联系的欧加手机-发送消息。 据了解,无网畅聊是一项利用蓝牙技术解决近场通信问题的功能。

  • AI日报:腾讯开源3D世界模型HunyuanWorld-Voyager;即梦AI系列模型开放API;通义推智能体开发框架AgentScope 1.0

    本文介绍了AI日报栏目,聚焦人工智能领域最新动态。主要内容包括:腾讯开源具备3D重建能力的HunyuanWorld-Voyager模型、通义实验室推出的多智能体开发框架AgentScope 1.0、即梦AI开放图像与视频生成API、腾讯翻译模型Hunyuan-MT-7B在WMT2025斩获佳绩、苹果推出图像生成技术STARFlow和视觉语言模型FastVLM、新模型CoMPaSS-FLUX.1提升空间理解能力、Cherry Studio免费提供Qwen38B模型、谷歌Gemini API新增网页内容解析功能,以及腾讯优图开源智能体框架Youtu-Agent。这些进展展现了AI技术在多个领域的创新与应用。

  • MCP服务库完整指南:如何选择最适合的Model Context Protocol服务

    本文介绍了MCP(Model Context Protocol)作为连接大型语言模型与外部数据源的重要桥梁。随着AI技术发展,选择合适的MCP服务库对开发者至关重要。文章分析了MCP服务库的核心价值:提升开发效率、增强系统互操作性、降低技术门槛。评估MCP服务库质量需考虑协议兼容性、安全性、生态系统丰富度及社区活跃度等维度。建议开发者根据业务需求选择服务,初创公司可侧重简便性,大型企业应关注安全性和扩展性。文章还指出MCP服务未来将向云原生化、智能化运维和标准化方向发展,并推荐使用专业对比平台(如mcp.aibase.cn)辅助决策。

  • CoinW 全栈融合 ,智能驱动——开启未来交易新格局

    全球领先加密货币交易平台CoinW宣布全面升级,构建"交易无界"一体化生态。平台通过统一账户体系整合中心化与去中心化交易、底层公链基础设施及机构级服务,形成协同互通的全球数字资产生态系统。升级后的CoinW具备三大核心特性:1)智能策略执行系统自动优化交易路径;2)支持链上结算、MPC自托管及RWA等多元资产接入;3)模块化功能组合满足不同交易需求。平�

  • 忆联新一代eMMC 5.1产品:容量倍增、功耗降低18%,以卓越TCO重塑智能终端存储体验

    忆联新一代eMMC5.1产品针对智能终端高清化、强交互性需求,推出256GB大容量版本,性能功耗双升级。关键优势:1)顺序读写速度达330/290MB/s,随机读写33K/30K IOPS;2)功耗降低18%,优化电源管理;3)采用3D NAND和动态SLC缓存技术,写入寿命提升50%至200TBW;4)创新分级睡眠机制,非活跃状态自动切换至微安级模式。通过"大容量+高能效+长寿命"三角模型,显著降低用户TCO,助力智能设备厂商构建可持续发展生态。

今日大家都在搜的词: