首页 > 业界 > 关键词  > ConsiStory最新资讯  > 正文

AI视野:英伟达推文生图模型ConsiStory;高度可控AI试衣OOTDiffusion;开发者推SoraWebui开源项目;Groq最快AI推理芯片成本推算高得离谱

2024-02-21 15:21 · 稿源:站长之家

欢迎来到【AI视野】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解https://top.aibase.com/

🤖📱💼AI应用

英伟达推出免训练,可生成连贯图片的文生图模型ConsiStory

图片

【AiBase提要:】

⭐️ 多数文生图模型使用随机采样模式,导致生成图像不连贯

⭐️ AI生成连贯图像连环画难度大,现有模型效果有限

⭐️ ConsiStory是一种免训练连贯文生图模型,可提升图像一致性和连贯性

论文地址:https://arxiv.org/abs/2402.03286

OOTDiffusion:一个高度可控的虚拟服装试穿AI工具

image.png

【AiBase提要:】

⭐️ 高度可控的虚拟服装试穿工具

⭐️ 按性别和体型自动调整,与模特身形贴合

⭐️ 支持半身模型和全身模型,试穿效果自然逼真

项目地址:https://top.aibase.com/tool/ootdiffusion

试玩地址:https://ootd.ibot.cn/

Sora还没正式开放 有开发者已经搞出了SoraWebui

【AiBase提要:】

🚀 Sora因视频生成效果惊艳火爆出圈,但仍在内测阶段,多数用户只能看。

🛠️ SoraWebui开源项目提前研究,模拟API接口字段实现,为未来上线做准备。

🔗 开源项目支持Vercel一键部署,便于开发者使用和测试。

项目地址:https://top.aibase.com/tool/sorawebui

Adobe推类ChatGPT助手AI Assistant 并集成到PDF中

image.png

【AiBase提要:】

⭐ Adobe推出生成式AI助手AI Assistant

⭐ AI Assistant类似于ChatGPT,提供摘要、核心见解

⭐ 用户可通过AI生成引擎验证答案来源,提升Reader和Acrobat的商业价值

谷歌AI推出ScreenAI:用于UI和信息图解读的视觉语言模型

【AiBase提要:】

⭐️GoogleAI团队推出了ScreenAI,一个视觉语言模型。

⭐️ScreenAI在多个任务上表现出色,包括图形问答和摘要生成。

⭐️发布了三个新数据集,为未来研究提供更多资源。

论文地址:https://arxiv.org/abs/2402.04615

FreeControl:无需训练即可控制任何文本到图像扩散模型的空间控制方法

image.png

【AiBase提要:】

⭐️支持多个条件、架构和检查点同时进行控制生成

⭐️通过结构和外观引导,实现对生成图像的控制

⭐️展示了 T2I 扩散模型进行可控生成的定性结果

项目网址:https://top.aibase.com/tool/freecontrol

Comfyui更新Stable Cascade 7个模型整合为两个模型文件

【AiBase提要:】

⭐ 简化操作流程,用户只需选择C和B阶段的模型文件

⭐ 提高用户便利性,更新后生成的图片质量和美观度显著提升

⭐ 但更新带来伪影问题,期待官方修复,提升用户体验

项目地址:https://top.aibase.com/tool/stable-cascade

工作流及模型下载:https://comfyanonymous.github.io/ComfyUI_examples/stable_cascade/

Reddit大佬开发GLIGEN GUI 可指定图像大小、位置等

image.png

【AiBase提要:】

⭐️ GLIGEN GUI让用户可以控制生成图像的大小、位置和元素之间的空间关系

⭐️ GLIGEN可以根据自然语言描述生成高质量的图像

⭐️ GLIGEN提供灵活性和创造性,让用户创造惊人的图像作品

GLIGEN GUI项目地址:https://top.aibase.com/tool/gligen-gui

GLIGEN项目地址:https://top.aibase.com/tool/gligen

目标检测跟踪模型YOLOv8能快速识别和定位多个对象

image.png

【AiBase提要:】

⭐ YOLOv8是一种先进的目标检测跟踪模型

⭐ 支持多种格式部署,提高了模型的可用性和兼容性

⭐ 适用于多种领域,包括安防监控、医疗图像分析、自动驾驶等

项目地址:https://top.aibase.com/tool/yolov8

FiT:一种全新的Transformer架构图像生成模型 分辨率和高宽比不受限制

【AiBase提要:】

⭐ FiT将图像视为一系列可变大小的图像块(Token)

⭐ FiT在处理不同分辨率的图像方面表现出卓越性能

⭐ FiT为生成不受限制的图像提供新的解决方案

项目地址:https://top.aibase.com/tool/fit

AnyGPT:实现任意模态输入到任意模态输出

image.png

【AiBase提要】

⚙️ 采用离散表示技术,实现多模态输入的统一处理

🔄 灵活性: 可稳定训练并轻松集成新模态

🎭 实用性: 生成大规模多模态指令数据集,实现任意多模态对话

产品入口:https://top.aibase.com/tool/any-gpt-

📰🤖📢AI新鲜事

Groq最快AI推理芯片成本推算高得离谱 运行LIama2得1171万美元

image.png

【AiBase提要:】

⚙️ Groq公司推出AI芯片与英伟达GPU性价比对比

💰 运行LIama2所需成本高达1171万美元

🔎 分析师评估成本效益,Groq需面对英伟达竞争

项目入口:https://top.aibase.com/tool/groq

马斯克X平台与Midjourney正商谈合作 致力于生成式AI项目

【AiBase提要】

⚙️ Elon Musk的X与Midjourney商谈合作,可能推动生成式人工智能项目。

🧠 可能合作在选举前识别X平台上的GenAI内容,推动人工智能技术应用。

🌐 Midjourney的生成式AI计划可根据自然语言描述生成图像,与其他项目类似。

B站UP主让AI修习春山学 视频播放量近200万

【AiBase提要:】

⭐️ 央视春晚《上春山》引发热议,UP主让AI修习春山学。

⭐️ AI识别节目表演者面部情绪,实时显示在视频中。

⭐️ AI情绪识别技术或带来更多便利和乐趣。

举报

  • 相关推荐
  • 霍涛推动开放战略落地,白山云接入快手KAT-Coder赋能开发者

    白山云科技与快手StreamLake合作,在其“白山智算”平台上线闭源编程大模型KAT-Coder。该模型在SWE-Bench测试中解决率达73.4%,性能媲美全球顶尖模型,支持端到端代码生成。白山云通过“顶尖模型能力+全球边缘算力”整合,为开发者提供低于300ms超低延时代码生成服务,仅需一行代码即可调用,大幅降低AI开发门槛。此次合作是白山云完善AI工具链布局的关键一步,未来将持续深化开放协作,优化模型与边缘算力服务模式。

  • 贝锐蒲公英上架iStoreOS应用中心:一键异地组网,高速远程访问!

    iStoreOS智能路由系统通过集成蒲公英异地组网,解决了远程访问NAS时无公网IP、配置复杂等痛点。用户只需在应用中心安装蒲公英插件,即可快速组建虚拟局域网,实现Jellyfin/Emby影音库远程播放、HomeAssistant智能家居控制、异地文件同步等功能。该系统支持全平台客户端,提供P2P直连和智能链路优化,确保跨运营商高速稳定访问,让家庭媒体中心、企业多网点互联等场景获得流畅远程体验。

  • 2025 HarmonyOS Connect伙伴峰会顺利举办,小豚当家携黑科技新品精彩亮相!

    2025年9月26日,HarmonyOS Connect伙伴峰会在深圳举行。小豚当家作为鸿蒙智选生态首批伙伴,发布首款搭载鲸瞳影像的户外摄像头鲸瞳Max,实现0.01Lux暗光全彩成像,破解日夜全彩难题。产品集成星瀚AI大模型,具备主动思考与看懂能力,推动家庭安防进入“看懂时代”。同时打通家庭存储,构建全链路安防体系,支持多设备联动与多终端共享。小豚当家与鸿蒙智选合作六年,多款产品完成HarmonyOS适配,实现无缝协同。此次发布标志着家庭安防生态迈出重要一步。

  • Checkout.com正式推出Flow Remember Me: 一键支付,全球通用

    Checkout.com推出嵌入式支付产品Flow的"记住我"功能,消费者仅需存储一次银行卡信息即可在全球商户网络实现跨平台快捷支付。测试数据显示,该功能最高可缩短70%付款时间并提升7%支付成功率。同时公司升级AI分析套件、支付优化工具及收单网络,并与Visa、Mastercard和Google达成AI智能体合作,助力商户在数字支付领域保持领先地位。

  • OPPO ColorOS 16发布:Find X9等机型将全球首发

    10月15日,OPPO正式发布ColorOS 16系统,由Find X9系列、一加15、一加Ace6及OPPO Pad5等机型首发。系统在流畅度、AI功能和生态互联实现重大突破:三大引擎提升流畅度,系统重载流畅度提升37%,功耗降低13%;新增一键闪记、智能场景识别等便捷功能;小布助手升级,提供个性化推荐;AI实景对话支持声纹识别;生态互联打通与Apple Watch壁垒,实现跨设备信息显示与操作迁移,全面提升用户体验。

  • RingConn智能戒指解码健康数据,亮相上海市医师协会医学大数据创新应用论坛

    9月27日,上海市医师协会医学大数据与转化创新专委会成立,并举办医学大数据创新应用论坛。会议聚焦可穿戴设备的医疗级数据价值,以RingConn智能戒指为例,展示其在持续监测心率、血氧、睡眠呼吸暂停(OSA)筛查等方面的突破。该产品凭借高佩戴率(超80%)和精准数据,正推动健康管理从医院向家庭延伸、从治疗向预防前移。未来,智能可穿戴设备将构建协同生态,实现数据互补与价值共生。

  • 开会必须面对面?TCL会议电视说NO!

    在分秒必争的商业环境中,传统面对面会议因效率低、成本高、协同难等问题阻碍发展。TCL会议电视通过创新技术打破局限:支持秒级无线投屏,简化设备连接;内置主流会议软件,实现一键入会;专业拾音与AI降噪确保远程沟通清晰;防眩光技术和广视角设计保障观看体验;灵活移动适配多样办公场景。其价值不仅提升会议效率,更助力企业降低差旅成本、加快决策、增强协同,在数字化浪潮中以高效抢占发展先机。

  • ColorOS 16正式版升级计划公布:OPPO Find X8系列率先尝鲜

    据ColorOS官微消息,OPPO全新系统ColorOS 16正式版升级适配计划今日公布,OPPO Find X8系列、一加13系列会在本月率先升级ColorOS 16正式版,具体如下。 2025年10月30日 OPPO Find N5、OPPO Find N5卫星通信版、OPPO Find X8 Ultra、OPPO Find X8 Ultra卫星通信版、OPPO Find X8s 、OPPO Find X8s、OPPO Find X8 Pro、OPPO Find X8 Pro卫星通信版、OPPO Find X8、一加13、一加13T。 2025年11月

  • ​​会议卡顿拖后腿?TCL会议平板让协作“零延迟”​​

    TCL会议平板V66N通过视听升级、智慧白板和无线投屏三大功能解决远程办公痛点:搭载5000万像素摄像头与AI影像算法,实现逆光清晰画质和发言人自动追踪;8阵列麦克风配合AI降噪,有效过滤环境杂音;超低延迟电子白板支持多人实时书写,手势擦除等智能功能简化操作;采用5G点对点传输与Wi-Fi 6协议,实现4K秒级无线投屏。内置主流会议软件,适配全场景协作,重新定义高效协作标准。

  • 正浩EcoFlow荣登《时代》杂志2025年度“最佳发明”榜单,OCEAN Pro获评绿色能源类创新典范

    《时代》杂志公布2025年度最佳发明榜单,正浩EcoFlow旗舰家庭储能系统OCEAN+Pro入选绿色能源类榜单。该系统通过AI驱动的智能能源管理,实现家庭高效储电与清洁电力调度,支持停电供电与高峰用电优化。这是正浩第三次获此殊荣,其北美洲业务总裁表示奖项印证了品牌在清洁能源创新领域的持续引领力。同时该企业今年还入选《时代》"全球顶尖绿色科技企业250强",凸显行业领导地位。

今日大家都在搜的词:

热文

  • 3 天
  • 7天