首页 > 业界 > 关键词  > ConsiStory最新资讯  > 正文

AI视野:英伟达推文生图模型ConsiStory;高度可控AI试衣OOTDiffusion;开发者推SoraWebui开源项目;Groq最快AI推理芯片成本推算高得离谱

2024-02-21 15:21 · 稿源:站长之家

欢迎来到【AI视野】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解https://top.aibase.com/

🤖📱💼AI应用

英伟达推出免训练,可生成连贯图片的文生图模型ConsiStory

图片

【AiBase提要:】

⭐️ 多数文生图模型使用随机采样模式,导致生成图像不连贯

⭐️ AI生成连贯图像连环画难度大,现有模型效果有限

⭐️ ConsiStory是一种免训练连贯文生图模型,可提升图像一致性和连贯性

论文地址:https://arxiv.org/abs/2402.03286

OOTDiffusion:一个高度可控的虚拟服装试穿AI工具

image.png

【AiBase提要:】

⭐️ 高度可控的虚拟服装试穿工具

⭐️ 按性别和体型自动调整,与模特身形贴合

⭐️ 支持半身模型和全身模型,试穿效果自然逼真

项目地址:https://top.aibase.com/tool/ootdiffusion

试玩地址:https://ootd.ibot.cn/

Sora还没正式开放 有开发者已经搞出了SoraWebui

【AiBase提要:】

🚀 Sora因视频生成效果惊艳火爆出圈,但仍在内测阶段,多数用户只能看。

🛠️ SoraWebui开源项目提前研究,模拟API接口字段实现,为未来上线做准备。

🔗 开源项目支持Vercel一键部署,便于开发者使用和测试。

项目地址:https://top.aibase.com/tool/sorawebui

Adobe推类ChatGPT助手AI Assistant 并集成到PDF中

image.png

【AiBase提要:】

⭐ Adobe推出生成式AI助手AI Assistant

⭐ AI Assistant类似于ChatGPT,提供摘要、核心见解

⭐ 用户可通过AI生成引擎验证答案来源,提升Reader和Acrobat的商业价值

谷歌AI推出ScreenAI:用于UI和信息图解读的视觉语言模型

【AiBase提要:】

⭐️GoogleAI团队推出了ScreenAI,一个视觉语言模型。

⭐️ScreenAI在多个任务上表现出色,包括图形问答和摘要生成。

⭐️发布了三个新数据集,为未来研究提供更多资源。

论文地址:https://arxiv.org/abs/2402.04615

FreeControl:无需训练即可控制任何文本到图像扩散模型的空间控制方法

image.png

【AiBase提要:】

⭐️支持多个条件、架构和检查点同时进行控制生成

⭐️通过结构和外观引导,实现对生成图像的控制

⭐️展示了 T2I 扩散模型进行可控生成的定性结果

项目网址:https://top.aibase.com/tool/freecontrol

Comfyui更新Stable Cascade 7个模型整合为两个模型文件

【AiBase提要:】

⭐ 简化操作流程,用户只需选择C和B阶段的模型文件

⭐ 提高用户便利性,更新后生成的图片质量和美观度显著提升

⭐ 但更新带来伪影问题,期待官方修复,提升用户体验

项目地址:https://top.aibase.com/tool/stable-cascade

工作流及模型下载:https://comfyanonymous.github.io/ComfyUI_examples/stable_cascade/

Reddit大佬开发GLIGEN GUI 可指定图像大小、位置等

image.png

【AiBase提要:】

⭐️ GLIGEN GUI让用户可以控制生成图像的大小、位置和元素之间的空间关系

⭐️ GLIGEN可以根据自然语言描述生成高质量的图像

⭐️ GLIGEN提供灵活性和创造性,让用户创造惊人的图像作品

GLIGEN GUI项目地址:https://top.aibase.com/tool/gligen-gui

GLIGEN项目地址:https://top.aibase.com/tool/gligen

目标检测跟踪模型YOLOv8能快速识别和定位多个对象

image.png

【AiBase提要:】

⭐ YOLOv8是一种先进的目标检测跟踪模型

⭐ 支持多种格式部署,提高了模型的可用性和兼容性

⭐ 适用于多种领域,包括安防监控、医疗图像分析、自动驾驶等

项目地址:https://top.aibase.com/tool/yolov8

FiT:一种全新的Transformer架构图像生成模型 分辨率和高宽比不受限制

【AiBase提要:】

⭐ FiT将图像视为一系列可变大小的图像块(Token)

⭐ FiT在处理不同分辨率的图像方面表现出卓越性能

⭐ FiT为生成不受限制的图像提供新的解决方案

项目地址:https://top.aibase.com/tool/fit

AnyGPT:实现任意模态输入到任意模态输出

image.png

【AiBase提要】

⚙️ 采用离散表示技术,实现多模态输入的统一处理

🔄 灵活性: 可稳定训练并轻松集成新模态

🎭 实用性: 生成大规模多模态指令数据集,实现任意多模态对话

产品入口:https://top.aibase.com/tool/any-gpt-

📰🤖📢AI新鲜事

Groq最快AI推理芯片成本推算高得离谱 运行LIama2得1171万美元

image.png

【AiBase提要:】

⚙️ Groq公司推出AI芯片与英伟达GPU性价比对比

💰 运行LIama2所需成本高达1171万美元

🔎 分析师评估成本效益,Groq需面对英伟达竞争

项目入口:https://top.aibase.com/tool/groq

马斯克X平台与Midjourney正商谈合作 致力于生成式AI项目

【AiBase提要】

⚙️ Elon Musk的X与Midjourney商谈合作,可能推动生成式人工智能项目。

🧠 可能合作在选举前识别X平台上的GenAI内容,推动人工智能技术应用。

🌐 Midjourney的生成式AI计划可根据自然语言描述生成图像,与其他项目类似。

B站UP主让AI修习春山学 视频播放量近200万

【AiBase提要:】

⭐️ 央视春晚《上春山》引发热议,UP主让AI修习春山学。

⭐️ AI识别节目表演者面部情绪,实时显示在视频中。

⭐️ AI情绪识别技术或带来更多便利和乐趣。

举报

  • 相关推荐
  • 大家在看
  • AI文生图模型PixArt-sigma,可以生成4K分辨率

    PixArt-sigma由华为诺亚方舟实验室联合多个研究机构共同开发的项目,是一个强大的文本到图像生成模型,通过弥散Transformer进行弱到强训练,旨在实现4K分辨率的图像生成。PixArt-sigma采用了弥散Transformer进行弱到强训练,从能够更好地生成高质量的4K分辨率图像。在应用方面,PixArt-Σ是一款强大的文本到图像生成工具,具有广泛的应用场景,可以满足艺术、设计、游戏开发、营销

  • Stable Diffusion 3 API申请入口 AI文生图API官方免费申请地址

    StableDiffusion3API是一款先进的文本到图像生成系统,它在排版和提示遵循方面与DALL-E3和Midjourneyv6等顶尖系统相匹敌或更优。该系统采用新的多模态扩散变换器架构,使用不同的权重集来改善图像和语言的表示,从提高文本理解和拼写能力。StableDiffusion3API的使用场景示例在以下情况下,您可以使用StableDiffusion3API进行图像生成:生成广告宣传图创建游戏角色概念图辅助教学材料的图像制作产品特色和功能StableDiffusion3API具有以下特色和功能:文本到图像的生成多模态扩散变换器架构图像和语言的独立表示文本理解和拼写能力提升想要了解更多关于StableDiffusion3API的信息并开始您的图像生成之旅,请访问StableDiffusion3API官方网站。

  • 英伟达发布AI Enterprise5.0,助力企业生成式AI开发

    英伟达正式发布了AIEnterprise5.0,这是一项旨在帮助企业加速生成式人工智能开发的重要产品。AIEnterprise5.0包含了英伟达微服务和可下载的软件容器,这些组件可用于部署生成式AI应用程序和加速计算。该产品不仅可以从安全、可投入生产且性能优化的软件中受益能够实现灵活部署,可以部署在数据中心、云端、工作站或网络边缘,满足不同场景下的需求。

  • 英伟达AI Workbench正式发布,大幅度简化大模型开发流程

    3月22日,英伟达在官网宣布,正式发布NVIDIAAIWorkbench。AIWorkbench是一款面向AI大模型开发人员的工具包,可以帮助开发人员消除很多繁琐、复杂的部署、开发流程。Workbench项目整合了所有需要的资源和元数据,以简化跨各种基础设施的工作流管理,同时促进无缝移植和可在任何地方再现性。

  • AI日报:首个AI程序员Devin造假被抓;​Sora平替?StreamingT2V试玩地址公布;Udio AI还可以创作喜剧、演讲;XAI发布Grok-1.5Vision多模态模型

    欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解:https://top.aibase.com/🤖📱💼AI应用Sora平替?2分钟超长AI视频模型StreamingT2V免费开源试玩地址公布UdioAI提供多功能音频生成还可以创作喜剧、演讲、电台广播等美图Wink“AI动漫”功能升级可将短剧作品转化为动漫风格StableDesign:适用于室内装修设计的SD方案文字提示就可修改室内设计图比换脸更强大!SwapAnything:替换图片中的任意元素AI延时视频生成工具MagicTime在线体验地址放出自动化写作工具STORM:可生成像维基百科一样的深度长篇内容Meta推出ViewDiff模型:文本生成多视角3D图像📰🤖📢AI新鲜事首个AI程序员造假被抓,Devin再次“震撼”硅谷!扒皮视频文字详解附上马斯克XAI发布Grok-1.5Vision多模态模型,可处理文本和图片信息360智脑7B参数大模型正式开源最长支持约50万字输入Adobe图像生成AI“Firefly”训练集中约有5%为AI图像代码、模型全开源!贾佳亚团队多模态模型Mini-Gemini登上热榜面壁智能开源MiniCPM2.0系列模型OCR等能力显著增强竞争升温!ChatGPT增长疲软3月全球访问量17.7亿次,Claude逐渐崛起InstantID团队推新风格迁移方法InstantStyle一键置身“梵高星空”——————每日midjourneyprompt:小说古风美女图源备注:图片由AI生成,图片授权服务商MidjourneyAbeautifulwomanfromancientChina,dressedinagorgeousredHanfu,withlonghairdrapedoverhershoulders,satinherboudoirwithasmile.Ancientstyle,hanfu,boudoir,gorgeous,palace,screen,carpet,softlight,eleganttemperament,ancientculture,inlinewithorientalaesthetics,richdetails,bestquality,exquisitemakeup,cleareyelinerpen,slendereyebrows,texturedskin,whiteskin,charmingheaddress,--ar3:4--niji6--styleraw一个中国古代美女,穿着华丽的红色汉服,长发披肩,微笑着坐在闺房内。

  • fal官网体验入口 生成式媒体模型AI推理工具使用地址

    fal是一个生成式媒体平台,旨在为开发者提供最先进的生成式媒体模型,并通过fal的推理专家优化,实现闪电般快速的推理。该平台支持实时WebSocket推理基础设施,并提供私有部署选项,以最经济的方式根据使用量付费。开发者可通过fal灵活的计费方式,实现经济高效的生成式媒体应用。

  • Fireworks.ai开源API使任何开发者都能使用生成式AI

    随着人们对生成式AI的热情不断高涨,越来越多的公司试图涉足这一领域。Fireworks.ai就是其中之一。该公司在2022年获得了2500万美元的融资,由Benchmark领投,SequoiaCapital和未透露姓名的天使投资者参与。

  • 除了唱歌,AI还能替你演出?又一AI公司将虚拟人推到新高度

    用Suno十秒写歌,是不是已经很震撼?现在不仅如此,用最新的AI工具,我们还可以快速生成歌手唱歌MV。一家名为AKOOL的AI公司推出了一个唱歌虚拟人工具,用户只需在平台上选择虚拟人,简单输入歌词指令,便可生成能唱歌的虚拟人MV。随着AI技术的不断进步,AKOOL将继续在创新和责任之间寻找平衡,引领行业技术向前发展。

  • AI行业买英伟达GPU,花的钱比赚的多17倍

    搞AI大模型,实在太烧钱了。如今的生成式AI有很大一部分是资本游戏,科技巨头利用自身强大的算力和数据占据领先位置,并正在使用先进GPU的并行算力将其推广落地。无论花掉多少钱,成为第一可能就会带来潜在的收益……但是什么样的收益,我们还无法作出预测。

  • Diffusion-RWKV官网体验入口 AI生成质量像工具使用地址

    Diffusion-RWKV是一种基于RWKV架构的扩散模型,旨在提高扩散模型的可扩展性。它针对图像生成任务进行了相应的优化和改进,可以生成高质量的图像。欲了解更多详细信息并开始使用Diffusion-RWKV,请访问Diffusion-RWKV官方网站。

  • Ongkanon:提升您每天的对话体验

    Ongkanon是一款智能对话AI助手,提供有意义且上下文相关的对话体验。它能够自然地与您交谈,就像与亲密的朋友聊天一样。Ongkanon会根据您的偏好进行个性化定制,还能记住以前对话的上下文,以便进行更连贯、有意义的交互。

  • X:生成你的AI头像视频!

    X Me是一个AI头像视频生成工具,通过输入文本即可快速生成个性化的AI头像视频。它使用轻量级的AI模型,无需复杂的训练过程,快速生成逼真的数字人物视频。X Me提供多种AI名人头像供用户选择,并支持将用户自己的面部特征和声音克隆到生成的头像视频中。用户可以根据自己的喜好和需求,自由创造个性化的AI头像视频。

  • Portrait Studio:AI生成专业商务头像

    Portrait Studio Pro是一款AI生成的专业商务头像服务。用户只需上传几张照片,我们的AI引擎将生成完美的商务照片,适用于LinkedIn等场景,无需进行实际拍摄。价格实惠,仅需191美元起,支持14天退款保证。

  • InterviewQueue:在线评估软件平台

    InterviewQueue是一个在线评估工具,帮助您轻松筛选候选人。通过ChatGPT集成,这个在线评估软件平台将帮助您创建逻辑评估,为您的组织找到理想的候选人!

  • Skyla:您的 Shopify 商店的 ChatGPT 客服聊天机器人

    Skyla 是专为 Shopify 商户打造的最佳客户支持聊天机器人。通过 ChatGPT 提供先进的 AI 动力,为您的商店提供最佳的客户支持体验。

  • Avatic:定制3D头像,提升在线身份

    Avatic 3D Avatars是一个定制3D头像服务,适用于游戏、社交和职业平台。通过将您的照片转换为个性化的半逼真3D头像,提升您的在线身份。无论您是为了保护隐私还是为了给您的在线形象添加独特的个性,我们的定制3D头像服务都是您一直在寻找的解决方案。我们的头像由经验丰富的3D艺术家使用Blender和Photoshop制作,呈现出独特的玩具感。我们提供100%的退款保证和无限次的修改,以确保您对最终成品完全满意。

  • Devika AI:开源AI软件工程师

    Devika AI是一个开源的AI软件工程师,可以理解高级人类指令,将其分解为步骤,研究相关信息并生成相应代码。它使用Claude 3、GPT 4、GPT 3.5和Local LLMs via Ollama。

  • Voxal.AI:提升销售和支持,无代码AI Chatbot

    Voxal AI是一款强大的AI Chatbot,通过展示产品、回答问题、生成潜在客户等方式,提升销售和支持。使用最新的AI技术,包括GPT 3、GPT 4和Mixtral,无需编码即可快速创建定制的Chatbot。适用于SaaS、Shopify、WordPress等平台,支持产品推荐和销售增长。提供高级分析功能,支持95种语言。快速部署,定制个性化外观和交互,轻松集成到网站中。

  • TTSVox:免费的在线文字转语音工具

    TTSVox是一款免费的在线文字转语音工具。它提供高质量、自然流畅的声音,适用于教育、专业和无障碍等各种场景。现在就来试试,让您的文字变得生动起来!

  • AI Elon:与世界上最伟大的AI创业者交谈

    AI Elon是与世界上最伟大的AI创业者对话的平台。用户可以获取关于任何想了解的事情的意见、建议、想法、反馈等等。

  • Resume Photo AI:AI生成专业人像照片

    专为职场人士打造的AI生成的专业人像照片。使用我们的AI技术,轻松获得专业人像照片,非常适合LinkedIn个人资料、简历或任何职业用途。

  • DeepAI:智能工具,激发创意无限

    DeepAI是一个提供多种人工智能工具的网站,包括AI视频生成器、AI图像生成器、AI图像编辑器和AI角色聊天等。用户可以利用这些工具将静态图片和文本提示转换成简短的视频动画,或者通过输入提示来生成图像。DeepAI的AI图像编辑器允许用户快速编辑图片,而AI角色聊天则可以与各种角色进行互动。此外,还有去除背景和给黑白照片上色的功能。DeepAI提供PRO会员服务,享受无广告体验、私有图片存储和API访问等特权。

  • tawk.to:100%免费的网站在线聊天软件

    tawk.to是一款完全免费的在线聊天软件,它允许网站所有者监控并与访问者进行实时聊天,响应支持票据,使用CRM组织联系人,并创建帮助中心以增强客户自助服务的能力。tawk.to的主要优势在于其易用性、安全性以及无需任何费用即可使用。此外,它还提供了AI Assist功能,允许用户训练一个完全自动化的AI驱动聊天机器人。

  • WaveAI:AI驱动的高级照片编辑器

    Wave AI是一款AI驱动的高级照片编辑器,可轻松编辑照片和图像。它具有背景更改、物体移除和定制广告等高级功能。通过简单的点击,无需设计技能,轻松提升您的图像。

  • NovelAI.Dev:AI 绘画兴趣站

    NovelAI.Dev 是一个以技术宅为核心的 AI 绘画爱好者群体网站,提供多种与绘画相关的 AI 技术应用和工具。

  • AI SEO Service in Australia | Optidan:AI数字营销和SEO服务

    Optidan AI是澳大利亚顶级AI数字营销机构,提供AI SEO服务、Shopify SEO服务、去抄袭和内容创作服务。我们通过性能管理、Web诊断和战略优化提升SEO卓越,快速增长您的在线业务。

  • AskJack:让你的AI助手回答HR问题

    AskJack通过为频繁的HR咨询提供自动化响应,提高了工作效率,让你能够专注于战略性事务。它使用AI技术将助手带到你团队最常用的工作场所。通过AskJack,你可以减少重复的HR咨询,让你和团队能够专注于战略性事务。它还可以简化员工入职流程,提供即时访问所需的文件、指南和资源,并在入职后全年无休地提供相同的信息。AskJack还能帮助你了解员工的需求,提供数据驱动的见解。

  • OPS 提示词工作室:可视化编辑提示词工具

    OPS 提示词工作室是一款可视化编辑工具,支持一键翻译 AIGC 提示词,提供 Midjourney 提示词库,让用户轻松管理和使用提示词,助力提升生产力。该工具还提供简洁清晰的界面,方便用户快速复制、导出和翻译提示词。

  • imiprompt:Midjourney v5 艺术生成器

    IMI Prompt Builder 是一款全面的 Midjourney v5 提示生成器,拥有数千种选项可在 Web、Android 和 iOS 上使用。用户只需点击几下,即可创建反映其个人风格和艺术愿景的独特 Midjourney v5 艺术作品。

  • Ai 画廊:Ai 关键词生成器

    Ai 画廊是一款提供 Ai 关键词生成器的网站,展示人工智能作品和生成关键词描述,帮助用户更好地了解和分享 Ai 作品。用户可以浏览不同风格的 Ai 作品,获取灵感和创意。

今日大家都在搜的词: