首页 > 业界 > 关键词  > Devin最新资讯  > 正文

AI日报:AI程序员Devin造假被抓;​Sora平替?StreamingT2V试玩地址公布;Udio AI还可以创作喜剧、演讲;XAI发布Grok-1.5Vision多模态模型

2024-04-15 16:11 · 稿源:站长之家

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解https://top.aibase.com/

🤖📱💼AI应用

Sora平替?2分钟超长AI视频模型StreamingT2V免费开源 试玩地址公布

2.png

【AiBase提要:】

⭐ StreamingT2V可以生成长达1200帧、时长2分钟的视频,超越了Sora模型

⭐ 采用先进的自回归技术,保持视频时间一致性和高质量

⭐ 它是一个免费开源的项目,可以无缝兼容SVD和animatediff等模型

⭐ 代码已发布,试玩地址也已上线。生成时间较久,一个视频预计要生成13分钟以上。

开源代码:https://top.aibase.com/tool/streamingt2v

论文地址:https://arxiv.org/pdf/2403.14773.pdf

试玩地址1:https://huggingface.co/spaces/PAIR/StreamingT2V

试玩地址2:https://replicate.com/camenduru/streaming-t2v

Udio AI提供多功能音频生成 还可以创作喜剧、演讲、电台广播等

image.png

【AiBase提要:】

⭐ Udio不仅可以创作音乐,还可以创作喜剧、演讲、NPC对话、体育分析、广告、电台广播、ASMR、自然音效等。

⭐ 简单的文字描述创作: 用户可通过简单文字描述指导Udio生成特定主题和情感的音乐作品。

⭐ 广泛的音乐类型和风格支持: Udio支持多种音乐类型和风格,满足不同用户的音乐品味。

感兴趣的可以点击播放列表查看:https://www.udio.com/playlists/deGuVDLYd9MrXtxnxfX7z1

体验地址:https://top.aibase.com/tool/udio

美图Wink“AI动漫”功能升级 可将短剧作品转化为动漫风格

微信截图_20240415085954.png

【AiBase提要:】

⭐ 近期美图Wink升级“AI动漫”功能,转化短剧作品为动漫风格。

⭐ 引入CFA模块,优化动作一致性,生成更流畅自然的动漫视频。

⭐ 分片技术处理长视频,减少等待时长,让创作更自如流畅。

StableDesign:适用于室内装修设计的SD方案 文字提示就可修改室内设计图

image.png

【AiBase提要:】

⭐️ 开发者创建了用于生成式室内设计的项目

⭐️ 通过下载爱彼迎房源数据和图像元数据,提取特征,实现训练

⭐️ 使用ControlNet和劳拉模型训练,实现室内设计生成的控制和文本到图像转换

在线体验:https://huggingface.co/spaces/MykolaL/StableDesign

比换脸更强大!SwapAnything:替换图片中的任意元素

image.png

【AiBase提要:】

🔍 SwapAnything框架具有精确控制对象和部分、保留上下文像素、适应个性化概念等优势。

🔍 通过定向变量交换和外观调整技术,SwapAnything展现了精确和忠实的交换能力。

🔍 SwapAnything能在图像中精确控制任意对象,实现高质量的个性化交换。

项目入口:https://top.aibase.com/tool/swapanything

AI延时视频生成工具MagicTime在线体验地址放出

image.png

【AiBase提要】

⭐ 时间延迟视频是摄影技术,展示长时间变化。

⭐ MagicTime能根据文本描述生成时间延迟视频。

⭐ 应用广泛,可记录自然现象和人为变化。

项目地址:https://top.aibase.com/tool/magictime

体验地址:https://huggingface.co/spaces/BestWishYsh/MagicTime

模型下载地址:https://huggingface.co/Kijai/MagicTime-merged-fp16

自动化写作工具STORM:可生成像维基百科一样的深度长篇内容

image.png

【AiBase提要:】

⭐️STORM自动搜集资料,模拟专家对话,生成结构化文章大纲。

⭐️STORM高效研究、整合多角度信息,促进深入理解和精准问题生成。

⭐️STORM生成文章大纲后,完整撰写、润色文章以提高整体质量。

项目地址:https://top.aibase.com/tool/storm

Meta 推出 ViewDiff 模型:文本生成多视角3D 图像

【AiBase提要:】

🌟 ViewDiff 解决了文本生成一致性、多视角3D 图像的三大难点

🌟 自回归生成模块使 ViewDiff 在任意视角上生成更多的3D 一致性图像

🌟 ViewDiff 填补了文本生成多视角3D 图像领域的技术空白

论文地址:https://arxiv.org/abs/2403.01807

项目地址:https://top.aibase.com/tool/viewdiff

📰🤖📢AI新鲜事

首个AI程序员造假被抓,Devin再次“震撼”硅谷!扒皮视频文字详解附上

图片

【AiBase提要:】

⭐️ 油管程序员揭露首个AI程序员Devin视频造假

⭐️ Devin演示不如实际神奇,修复bug自创bug

⭐️ 遭到疑问和打假,网友对AI产品炒作嗤之以鼻

详细内容:https://www.chinaz.com/2024/0415/1610127.shtml

马斯克XAI发布Grok-1.5Vision多模态模型,可处理文本和图片信息

image.png

【AiBase提要:】

⭐️ Grok-1.5Vision模型展现卓越性能,超越GPT4V。

⭐️ 在RealWorldQA基准测试中表现优异,理解真实世界物理空间。

⭐️ Grok-1.5Vision模型具有强大的现实世界空间处理和理解能力。

官网地址:https://top.aibase.com/tool/grok-1-5-vision-preview

360智脑7B参数大模型正式开源 最长支持约50万字输入

【AiBase提要:】

🧠360智脑7B参数大模型正式开源。

🧩 支持不同文本长度版本,最长可处理360K长文本。

🔥 在能力测试中表现出色,综合能力排名前三。

项目地址:https://github.com/Qihoo360/360zhinao

Adobe图像生成AI “Firefly” 训练集中约有5%为AI图像

【AiBase提要:】

⭐ Adobe Stock开始接受AI内容,约14%为AI生成图像。

⭐ 学者指出Firefly学习自Midjourney生成的图像,与其声称不同。

⭐ 用户表示对Adobe用其作品训练Firefly感到不满。

代码、模型全开源!贾佳亚团队多模态模型 Mini-Gemini登上热榜

image.png

【AiBase提要:】

⭐️ Mini-Gemini模型在多模态任务上取得显著成绩,开源代码和模型数据。

⭐️ Mini-Gemini结合图像理解和生成,展现出色图像推理能力。

⭐️ 采用Gemini视觉双分支信息挖掘方法,有效处理高分辨率图像并生成内容丰富的视觉和文本内容。

项目地址:https://top.aibase.com/tool/mini-gemini

试玩地址: https://103.170.5.190:7860/

面壁智能开源MiniCPM2.0系列模型 OCR等能力显著增强

【AiBase提要:】

⭐ MiniCPM-V2.0是端侧最强的多模态模型,具有强大的OCR能力。

⭐ MiniCPM-1.2B是适配端侧场景的基座模型,推理速度快成本低。

⭐ MiniCPM-2B-128K是目前最小的长文本模型,处理128K文本内容。

MiniCPM-V2.0:

https://github.com/OpenBMB/MiniCPM-V

MiniCPM系列开源地址:

https://github.com/OpenBMB/MiniCPM

MiniCPM技术Blog地址:

https://openbmb.vercel.app/?category=Chinese+Blog

竞争升温!ChatGPT增长疲软3月全球访问量17.7亿次,Claude逐渐崛起

【AiBase提要:】

📉 ChatGPT全球访问量增长放缓,尽管推出新功能。

🚀 Anthropic的Claude在欧洲市场蓬勃发展,加剧与ChatGPT的竞争。

💥 Claude3发布后持续快速增长,显示新产品潜力。

InstantID团队推新风格迁移方法InstantStyle 一键置身“梵高星空”

image.png

【AiBase提要:】

⭐️特征相减:利用CLIP模型的特性,通过特征相减去除内容信息,实现风格和内容解耦。

⭐️仅风格层注入:在特定风格层完成特征注入,实现风格和内容解耦。

⭐️通用性强:InstantStyle的方法具有通用性,提供丰富代码实现,支持多种应用场景。

项目地址:https://top.aibase.com/tool/instantstyle

在线试玩:https://huggingface.co/spaces/InstantX/InstantStyle

——————

每日midjourney prompt:小说古风美女

2_1713162496656_ai2023_A_beautiful_woman_from_ancient_China_dressed_in_a_gorgeo_a8915415-91c6-458e-b123-27e4d3fb15f6.png

图源备注:图片由AI生成,图片授权服务商Midjourney

A beautiful woman from ancient China, dressed in a gorgeous red Hanfu, with long hair draped over her shoulders, sat in her boudoir with a smile. Ancient style, hanfu, boudoir, gorgeous, palace, screen, carpet, soft light, elegant temperament, ancient culture, in line with oriental aesthetics, rich details, best quality, exquisite makeup, clear eyeliner pen, slender eyebrows, textured skin, white skin, charming headdress, --ar3:4 --niji6 --style raw

一个中国古代美女,穿着华丽的红色汉服,长发披肩,微笑着坐在闺房内。古风,汉服,闺房,华丽,宫殿,屏风,地毯,柔和光线,高雅气质,古代文化,符合东方美学,细节丰富,品质最佳,精致的妆容,清晰的眼线笔,纤细的眉毛,纹理皮肤,白皙的皮肤,迷人的头饰

举报

  • 相关推荐
  • 大家在看

今日大家都在搜的词: