首页 > 业界 > 关键词  > Devin最新资讯  > 正文

AI日报:首个AI程序员Devin造假被抓;​Sora平替?StreamingT2V试玩地址公布;Udio AI还可以创作喜剧、演讲;XAI发布Grok-1.5Vision多模态模型

2024-04-15 16:11 · 稿源:站长之家

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解https://top.aibase.com/

🤖📱💼AI应用

Sora平替?2分钟超长AI视频模型StreamingT2V免费开源 试玩地址公布

2.png

【AiBase提要:】

⭐ StreamingT2V可以生成长达1200帧、时长2分钟的视频,超越了Sora模型

⭐ 采用先进的自回归技术,保持视频时间一致性和高质量

⭐ 它是一个免费开源的项目,可以无缝兼容SVD和animatediff等模型

⭐ 代码已发布,试玩地址也已上线。生成时间较久,一个视频预计要生成13分钟以上。

开源代码:https://top.aibase.com/tool/streamingt2v

论文地址:https://arxiv.org/pdf/2403.14773.pdf

试玩地址1:https://huggingface.co/spaces/PAIR/StreamingT2V

试玩地址2:https://replicate.com/camenduru/streaming-t2v

Udio AI提供多功能音频生成 还可以创作喜剧、演讲、电台广播等

image.png

【AiBase提要:】

⭐ Udio不仅可以创作音乐,还可以创作喜剧、演讲、NPC对话、体育分析、广告、电台广播、ASMR、自然音效等。

⭐ 简单的文字描述创作: 用户可通过简单文字描述指导Udio生成特定主题和情感的音乐作品。

⭐ 广泛的音乐类型和风格支持: Udio支持多种音乐类型和风格,满足不同用户的音乐品味。

感兴趣的可以点击播放列表查看:https://www.udio.com/playlists/deGuVDLYd9MrXtxnxfX7z1

体验地址:https://top.aibase.com/tool/udio

美图Wink“AI动漫”功能升级 可将短剧作品转化为动漫风格

微信截图_20240415085954.png

【AiBase提要:】

⭐ 近期美图Wink升级“AI动漫”功能,转化短剧作品为动漫风格。

⭐ 引入CFA模块,优化动作一致性,生成更流畅自然的动漫视频。

⭐ 分片技术处理长视频,减少等待时长,让创作更自如流畅。

StableDesign:适用于室内装修设计的SD方案 文字提示就可修改室内设计图

image.png

【AiBase提要:】

⭐️ 开发者创建了用于生成式室内设计的项目

⭐️ 通过下载爱彼迎房源数据和图像元数据,提取特征,实现训练

⭐️ 使用ControlNet和劳拉模型训练,实现室内设计生成的控制和文本到图像转换

在线体验:https://huggingface.co/spaces/MykolaL/StableDesign

比换脸更强大!SwapAnything:替换图片中的任意元素

image.png

【AiBase提要:】

🔍 SwapAnything框架具有精确控制对象和部分、保留上下文像素、适应个性化概念等优势。

🔍 通过定向变量交换和外观调整技术,SwapAnything展现了精确和忠实的交换能力。

🔍 SwapAnything能在图像中精确控制任意对象,实现高质量的个性化交换。

项目入口:https://top.aibase.com/tool/swapanything

AI延时视频生成工具MagicTime在线体验地址放出

image.png

【AiBase提要】

⭐ 时间延迟视频是摄影技术,展示长时间变化。

⭐ MagicTime能根据文本描述生成时间延迟视频。

⭐ 应用广泛,可记录自然现象和人为变化。

项目地址:https://top.aibase.com/tool/magictime

体验地址:https://huggingface.co/spaces/BestWishYsh/MagicTime

模型下载地址:https://huggingface.co/Kijai/MagicTime-merged-fp16

自动化写作工具STORM:可生成像维基百科一样的深度长篇内容

image.png

【AiBase提要:】

⭐️STORM自动搜集资料,模拟专家对话,生成结构化文章大纲。

⭐️STORM高效研究、整合多角度信息,促进深入理解和精准问题生成。

⭐️STORM生成文章大纲后,完整撰写、润色文章以提高整体质量。

项目地址:https://top.aibase.com/tool/storm

Meta 推出 ViewDiff 模型:文本生成多视角3D 图像

【AiBase提要:】

🌟 ViewDiff 解决了文本生成一致性、多视角3D 图像的三大难点

🌟 自回归生成模块使 ViewDiff 在任意视角上生成更多的3D 一致性图像

🌟 ViewDiff 填补了文本生成多视角3D 图像领域的技术空白

论文地址:https://arxiv.org/abs/2403.01807

项目地址:https://top.aibase.com/tool/viewdiff

📰🤖📢AI新鲜事

首个AI程序员造假被抓,Devin再次“震撼”硅谷!扒皮视频文字详解附上

图片

【AiBase提要:】

⭐️ 油管程序员揭露首个AI程序员Devin视频造假

⭐️ Devin演示不如实际神奇,修复bug自创bug

⭐️ 遭到疑问和打假,网友对AI产品炒作嗤之以鼻

详细内容:https://www.chinaz.com/2024/0415/1610127.shtml

马斯克XAI发布Grok-1.5Vision多模态模型,可处理文本和图片信息

image.png

【AiBase提要:】

⭐️ Grok-1.5Vision模型展现卓越性能,超越GPT4V。

⭐️ 在RealWorldQA基准测试中表现优异,理解真实世界物理空间。

⭐️ Grok-1.5Vision模型具有强大的现实世界空间处理和理解能力。

官网地址:https://top.aibase.com/tool/grok-1-5-vision-preview

360智脑7B参数大模型正式开源 最长支持约50万字输入

【AiBase提要:】

🧠360智脑7B参数大模型正式开源。

🧩 支持不同文本长度版本,最长可处理360K长文本。

🔥 在能力测试中表现出色,综合能力排名前三。

项目地址:https://github.com/Qihoo360/360zhinao

Adobe图像生成AI “Firefly” 训练集中约有5%为AI图像

【AiBase提要:】

⭐ Adobe Stock开始接受AI内容,约14%为AI生成图像。

⭐ 学者指出Firefly学习自Midjourney生成的图像,与其声称不同。

⭐ 用户表示对Adobe用其作品训练Firefly感到不满。

代码、模型全开源!贾佳亚团队多模态模型 Mini-Gemini登上热榜

image.png

【AiBase提要:】

⭐️ Mini-Gemini模型在多模态任务上取得显著成绩,开源代码和模型数据。

⭐️ Mini-Gemini结合图像理解和生成,展现出色图像推理能力。

⭐️ 采用Gemini视觉双分支信息挖掘方法,有效处理高分辨率图像并生成内容丰富的视觉和文本内容。

项目地址:https://top.aibase.com/tool/mini-gemini

试玩地址: https://103.170.5.190:7860/

面壁智能开源MiniCPM2.0系列模型 OCR等能力显著增强

【AiBase提要:】

⭐ MiniCPM-V2.0是端侧最强的多模态模型,具有强大的OCR能力。

⭐ MiniCPM-1.2B是适配端侧场景的基座模型,推理速度快成本低。

⭐ MiniCPM-2B-128K是目前最小的长文本模型,处理128K文本内容。

MiniCPM-V2.0:

https://github.com/OpenBMB/MiniCPM-V

MiniCPM系列开源地址:

https://github.com/OpenBMB/MiniCPM

MiniCPM技术Blog地址:

https://openbmb.vercel.app/?category=Chinese+Blog

竞争升温!ChatGPT增长疲软3月全球访问量17.7亿次,Claude逐渐崛起

【AiBase提要:】

📉 ChatGPT全球访问量增长放缓,尽管推出新功能。

🚀 Anthropic的Claude在欧洲市场蓬勃发展,加剧与ChatGPT的竞争。

💥 Claude3发布后持续快速增长,显示新产品潜力。

InstantID团队推新风格迁移方法InstantStyle 一键置身“梵高星空”

image.png

【AiBase提要:】

⭐️特征相减:利用CLIP模型的特性,通过特征相减去除内容信息,实现风格和内容解耦。

⭐️仅风格层注入:在特定风格层完成特征注入,实现风格和内容解耦。

⭐️通用性强:InstantStyle的方法具有通用性,提供丰富代码实现,支持多种应用场景。

项目地址:https://top.aibase.com/tool/instantstyle

在线试玩:https://huggingface.co/spaces/InstantX/InstantStyle

——————

每日midjourney prompt:小说古风美女

2_1713162496656_ai2023_A_beautiful_woman_from_ancient_China_dressed_in_a_gorgeo_a8915415-91c6-458e-b123-27e4d3fb15f6.png

图源备注:图片由AI生成,图片授权服务商Midjourney

A beautiful woman from ancient China, dressed in a gorgeous red Hanfu, with long hair draped over her shoulders, sat in her boudoir with a smile. Ancient style, hanfu, boudoir, gorgeous, palace, screen, carpet, soft light, elegant temperament, ancient culture, in line with oriental aesthetics, rich details, best quality, exquisite makeup, clear eyeliner pen, slender eyebrows, textured skin, white skin, charming headdress, --ar3:4 --niji6 --style raw

一个中国古代美女,穿着华丽的红色汉服,长发披肩,微笑着坐在闺房内。古风,汉服,闺房,华丽,宫殿,屏风,地毯,柔和光线,高雅气质,古代文化,符合东方美学,细节丰富,品质最佳,精致的妆容,清晰的眼线笔,纤细的眉毛,纹理皮肤,白皙的皮肤,迷人的头饰

举报

  • 相关推荐
  • AI日报:快手KAT-Dev代码模型开源登顶;全球首款IP66防护人形机器人DR02发布;谷歌Chrome即将引入Gemini新功能

    快手开源72B代码模型KAT-Dev在SWE-Bench测试中准确率达74.6%,创国产AI编程里程碑;杭州云深处推出全球首款IP66防护全候作业机器人DR02;谷歌Chrome将集成Gemini引发隐私担忧;学者指控苹果使用盗版书籍训练AI,版权争议再起;Liquid AI发布高效稀疏激活模型LFM2-8B-A1B;苹果拟收购Prompt AI布局智能家居视觉技术;AI伴侣应用泄露4300万条用户隐私对话;西湖大学DeepScientist显著提升科研效率。

  • 传承海尔,进化自我:Leader统帅的年轻化新路径

    在家电行业年轻化浪潮中,统帅品牌以独特视角重新定义年轻家电:依托海尔技术底蕴,通过精准功能裁剪与简约美学设计,将领先技术转化为年轻人真正需要的产品。其核心在于实现"技术轻量化表达",剔除冗余功能,保留核心体验,让科技自然融入生活。产品设计强调"无感适配",智能体验注重解决实际问题而非炫技,构建理性精致的消费文化。这种基因传承下的自我进化,使统帅成为年轻人生活中可靠伙伴,重新诠释了高性价比的真正含义——在可靠品质基础上提供恰到好处的体验。

  • 简化版Model Y将便宜约10%!特斯拉发布Model 3/Y Standard标准版

    特斯拉在北美推出两款低价入门车型:Model Y标准版起售价39990美元,较原版降价5000美元;Model 3标准版起售价36990美元,降价5500美元。两款车型均为后驱设计,但续航、配置大幅精简:Model Y续航降至321英里,移除全景天窗、氛围灯等功能;Model 3音响系统减配至7个扬声器,取消方向盘电动调节等。特斯拉曾计划推出2.5万美元平价电动车,但已被叫停,资源转向自动驾驶领域。目前中国市场是否引入新车尚未确认。

  • Leader统帅官宣品牌大使林高远,懒人新风空调同步上线

    10月14日,统帅官宣乒乓球世界冠军林高远成为品牌大使,并发布懒人家族新成员——懒人新风空调。双方提出“懒有引力,有‘球’必应”的生活主张,传递冠军品质与理想生活理念。统帅以“听劝创新”为核心,从解决用户混洗烦恼的“一机三滚筒”洗衣机起步,逐步构建覆盖多元场景的懒人产品矩阵,形成完整居住生态。新品空调搭载AI技术,支持一键懒人模式自动关机,并通过大风量鲜氧新风与四重过滤提升舒适体验。品牌将持续以智慧产品为用户开启高效便捷的懒人新生活。

  • 霍涛推动开放战略落地,白山云接入快手KAT-Coder赋能开发者

    白山云科技与快手StreamLake合作,在其“白山智算”平台上线闭源编程大模型KAT-Coder。该模型在SWE-Bench测试中解决率达73.4%,性能媲美全球顶尖模型,支持端到端代码生成。白山云通过“顶尖模型能力+全球边缘算力”整合,为开发者提供低于300ms超低延时代码生成服务,仅需一行代码即可调用,大幅降低AI开发门槛。此次合作是白山云完善AI工具链布局的关键一步,未来将持续深化开放协作,优化模型与边缘算力服务模式。

  • “闪电匣”荣获2025年IDEA国际设计卓越奖,智慧配送闪耀世界舞台!

    普渡机器人“闪电匣”凭借卓越设计斩获美国IDEA国际设计大奖。该产品专为酒店半户外场景打造,采用模块化舱体设计,支持2-4格灵活调整,实现毫秒级响应与一键并发配送。搭载VSLAM+3D避障技术,在复杂环境中穿梭自如。一体化简约造型搭配10.1英寸大屏,兼顾美学与实用性。这是普渡继“欢乐送2”后再度获奖,彰显中国配送机器人设计实力。

  • 携手Josh Rowledge登上季军奖台,WeTrade 8号赛车闪耀新加坡赛道

    亚洲保时捷卡雷拉杯重返新加坡滨海湾街道赛道,年轻车手Josh Rowledge驾驶WeTrade 8号赛车凭借稳定果敢表现登上领奖台,并以优异积分摘得2025年Street Cup年度季军。文章强调赛车与金融交易的核心共性:精准判断、稳健执行与持续突破。WeTrade通过赛事赞助传递"专业、稳健、精进"的品牌精神,展现速度与纪律的完美平衡,助力每位交易者在属于自身的赛道上赢得更稳更远。

  • 特斯拉计划推出更低价Model Y:应对美国停止补贴的影响

    特斯拉公司计划推出一款更低价版的Model Y车型,以此兑现其承诺,即推出一款价格更亲民的汽车,以应对美国电动汽车激励政策取消所带来的影响。 知情人士称,这款更便宜的车型将取消某些配置,并采用品质稍逊的材料,以弥补美国自本月起停止提供的最高达7500美元的联邦税收抵免优惠。 此前曝光的低价版Model Y实车照片显示,新车尺寸和在售版基本保持一致,但重新设�

  • 特斯拉Model Y L全新浅灰色高级内饰上线 售价 8000元

    特斯拉Model Y L版新增浅灰色高级内饰,选装价8000元。新车内饰采用极简设计,搭配氛围灯增强空间感,并针对日常使用优化了耐磨抗污性能。该车型于8月19日上市,售价33.9万元起,提供3年0息金融方案。作为加长版车型,首次推出2+2+2六座布局,并在音响、座椅、底盘等方面全面升级,进一步提升驾乘体验。

  • OpenDevin官网体验入口 国内版Devin使用方法教程指南

    OpenDevin是一个开源项目,旨在复制、增强和创新Devin——一个能够执行复杂工程任务并与用户在软件开发项目上积极协作的自主AI软件工程师。该项目通过开源社区的力量,探索和扩展Devin的能力,识别其优势和改进空间,以指导开源代码模型的进展。要获取更多详细信息并开始您的AI算力平台体验之旅,请访问OpenDevin官网体验入口。

今日大家都在搜的词: