首页 > 业界 > 关键词  > Devin最新资讯  > 正文

AI日报:首个AI程序员Devin造假被抓;​Sora平替?StreamingT2V试玩地址公布;Udio AI还可以创作喜剧、演讲;XAI发布Grok-1.5Vision多模态模型

2024-04-15 16:11 · 稿源:站长之家

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解https://top.aibase.com/

🤖📱💼AI应用

Sora平替?2分钟超长AI视频模型StreamingT2V免费开源 试玩地址公布

2.png

【AiBase提要:】

⭐ StreamingT2V可以生成长达1200帧、时长2分钟的视频,超越了Sora模型

⭐ 采用先进的自回归技术,保持视频时间一致性和高质量

⭐ 它是一个免费开源的项目,可以无缝兼容SVD和animatediff等模型

⭐ 代码已发布,试玩地址也已上线。生成时间较久,一个视频预计要生成13分钟以上。

开源代码:https://top.aibase.com/tool/streamingt2v

论文地址:https://arxiv.org/pdf/2403.14773.pdf

试玩地址1:https://huggingface.co/spaces/PAIR/StreamingT2V

试玩地址2:https://replicate.com/camenduru/streaming-t2v

Udio AI提供多功能音频生成 还可以创作喜剧、演讲、电台广播等

image.png

【AiBase提要:】

⭐ Udio不仅可以创作音乐,还可以创作喜剧、演讲、NPC对话、体育分析、广告、电台广播、ASMR、自然音效等。

⭐ 简单的文字描述创作: 用户可通过简单文字描述指导Udio生成特定主题和情感的音乐作品。

⭐ 广泛的音乐类型和风格支持: Udio支持多种音乐类型和风格,满足不同用户的音乐品味。

感兴趣的可以点击播放列表查看:https://www.udio.com/playlists/deGuVDLYd9MrXtxnxfX7z1

体验地址:https://top.aibase.com/tool/udio

美图Wink“AI动漫”功能升级 可将短剧作品转化为动漫风格

微信截图_20240415085954.png

【AiBase提要:】

⭐ 近期美图Wink升级“AI动漫”功能,转化短剧作品为动漫风格。

⭐ 引入CFA模块,优化动作一致性,生成更流畅自然的动漫视频。

⭐ 分片技术处理长视频,减少等待时长,让创作更自如流畅。

StableDesign:适用于室内装修设计的SD方案 文字提示就可修改室内设计图

image.png

【AiBase提要:】

⭐️ 开发者创建了用于生成式室内设计的项目

⭐️ 通过下载爱彼迎房源数据和图像元数据,提取特征,实现训练

⭐️ 使用ControlNet和劳拉模型训练,实现室内设计生成的控制和文本到图像转换

在线体验:https://huggingface.co/spaces/MykolaL/StableDesign

比换脸更强大!SwapAnything:替换图片中的任意元素

image.png

【AiBase提要:】

🔍 SwapAnything框架具有精确控制对象和部分、保留上下文像素、适应个性化概念等优势。

🔍 通过定向变量交换和外观调整技术,SwapAnything展现了精确和忠实的交换能力。

🔍 SwapAnything能在图像中精确控制任意对象,实现高质量的个性化交换。

项目入口:https://top.aibase.com/tool/swapanything

AI延时视频生成工具MagicTime在线体验地址放出

image.png

【AiBase提要】

⭐ 时间延迟视频是摄影技术,展示长时间变化。

⭐ MagicTime能根据文本描述生成时间延迟视频。

⭐ 应用广泛,可记录自然现象和人为变化。

项目地址:https://top.aibase.com/tool/magictime

体验地址:https://huggingface.co/spaces/BestWishYsh/MagicTime

模型下载地址:https://huggingface.co/Kijai/MagicTime-merged-fp16

自动化写作工具STORM:可生成像维基百科一样的深度长篇内容

image.png

【AiBase提要:】

⭐️STORM自动搜集资料,模拟专家对话,生成结构化文章大纲。

⭐️STORM高效研究、整合多角度信息,促进深入理解和精准问题生成。

⭐️STORM生成文章大纲后,完整撰写、润色文章以提高整体质量。

项目地址:https://top.aibase.com/tool/storm

Meta 推出 ViewDiff 模型:文本生成多视角3D 图像

【AiBase提要:】

🌟 ViewDiff 解决了文本生成一致性、多视角3D 图像的三大难点

🌟 自回归生成模块使 ViewDiff 在任意视角上生成更多的3D 一致性图像

🌟 ViewDiff 填补了文本生成多视角3D 图像领域的技术空白

论文地址:https://arxiv.org/abs/2403.01807

项目地址:https://top.aibase.com/tool/viewdiff

📰🤖📢AI新鲜事

首个AI程序员造假被抓,Devin再次“震撼”硅谷!扒皮视频文字详解附上

图片

【AiBase提要:】

⭐️ 油管程序员揭露首个AI程序员Devin视频造假

⭐️ Devin演示不如实际神奇,修复bug自创bug

⭐️ 遭到疑问和打假,网友对AI产品炒作嗤之以鼻

详细内容:https://www.chinaz.com/2024/0415/1610127.shtml

马斯克XAI发布Grok-1.5Vision多模态模型,可处理文本和图片信息

image.png

【AiBase提要:】

⭐️ Grok-1.5Vision模型展现卓越性能,超越GPT4V。

⭐️ 在RealWorldQA基准测试中表现优异,理解真实世界物理空间。

⭐️ Grok-1.5Vision模型具有强大的现实世界空间处理和理解能力。

官网地址:https://top.aibase.com/tool/grok-1-5-vision-preview

360智脑7B参数大模型正式开源 最长支持约50万字输入

【AiBase提要:】

🧠360智脑7B参数大模型正式开源。

🧩 支持不同文本长度版本,最长可处理360K长文本。

🔥 在能力测试中表现出色,综合能力排名前三。

项目地址:https://github.com/Qihoo360/360zhinao

Adobe图像生成AI “Firefly” 训练集中约有5%为AI图像

【AiBase提要:】

⭐ Adobe Stock开始接受AI内容,约14%为AI生成图像。

⭐ 学者指出Firefly学习自Midjourney生成的图像,与其声称不同。

⭐ 用户表示对Adobe用其作品训练Firefly感到不满。

代码、模型全开源!贾佳亚团队多模态模型 Mini-Gemini登上热榜

image.png

【AiBase提要:】

⭐️ Mini-Gemini模型在多模态任务上取得显著成绩,开源代码和模型数据。

⭐️ Mini-Gemini结合图像理解和生成,展现出色图像推理能力。

⭐️ 采用Gemini视觉双分支信息挖掘方法,有效处理高分辨率图像并生成内容丰富的视觉和文本内容。

项目地址:https://top.aibase.com/tool/mini-gemini

试玩地址: https://103.170.5.190:7860/

面壁智能开源MiniCPM2.0系列模型 OCR等能力显著增强

【AiBase提要:】

⭐ MiniCPM-V2.0是端侧最强的多模态模型,具有强大的OCR能力。

⭐ MiniCPM-1.2B是适配端侧场景的基座模型,推理速度快成本低。

⭐ MiniCPM-2B-128K是目前最小的长文本模型,处理128K文本内容。

MiniCPM-V2.0:

https://github.com/OpenBMB/MiniCPM-V

MiniCPM系列开源地址:

https://github.com/OpenBMB/MiniCPM

MiniCPM技术Blog地址:

https://openbmb.vercel.app/?category=Chinese+Blog

竞争升温!ChatGPT增长疲软3月全球访问量17.7亿次,Claude逐渐崛起

【AiBase提要:】

📉 ChatGPT全球访问量增长放缓,尽管推出新功能。

🚀 Anthropic的Claude在欧洲市场蓬勃发展,加剧与ChatGPT的竞争。

💥 Claude3发布后持续快速增长,显示新产品潜力。

InstantID团队推新风格迁移方法InstantStyle 一键置身“梵高星空”

image.png

【AiBase提要:】

⭐️特征相减:利用CLIP模型的特性,通过特征相减去除内容信息,实现风格和内容解耦。

⭐️仅风格层注入:在特定风格层完成特征注入,实现风格和内容解耦。

⭐️通用性强:InstantStyle的方法具有通用性,提供丰富代码实现,支持多种应用场景。

项目地址:https://top.aibase.com/tool/instantstyle

在线试玩:https://huggingface.co/spaces/InstantX/InstantStyle

——————

每日midjourney prompt:小说古风美女

2_1713162496656_ai2023_A_beautiful_woman_from_ancient_China_dressed_in_a_gorgeo_a8915415-91c6-458e-b123-27e4d3fb15f6.png

图源备注:图片由AI生成,图片授权服务商Midjourney

A beautiful woman from ancient China, dressed in a gorgeous red Hanfu, with long hair draped over her shoulders, sat in her boudoir with a smile. Ancient style, hanfu, boudoir, gorgeous, palace, screen, carpet, soft light, elegant temperament, ancient culture, in line with oriental aesthetics, rich details, best quality, exquisite makeup, clear eyeliner pen, slender eyebrows, textured skin, white skin, charming headdress, --ar3:4 --niji6 --style raw

一个中国古代美女,穿着华丽的红色汉服,长发披肩,微笑着坐在闺房内。古风,汉服,闺房,华丽,宫殿,屏风,地毯,柔和光线,高雅气质,古代文化,符合东方美学,细节丰富,品质最佳,精致的妆容,清晰的眼线笔,纤细的眉毛,纹理皮肤,白皙的皮肤,迷人的头饰

举报

  • 相关推荐
  • 特斯拉Model S/X库存见底 马斯克感慨:一个时代的感伤落幕

    特斯拉CEO马斯克在社交平台发文称,特斯拉Model S和Model X的库存已经只剩最后几百台,一个时代迎来感伤的落幕。 这条动态是马斯克回复一位用户的换车分享。有车主表示,在Model S/X停产前,用2020款Model S置换了全新的Plaid版Model X,体验后对FSD完全自动驾驶功能赞不绝口,称在洛杉矶过去一个月里,95%的里程都是自动驾驶完成,远超预期。 马斯克在回复中直接确认,Model S和Mo

  • 元戎启行冲刺百万级交付,前DeepSeek核心成员阮翀将亮相北京车展

    元戎启行CEO周光透在智能电动汽车发展高层论坛上表示,公司正通过基座模型推动辅助驾驶系统规模化落地,计划2026年实现百万辆量产目标。基座模型能显著降低系统开发与部署成本,使辅助驾驶能力在更大规模车型中落地。随着量产规模扩大,系统将获得更多真实数据,形成“规模-数据-模型”的正向循环,持续提升系统稳定性与安全性。目前搭载其城市NOA方案的量产车辆已超30万辆,累计运行里程超13亿公里。业内分析认为,规模化将成为自动驾驶公司竞争的重要壁垒。

  • GLM-5.1之后Minimax 2.7正式开源:顶级国产AI就等DeepSeek V4了

    稀宇科技旗下Minimax 2.7大模型已开源,编程能力大幅提升,性能接近Claude Opus和GPT-4 Pro,但价格更低。国产开源大模型已占据全球主要份额,头部包括阿里Qwen、智谱GLM、稀宇Minimax及备受关注的DeepSeek。目前GLM-5.1和Minimax 2.7均已开源,而DeepSeek V4预计4月下旬发布,将全面支持国产AI硬件系统,原生支持多模态,并有望在AI编程方面带来惊喜。

  • DeepSeek专家模式上线 此前V4版本已开启灰度测试

    近日,智能交互平台DeepSeek迎来重要更新,正式上线专家模式,旨在为用户在处理复杂问题时提供更为卓越的体验。此次更新是DeepSeek自走红以来,首次在产品端引入模式分层设计,标志着其在功能优化与用户体验提升上迈出了重要一步。 在最新版本的DeepSeek中,用户在输入框上方即可清晰看到新增的“快速模式”与“专家模式”选项。其中,快速模式主要针对日常对话场景设

  • DeepSeek专家模式上线!深度思考+极速Token 复杂难题一键搞定

    DeepSeek正式上线专家模式,进一步提升用户在处理复杂问题时的体验。 最新版本中,DeepSeek输入框上方新增快速模式”与专家模式”,这是DeepSeek走红以来首次在产品端引入模式分层设计。 快速模式侧重日常对话,即时响应速度快,还支持图片和文件文字识别。 专家模式则专注解决复杂问题,支持更深入的思考和智能搜索。尽管尚不确定该模式是否搭载了传闻中的 DeepSeek V4 �

  • 千问3.6正式发布:最强编程国产模型 接近Claude

    今天,千问发布新一代大语言模型Qwen3.6-Plus。 千问3.6整体性能较3.5进步显著,具备极强的智能体编程能力,在系列编程能力权威评测中,千问3.6成为当下编程能力最强的国产模型,接近全球最强编程模型Claude系列。 在前端网页开发、仓库级复杂任务等实测场景中,千问3.6可自主拆解任务、规划路径、测试修改直至任务完成。 Qwen3.6-Plus展现出卓越的工程落地能力,不仅能实�

  • 品牌在 DeepSeek/豆包搜索结果中不显示怎么办?GEOBase 一站式诊断 AI 可见度

    2026年,AI搜索(AIGC Search)已成为主流流量入口,品牌面临的最大危机是“AI根本不知道你是谁”。文章分析了全球及中国GEO市场竞争格局,指出市场已形成“综合型大厂”与“技术型精锐”并行的局面,并列举了PureblueAI、蓝色光标等十家头部服务商的核心定位。同时,文章拆解了头部服务商的三种核心策略:RAG适配、引用率保证和语义舆情对冲。针对品牌在AI回答中“消失”的痛点,2026年的工具已从“搜排名”进化到“语义监测”,并介绍了GEO诊断系统、AI引用追踪器等工具如何解决具体问题。最后,文章以GEOBase为例,阐述了其基于“站长之家”背景的差异化竞争优势:权威性、工具化、平民化,以及极致的性价比。

  • DeepSeek V4又又灰度测试:全新界面、多模态重大升级没跑了

    快科技4月7日消息,DeepSeek V4预计本月发布,新模型可能包含快速版、深度版及多模态版三款,支持视觉功能。此前系统崩溃和灰度测试均暗示升级在即。程序员展示的新界面含快速、专家及视觉选项,与现有界面形成对比。此外,DeepSeek至少还有两款使用国产芯片的大模型在开发中。用户期待官方正式发布,并希望推出面向AI编程的特别版。

  • 荣耀600 Pro国际版真机亮相:横向Deco+橙色机身 果味十足

    日前,荣耀新一代数字系列荣耀600系列在荣耀马来西亚官网公布,将带来荣耀600和荣耀600 Pro两款机型。 今日,荣耀600 Pro国际版真机亮相,其采用横向大矩阵Deco设计,整体视觉风格与iPhone 17 Pro颇为相似,辨识度十足。 从外观来看,Deco内配备三颗镜头,呈三角形排列,其中一颗采用椭圆形造型设计,显得格外独特,也进一步强化了整机的视觉层次感。 配色方面,新机提供橙

  • openclaw github installation guide:官方安装全流程!

    本文介绍了2026年AI行业已进入注重落地和实际应用的智能体阶段,并推荐了开源智能体框架OpenClaw。文章提供了详细的保姆级部署教程,支持Windows、macOS、Linux全平台,涵盖网关搭建、认证配置、模型对接等步骤,帮助用户快速拥有专属的私有化AI助手,实现隐私自主与强大执行能力。教程包括环境准备、一键安装、模型选择(如Kimi、OpenAI等)、API配置及TUI界面使用,并解答了常见问题。最终目标是让用户轻松部署并开启专属AI的高效应用之旅。

今日大家都在搜的词: