首页 > 原创 > 关键词  > 人工智能最新资讯  > 正文

A日报:B站升级动漫视频生成模型AniSora V3;字节开源4D视频生成框架EX-4D;DeepSWE开源AI Agent系统强势登顶

2025-07-03 16:30 · 稿源: aibase

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解:https://top.aibase.com/

1、字节跳动EX-4D震撼开源:单目视频秒变自由视角4D大片

EX-4D是字节跳动PICO-MR团队推出的4D视频生成框架,能够从单目视频生成高质量、多视角的4D视频序列。该技术通过深度密闭网格(DW-Mesh)和轻量级适配架构,解决了传统视频生成技术在多视角生成中的挑战,并在性能指标上全面领先。

【AiBase提要:】

💡 EX-4D利用深度密闭网格(DW-Mesh)实现单目视频到多视角的高质量生成。

🔍 通过渲染mask和跟踪mask策略,解决多视角数据稀缺问题。

🚀 在FID、FVD和VBench等指标上全面超越现有开源方法,性能表现卓越。

详情链接:https://github.com/tau-yihouxiang/EX-4D

2、Bilibili开源动漫视频生成模型AniSora V3版,一键生成多种风格动漫视频镜头

Bilibili宣布其开源动漫视频生成模型AniSora V3迎来重大更新,显著提升了生成质量、动作流畅度和风格多样性。该版本基于CogVideoX-5B和Wan2.1-14B模型,结合强化学习与人类反馈(RLHF)框架,支持多种动漫风格的视频生成,为创作者提供了更强大的工具。

【AiBase提要:】

✨ AniSora V3通过时空掩码模块优化,增强了动画任务的控制能力。

🚀 支持多任务处理,包括单帧图像生成视频、关键帧插值和唇部同步等功能。

📦 开源生态推动社区协作,开发者可通过GitHub获取代码和数据集。

详情链接:https://t.co/I3HPKPvsBV

3、DeepSWE 开源 AI Agent系统强势登顶,基于 Qwen3-32B

DeepSWE 是一款基于 Qwen3-32B 模型的开源 AI Agent 系统,通过强化学习进行训练,并在 SWE-Bench-Verified 测试中取得了出色的性能表现。该系统采用 rLLM 框架和改进的 GRPO++ 算法,在软件工程任务中展现出强大的学习能力与应用潜力。

image.png

【AiBase提要:】

🧠 DeepSWE 是基于 Qwen3-32B 模型,完全通过强化学习训练而成,开源信息已全面发布。

🏆 在 SWE-Bench-Verified 测试中,DeepSWE 表现出色,Pass@1准确率达到了59%,成为所有开源代理中的佼佼者。

💡 采用了 rLLM 框架和改进的 GRPO++ 算法,DeepSWE 在实际软件工程任务中展现了其强大的学习能力和应用潜力。

详情链接:https://huggingface.co/agentica-org/DeepSWE-Preview

4、字节跳动开源新模型VINCIE-3B:3亿参数,支持上下文连续图像编辑

字节跳动开源了支持上下文连续图像编辑的VINCIE-3B模型,该模型基于MM-DiT架构开发,能够从视频中学习并实现高效的图像编辑。其技术亮点包括视频驱动训练、块因果扩散变换器以及三重代理任务训练,显著提升了图像编辑的质量和效率。

image.png

【AiBase提要:】

🎥 视频驱动训练:VINCIE-3B利用视频的连续帧,自动提取文本描述与图像序列,构建多模态训练数据。

🧠 块因果扩散变换器:模型采用块因果注意力机制,在文本和图像块之间实现因果注意力,块内则为双向注意力。

🔄 三重代理任务训练:通过下一帧预测、当前帧分割预测和下一帧分割预测三种任务进行训练,增强模型对动态场景和物体关系的理解能力。

详情链接:https://huggingface.co/ByteDance-Seed/VINCIE-3B

5、Stability AI开源Stable Audio Open Small,手机秒变音频创作神器

Stability AI与Arm合作推出Stable Audio Open Small,一款专为移动设备优化的轻量级文本到音频生成模型。该模型在移动端本地运行,支持离线处理,具备高效、低延迟和高质量输出的特点,推动了AI音频生成技术向边缘计算和移动设备的转型。

【AiBase提要:】

📱 轻量化设计:参数量压缩至341M,适合移动端运行。

🔊 高质量音频生成:支持立体声音频生成,无需云端处理。

🌐 开源赋能开发者:遵循社区许可,降低技术门槛,鼓励创意应用。

详情链接:https://huggingface.co/stabilityai/stable-audio-open-small

6、谷歌重磅发布Gemini for Education!免费AI工具席卷全球教育

谷歌推出全新AI工具套件Gemini for Education,基于最新一代Gemini2.5Pro模型和LearnLM学习型大模型,为全球师生提供免费、强大且高效的学习与教学支持。该工具覆盖30多种功能,支持40多种语言,旨在通过AI技术赋能教育工作者和学生,打造更加个性化和高效的学习体验。

【AiBase提要:】

🌍 全球化教育赋能:支持40多种语言,覆盖230多个国家和地区。

📚 免费开放:对所有Google Workspace for Education用户完全免费,推动教育公平。

🔒 安全与隐私:严格遵循隐私条款,确保用户数据安全。

7、Topview Avatar2震撼发布!AI数字人革新电商带货,模特时代终结?

Topview Avatar2通过突破性的功能和逼真的效果,为出海电商和内容创作者带来了革命性的体验。其创新的AI数字人技术能够实现产品与数字人的自然交互,极大提升了视频制作效率和内容质量。

image.png

【AiBase提要:】

🌍 全球首创AI数字人“穿戴”产品,实现更真实的交互效果。

⚙️ 一键生成定制化视频,支持多语言口型同步,提升营销灵活性。

🚀 革新传统UGC视频模式,降低电商拍摄门槛,助力品牌全球化。

详情链接:https://www.topview.ai/ai-product-avatar

8、Perplexity推出Max订阅计划:每月200美元解锁无限AI生产力

Perplexity推出了高端订阅计划Max,定价为每月200美元或每年2000美元,旨在满足高频用户和专业人士的需求。该计划提供无限量访问Labs、优先体验新功能以及最新前沿模型的支持,标志着其在AI生产力工具领域的进一步深耕。

image.png

【AiBase提要:】

🧠 无限Labs查询:满足专业用户对深度研究和复杂项目的需求。

🚀 优先访问前沿模型:确保用户始终站在技术前沿。

🔒 优先支持:提供专用基础设施和更快的客户响应时间。

9、Cursor 大胆挖人!Claude Code 核心人物转投竞争对手

Cursor 挖走 Anthropic 的两位核心人物,标志着 AI 编程市场竞争的加剧。尽管 Anthropic 面临人才流失,但其业务依然强劲,收入和估值显著增长。Anysphere 则借助这些人才进一步提升产品竞争力。

【AiBase提要:】

🧠 Cursor 成功挖走 Anthropic 核心人物,技术实力增强

💼 Boris Cherny 和 Cat Wu 加入 Anysphere,推动产品创新

📈 Anthropic 业务增长迅速,收入和估值均大幅提升

10、OpenAI 声明:Robinh ood 推出的 “OpenAI 代 币” 与我们无关

R obinh ood 在欧洲推出了 OpenAI 和 SpaceX 的代 币化股票,但 OpenAI 明确表示这些代 币并非其股权,且与 Robinh ood 没有合作关系。尽管 Robinh ood 提供了限时优惠吸引用户,但美国用户无法参与。这一事件引发了市场的热烈反响,Robinh ood 股价一度飙升。

【AiBase提要:】

💰 OpenAI 强调“OpenAI 代 币”不是其股权,与 Robinh ood 无合作。

⚠️ Robinh ood 通过代 币化股票吸引投资者,但美国用户无法参与。

📈 Robinh ood 股价因该消息上涨,创下历史新高。

举报

  • 相关推荐
  • 海尔冰箱唯一获批“制冷家电人工智能技术山东省工程研究中心”

    海尔冰箱在人工智能领域取得新突破,主导建设的"制冷家电人工智能技术山东省工程研究中心"成为2025年山东省工程研究中心认定名单中唯一入选的冰箱品牌。该中心聚焦人工智能、物联网、大数据等技术方向,开发了全空间智慧保鲜舱冰箱等140多项行业首创产品,近三年获授权发明专利803件。海尔冰箱还推出行业首款接入DeepSeek的AI全空间保鲜冰箱,具备方言识别、降噪技术等功能,显著提升用户体验。市场数据显示,2023年1-7月海尔冰箱以47%市场份额稳居行业第一。通过AI技术赋能,海尔冰箱正引领行业向精准、智能保鲜时代跨越。

  • 下一个爆款在哪儿?2025英特尔人工智能创新应用大赛获奖名单揭晓

    8月16日,2025英特尔人工智能创新应用大赛总决赛在深圳落幕。40支优秀团队从2817支队伍中脱颖而出,围绕工业、教育、心理健康、游戏等领域展开对决。大赛展示了AI从云端走向边缘的趋势,依托酷睿Ultra处理器和低代码开发工具,推动AI应用本地化落地。获奖作品包括动力电池机器人协作拆卸系统和AI生成PPT服务,体现AI与产业需求的深度融合。英特尔与联想、惠普等合作伙伴共同为开发者提供全栈支持,加速AI技术普及和商业化进程。

  • 字节跳动否认将推手机产品:探索把自己的AI能力开放给硬件厂商

    字节跳动否认年底推出自有手机产品传闻,表示专注于AI大模型技术开发,为手机厂商提供基于大模型的软件解决方案,推动智能交互和个性化推荐功能,旨在改善用户体验并促进行业发展。

  • ISC.AI 2025 人工智能安全治理与创新实践论坛圆满召开

    ISC.AI2025人工智能安全论坛在北京召开,聚焦AI安全治理与创新实践。论坛汇集顶尖专家,探讨大模型安全评估与防护、智能体安全、AI治理等前沿议题。360集团张向征指出,随着Agent技术爆发式应用,AI安全已成为产业核心焦点。专家们强调需构建AI安全防护体系,应对大模型直接访问核心系统带来的全新挑战。中国电子院彭健提出企业合规建设需关注九大要素,清华大学苏航揭示智能体安全风险远超传统AI。华为云范建军倡导端到端大模型安全防护,中国信通院杨哲超呼吁构建协同治理框架。论坛为构建安全、普惠、负责任的人工智能未来贡献智慧。

  • 马斯克母亲发帖支持儿子:演示Grok视频生成功能

    近日,马斯克母亲梅耶-马斯克发帖演示支持马斯克的Grok视频生成功能。 她表示,这次我把手指放在了最近在X上发布的这张照片上,提示是用Grok制作视频”,现在自己的狗摇着尾巴了,自己玩得很开心。 她还特别提示,这个视频由@grok Imagine制作。

  • 三星年底推出XR新品头显,字节跳动/微美全息加速MR眼镜布局卡位争夺先机

    三星确认将于2023年下半年推出三折折叠智能手机与XR头显组合设备,搭载Android XR系统,配备Micro OLED/OLEDoS显示屏,支持90Hz刷新率和眼动追踪功能。字节跳动旗下PICO公司正开发代号"Project P"的MR头显,直接对标Meta计划2027年推出的旗舰产品"Phoenix"。微美全息(WIMI.US)作为AR领域重要参与者,通过技术研发和生态合作持续强化竞争力。行业分析指出,XR设备正朝着轻量化方向发展,分体式设计可能成为未来主流趋势,市场竞争格局正在重塑。

  • Razer(雷蛇)在新加坡设立AI CENTER OF EXCELLENCE,加速人工智能投资布局

    雷蛇宣布在新加坡设立全球AI卓越中心,并计划在欧洲和美国建立类似机构,推动游戏与开发者工具领域的创新。新加坡中心将招聘150名AI工程师,专注于下一代AI游戏技术研发。雷蛇还推出AI工具套件,包括Game Co-AI和QA Co-AI,帮助开发者提升游戏质量和开发效率。该战略布局正值全球游戏市场快速增长期,预计2033年AI游戏市场规模将达280亿美元。新加坡数字产业发展局表示,此举将巩固该国作为区域AI创新中心的地位。

  • AI日报:智谱AI发布AutoGLM 2.0;腾讯元宝接入腾讯视频;字节发布开源大语言模型 Seed-OSS

    本期AI日报聚焦多项AI技术突破:智谱发布革命性语音代理AutoGLM 2.0,实现全平台语音操控;腾讯元宝接入视频平台提升观影便捷性;字节跳动开源大模型Seed-OSS专注长文本处理;速卖通AI代理助力新品推广效率翻倍;微软测试Copilot智能文件搜索功能;Liquid AI推出低延迟视觉语言模型LFM2-VL;OpenAI月收入首破10亿美元;谷歌Pixel 10系列全面升级AI功能,包括情感识别和实时翻译;Pixel Buds Pro 2引入AI手势控制;ElevenLabs发布支持70+语言的文本转语音API。

  • 诚志生命D-核糖荣获“FHE同心奖”,创新引领健康食品产业发展

    2025年2月17-20日,博鳌健康食品科学大会(FHE2025)在海南博鳌召开。会议聚焦"科技创新与科学循证",围绕食品法规、新技术、药食同源等六大板块展开研讨。诚志生命科技携核心产品D-核糖参展并获"FHE同心奖",其临床研究显示D-核糖能显著减少马拉松运动员心肌损伤,提升完赛成绩。公司作为D-核糖全球知识产权持有者,展示了包括D-核糖冲剂等系列营养健康产品。诚志生命成立于2000年,是专注于合成生物学研发的国有控股高科技企业,未来将持续加大D-核糖等核心产品的迭代升级,推动"科技+健康"双驱动发展。

  • 硅基智能完成数亿元D轮融资,司马华鹏:要从卖工具到卖结果

    南京硅基智能科技完成数亿元D轮融资,由嘉兴高新区产业基金投资。资金将用于核心技术研发和产品市场化应用。公司聚焦AIGC数字人技术,已服务超5000家企业,年营收达数亿元。其新一代多模态大模型DUIX ONE提升了人机交互真实感,并推出"DUIX Inside"战略,为开发者提供标准化API服务。公司还探索"按效果付费"新模式,从卖工具转向卖结果。硅基智能计划在全球1

今日大家都在搜的词: