首页 > 业界 > 关键词  > CogVideoX最新资讯  > 正文

AI日报:智谱开源清影同源“兄弟”CogVideoX;阿里通义App推出角色扮演功能;即梦视频生成推动效画板功能;OpenAI领导层大动荡!

2024-08-06 16:20 · 稿源:站长之家

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解:https://top.aibase.com/

1、智谱AI宣布开源「清影」同源视频生成模型——CogVideoX

智谱AI宣布开源了CogVideoX视频生成模型,旨在推动视频生成技术的发展和应用。该模型采用先进的大型模型技术,具备商业级应用需求,实现了高效的推理和微调,结合3D VAE技术和Transformer技术,生成高质量视频内容。智谱AI通过筛选高质量视频数据和处理视频字幕问题,确保模型训练数据质量。CogVideoX在性能评估方面表现优异,将继续探索视频生成领域的创新。

image.png

【AiBase提要:】

⚙️ CogVideoX模型基于大型模型技术,满足商业级应用需求,推理和微调效率高

🔍 CogVideoX采用3D VAE技术和Transformer技术,生成高质量视频内容

📈 智谱AI通过筛选高质量视频数据和解决视频字幕问题,确保模型训练数据质量,性能评估优异

详情链接:https://github.com/THUDM/CogVideo

2、阿里通义App推出角色扮演功能

阿里通义App最新推出了创新的角色扮演功能,用户可一键替换视频中的人物。这一功能源自阿里通义实验室推出的Motionshop模型,吸引全球创作者关注。Motionshop已产品化并免费集成到通义App,拓展视频创作和动画制作领域。通义App将在9月推出自定义角色功能,丰富用户创作体验。

image.png

【AiBase提要:】

🎭 角色扮演功能让用户一键替换视频人物,源自阿里通义实验室的Motionshop模型

🌐 Motionshop融合多种先进技术,允许用户在动态视频中实现现实与虚拟转换

💡 传统人物替换依赖路径追踪渲染,Motionshop提升效率并保持渲染质量

3、即梦视频生成推动效画板功能

即梦最新推出的动效画板功能让用户可以精确控制视频中物体的运动轨迹和结束状态,提升视频输出质量。这项功能支持框选或手动选择背景或主体,自动识别并节省用户时间。用户可以自由描绘运动轨迹,设置结束状态框位置,输出视频时长为4秒或6秒,创意无限。

【AiBase提要:】

✨ 动效画板功能让用户精确控制视频物体运动轨迹和结束状态,提升输出质量。

🎨 支持自由描绘运动轨迹,设置结束状态框位置,创意表现更丰富。

⏱ 视频输出时长可选4秒或6秒,满足不同创作需求。

产品入口:https://top.aibase.com/tool/jimengdreamina

详细内容点此查看:https://www.aibase.com/zh/news/10847

4、钉钉推出“AI 迎新百事通”:10分钟即可定制校园智能迎新助手

钉钉推出了名为“AI 迎新百事通”的智能化迎新解决方案,专为高校开学季设计,以提升新生入学的安全性和便捷性,并减轻教职员工的工作负担。该方案基于钉钉AI助理和知识库,能在10分钟内为学校定制一个全天候的智能迎新助手,7×24小时回答新生关于入学流程、校园生活和学习资源的问题。

image.png

【AiBase提要:】

⭐ 高校开学季定制智能迎新助手,提升新生入学安全便捷,减轻教职员工工作负担。

⭐ 覆盖新生导入期、入校前、入校中、入校后四个关键阶段,提供全面迎新服务。

⭐ 体现数智化理念,预示高校数智化管理趋势,推动高等教育管理智能化、人性化发展。

详情链接:https://alidocs.dingtalk.com/notable/share/form/v01AJdl6406WLx2qke1_dv19yqvsgs3oebp3pcjys_1qX0QQ0?dontjump=true

5、月之暗面回应腾讯参与 Kimi3亿美元融资

这篇文章报道了腾讯参与中国人工智能独角兽企业月之暗面科技有限公司的融资事件,引起了关注。月之暗面作为大模型创业公司的佼佼者,由清华大学教授创立,汇聚了全球顶级人才和技术。公司融资规模巨大,股东包括阿里巴巴、红杉中国等知名机构。Kimi智能助手在国内AI聊天机器人中表现突出,访问量持续增长。

image.png

【AiBase提要:】

🚀 月之暗面科技有限公司由清华大学教授创立,汇聚全球顶级人才和技术。

💰 公司融资规模巨大,腾讯参与的3亿美元融资引发关注,估值达到30亿美元。

🤖 Kimi智能助手在国内AI聊天机器人中表现突出,访问量持续增长,成为访问量第一的AI聊天机器人。

6、玩法升级!Runway Gen-3Alpha图生视频新增首尾帧功能

Runway在AI生成视频领域迈出重要一步,支持图像作为视频生成的首尾帧,提高艺术控制能力。这一功能解决了AI视频创作中的关键挑战,受到用户认可。Runway与其他竞争者竞争激烈,但公共可用性带来优势。新功能解决AI生成视频连贯性和艺术意图挑战,有望在商业应用中有重要价值。Runway正处关键时刻,谈判中或筹集巨额资金,技术意义深远,可能重塑行业。

【AiBase提要:】

⚙️ 图像作为视频生成首尾帧,提高艺术控制能力

🔑 解决AI视频创作关键挑战,获得用户认可

💡 新功能有望在商业应用中有重要价值

详情链接:https://top.aibase.com/tool/runwayml

7、小米14、K70等将推澎湃OS全AI功能

小米公司宣布推出全新全AI功能,用户无需申请内测资格即可体验。全AI功能涵盖小爱输入助手、AI写真、AI搜图等多个方面。灰度测试将从本月开始,逐步推送至不同机型。暂时无法体验的用户需耐心等待。

【AiBase提要:】

🚀 小米公司宣布推出全新全AI功能,用户无需申请内测资格即可体验。

🔍 全AI功能涵盖小爱输入助手、AI写真、AI搜图等多个方面。

📱 灰度测试将从本月开始,逐步推送至不同机型。暂时无法体验的用户需耐心等待。

8、ControlMM:文字、语音、音乐多模态输入生成全身动作

香港中文大学和腾讯联合推出的技术框架ControlMM实现了全身动作生成的新突破,支持多模态输入,解决了全身多模态运动生成中的诸多难题。通过创新方法和新基准的推出,ControlMM在各项标准运动生成任务中表现出色,具有优越的生成效果。

image.png

【AiBase提要:】

🔥 多模态控制: ControlMM支持文本、语音、音乐等多种模态进行全身运动生成,增强了控制能力和适应性。

⚙️ 统一框架: 采用统一的ControlMM框架,整合了多种运动生成任务,提高了生成效率。

🎯 分阶段训练策略: 通过粗到细的训练策略,确保模型在不同粒度条件下的有效性。

详情链接:https://top.aibase.com/tool/controlmm

9、三星开始大规模生产用于设备端AI的内存芯片

三星宣布量产业内最薄的LPDDR5X DRAM芯片,厚度仅相当于指甲的薄度,以满足移动设备上的AI需求。新款内存不仅薄至0.65毫米,热阻性能提升21.2%,还展现出色的性能表现。三星计划扩大低功耗DRAM市场,推出更多高性能、高密度的内存解决方案。

【AiBase提要:】

🌟 三星开始量产超薄LPDDR5X DRAM芯片,旨在满足移动设备上的AI需求。

📏 新款内存厚度仅0.65毫米,比前代产品更薄,热阻性能显著提升。

📈 三星计划扩大低功耗DRAM市场,推出更多高性能、高密度的内存解决方案。

10、英伟达被曝秘密抓取 YouTube 视频数据训练AI

英伟达近期被曝光秘密抓取大量YouTube视频数据用于训练人工智能模型,引发法律和伦理问题。管理层态度大胆自信,认为行为获得全面批准。谷歌指出未经许可使用YouTube数据违反服务条款,英伟达回应引发争议。

【AiBase提要:】

📹 英伟达秘密抓取大量 YouTube 视频数据进行 AI 训练,法律和伦理问题引发关注。

💻 内部邮件显示,英伟达高管认为这一行为获得了全面批准,态度相当大胆。

📜 谷歌指出,未经许可使用 YouTube 数据明显违反平台服务条款,英伟达的回应引发争议。

11、AI芯片创业公司Groq获6.4亿美元融资 估值28亿美元

Groq成功获得6.4亿美元融资,估值达到28亿美元,意在挑战Nvidia的市场地位。该公司专注于开发语言处理单元(LPU),具备出色的处理速度和能源效率。Groq积极拓展市场,与多家公司建立合作关系,努力成为AI芯片行业的有力竞争者。

【AiBase提要:】

🌟 Groq获得6.4亿美元融资,估值28亿美元,意在挑战Nvidia的市场地位。

⚡ Groq的语言处理单元(LPU)专为AI工作负载设计,具备出色的处理速度和能源效率。

🌍 Groq积极布局政府和国际市场,与多家公司建立合作关系,扩展市场影响力。

12、苹果AI功能指令曝光 揭示iOS和macOS未来AI助手细节

苹果公司最新开发者测试版加入多项生成式AI功能,包括邮件助手、文本重写、邮件摘要、照片回忆和消息总结。这些功能揭示了苹果未来AI助手的工作方式,但用户需谨慎探索敏感区域。iOS和macOS新版本推出后,将体验这些AI功能。

image.png

【AiBase提要:】

📧 邮件助手:AI根据邮件内容提出问题,可能智能回复一部分。

📝 文本重写:AI限制回答在50字内,禁止幻觉或编造事实。

📬 邮件摘要:AI用三句话不超过60字总结邮件内容,不回答问题。

13、OpenAI领导层大动荡!两个联合创始人一个离职、一个延长休假

OpenAI的管理层出现重大变动,总裁兼联合创始人Greg Brockman宣布休假至年底,另一联合创始人John Schulman加入竞争对手Anthropic。这一变动意味着公司经历新的调整,尤其在经历多次高管变动后。

【AiBase提要:】

🌟 Greg Brockman宣布休假至年底,Schulman转投竞争对手Anthropic。

🚀 今年以来OpenAI管理层变动频繁,已离职多名高管。

💡 Schulman被誉为ChatGPT的“设计师”,但他表示这要归功于整个团队的努力。

14、零一万物01AI旗下Yi API宣布 Function Call 功能上线

Yi API推出具有Function Call功能的Yi-Large-FC模型,实现平滑替代GPT的能力,对构建AI Agent系统至关重要,展现高性能在API调用场景中的表现。Yi系列大模型已成为企业探索新业务和验证AI-first产品的首选。零一万物持续推出新工具,如RAG和Function Call,提供更易用、更深入、更安全稳定的解决方案。

image.png

【AiBase提要:】

🚀 Yi-Large-FC模型具有Function Call功能,可根据用户输入判断何时调用外部工具,并以JSON格式响应,兼容OpenAI接口设计,实现平滑替代GPT的能力。

💡 Function Call能力对于构建AI Agent系统至关重要,特别适用于实时信息处理、专用任务处理、自动化工作流程和增强模型能力的场景。

💼 Yi-Large-FC在BFCL排名全球第六,在Exec摘要得分排行中位列世界第二,展现出在实际API调用场景中的高性能

举报

  • 相关推荐
  • 阿里发布Wan2.7-Video视频生成模型!从演迈向导 聚焦创作全链路

    阿里巴巴今日正式发布Wan2.7-Video视频生成系列模型,涵盖文生视频、图生视频、参考生视频和视频编辑四大模型。 新模型拥有全面的创作控制力,将AI的能力从单一素材生成扩至创作全链路,从演”迈向导”。

  • 年轻人的影音刚需,Vidda 小钢炮 S Mini 用1999元一次性全满足

    文章指出,2026年选购Mini LED电视面临挑战:该技术虽在画质上远超普通LED,但成本高,中端市场常陷入“涨价”或“减配”的困境。Vidda推出小钢炮S Mini系列,以1999元起售价打破行业“高价低配”潜规则。它搭载AG+LR无倒影低反屏、180个独立分区、1.2L独立低音炮、180Hz高刷等旗舰配置,实现音画双绝,将高端体验拉至入门价位,为年轻人提供高性价比选择。

  • 从 RTX 到 Spark:NVIDIA 为本地代理式 AI 加速 Gemma 4

    Google推出小巧、快速且具备多模态能力的Gemma4模型家族,与NVIDIA合作优化,可在各类设备上高效本地运行。该系列涵盖E2B至31B多种变体,专为从边缘设备到高性能GPU的高效部署设计。Gemma4支持推理、编码、智能体及多模态交互等丰富任务,并兼容OpenClaw等应用,实现任务自动化。用户可通过Ollama或llama.cpp在NVIDIA RTX GPU和DGX Spark上免费运行。

  • Vidda杀疯了!新品小钢炮S Mini开售,1999元拿下顶配Mini LED 电视

    4月7日,Vidda小钢炮S Mini正式开启全渠道预售。作为专为年轻人打造的首台Mini LED电视,该产品打破中端市场“成本妥协、配置阉割”的行业潜规则,集旗舰抗光屏、MiniLED精准控光、独立低音炮、超高刷等硬核配置于一身,提供55、65、75英寸三大主流尺寸,最低1999元即可入手。产品搭载旗舰级AG+LR低反光屏幕,配备180个独立分区Mini LED背光,结合AI画质引擎实现精准控光,同时内置2.1声道独立低音炮系统,支持杜比与DTS双认证,配合180Hz超高刷新率与MEMC运动补偿,带来影院级音画体验。Vidda以极致性价比推动高端显示技术下沉,让年轻人无需妥协即可拥有全能影音终端。

  • 荣耀600 Pro国际版真机亮相:横向Deco+橙色机身 果味十足

    日前,荣耀新一代数字系列荣耀600系列在荣耀马来西亚官网公布,将带来荣耀600和荣耀600 Pro两款机型。 今日,荣耀600 Pro国际版真机亮相,其采用横向大矩阵Deco设计,整体视觉风格与iPhone 17 Pro颇为相似,辨识度十足。 从外观来看,Deco内配备三颗镜头,呈三角形排列,其中一颗采用椭圆形造型设计,显得格外独特,也进一步强化了整机的视觉层次感。 配色方面,新机提供橙

  • 梦回霸王!何润东再Cos项羽气场拉满

    何润东在抖音更新了一条趣味视频,内容是cos《王者荣耀》里的项羽,整段风格轻松搞笑,一下子吸引不少网友关注。 视频里的对话特别有意思,有人问他,哥,你真的手无缚鸡之力吗。何润东很坦然回答,是啊。对方接着追问,那十只呢,他说好像可以。再问到一百只的时候,他依旧笑着说好像还可以。短短几句问答,反差感拉满,看着又好玩又接地气。 这次他cos的项羽�

  • 2026 NVIDIA GTC 圆满落幕:阿丘科技携 Factory AI 亮相 GTC

    全球AI顶级盛会NVIDIA GTC 2026于3月16日至19日在美国加州圣何塞举行。NVIDIA创始人兼CEO黄仁勋发表主题演讲,揭示加速计算与AI的未来蓝图。阿丘科技以“Factory AI Pioneer”身份亮相,展示了基于NVIDIA平台的工业AI前沿技术与全场景解决方案,并与全球伙伴探讨AI与物理世界深度融合,如何重构工厂的质量与安全体系。阿丘科技还作为NVIDIA初创加速计划会员代表,在线上演讲中分享基于视觉平台的全厂AI方案。盛会虽落幕,但阿丘科技探索智能制造的旅程仍在继续。

  • 绿算技术亮相NVIDIA GTC 2026暨AI存储闭门会,分享存算协同新突破

    随着大模型推理从“可用”迈向“高效”,软硬件协同、数据通路重构与存算新架构已成为全球AI基础设施竞争的核心高地。近日,2026年NVIDIA亚太区AI存储研讨会在NVIDIA总部成功举办。作为AI存储与算力基础设施领域的创新先锋,绿算技术产品及研发中心总经理孔维海受邀出席,并在闭门会议中分享了前沿技术观点与绿算产品体系的最新进展。本次研讨会汇聚了NVIDIA、超云、DaoC

  • openclaw github installation guide:官方安装全流程!

    本文介绍了2026年AI行业已进入注重落地和实际应用的智能体阶段,并推荐了开源智能体框架OpenClaw。文章提供了详细的保姆级部署教程,支持Windows、macOS、Linux全平台,涵盖网关搭建、认证配置、模型对接等步骤,帮助用户快速拥有专属的私有化AI助手,实现隐私自主与强大执行能力。教程包括环境准备、一键安装、模型选择(如Kimi、OpenAI等)、API配置及TUI界面使用,并解答了常见问题。最终目标是让用户轻松部署并开启专属AI的高效应用之旅。

  • 健合Solid Gold素力高深耕宠物营养健康领域,打造低脂高蛋白优质猫粮

    随着情感陪伴需求上升,宠物深度融入中国家庭,成为不可或缺的“家庭成员”,也驱动着相关消费市场持续扩容。养宠方式正加速迈向科学化、精细化,品牌需精准解决特定场景下的健康痛点。素力高品牌洞察中国室内猫喂养趋势,针对“足不出户”导致的肥胖、肠道健康等核心困扰,推出低脂高蛋白猫粮新品。该产品采用科学配方,并添加自主研发的专利猫源益生菌HHP003,旨在从源头控制脂肪摄入,同时温和呵护猫咪肠道,为室内猫的体重管理与肠道健康提供更有效的支持。

今日大家都在搜的词: