首页 > 业界 > 关键词  > CogVideoX最新资讯  > 正文

AI日报:智谱开源清影同源“兄弟”CogVideoX;阿里通义App推出角色扮演功能;即梦视频生成推动效画板功能;OpenAI领导层大动荡!

2024-08-06 16:20 · 稿源:站长之家

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解:https://top.aibase.com/

1、智谱AI宣布开源「清影」同源视频生成模型——CogVideoX

智谱AI宣布开源了CogVideoX视频生成模型,旨在推动视频生成技术的发展和应用。该模型采用先进的大型模型技术,具备商业级应用需求,实现了高效的推理和微调,结合3D VAE技术和Transformer技术,生成高质量视频内容。智谱AI通过筛选高质量视频数据和处理视频字幕问题,确保模型训练数据质量。CogVideoX在性能评估方面表现优异,将继续探索视频生成领域的创新。

image.png

【AiBase提要:】

⚙️ CogVideoX模型基于大型模型技术,满足商业级应用需求,推理和微调效率高

🔍 CogVideoX采用3D VAE技术和Transformer技术,生成高质量视频内容

📈 智谱AI通过筛选高质量视频数据和解决视频字幕问题,确保模型训练数据质量,性能评估优异

详情链接:https://github.com/THUDM/CogVideo

2、阿里通义App推出角色扮演功能

阿里通义App最新推出了创新的角色扮演功能,用户可一键替换视频中的人物。这一功能源自阿里通义实验室推出的Motionshop模型,吸引全球创作者关注。Motionshop已产品化并免费集成到通义App,拓展视频创作和动画制作领域。通义App将在9月推出自定义角色功能,丰富用户创作体验。

image.png

【AiBase提要:】

🎭 角色扮演功能让用户一键替换视频人物,源自阿里通义实验室的Motionshop模型

🌐 Motionshop融合多种先进技术,允许用户在动态视频中实现现实与虚拟转换

💡 传统人物替换依赖路径追踪渲染,Motionshop提升效率并保持渲染质量

3、即梦视频生成推动效画板功能

即梦最新推出的动效画板功能让用户可以精确控制视频中物体的运动轨迹和结束状态,提升视频输出质量。这项功能支持框选或手动选择背景或主体,自动识别并节省用户时间。用户可以自由描绘运动轨迹,设置结束状态框位置,输出视频时长为4秒或6秒,创意无限。

【AiBase提要:】

✨ 动效画板功能让用户精确控制视频物体运动轨迹和结束状态,提升输出质量。

🎨 支持自由描绘运动轨迹,设置结束状态框位置,创意表现更丰富。

⏱ 视频输出时长可选4秒或6秒,满足不同创作需求。

产品入口:https://top.aibase.com/tool/jimengdreamina

详细内容点此查看:https://www.aibase.com/zh/news/10847

4、钉钉推出“AI 迎新百事通”:10分钟即可定制校园智能迎新助手

钉钉推出了名为“AI 迎新百事通”的智能化迎新解决方案,专为高校开学季设计,以提升新生入学的安全性和便捷性,并减轻教职员工的工作负担。该方案基于钉钉AI助理和知识库,能在10分钟内为学校定制一个全天候的智能迎新助手,7×24小时回答新生关于入学流程、校园生活和学习资源的问题。

image.png

【AiBase提要:】

⭐ 高校开学季定制智能迎新助手,提升新生入学安全便捷,减轻教职员工工作负担。

⭐ 覆盖新生导入期、入校前、入校中、入校后四个关键阶段,提供全面迎新服务。

⭐ 体现数智化理念,预示高校数智化管理趋势,推动高等教育管理智能化、人性化发展。

详情链接:https://alidocs.dingtalk.com/notable/share/form/v01AJdl6406WLx2qke1_dv19yqvsgs3oebp3pcjys_1qX0QQ0?dontjump=true

5、月之暗面回应腾讯参与 Kimi3亿美元融资

这篇文章报道了腾讯参与中国人工智能独角兽企业月之暗面科技有限公司的融资事件,引起了关注。月之暗面作为大模型创业公司的佼佼者,由清华大学教授创立,汇聚了全球顶级人才和技术。公司融资规模巨大,股东包括阿里巴巴、红杉中国等知名机构。Kimi智能助手在国内AI聊天机器人中表现突出,访问量持续增长。

image.png

【AiBase提要:】

🚀 月之暗面科技有限公司由清华大学教授创立,汇聚全球顶级人才和技术。

💰 公司融资规模巨大,腾讯参与的3亿美元融资引发关注,估值达到30亿美元。

🤖 Kimi智能助手在国内AI聊天机器人中表现突出,访问量持续增长,成为访问量第一的AI聊天机器人。

6、玩法升级!Runway Gen-3Alpha图生视频新增首尾帧功能

Runway在AI生成视频领域迈出重要一步,支持图像作为视频生成的首尾帧,提高艺术控制能力。这一功能解决了AI视频创作中的关键挑战,受到用户认可。Runway与其他竞争者竞争激烈,但公共可用性带来优势。新功能解决AI生成视频连贯性和艺术意图挑战,有望在商业应用中有重要价值。Runway正处关键时刻,谈判中或筹集巨额资金,技术意义深远,可能重塑行业。

【AiBase提要:】

⚙️ 图像作为视频生成首尾帧,提高艺术控制能力

🔑 解决AI视频创作关键挑战,获得用户认可

💡 新功能有望在商业应用中有重要价值

详情链接:https://top.aibase.com/tool/runwayml

7、小米14、K70等将推澎湃OS全AI功能

小米公司宣布推出全新全AI功能,用户无需申请内测资格即可体验。全AI功能涵盖小爱输入助手、AI写真、AI搜图等多个方面。灰度测试将从本月开始,逐步推送至不同机型。暂时无法体验的用户需耐心等待。

【AiBase提要:】

🚀 小米公司宣布推出全新全AI功能,用户无需申请内测资格即可体验。

🔍 全AI功能涵盖小爱输入助手、AI写真、AI搜图等多个方面。

📱 灰度测试将从本月开始,逐步推送至不同机型。暂时无法体验的用户需耐心等待。

8、ControlMM:文字、语音、音乐多模态输入生成全身动作

香港中文大学和腾讯联合推出的技术框架ControlMM实现了全身动作生成的新突破,支持多模态输入,解决了全身多模态运动生成中的诸多难题。通过创新方法和新基准的推出,ControlMM在各项标准运动生成任务中表现出色,具有优越的生成效果。

image.png

【AiBase提要:】

🔥 多模态控制: ControlMM支持文本、语音、音乐等多种模态进行全身运动生成,增强了控制能力和适应性。

⚙️ 统一框架: 采用统一的ControlMM框架,整合了多种运动生成任务,提高了生成效率。

🎯 分阶段训练策略: 通过粗到细的训练策略,确保模型在不同粒度条件下的有效性。

详情链接:https://top.aibase.com/tool/controlmm

9、三星开始大规模生产用于设备端AI的内存芯片

三星宣布量产业内最薄的LPDDR5X DRAM芯片,厚度仅相当于指甲的薄度,以满足移动设备上的AI需求。新款内存不仅薄至0.65毫米,热阻性能提升21.2%,还展现出色的性能表现。三星计划扩大低功耗DRAM市场,推出更多高性能、高密度的内存解决方案。

【AiBase提要:】

🌟 三星开始量产超薄LPDDR5X DRAM芯片,旨在满足移动设备上的AI需求。

📏 新款内存厚度仅0.65毫米,比前代产品更薄,热阻性能显著提升。

📈 三星计划扩大低功耗DRAM市场,推出更多高性能、高密度的内存解决方案。

10、英伟达被曝秘密抓取 YouTube 视频数据训练AI

英伟达近期被曝光秘密抓取大量YouTube视频数据用于训练人工智能模型,引发法律和伦理问题。管理层态度大胆自信,认为行为获得全面批准。谷歌指出未经许可使用YouTube数据违反服务条款,英伟达回应引发争议。

【AiBase提要:】

📹 英伟达秘密抓取大量 YouTube 视频数据进行 AI 训练,法律和伦理问题引发关注。

💻 内部邮件显示,英伟达高管认为这一行为获得了全面批准,态度相当大胆。

📜 谷歌指出,未经许可使用 YouTube 数据明显违反平台服务条款,英伟达的回应引发争议。

11、AI芯片创业公司Groq获6.4亿美元融资 估值28亿美元

Groq成功获得6.4亿美元融资,估值达到28亿美元,意在挑战Nvidia的市场地位。该公司专注于开发语言处理单元(LPU),具备出色的处理速度和能源效率。Groq积极拓展市场,与多家公司建立合作关系,努力成为AI芯片行业的有力竞争者。

【AiBase提要:】

🌟 Groq获得6.4亿美元融资,估值28亿美元,意在挑战Nvidia的市场地位。

⚡ Groq的语言处理单元(LPU)专为AI工作负载设计,具备出色的处理速度和能源效率。

🌍 Groq积极布局政府和国际市场,与多家公司建立合作关系,扩展市场影响力。

12、苹果AI功能指令曝光 揭示iOS和macOS未来AI助手细节

苹果公司最新开发者测试版加入多项生成式AI功能,包括邮件助手、文本重写、邮件摘要、照片回忆和消息总结。这些功能揭示了苹果未来AI助手的工作方式,但用户需谨慎探索敏感区域。iOS和macOS新版本推出后,将体验这些AI功能。

image.png

【AiBase提要:】

📧 邮件助手:AI根据邮件内容提出问题,可能智能回复一部分。

📝 文本重写:AI限制回答在50字内,禁止幻觉或编造事实。

📬 邮件摘要:AI用三句话不超过60字总结邮件内容,不回答问题。

13、OpenAI领导层大动荡!两个联合创始人一个离职、一个延长休假

OpenAI的管理层出现重大变动,总裁兼联合创始人Greg Brockman宣布休假至年底,另一联合创始人John Schulman加入竞争对手Anthropic。这一变动意味着公司经历新的调整,尤其在经历多次高管变动后。

【AiBase提要:】

🌟 Greg Brockman宣布休假至年底,Schulman转投竞争对手Anthropic。

🚀 今年以来OpenAI管理层变动频繁,已离职多名高管。

💡 Schulman被誉为ChatGPT的“设计师”,但他表示这要归功于整个团队的努力。

14、零一万物01AI旗下Yi API宣布 Function Call 功能上线

Yi API推出具有Function Call功能的Yi-Large-FC模型,实现平滑替代GPT的能力,对构建AI Agent系统至关重要,展现高性能在API调用场景中的表现。Yi系列大模型已成为企业探索新业务和验证AI-first产品的首选。零一万物持续推出新工具,如RAG和Function Call,提供更易用、更深入、更安全稳定的解决方案。

image.png

【AiBase提要:】

🚀 Yi-Large-FC模型具有Function Call功能,可根据用户输入判断何时调用外部工具,并以JSON格式响应,兼容OpenAI接口设计,实现平滑替代GPT的能力。

💡 Function Call能力对于构建AI Agent系统至关重要,特别适用于实时信息处理、专用任务处理、自动化工作流程和增强模型能力的场景。

💼 Yi-Large-FC在BFCL排名全球第六,在Exec摘要得分排行中位列世界第二,展现出在实际API调用场景中的高性能

举报

  • 相关推荐
  • 跨越四大洲的美丽探索:Vida Glow 十年创新,定义口服美容新范式

    Vida Glow是源自澳大利亚的口服美容品牌,2014年由Anna Lahey创立,以天然水解海洋胶原蛋白粉为核心产品。品牌通过法国专利水解技术提升吸收率,产品覆盖全球高端百货及医美机构,平均每4秒售出一罐,被誉为全球胶原蛋白领先品牌。目前产品线已扩展至日常护理、高级修护和女性健康系列,致力于以科技推动口服美容行业发展。

  • 再次定义行业创新范式 跃然创新推出全球首款端到端 AI 玩具 CocoMate

    8月26日,跃然创新推出全球首款搭载端到端语音模型的AI玩具CocoMate系列。该产品采用可拆卸设计,配备3000mAh电池,支持4G和WiFi网络。依托端到端技术,具备丰富交互表现和拟人化情感能力,支持多重唤醒、主题游戏及聊天室等功能。新品将于8月27日开售,首发包含奥特曼及原创IP“泡泡”等角色,后续还将上线财神爷、塔罗猫等系列,目标人群从儿童延伸至成年人。

  • 网红Coser“若童”因肠癌去世:年仅32岁

    网红Coser若童因肠癌不幸病逝,年仅32岁,抖音账号艾米尔的抹茶拿铁”发布了相关讣告。 讣告中表示,若童于8月27日因病逝世,若童老师待人真诚友善,他非常珍惜这每一段和大家一起度过的时光,非常感谢大家的喜爱和关心,他自始至终心存感激,愿来世还能再相见。 资料显示,肠癌是一种常见的消化道恶性肿瘤,绝大多数由结肠息肉逐渐演变而来,其诱发因素通常包括

  • 七夕“cos委托”走红:年轻人付费请人扮演虚拟恋人

    今天是七夕节,每到七月初七,甜蜜而又浪漫的浪潮奔涌而来。时至今日,七夕节对于现代人的意义依旧重大,随着社会的飞速发展,人们过节的方式似乎悄然发生了改变。 据媒体报道,在今年七夕节,一种名为Cos委托”的七夕约会走红网络,有年

  • “无限量”供应Claude,就是AI IDE们的百亿补贴

    Anthropic于2025年7月28日宣布,将从8月28日起对Claude Code工具新增每周调用限额——因为少数重度用户全天候高频使用,一次使用成本甚至高达数万美元,远远超过普通订阅预期。 同样在上个月,Cursor曾因其“I’ll keep it unlimited”的Pro收费模式悄然变更为计算tokens限制,导致大量用户抱怨“实际上并非无限”,纷纷在社群中吐槽,迫使公司CEO出面道歉、甚至给出退款补偿。 这两�

  • MCP服务库完整指南:如何选择最适合的Model Context Protocol服务

    本文介绍了MCP(Model Context Protocol)作为连接大型语言模型与外部数据源的重要桥梁。随着AI技术发展,选择合适的MCP服务库对开发者至关重要。文章分析了MCP服务库的核心价值:提升开发效率、增强系统互操作性、降低技术门槛。评估MCP服务库质量需考虑协议兼容性、安全性、生态系统丰富度及社区活跃度等维度。建议开发者根据业务需求选择服务,初创公司可侧重简便性,大型企业应关注安全性和扩展性。文章还指出MCP服务未来将向云原生化、智能化运维和标准化方向发展,并推荐使用专业对比平台(如mcp.aibase.cn)辅助决策。

  • WEEX亮相0xConnect线下活动,深化全球化布局与行业伙伴交流

    WEEX交易所受邀出席圣彼得堡0xConnect线下活动,与全球加密品牌共同探讨行业趋势并拓展合作机会。该活动聚集了来自交易所、公链项目、钱包及投资机构的代表,通过面对面交流碰撞出新的合作火花。WEEX团队借此机会向与会者介绍了平台在合规建设、资金安全和用户体验方面的价值理念,展示了打造安全透明交易环境的品牌承诺。未来WEEX将继续参与全球行业活动,以开放姿态推动加密生态健康发展。

  • 苹果首款折叠iPhone细节曝光:支持eSIM、Touch ID回归

    日前,知名科技记者马克古尔曼(Mark Gurman)曝光苹果首款折叠iPhone更多细节。 古尔曼透露,苹果折叠iPhone将配备四颗镜头,分别是外屏前摄、内屏前摄,以及两颗后摄。 另外,新款iPad Air、iPad mini和入门级iPad机型均配备了Touch ID电源键,这一功能可能会延续到折叠iPhone上,而非目前iPhone所使用的面部识别(Face ID)技术。

  • BOE(京东方)携手联想发布旗舰款显示器 Oxide氧化物技术打造商用显示器领域新标杆

    8月22日,BOE与联想在南京联合发布ThinkVision P系列高端商用显示器,采用BOE独家Oxide氧化物技术,具备低功耗、高刷新率、高色域及护眼优势。该产品覆盖商务办公、专业设计等多场景,并大量采用环保材料,推动低碳运营。双方合作彰显技术突破与可持续发展理念,共同引领显示产业向高效、绿色、智能化发展。

  • Matrixport 受邀出席 Bitcoin Asia 2025,共议机构投资新趋势

    Bitcoin Asia 2025峰会将于8月28-29日在香港举行,由BTC Media主办。预计吸引超1.5万名与会者,涵盖主题演讲、圆桌讨论及展览等活动,突显香港在全球数字资产领域的战略地位。会议将探讨亚太市场潜力、机构化进程及多元化投资机会,并邀请200余位全球重量级嘉宾参与。Matrixport作为亚洲领先加密金融服务平台,将持续推动资产数字化及Web3基础设施落地,助力行业创新与发展。

今日大家都在搜的词: