首页 > 业界 > 关键词  > 视频生成最新资讯  > 正文

AI视野:谷歌发布视频生成模型Lumiere; AI女友陪聊月入20+万元;谷歌浏览器新增生成式AI;《幻兽帕鲁》疑似用AI卷设计

2024-01-24 15:38 · 稿源:站长之家

欢迎来到【AI视野】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解https://top.aibase.com/

🤖📱💼AI应用

谷歌发布视频生成模型Lumiere

image.png

【AiBase提要:】

⭐ 运动幅度和一致性表现良好

⭐支持文生视频,图生视频,视频生视频

⭐视频生视频支持局部修改以及风格化转换

项目地址:https://top.aibase.com/tool/lumiere

谷歌浏览器新增3个重磅生成式AI!自动生成文本、壁纸等

图片

【AiBase提要:】

📝 谷歌浏览器新增生成式AI功能

📱 自动生成文本、壁纸以及自动管理标签

💡 提供更好的搜索体验

InstantID in ComfyUI来了!9种风格可选

image.png

【AiBase提要:】

⭐️ 高效的角色保持工具

⭐️9种不同风格可选,可与PhotoMaker Styler通用

⭐️ 提供多种工作流选择

项目地址:https://top.aibase.com/tool/comfyui-instantid

扩散模型更懂复杂提示词!Pika北大斯坦福开源新框架RPG-DiffusionMaster

image.png

【AiBase提要:】

⭐️ 扩散模型具备更强提示词理解能力

⭐️ RPG框架能生成更符合提示词要求的图片

⭐️ RPG在色彩、形状、空间等维度超越其他图像生成模型

项目地址:https://top.aibase.com/tool/rpg-diffusionmaster

v0.dev开源替代品来了 vx.dev可与GitHub无缝集成

image.png

【AiBase提要:】

🛠️ vx.dev可以与GitHub无缝集成,用户可以在GitHub上提交Issue生成UI代码。

🤖 利用AI模型如GPT-4,可根据描述自动生成代码。

👩‍💻 支持生成不同前端框架的用户界面代码。

项目地址:https://top.aibase.com/tool/vx-dev

📰🤖📢AI新鲜事

《幻兽帕鲁》疑似用AI卷设计,遭同行炮轰

图片

【AiBase提要:】

🎮 《幻兽帕鲁》在Steam平台大卖,超越了《CS2》成为第二的游戏。

🎨 《幻兽帕鲁》丰富的内容设计和3D模型展示,引发了AI辅助设计的猜疑。

🕹️ 生成式AI对角色设计和游戏环境的改进正在改变游戏行业。

微软组建王牌AI团队专攻小模型,为大模型降本增效

【AiBase提要:】

💡 微软正在组建名为GenAI的团队

💡 目标是开发更小、更便宜的人工智能模型

💡 模型将专注于语言模型,类似于OpenAI的GPT-4

买个机器人端茶倒水有希望了?Meta推机器人框架OK-Robot

【AiBase提要:】

🤖 OK-Robot融合视觉语言模型识别物体

🏠 OK-Robot在真实家庭环境中取得成功率

🚀 机器人在家庭环境中执行日常任务提供新可能性

项目地址:https://ok-robot.github.io/

AI女友陪聊月入20+万元!社交账号光发“假图”吸粉2万

image.png

【AiBase提要:】

🤖 AI女友月收入高达3万美元,每月通过付费聊天和互动赚取高额收入

📈 社交账号热度持续上升: Lexi Love的社交账号在短时间内吸引了2.2万粉丝

🚫 OpenAI商店禁止发布类似机器人,引起了对于人机互动的讨论。

详细内容点此查看:https://www.chinaz.com/2024/0124/1592785.shtml

Artisse AI融资670万美元,打造更逼真的AI摄影应用

【AiBase提要:】

🚀 Artisse AI成功融资670万美元,专注于开发更逼真的照片

📸 与竞争对手不同,Artisse生成逼真照片注重细致的人物因素

💼 初期通过提供免费照片盈利,现已转向订阅模式,年收入达250万美元。

Anthropic反击音乐发行商禁令动议

【AiBase提要:】

1. 音乐发行商要求对Anthropic提出了初步禁令

2. Anthropic认为使用受版权保护的内容作为LLM训练数据是合理的

3. Anthropic不会对付费服务的客户数据进行AI模型训练

举报

  • 相关推荐
  • 视频生成每秒仅需1元!字节Seedance2.0正式上线API服务

    今日,字节旗下火山引擎正式上线Seedance 2.0系列API服务,企业和个人用户现在可以调用其视频生成能力。 作为全球SOTA模型,Seedance 2.0支持文字、图片、音频、视频四种模态输入;同时它在复杂交互和运动场景下的可用率更高,更加贴合工业级创作场景的需求。 此外,火山引擎还为Seedance 2.0建立了肖像与版权安全标准,覆盖视频生成涉及的各种模态和创作前后的全部流程。 �

  • AI日报:火山引擎Seedance2.0 API全面开放;阿里巴巴首款具身机器人曝光;Skywork AI发布实时视频生成系统Matrix-Game 3.0

    本期AI日报聚焦多领域前沿动态:火山引擎Seedance 2.0 API上线,提供SOTA级视频生成能力;Skywork AI发布Matrix-Game 3.0,实现720p实时高清“世界生成”;特斯拉2026春季更新将带来Grok语音助手升级与FSD一键订阅。此外,五部门联合部署“人工智能+教育”行动,计划到2030年构建深度融合格局;爱奇艺CEO预测3-6个月内或出现AI商业大片;阿里巴巴发布首款具身四足机器人;LPM1.0模型实现单图转实时交互式数字人视频;谷歌Gemini推出基于Nano Banana技术的交互式可视化图像生成功能。

  • 爱诗科技PixVerse V6 正式发布,AI视频生成迈向“真实世界模拟”

    爱诗科技发布新一代视频生成模型PixVerse V6,在保持秒级生成速度基础上,全面升级人物真实感、复杂运动表现、物理模拟及声画协同能力,最长可生成15秒视频。该模型在AI视频生成榜单中位列全球第二,显示其领先水平。V6重点提升视频的真实世界模拟能力,优化人物细节表现,强化复杂场景处理,增强物理属性模拟,并优化镜头连续性。同时降低创作门槛,用户可通过简洁描述生成复杂镜头效果。目前PixVerse V6已在拍我AI Web端、App端及API平台上线,并推出限时优惠活动。

  • 阿里发布Wan2.7-Video视频生成模型!从演迈向导 聚焦创作全链路

    阿里巴巴今日正式发布Wan2.7-Video视频生成系列模型,涵盖文生视频、图生视频、参考生视频和视频编辑四大模型。 新模型拥有全面的创作控制力,将AI的能力从单一素材生成扩至创作全链路,从演”迈向导”。

  • 逗哥配音:一站式AI创作平台赋能短视频生态,千万博主验证的配音软件再升级

    在短视频内容生态从粗放式铺量转向精细化质感运营的当下,配音已成为决定完播率与情绪价值的关键引擎。逗哥配音作为行业头部智能创作平台,凭借海量音色库、真人授权与全链路效率工具,以“一站式AI配音创作平台”的定位,深度赋能影视解说、小说推文、AI漫画及内容出海等多元变现赛道。其核心竞争力在于拒绝“一刀切”的配音方案,针对高潜力创作类型提供模块化赋能,并通过声音广场智能检索系统、精准节奏卡点算法及一站式效率工具箱,极大提升创作效率与沉浸留存。平台更构建了完善的声音资产增值与保护体系,推出声音授权变现模式,并建立专业的版权监控与法律维权绿色通道,吸引顶级声优与头部KOL入驻生态。未来,逗哥配音将继续以技术驱动创作普惠,为全球创作者提供更具情感温度与商业价值的声音基础设施。

  • OpenAI停止视频生成工具Sora 将内部进行重组

    OpenAI公司近日宣布了一个让不少用户感到意外的决定:在推出Sora独立应用程序仅仅六个月后,他们计划停止这项视频生成服务,目的是为了简化自家的AI产品线。 按照官方给出的说法,Sora的消费者端应用、开发者接口以及与ChatGPT相关的功能都将全面关闭。OpenAI团队在社交平台上发布了一封告别信,信中承诺会公布用户内容的保存方案以及具体的停运时间表。他们感谢了用户一

  • 小红书要用长视频“抢”什么?

    全网头部的长视频创作者们,开始悄悄流向小红书了? 旅行、摄影长视频创作者Links,作为B站连续三年百大UP主,一直被称为旅行摄影区的“天花板级”创作者。他视频中出现的画面,往往来自地球上最难以到达的角落。每一次更新,都有网友感叹,“又多了一个此生必去的地方。” 而不久前,全网累计拥有超过千万粉丝的Links,把一个长达36分钟的新视频,首发在了小红书。

  • Soul CEO张璐团队开源SoulX-LiveAct:从“能生成”到“能长时间稳定生成”

    Soul CEO张璐团队开源实时数字人生成模型SoulX-LiveAct,旨在解决长时连续生成难题。模型基于AR Diffusion框架,采用分块生成与上下文传递机制,结合Neighbor Forcing和ConvKV Memory优化性能与一致性。在多项基准测试中表现优异,支持数字人直播、AI教育等在线场景。该模型与团队此前开源的SoulX-FlashTalk、SoulX-FlashHead共同完善技术布局,推动AI应用生态发展。

  • 阿里云百炼上线三方视频生成模型,PixVerse首发登陆

    全球领先的AI视频生成模型PixVerse V5.6正式登陆阿里云百炼平台,成为该平台首批引入的视频生成模型。此次合作标志着PixVerse从技术领先迈向规模化商业应用。模型支持文生视频、图文生视频等多种创作模式,并推出按需、按时长计费的灵活模式,大幅降低高质量视频创作门槛。同时,PixVerse V5.6在复杂运动场景的稳定性和“镜头语言”理解能力上显著提升,能生成更符合商业交付标准的内容。通过百炼平台,PixVerse将触达阿里云庞大的企业用户群,推动AI视频从“演示级能力”迈向“工业化生产”,在电商营销、泛娱乐内容、短剧创作等多个行业展现广泛应用价值。

  • 腾讯混元3D世界模型2.0发布 一句话生成3D资产

    今日,腾讯正式发布并开源混元3D世界模型2.0(HY-World 2.0)。 官方表示,该模型一句话就能生成3D资产,并直接导入到游戏制作或具身仿真引擎,实现真正的可玩、可用。 具体来说,用户完全不需要懂任何复杂的3D软件,只要像平时说话一样输入一句文字描述,或者直接上传一张图片,模型就能精准解析复杂的语义。 随后,它会一键生成混合了3D高斯泼溅(3DGS)与Mesh表征的�

今日大家都在搜的词: