首页 > 业界 > 关键词  > 谷歌最新资讯  > 正文

谷歌Gemini整合Veo 2视频生成模型,8秒720P视频轻松搞定

2025-04-16 09:48 · 稿源:站长之家

站长之家(ChinaZ.com) 4月16日 消息:据外媒报道称,谷歌将其 Veo 2 视频生成模型整合进了 Gemini 应用程序和网站之中,让付费用户有机会使用谷歌“最先进的视频模型”创建短视频片段。Veo 2 的工作原理与包括 OpenAI 的 Sora 在内的其他视频生成器类似 —— 输入描述场景的文本,然

......

111本文由站长之家用户投稿发布于站长之家平台,本平台仅提供信息索引服务。为了保证文章信息的及时性,内容观点的准确性,平台将不提供完全的内容展现,本页面内容仅为平台搜索索引使用。需阅读完整内容的用户,请查看原文,获取内容详情。

举报

  • 相关推荐
  • 谷歌推出Gemini Go:2GB内存手机也能跑大模型

    谷歌为Android Go系统推出全新Gemini Go AI助手,专为内存超2GB的低配设备设计。该精简版大模型取代Google Assistant Go,用户无需下载独立应用,长按Home键或电源键即可唤醒。它支持拨打电话、发短信、查询地图、搜索餐厅、设置闹钟等日常功能,还能上传文档和照片以提供更自然的对话体验。目前,Gemini Go已开始分阶段向符合条件的设备推送。

  • 最强AI大模型Fable 5、Mythos 5发布:人类智力优势还能撑多久

    Anthropic发布基于Mythos Preview的Claude Fable 5和Mythos 5两款AI模型,自称最强,在多项测试中达SOTA水平。Fable 5面向公众开放,保留安全运制;Mythos 5无运制但仅限审核机构使用。两者性能卓越,尤其在编程方面提升明显,但存在定价昂贵(1M输入/输出分别需10/50美元)、安全运制敏感(触发即降级至Opus 4.8)及强制30天安全审计等问题,影响商业用户使用。

  • 8GB内存成硬伤!iPhone 17无缘苹果最强端侧AI大模型

    根据苹果官方硬件适配细则,iPhone 17标准版和满血版因仅配备8GB内存,无法达到12GB门槛,无缘端侧AI大模型。目前仅iPhone Air、iPhone 17 Pro及Pro Max三款机型可完整体验。博主透露,苹果后续可能调整策略,下一代iPhone 18系列或全系标配12GB内存,以从根源满足端侧大模型需求,避免基础款用户被核心功能割裂。12GB内存将大幅强化本地AI推理速度,支持更复杂多模态任务,并降低对云端的依赖,提升数据隐私保护。

  • AI日报:MiniMax发布M3 大模型;英伟达物理大模型Cosmos3发布;小红书已治理超120万个AI托管账号

    今日AI领域动态丰富:MiniMax发布M3+大模型,首创MSA架构并支持1M上下文,全面开源对标海外旗舰;英伟达联合行业巨头发布全球首款全开源全模态物理AI大模型Cosmos3,成立宇宙联盟;千问APP六一期间礼品选购咨询量增长260%,展现AI购物潜力;小红书治理超120万AI托管账号,处置18万篇AI造假笔记;抖音4月新增AI短剧超4.4万部,但爆款率仅0.6%;胡彦斌上线粉丝社区应用“彦火”,展示Vibe Coding潜力;LobsterAI推出图片视频大模型矩阵,整合四大主流模型;OpenAI重启机器人业务,奥特曼公开招募工程师,拓展具身智能布局。

  • 苹果满血AI大模型仅支持iPhone 17 Pro/Air:iPhone 17用户无缘

    苹果今天凌晨在WWDC2026开发者大会上正式发布了全新的Siri AI,这是一套完全由Apple Intelligence驱动的智能助理,相当于把过去几代的Siri完成了彻底重构。 据悉,Siri AI搭载了个人情境深度理解能力、覆盖海量信息的广泛世界知识库,还有实时屏幕感知能力,能随时协助用户找到自己需要的所有内容,不管是解答各类问题,还是从用户短信、电子邮件、照片等不同应用里精准提取�

  • AI日报:字节开源统一多模态大模型Lance 3B;智谱发布GLM-5.1高速版;CapCut与Gemini合作推出深度集成

    本期AI日报聚焦8大热点:字节跳动开源3B参数多模态大模型Lance,实现图像视频理解与生成统一;智谱发布GLM-5.1高速版API,以400 tokens/s刷新全球纪录;CapCut与Gemini合作实现AI创作智能互联;OpenAI推出ChatGPT for PowerPoint插件,一句话生成PPT;WordPress 7.0原生集成AI,开启智能建站新时代;Spotify联手环球音乐推出正版AI翻唱与混音功能;美团开源LongCat-Video-Avatar1.5数字人视频生成模型,�

  • 小米超高端手机下半年发布:玄戒芯片+OS+AI大模型大会师!全自研

    小米将于下半年发布一款超高端新品,属于MIX系列,可能命名为MIX Fold 5,搭载自研玄戒O3旗舰SoC(3nm制程、超大核4.05Ghz等)、澎湃OS 4系统(底层重构提升流畅度)和自研MiMo大模型(MiMo-V2.5系列全球领先)。该产品并非小米17S Pro,而是新一代大折叠屏手机,此外MIX系列还规划了一款直板机,带模块化磁吸镜头量产方案,两款机型预计Q3发布,最快7月亮相。

  • 谷歌IO押注AI Agent 万兴科技等应用层公司有望打开新空间

    谷歌I/O 2026开发者大会聚焦AI Agent,发布Gemini Spark等全天候个人智能体,加速布局AI应用。市场反应积极,Alphabet股价攀升。国内AI视频、漫画等创作领域受关注,万兴科技推出万兴剧厂,实现从剧本到成片的全流程Agent化生产,助力“1人1天1部剧”,推动AI漫画工业化量产。其商业化模式验证成功,周度AI积分消耗增速达63%,多部作品播放量破亿,展现AI产业落地新空间。

  • 京东云率先上线MiniMax M3:显著提升模型推理吞吐

    MiniMax M3正式上线,京东云JoyBuilder模型开发平台已第一时间接入MiniMax M3模型并同步开放服务。 依托京东云自研推理框架,JoyBuilder采用了PD分离部署、KV Cache缓存、投机采样等先进推理优化技术,显著提升了模型推理吞吐量与响应效率。 MiniMax M3在编程、智能体等专业任务上达到了前沿水平。其采用全新的MiniMax稀疏注意力架构(MSA),最高支持100万token的超长上下文。作为一款�

  • 不只能画图!谷歌推出Gemini Omni:只需动动嘴 AI自动帮你改大片

    在Google I/O 2026上,谷歌正式发布Gemini Omni模型。该模型支持文本、图像、音频、视频作为输入,实现跨模态生成与编辑。 其中在音频方面,目前该模型初期仅支持语音输入,但Google表示未来将很快扩展更多类型的音频输入能力。 首发产品Gemini Omni Flash已在Gemini应用上线,后续将向企业客户开放API。 该模型核心卖点在于深度视频编辑能力。用户通过自然语言指令即可对生成内�

今日大家都在搜的词: