首页 > 业界 > 关键词  > 视频模型最新资讯  > 正文

开源Open-Sora大更新:可生成16秒,720P高清视频

2024-04-29 10:03 · 稿源: ​ AIGC开放社区公众号

国内著名大模型开源公司潞晨科技,对其开源文生视频模型Open-Sora进行了大更新,现在可生成16秒,分辨率高达720P的视频。同时具备可以处理任何宽高比的文本到图像、文本到视频、图像到视频、视频到视频和无限长视频的多模态功能。本次潞晨科技已经把Open-Sora的模型架构、最新的模

......

本文由站长之家合作伙伴自媒体作者“​ AIGC开放社区公众号”授权发布于站长之家平台,本平台仅提供信息索引服务。由于内容发布时间超过平台更新维护时间,为了保证文章信息的及时性,内容观点的准确性,平台将不提供完全的内容展现,本页面内容仅为平台搜索索引使用。需阅读完整内容的用户,请查看原文,获取内容详情。

举报

  • 相关推荐
  • MWC首秀即焦点!讯飞AI眼镜携多模态同传大模型革新智能穿戴体验

    在2026年世界移动通信大会(MWC)上,科大讯飞以“AI Connecting Ideas”为主题,首次全球亮相其AI眼镜。该产品集多模态同传翻译与极致轻量化设计于一身,凭借领先的多模态降噪、全能翻译及多模态记录功能,吸引了众多海外运营商、技术伙伴及专业媒体的关注。其创新的唇动识别多模态降噪方案,通过摄像头捕捉说话者唇部运动,融合骨传导麦克风捕捉佩戴者声音,将音视频两路信息融合处理,在多人交谈的嘈杂背景中精准锁定目标讲话人,将语音识别和翻译的准确率提升50%以上。整机重量仅40克,相比当前市面主流同类产品重量降低了约20%,是目前全球最轻的双目单色显示多模态智能眼镜。此外,讯飞AI眼镜还具备多模态记录功能,能自动智能生成图文声并茂的会议纪要,覆盖信息记录和总结的全流程,为跨国商务人群提升工作效率。讯飞AI眼镜于北京时间3月4日上午10:10在国内电商开启预约。

  • 科大讯飞AI眼镜开放预约:仅重40克 支持多模态降噪翻译

    科大讯飞近日在世界移动通信大会上发布了一款创新产品讯飞AI眼镜。这款专为跨语言交流设计的智能设备重量仅40克,目前产品已开启预约通道。 虽然具体售价和正式发售日期尚未公布,但官方透露提前预约可享受299元抵扣优惠。 这款眼镜突破了传统翻译设备的形态限制,通过镜片实时投射翻译字幕,并配合内置扬声器输出语音译文。 当对话双方交流时,系统可同步完成�

  • AI日报:多模态大模型DeepSeek V4即将发布;谷歌即将停用Gemini 3 Pro Preview;微软推出AI软件组合

    本期AI日报聚焦行业动态:谷歌将停用Gemini 3 Pro Preview,开发者需迁移至3.1版本;DeepSeek V4发布,支持多模态生成并与华为、寒武纪合作优化硬件;微软计划推出AI软件组合,月费或高达99美元;爱奇艺财报显示利润下滑,将押注AI电影制作与去中心化转型;壁仞智能完成数亿元融资,深化端侧AI布局;英伟达将发布集成Groq技术的推理处理器,巩固市场地位;联想展示模块化AI PC概念,提升用户体验;我国发布首个国家级人形机器人标准体系,推动产业高质量发展。

  • AI日报:谷歌Nano Banana 2正式上线;可灵3.0全球视频模型第一;周鸿祎直言AI眼镜难做

    本期AI日报聚焦多领域进展:谷歌Gemini App更新,图像生成模型Nano Banana 2上线,支持2K分辨率与文字渲染;快手可灵3.0在视频生成基准测试中表现优异,彰显中国AI技术领先地位;周鸿祎指出AI眼镜硬件门槛高,未来应聚焦智能体技术;阿里巴巴推出千问AI眼镜,整合生态提供智能生活体验;xAI联合创始人离职引发核心团队变动关注;豆包手机助手回应安全争议,称未收到漏洞报�

  • AI日报:美团Tabbit浏览器开启公测;通义发布语音双模型;Notion 引入首个开源权重模型 MiniMax M2.5

    本期AI日报聚焦多领域AI新动态:美团旗下Tabbit浏览器公测,集成多模型AI Agent,实现网页自动化执行;阿里通义发布语音双模型,支持自然语言控制音色与场景;Notion引入开源模型MiniMax M2.5,打破闭源垄断,提升性价比;谷歌升级Flow AI工具,整合视频、绘画与特效功能;阿里巴巴AI品牌统一更名为“千问”,强化战略聚焦;三星宣布2030年迈向“AI工厂”,以Agentic AI驱动全链路自治;OpenAI疑似收购顶级域名GPT.com,巩固品牌地位;北京大学与OceanBase打造LoVR基准,入选WWW 2026,开启全视频智能检索新模式。

  • AI日报:小米发布Agent产品Xiaomi miclaw;OpenAI 发布 GPT-5.4系列;微软宣布必应视频全面接入Sora2模型

    本期AI日报涵盖多项重要动态:小米发布首款移动端Agent产品Xiaomi miclaw,基于自研MiMo大模型,旨在实现智能终端自动化交互。OpenAI推出GPT-5.4系列模型,包括标准版、推理版和高性能版,上下文窗口达百万级,在金融和法律领域表现优异。微软宣布必应视频创作者全面接入Sora2模型,提供免费高质量视频生成服务。Roblox推出AI实时改写功能,将违规内容自动转为礼貌合规语言。3D生成模型公司VAST获5000万美元融资,由阿里巴巴领投,将用于构建UGC互动生态。携程下线自动调价工具,推动酒店行业转向服务竞争。陈天桥九年后首度露面,透露正投入20亿美元研发“发现式AI”。阿里巴巴澄清千问团队集体离职传闻,称团队稳定,服务正常。

  • AI日报:谷歌发布Gemini3.1Pro;Claude Code远程控制功能上线;Qwen3.5开源家族新增多款模型

    本期AI日报汇总了人工智能领域的最新动态。谷歌发布Gemini 3.1 Pro,推理能力显著提升,多项基准测试超越GPT-4o。Anthropic为Claude Code推出“远程控制”功能,实现移动设备无缝管理电脑编码任务。OpenAI发布深度融合推理能力的编程模型GPT-5.3-Codex。通义千问Qwen3.5开源家族新增多款模型并上线托管服务。Meta开源GPU集群监控工具GCM,精准定位硬件故障。Anthropic发布企业级插件,将Claude深度集成至Office全家桶。谷歌AI虚拟形象支持24种语言,提升跨语言沟通效率。阿里云Coding Plan推出低价订阅服务,降低开发者使用成本。

  • 小米手机版龙虾Xiaomi miclaw来了!绝不用个人数据训练 小白也能快速部署

    今日,小米发布移动端Agent产品Xiaomi miclaw,目前面向科技发烧友、极客用户小规模测试,支持小米17、小米17 Pro、小米17 Pro Max、小米17 Ultra、小米17 Ultra徕卡版五款机型。 Xiaomi miclaw是基于小米MiMo大模型构建的AI交互测试产品,是国内首个手机端类OpenClaw(昵称龙虾”)Agent应用。 对于Xiaomi miclaw与OpenClaw之间的关系,小米表示,在产品理念层面,全球Agent的架构都类似,可以说�

  • 一年斩获十余项荣誉,简知科技的2025做对了什么?

    2025年,简知科技凭借“简智AI大模型”等技术实力,入选广州“未来独角兽”创新企业及“文化企业30强”,并获评“人工智能+教育”典型案例。旗下简橙教育在银发教育领域深耕,获评“中老年教育影响力企业”等荣誉;简知文旅获“银发文旅创新影响力大奖”。集团通过AI技术赋能儿童素质与成人兴趣教育,实现个性化学习,累计服务用户超4700万。同时,简知科技积极践行社会责任,参与公益慈善。展望2026,集团将继续依托AI大模型,深化终身学习生态建设,以科技赋能文化与教育。

  • 小铁科技集团亮相2026成都元宵盛典,AI力量点亮双塔巨幕

    3月3日,成都高新区“风华正茂+成都我的家”2026年元宵节主题活动盛大举行。小铁科技集团深度参与,与青年人才、领军企业共同点亮天府双塔,展现科技与人文交融画卷。作为重点企业代表,小铁科技登上城市“C位”,滚动展示其科技赋能商业场景、深耕AI的决心。活动中,小铁AI打卡机成为市民互动热点,通过智能AI融合生成个性化节日照片,定格美好瞬间。小铁科技扎根成都高新区,依托区域科创生态,持续深耕AI智能硬件研发,助力区域数字产业升级,并连续三年参与该城市级IP活动,见证其在成都的成长与壮大。

今日大家都在搜的词: