AI变鉴片大师，星际穿越都能看懂！贾佳亚团队新作，多模态大模型挑战超长3小时视频

2023-12-10 15:21 · 稿源：量子位公众号

啥?AI都能自己看电影大片了?贾佳亚团队最新研究成果，让大模型直接学会了处理超长视频。丢给它一部科幻大片《星际穿越》（片长2小时49分钟）:它“看”完之后，不仅能结合电影情节和人物轻松对电影进行点评:还能很精准地回答出剧中所涉的细节:例如:虫洞的作用和创造者是谁?答:未

......

本文由站长之家合作伙伴自媒体作者“量子位公众号”授权发布于站长之家平台，本平台仅提供信息索引服务。由于内容发布时间超过平台更新维护时间，为了保证文章信息的及时性，内容观点的准确性，平台将不提供完全的内容展现，本页面内容仅为平台搜索索引使用。需阅读完整内容的用户，请查看原文，获取内容详情。

即将跳转到外部网站

安全性未知，是否继续

继续前往

（举报）

相关推荐

关键词：

大模型

算力赋能营销革新，东信云与华为云签约共建多模态大模型应用标杆

6月21日，东信云与华为云在HDC2025大会上签署合作协议，双方将基于昇腾AI云服务深化合作，重点布局多模态大模型应用与数字人技术。合作内容包括：1）构建智能营销系统，整合文本、图像、视频等多元数据，提升市场分析和消费者行为预测能力；2）通过大模型实现营销内容自动化生成，包括新闻稿、社交媒体帖子和广告文案；3）优化大模型架构，提升训练和推理效率。东信云6月发布的"数字人智能引擎"已实现分钟级生成逼真数字人，显著提升推荐转化率。双方还将联合行业伙伴共建营销大模型生态系统，推动营销行业智能化升级。

华为云东信云科技 AI与大数据
荐AI日报：阿里云通义灵码AI IDE上线；小米多模态大模型Xiaomi MiMo-VL开源；黑森林实验室推出FLUX.1Kontext

【AI日报】今日AI领域重要动态：1)阿里云推出通义灵码AI IDE，集成千问3模型，显著提升编程效率；2)小米开源多模态大模型MiMo-VL-7B，性能超越更大规模闭源模型；3)黑森林实验室发布FLUX.1Kontext图像生成模型，支持文本和参考图像多次编辑；4)Midjourney V7渲染速度提升40%，新增用户投票功能；5)DeepSeek R1-0528大模型在AGI领域取得突破，性能超越xAI等公司；6)Hugging Face进军机器人市场，推出开源人形机器人HopeJR；7)字节跳动火山方舟接入DeepSeek最新大模型；8)Anthropic开源"电路追踪"工具，揭示大模型决策过程；9)阿里巴巴开源自主搜索AI智能体WebAgent；10)Hume发布低延迟语音语言模型EVI3；11)Manus Slides支持一键生成专业幻灯片；12)Runway Gen-4 References支持手机照片艺术化处理。

人工智能 AI开发工具编程效率
慧科讯业AI赋能数据标签化，破局多模态数据治理难题

文章探讨了数字化浪潮下数据标签化的重要性及其商业应用。数据标签化作为大数据分析的基础，能帮助企业实现精准营销和智能决策。然而，多模态数据处理复杂、人工标注成本高、业务理解不足等问题制约了数据价值的释放。文章提出数据标签化在构建用户画像、舆情监控、市场趋势预测等场景中的核心价值，并分析了当前面临的挑战：包括传统NLP算法不精准、大语言模型成本高且不稳定等。慧科讯业通过TDaaS服务模式，结合行业领先的数据源、NLP技术和垂直知识图谱，为企业提供高效的数据标注解决方案，显著提升数据处理效率。未来，随着AI技术发展，知识图谱驱动的TDaaS模式将重新定义数据价值变现方式。

数据标签化数字化转型人工智能
OpenAI 提升o3多模态模型推理实力，微美全息（WIMI.US）加速引领产业新变革征程

OpenAI推出突破性的o3推理模型，首次实现图像直接融入推理过程，在多模态基准测试V* Bench上准确率达95.7%。DeepSeek完成R1模型升级，上下文窗口从12K扩展至23K，幻觉率降低45%-50%。行业呈现开源趋势，DeepSeek开源策略促使多家企业跟进，OpenAI也考虑开源。微美全息加速布局多模态大模型，计划提供实时多模态AI体验。专家指出AI发展重心正从大模型向智能体演进，开源技术显著降低训练门槛，提升泛化能力，为多模态智能探索开辟新路径。企业需紧跟趋势把握机遇，在大模型驱动的新时代找准定位。

OpenAI o3模型多模态推理
大模型都能冲清北了？首个AI高考总分评测结果出炉

7家国产大模型参加2025年辽宁高考模拟测试，结果显示：腾讯元宝在文科考试中以667.5分夺冠，接近清北录取线；豆包、讯飞星火分别以655分和652分紧随其后，均达985高校水平。理科方面，豆包以635分领先，元宝和Kimi分别获得632.5分和629分。测试发现大模型在文科表现优于理科，尤其在语文作文和数学解题能力突出，元宝数学获得149分高分。但在理科综合科目存在短板，物理化学的解题过程和知识点推导不够完整，图像符号理解不足。相比去年，今年大模型整体能力显著提升，已从"文科一本、理科二本"水平进步到冲击顶尖高校的水平，展现了国产AI的快速发展。

高考大模型考试
荐多模态2025：技术路线“神仙打架”，视频生成冲上云霄

一场大会，聚集了中国多模态大模型的“半壁江山”。智源大会2025为期两天的论坛中，汇集了学界、创业公司和大厂等三方的热门选手，关于多模态的集中讨论达到了前所未有的热度。其中，创业公司就有爱诗科技、生数科技、Sand.ai、智象未来、Luma AI、智谱等六家公司创始人、CEO分享心得;隶属大厂队的字节、腾讯、百度的多模态技术负责人，以及学术界的人大和MIT（麻省�

多模态大模型智源大会2025 人工智能技术
荐AI日报：昆仑万维天工超级智能体APP上线;谷歌重磅发布三大Gemma模型变体;字节推出开源多模态模型BAGE

本文介绍了AI领域最新动态：1)昆仑万维推出全球首款AI+Agent架构的Office智能体应用；2)研究显示ChatGPT能提升K12学生成绩近87%；3)谷歌视频生成工具Veo3扩展至更多地区；4)谷歌发布三款Gemma模型变体，覆盖医疗、手语翻译和海豚语言研究；5)VideoTutor实现一句话生成定制教学视频；6)字节跳动开源多模态模型BAGEL；7)Rork支持无代码开发iOS/Android应用；8)AingDesk降低AI助手开发门槛；9)Claude4登陆亚马逊Bedrock平台；10)Youware通过MCP协议提升网页生成能力。这些创新展示了AI技术在各领域的快速发展和应用潜力。

人工智能移动办公 AI应用
破局多模态数据治理难点，数据标注重构企业营销新基建

文章探讨了AI数据标注行业的发展现状与未来趋势。主要内容包括：1）AI数据标注已成为企业数字化转型的核心基础设施，92.9%数据为非结构化形态；2）营销领域多模态数据融合正在重塑商业决策模式；3）慧科讯业等企业通过TDaaS服务帮助客户构建数据资产；4）数据标注服务商分为国际头部、自有生态型、垂直领域型和综合营销数字化型四类；5）未来趋势包括AI驱动的自动化标注、数据合规升级和人机协同模式创新。文章强调，高质量数据标注服务将助力企业实现从"可用"到"可信高效"的数字化转型。

Scale AI 数据标注行业
AI触控云台浩瀚V3 Ultra发布，首发AI多模态追踪模块，定义手机云台轻旗舰标准！

6月6日，浩翰V3 Ultra智能影像稳定器正式发布。作为旗舰级产品，它搭载行业首创AI多模态万物原生跟拍技术，支持10米远程触控彩屏、AI可视化构图、360°无死角跟拍及三轴稳拍等功能。新品采用第九代iSteady增稳系统，折叠后体积小巧便携。配备22英寸触控彩屏，支持5米手势控制和隔空补光功能。售价999元起，同步推出含无线麦克风的创作者套装。浩翰深耕稳定器行业11年，产�

hohem 浩瀚V3 Ultra
Meta拟百亿美元投资Scale AI，微美全息（WIMI.US）端侧多模态AI加速开启科技新局

Meta正与AI初创企业Scale AI洽谈数十亿美元投资，估值或超100亿美元，有望创下私营企业融资纪录。Scale AI为微软、OpenAI等提供数据标注服务，是生成式AI热潮主要受益者。这将是Meta史上最大规模外部AI投资，标志其战略转向。Meta CEO扎克伯格宣布将AI确立为战略重心，2024年将投入650亿美元推进相关项目，重点打造Llama模型成为行业标准。同时，谷歌推出Gemini助手"计划操作"新功能，支持任务自动化管理。科技巨头纷纷重金布局AI，微软向OpenAI注资逾130亿美元，亚马逊投资Anthropic数十亿美元。行业观察认为AI技术普及将推动效率革命，微美全息等企业正通过技术创新赋能产业转型，共同探讨人工智能技术突破新动态。AI正以前所未有的速度重塑全球发展格局。

Meta投资 Scale AI

热文

3 天
7天

AI变鉴片大师，星际穿越都能看懂！贾佳亚团队新作，多模态大模型挑战超长3小时视频

算力赋能营销革新，东信云与华为云签约共建多模态大模型应用标杆

荐AI日报：阿里云通义灵码AI IDE上线；小米多模态大模型Xiaomi MiMo-VL开源；黑森林实验室推出FLUX.1Kontext

慧科讯业AI赋能数据标签化，破局多模态数据治理难题

OpenAI 提升o3多模态模型推理实力，微美全息（WIMI.US）加速引领产业新变革征程

大模型都能冲清北了？首个AI高考总分评测结果出炉

荐多模态2025：技术路线“神仙打架”，视频生成冲上云霄

荐AI日报：昆仑万维天工超级智能体APP上线;谷歌重磅发布三大Gemma模型变体;字节推出开源多模态模型BAGE

破局多模态数据治理难点，数据标注重构企业营销新基建

AI触控云台浩瀚V3 Ultra发布，首发AI多模态追踪模块，定义手机云台轻旗舰标准！

Meta拟百亿美元投资Scale AI，微美全息（WIMI.US）端侧多模态AI加速开启科技新局

热文

2025新财富500创富榜发布：张一鸣问鼎首富梁文锋进前十

小米MIX Flip 2外观公布：配备骁龙8至尊版、5165mAh电池

中消协发倡议抵制极端吃播：平台应严格识别、及时下架

苹果官网首次支持国补目前仅限北京收货地址及上海线下购买

2025新财富500创富榜发布：张一鸣问鼎首富梁文锋进前十

刘强东点外卖给骑手1000元小费：此前达达已完成私有化

字节小米位列中国全球化品牌前二中国全球化品牌50强出炉

SpaceX回应星舰爆炸：无人员伤亡及周边危害

小米MIX Flip 2外观公布：配备骁龙8至尊版、5165mAh电池

中消协发倡议抵制极端吃播：平台应严格识别、及时下架

苹果官网首次支持国补目前仅限北京收货地址及上海线下购买

站长商机