首页 > 业界 > 关键词  > 快手AI最新资讯  > 正文

想让AI成为新引擎,快手不能只靠可灵

2025-12-07 10:39 · 稿源: 窄播公众号

从12月1日开始,快手开启了「可灵全能灵感周」,要连续5天,每天都发布一项新产品。目前,快手已经发布了统一多模态视频大模型可灵视频O1和全能图像模型可灵图片O1,展现了要一站式满足AI视频、图像创作需求的野心。这种密集的发布,也是快手在向外界进一步展示自身的AI技术积累。

......

本文由站长之家合作伙伴自媒体作者“窄播公众号”授权发布于站长之家平台,本平台仅提供信息索引服务。由于内容发布时间超过平台更新维护时间,为了保证文章信息的及时性,内容观点的准确性,平台将不提供完全的内容展现,本页面内容仅为平台搜索索引使用。需阅读完整内容的用户,请查看原文,获取内容详情。

举报

  • 相关推荐
  • AI日报:字节推StoryMem系统;月之暗面再推多模态新模型;AI眼镜Pickle 1发布

    本期AI日报聚焦多项AI领域进展:字节跳动推出StoryMem系统,提升AI生成视频角色一致性28.7%;月之暗面计划2026年推出多模态模型K2.1/K2.5;智能眼镜Pickle 1实现“无限记忆”与主动交互;清华与OpenBMB开源音频模型评测框架UltraEval-Audio;OpenAI押注语音交互,整合团队重构音频系统;开源工具Antigravity支持多账号切换,突破AI使用限制;元象开源面向泛娱乐场景的大模型XVERSE-Ent;苹果回应“国行版AI功能阉割”传闻,提醒用户勿通过第三方强行激活。

  • AI日报:实时世界模型 PixVerse R1发布;Vidu发布AI一键生成MV功能;可灵AI ARR达2.4亿美元

    本期AI日报聚焦多项AI领域突破:爱诗科技发布全球首个通用实时世界模型PixVerse R1,实现虚拟世界实时交互;Vidu推出AI一键生成MV功能,打造“虚拟制片厂”;MiniMax发布编程智能体基准测试OctoCodingBench;快手可灵AI年化收入达2.4亿美元;智谱联合华为开源多模态模型GLM-Image,全链路跑通国产芯片;百川智能发布医疗大模型Baichuan-M3;谷歌重构电商未来,推出Agentic AI购物系统;谷歌开源医疗AI模型MedGemma 1.5与语音识别模型MedASR。

  • AI日报:阿里云推多模态交互开发套件;智谱AI港股首日上市;混元发布 HY-Motion1.0开源3D 角色动画生成模型

    阿里云发布多模态交互开发套件,集成通义千问、万相、百聆三大模型,赋能智能硬件。腾讯混元推出开源3D角色动画生成模型HY-Motion 1.0,助力游戏与动画制作。智谱AI在港上市,募资43亿港元,加速商业化落地。抖音在深圳南山设立第二总部,聚焦AI与泛视频研发。OpenAI推出ChatGPT Health,强化健康数据管理与隐私保护。法拉第未来宣布进军具身智能机器人领域,推动汽车与机器人业务协同。蚂蚁阿福月活超3000万,AI健康赛道进入中美竞速新阶段。MiroThinker 1.5以300亿参数实现媲美万亿模型的性能,显著降低推理成本。

  • 即构推出AI音视频能力矩阵 助力应用突围增长

    如今,移动应用市场竞争进入了存量博弈新阶段,应用内的新玩法复制成本低,单靠独创模式难以吸引用户留存。Sensor Tower数据显示,全球应用商店双寡头垄断格局稳固,头部应用占据超60%用户时长,中小应用突围愈发艰难。行业增长逻辑已转向内容质量与优质体验,音视频质量低下可能导致用户留存与转化显著下滑。尤其是在直播语聊、网课、电商、音视频创作工具等高频�

  • 20+大模型与70+智能体调度!李未可AI眼镜定义群体智能新范式

    文章以丹尼尔·卡尼曼的“快与慢”思维系统理论为引,介绍了李未可AI智能眼镜如何将AI融入人类最自然的“看、听、说”交互中。该产品通过“超能李未可”系统,结合自研大模型与多智能体协同的“群体智能”模式,实现了从快速直觉响应到深度理性思考的无缝衔接。它能高效处理实时翻译、信息查询等日常任务,并在需要时启动多专家智能体进行复杂规划与创意生成,致力于成为用户随身、随思、随需的“第二大脑”,让技术回归增强人类感知与创造能力的本质。

  • 双技术突破重构沟通体验时空壶W4在CES定义AI同传新标杆

    2026年CES展上,时空壶推出的W4 AI同传耳机凭借AI骨导收音与AI翻译引擎优选技术的融合,重新定义了行业标准。其骨导技术通过传感器捕捉颅骨振动信号,有效隔绝环境噪音,拾音准确率超98%;翻译技术则动态适配最优模型,专业术语翻译准确率超96%,延迟控制在2-3秒内。产品以开放式设计兼顾舒适度与环境感知,让跨语言交流回归自然对话,目前已覆盖全球170多个国家和地区。

  • 花3000元让AI改口,大模型的尽头是广告?

    大模型界的翘楚OpenAI,面对每年数十亿美元的研发成本,正迎来一个艰难的决定:其员工正在琢磨如何让 ChatGPT 在用户提出相关问题时,优先显示赞助内容。 也就是说,当用户让大模型推荐一家眼镜店、一款工业传感器、一家民宿时,很可能大模型给出的是企业的软广。但大模型本身可能并不知道答案被“精心设计”过,它依然兢兢业业,会根据各个指标筛选出你想要的产品�

  • TCL登台CES 2026:从屏显技术到AI能力的系统级进化

    TCL在CES 2026上以“屏宇宙”和“AI生活”为主线,全面展示其创新成果。重点包括:升级的SQD-Mini LED电视技术,实现更优画质;全球首款印刷OLED车载屏,推动显示升级;集成eSIM的AR智能眼镜,具备独立通信能力;以及AI空调、陪伴机器人等智能家居产品。作为参展规模最大的中国品牌,TCL通过持续研发投入与全球布局,强化产业纵深,并积极推动AI与显示技术的深度融合与应用落地。

  • 雷军宣布小米千万技术大奖:玄戒O1团队脱颖而出

    今天上午,小米创办人、董事长兼CEO雷军在微博发文,详细介绍了小米开年重要举措——颁发千万技术大奖的相关情况。雷军提到,每年开年为优秀工程师和工程团队颁发千万技术大奖,是小米的一项重要大事。自2020年至今,该奖项已连续颁奖6次,累计奖励金额达7500万元。 雷军进一步披露了2025年“千万技术大奖”的更多细节。此次共有154个项目参与激烈角逐,其中底层核�

  • 技术创新锚定场景需求时空壶W4Pro引领AI同传行业高质量发展

    随着AI大模型加速落地与全球化协作加深,跨语言沟通设备正朝着高精准、全场景、自然化方向迭代。时空壶推出的W4Pro AI同传耳机,凭借矢量降噪、双向同传等核心技术突破,以及全场景深度适配能力,成为行业标杆产品。其采用三麦克风阵列与矢量降噪算法,在嘈杂环境中语音识别准确率超92%,远超行业平均水平。搭载自研BabelOS同传系统,支持43种语言及96种口音互译,覆盖全球98%主流经贸区域。创新的双向同传技术将交流效率提升4倍,翻译延迟稳定在3-5秒。产品兼容微信、Zoom等软件通话及传统电话,无需对方专用设备即可开启双向实时翻译,通话后自动生成双语会议纪要。依托全球服务器智能调配,即使在弱网环境下仍能保持98%的翻译准确率。12g轻量化开放式设计兼顾佩戴舒适性与环境音感知,18小时续航满足全天高频使用需求。时空壶产品已远销170多个国家和地区,服务超百万用户与4300余家行业客户,在全球AI开放式耳机行业跻身头部阵营。

今日大家都在搜的词: