首页 > 业界 > 关键词  > 正文

快手公布全模态、大模型AIGC解决方案和数字人产品“快手智播”

2023-08-10 15:32 · 稿源:站长之家

站长之家(ChinaZ.com)8月10日 消息:在2023年的快手光合创作者大会上,快手首次正式公布了他们在大型模型方面的最新进展。快手AI和用户增长业务的负责人王仲远在会议上展示了一种全模态、大模型的AIGC解决方案以及相应的数字人产品“快手智播”。

快手

王仲远表示,快手的“全模态、大模型AIGC解决方案”是基于他们自主研发的基座大模型,提供了文本生成、图像生成、3D生成、音乐生成以及视频生成等技术能力。

举报

  • 相关推荐
  • 大家在看
  • 快手AI持续发力 自研文生图大模型“可图”亮相

    快手自研文生图大模型“可图”正式亮相。快手宣布在站内短视频评论开始内测AI文生图功能——快手AI玩评,用户可以通过输入各种创意文字,一键生成海量风格图片,可以更轻松、便捷地在评论区进行趣味互动。可图将会与快手的更多业务开展合作,用AI技术丰富业务的想象力,探索更多有趣、有价值的创新应用落地,让人机共创成为现实。

  • 快手自研文生图大模型可图Kolors开启内测

    快手自研的文生图大模型“可图”已于近期开启内测。该大模型具有强大的文本理解、丰富的细节刻画和多样的风格转化特点。快手在APP评论区已开始内测“AI玩评”功能,内测中的“AI玩评”功能可以根据用户输入的文字生成相应的图像,并提供多种风格选择。

  • 快手举办上市后首届投资者日,程一笑解读快手商业增长引擎

    9月21日,快手科技2023年投资者日活动在其新总部元中心举办。这是快手上市以来,首次在线下举办投资者日交流活动。相信在技术和使命的双重驱动下,在这个高速成长的短视频赛道上,快手通过高效率的增长,可以实现高质量发展。

  • 怪兽智能AI数字人软件:数字人制作、数字人短视频生成、数字人直播解决方案

    怪兽智能AI数字人软件是一款领先的虚拟数字人创作工具,以其独特的功能和卓越的性能闻名于业界。从数字人制作到数字人短视频生成,再到数字人直播,这款软件系统提供了一站式解决方案,满足了广大用户在数字人创作和展示方面的需求。作为一家专注于数字人技术的公司,怪兽智能AI数字人软件不仅提供了先进的数字人制作工具,还能将真人形象克隆、声音克隆、实时�

  • 快手解锁看亚运新玩法:民领金币,好礼兑不停!

    亚运适逢国庆,盛会又遇盛典。自9月23日杭州第19届亚运会开幕以来,中国体育健儿在赛场上劈金斩银、奋勇争先,赛场外观众的热情也让这届亚运会成为了一场“全民参与”的体育盛事。作为此次杭州第19届亚运会持权转播商以及官方短视频分享平台,快手通过全场次的赛事点播、多档自制节目、丰富的互动玩法等,为观众带来更多视角、更加立体化的观赛体验。为了全方位�

  • 快手看亚运,解锁不一样的观赛视角与亚运体验

    9月23日晚8点,万众瞩目的第19届亚运会正式拉开帷幕,全亚洲的体育健儿们共赴本次的杭州之约。为让更多人参与进这场体育盛事,激发全民运动热情,快手作为杭州亚运会持权转播商及官方短视频分享平台,在赛事期间也将通过覆盖全场次的赛事点播、多档自制节目、丰富的互动玩法等,从赛事、内容、互动、技术多个维度全面发力,带大家深入现场、近距离感受冠 军风采�

  • 风尚-秋日户外穿搭公式”活动开启,快手电商联合快手时尚引领秋季穿搭新风向

    时至九月,由夏入秋,为了解决用户换季穿搭苦恼, 9 月 20 日至 9 月 26 日,快手电商联合快手时尚推出“快风尚-秋日户外穿搭公式”活动,分享换季穿搭灵感,引领秋冬时尚新风向。 据了解,此次活动可通过平台筛选和平台运营报名两种渠道参与。商家和达人创作秋冬时尚穿搭强相关内容,并带 #快风尚 与 #老铁时装周 两个话题词,发布挂车短视频,优质视频内容即可获得

  • 实测快手“AI玩评”功能,以后AI也要来抢热评了

    AI也要来抢热评了。继8月推出“文生文”大语言模型“快意”后,快手又在“文生图”赛道推出了自研大模型“可图”。如果“AI玩评”能够更加准确地理解评论的语意,将模糊的形容词演绎得更加生动,应该能够发挥更大实用价值和创造空间。

  • 团圆佳节念故土 快手掀起乡土文化新潮流

    情更浓,无论走到哪里,人们心中总有一抹乡情连接着家乡的土地。2023年中秋节,快手推出中秋礼盒「快手土特产」,携手快手达人,打造一份定制土特产,用丽江果干、云南咖啡、民间版画等传递乡土风情,掀起了乡土文化新潮流。快手也会持续为创作者赋能,不断构建繁荣生态,从政策扶持、发展引导、商业变现等多维度,助力传统文化传播。

  • 跟着蔡依林上快手玩转成都,「怪巴适派对」开启独特城市打卡

    看大熊猫、逛川剧院、举办城市主题直播,最近现身成都为演唱会做准备的蔡依林,开启了“特种兵”式打卡模式,带着快手用户线上解锁成都吃喝玩乐攻略,全方位、沉浸式感受成都魅力。谈及这次来成都的感受,她表示:“以前都没有时间观光旅游,这次吃喝玩乐都收集到了,所以心情又更加愉悦了。越来越多有烟火气的明星直播还在快手继续,期待更多明星给用户带来不一样的体验。

  • LibreChat.ai:一站式AI聊天平台,自由定制,支持多种AI服务。

    LibreChat是一个免费、开源的AI聊天平台,提供广泛的定制选项,支持众多AI提供商、服务和集成。它以熟悉的界面,创新的增强功能,服务于所有AI对话,满足您所需的用户数量。

  • Genspark:AI代理引擎,提供个性化信息搜索体验。

    Genspark是一个AI代理引擎,它通过一个多代理框架提供个性化的信息搜索体验。与传统搜索引擎不同,Genspark的AI代理能够实时生成新的、定制的Sparkpages页面,直接满足用户的查询需求,从多个相关来源综合内容,提供高质量、无偏见的信息。

  • ShareGPT4Video:提升视频理解和生成的AI模型。

    ShareGPT4Video系列旨在通过密集且精确的字幕来促进大型视频-语言模型(LVLMs)的视频理解以及文本到视频模型(T2VMs)的视频生成。该系列包括:1) ShareGPT4Video,40K GPT4V注释的密集视频字幕,通过精心设计的数据过滤和注释策略开发而成。2) ShareCaptioner-Video,一个高效且功能强大的任意视频字幕模型,由其注释的4.8M高质量美学视频。3) ShareGPT4Video-8B,一个简单但卓越的LVLM,其在三个先进的视频基准测试中达到了最佳性能。

  • PixelProse:大规模图像描述数据集,提供超过16M的合成图像描述。

    PixelProse是一个由tomg-group-umd创建的大规模数据集,它利用先进的视觉-语言模型Gemini 1.0 Pro Vision生成了超过1600万个详细的图像描述。这个数据集对于开发和改进图像到文本的转换技术具有重要意义,可以用于图像描述生成、视觉问答等任务。

  • GPTCommit:自动化生成Git提交信息的脚本工具。

    GPTCommit是一个利用OpenAI的GPT-4o模型来分析代码变更并自动生成提交信息的自动化Git提交工具。它简化了代码提交流程,通过智能分析代码变更,快速生成合适的提交信息,提高开发效率。

  • DeepFuze:革命性深度学习工具,用于面部转换和视频生成。

    DeepFuze是与ComfyUI无缝集成的先进深度学习工具,用于革新面部转换、lipsyncing、视频生成、声音克隆和lipsync翻译。利用先进的算法,DeepFuze使用户能够以无与伦比的真实性结合音频和视频,确保完美的面部动作同步。这一创新解决方案非常适合内容创作者、动画师、开发者以及任何希望以先进的AI驱动功能提升其视频编辑项目的人士。

  • TikTok Symphony:创意AI套件,简化TikTok内容创作。

    TikTok Symphony是一个由生成性AI驱动的全新创意解决方案套件,旨在简化营销人员和创作者在TikTok上的内容创作旅程。通过将人类想象力与AI驱动的效率相结合,TikTok Symphony使各种规模的企业、创作者和代理机构能够提升内容创作水平,提高生产力,并发现有价值的洞察。

  • Moatless Tools:使用大型语言模型编辑大型代码库的工具。

    Moatless Tools 是一个业余项目,作者在这里尝试一些关于如何使用大型语言模型(LLMs)来编辑大型现有代码库的想法。项目认为,构建好工具以插入正确的上下文到提示中并处理响应,比依赖代理推理解决方案更为关键。

  • CogiDigm:创新AI技术,引领数字艺术未来。

    CogiDigm利用GenAI技术革新娱乐产业的叙事方式,包括电影制片厂、后期制作和广告代理公司。我们拥有尖端技术,成为行业领跑者。我们与FBRC.ai和AILA合作,提供视频生成和操作服务,释放创造力。我们的理念是采用以人为本的集体智能方法,提供广泛的服务,包括创新的GenAI解决方案、道德的AI模型实施、专业的技术指导、战略咨询和无缝部署专业知识。

  • Flash Diffusion:快速生成高质量图像的扩散模型

    Flash Diffusion 是一种高效的图像生成模型,通过少步骤生成高质量的图像,适用于多种图像处理任务,如文本到图像、修复、超分辨率等。该模型在 COCO2014 和 COCO2017 数据集上达到了最先进的性能,同时训练时间少,参数数量少。

  • Pizi:快速将照片转化为产品页面

    Pizi是一个创新的应用程序,它允许用户通过简单的拍照将照片快速转化为产品页面,极大地节省了创建产品页面所需的时间和精力。它通过优化照片和描述,旨在提高转化率,同时无需专业设备或人员,节省成本。Pizi还具备SEO功能,能够提高产品页面的搜索引擎可见性。

  • Seio:快速创建SEO优化文章,提升在线业务影响力

    Seio是一个SEO内容创作工具,它允许用户在几分钟内从关键词创建SEO优化的文章,帮助企业提升在线影响力。它提供了强大的自助产品和增长分析功能,以及团队共享的收件箱,以确保团队协作的高效性。Seio还提供了AI驱动的编辑器和多平台发布功能,以及与Zapier集成的自动化SEO流程。此外,Seio提供全天候的客服支持,帮助用户解决问题。

  • Accorata:AI驱动的早期投资项目发现平台

    Accorata是一个面向早期投资者的AI驱动的项目发现平台,旨在通过快速筛选全球前种子期和种子期初创企业来简化早期项目源的获取。平台通过集成的甲板处理器、AI增强的创始人尽职调查和符合最严格欧洲数据保护标准的主权技术,为投资者提供快速、深入的分析和筛选服务。

  • Callin AI:AI驱动的语音助手,提升企业客户服务效率。

    Callin AI提供一系列AI语音助手,旨在通过自动化客户对话来增强企业的成长。这些助手可以处理来电和去电,提供24/7的客户服务,并且可以根据企业的具体需求进行定制。Callin AI利用最新的语音识别和自然语言处理技术,帮助企业提高客户满意度,减少等待时间,并扩大服务能力。

  • Agent Mode:AI时代的命令行助手

    Agent Mode是Warp AI的一个特性,它允许用户使用自然语言在终端中完成多步骤工作流程。它能够识别和解释自然语言指令,提供环境特定的指导,并引导用户完成多步骤任务。Agent Mode利用OpenAI的API,但不会存储或保留用户的输入或输出数据。

  • Epipheo AI:AI视频生成器,快速创建专业解说视频。

    Epipheo AI是一个强大的通用人工智能工具,能够轻松生成专业的解说视频。它具有直观的界面和先进的算法,使用户能够在几分钟内创建吸引人的视频。Epipheo AI提供多种高质量的语音选项,确保信息传达清晰有效,增强观众参与度和专业性。此外,它还提供AI生成的变体,用于快速迭代和分享,确保视频不仅满足而且超出预期,具有高效率和易用性。

  • ComfyUI-LuminaWrapper:一个用于Lumina模型的Python包装器

    ComfyUI-LuminaWrapper是一个开源的Python包装器,用于简化Lumina模型的加载和使用。它支持自定义节点和工作流,使得开发者能够更便捷地集成Lumina模型到自己的项目中。该插件主要面向希望在Python环境中使用Lumina模型进行深度学习或机器学习的开发者。

  • Safe Superintelligence Inc.:构建安全的超级智能

    Safe Superintelligence Inc. 是一家专注于构建安全超级智能(SSI)的公司,由 OpenAI 联合创始人兼前首席科学家 Ilya Sutskever 创办,其将安全置于“商业压力”之上。该公司认为SSI是当前时代最重要的技术问题,并致力于通过革命性的工程和科学突破来解决这一问题。公司的目标是快速提升智能能力,同时确保安全始终领先。其商业模式确保了安全性、安全性和进步不受短期商业压力的影响。

  • Tele-FLM:52B参数的开源多语言大型语言模型

    Tele-FLM(亦称FLM-2)是一个52亿参数的开源多语言大型语言模型,具有稳定高效的预训练范式和增强的事实判断能力。基于解码器仅变换器架构,已在大约2T的token上进行训练。Tele-FLM在同等规模上展现出优越的性能,有时甚至超越了更大的模型。除了分享模型权重外,我们还提供了核心设计、工程实践和训练细节,期待它们对学术界和工业界社区都有所裨益。

  • ChatFLM:智能聊天助手,提供高效交流体验。

    ChatFLM是一款基于FLM技术的智能聊天模型,旨在为用户提供流畅且智能的对话体验。该模型通过先进的自然语言处理技术,能够理解用户意图并生成合适的回复,适用于多种交流场景。

今日大家都在搜的词: