首页 > 热点 > 关键词  > 正文

新壹科技发布新壹视频大模型 同时推出新壹数字人平台

2023-07-28 17:35 · 稿源:站长之家

站长之家(ChinaZ.com)7月28日 消息:7月27日,新壹科技发布了国内首款聚焦视频的大模型“新壹视频大模型”,以及AIGC视频生成平台“秒创视频创作平台”,首款基于商用的数字人平台“新壹数字人平台”,此外,还发布了国内首款明星数字人祝福视频制作产品“秒祝”。

新壹视频大模型是以视频生成为核心的多模态AIGC模型。基于深度学习海量视频样本,新壹视频大模型拥有了从脚本生成、素材匹配、智能剪辑配音到数字人播报的AI全流程视频生产能力。让每个人都能实现高质量、高效率、低成本、无门槛视频创作。

微信截图_20230728173706.png

新壹视频大模型具备多模态感知、实时学习、自迭代及多场景交叉推理的核心能力。能够处理多模态的输入信息,可以理解文字的含义,识别图像的内容,感知音乐的情绪,基于对内容深度准确的理解,生成视频。新壹视频大模型采用了自监督学习方案,会观察和学习大量的视频数据,通过分析视频的结构、内容、风格等多个维度,自我理解和把握视频制作的规则和逻辑。从而在处理视频制作任务时,能有出色的表现。新壹视频大模型能跨场景进行知识迁移与关联,选择合适素材,调整视频风格,生成满足创作者需求且质量高的视频;其可面向行业级的垂直场景对新壹视频大模型做定向训练,以提供更加精准、专业的服务,满足客户的多样化需求。

而秒创是基于新壹科技视频大模型的智能AI内容生成平台。通过秒创平台,创作者可以把一篇文章甚至是一个想法快速地制作为视频,5分钟即可从文案到视频成品。为了达到这样的效果,秒创除了提供图片生成、视频生成、声音生成、数字人生成等AIGC功能外,还提供了一个千万级的结构化视频库为用户提供精准匹配。据悉,秒创试运营半年多以来,已经积累了200多万的用户,每天产出超过10万分钟视频。

新壹科技还发布了数字人平台。基于新壹视频大模型,24内小时即可完成一个数字人的训练。

此外,新壹科技还发布了明星数字人祝福视频制作产品——秒祝。秒祝通过对明星视频进行训练,将明星的形象和声音完美地还原出来,生成对应的明星数字人形象。最终呈现给客户的是以明星数字人为主角的个性化定制祝福视频。

举报

  • 相关推荐
  • 大家在看
  • 澜舟科技孟子大模型开放公众服务 上线四款大模型产品

    澜舟科技孟子GPT大模型正式通过网信办生成式人工智能备案,现正式面向公众开放服务。本次对外开放将上线四款大模型产品,分别是孟子大模型-轻量、孟子大模型-标准、孟子大模型-金融和孟子大模型-编程。对于开发者来说,澜舟科技还提供了免费的API服务,新用户可享受400万tokens的免费额度。

  • 大模型为病人提供医疗咨询,谷歌推出AMIE模型

    医生与患者之间的对话是确诊病情、建立有效治疗方案的关键所在。现实中并不是所有人都能享受丰厚的医疗资源与医生进行深度咨询。根据专科医生的评估,AMIE在诊断准确性和32个评估维度中有28个优于初级保健医生;根据患者的评估,AMIE在26个评估维度中有24个维度表现出更好的诊断结果。

  • 「天工2.0」MoE大模型发布

    北京时间2月6日,昆仑万维正式发布新版MoE大语言模型「天工2.0」与新版「天工AI智能助手」APP,这是国内首个搭载MoE架构并面向全体C端用户免费开放的千亿级参数大语言模型AI应用。用户即日起可在各手机应用市场下载「天工AI智能助手」APP,体验昆仑万维「天工2.0」MoE大模型的卓越性能。昆仑万维始终秉承着“实现通用人工智能,让每个人更好地塑造和表达自我”的公司使命,不断降低大模型技术在各行各业的应用和学习门槛,携手探索未知世界、共创科技未来。

  • 国内首个音视频多媒体大模型万兴“天幕”发布:支持AI剪辑

    万兴科技发布了国内首个音视频多媒体大模型万兴天幕”,并宣布大模型研发中心将正式落户马栏山。天幕”聚焦数字创意垂类创作场景,以音视频生成式AI技术为基础,支持全球不同语言,引领音视频创作闭环解决方案,相关能力已在海外规模化商用。万兴科技在互动平台表示,公司目前未使用境外云服务进行大模型的训练,公司天幕大模型的训练是在国内算力和服务器基础上进行。

  • 谷歌推出ASPIRE框架 让大模型具备自我判断意识

    谷歌最近推出了一项名为ASPIRE的自适应评估框架,旨在帮助大型语言模型在面对置信度较低的样本时做出正确的判断。这个框架的核心技术思路是基于自我评估的选择性预测,通过任务定向微调、答案采样和自我评估学习三大模块来实现。随着这一框架的不断完善和应用,相信大型语言模型在各个领域的表现将会更加出色,为人们带来更好的体验和服务。

  • 华为、阿里等参编:首个代码大模型标准发布

    快科技1月31日消息,近日,人工智能产业发展联盟AIIA发布通告称,由中国信通院联合中国工商银行牵头《智能化软件工程技术和应用要求 第1部分:代码大模型》标准发布。作为业内首个代码大模型标准,该标准的核心参编单位共12家,分别为:中国工商银行、科大讯飞、华为、平安银行、阿里云、三六零、蚂蚁、天翼数字生活、交通银行、网易数帆、深圳集义。此外还有百度

  • 数字人拜年:让一亿人拥有自己的数字分身

    一种全新的“数字人”拜年方式正在流行。一键拍照上传个人照片即可创建数字人分身,搭配春节服饰、背景、拜年模板,生成专属的数字人拜年视频,简单便捷低成本。中国联通集中打造的1个元宇宙底座、2个能力平台、4个系列产品、8个行业方案以及互通互联的元宇宙生态体系将在更多场景闪耀光芒。

  • 讯飞星火大模型V3.5将于1月30日发布 星火开源大模型等将亮相

    讯飞星火V3.5宣布将于2024年1月30日正式发布。这次升级中,讯飞星火首次基于全国产化算力平台进行训练,实现了全民开放大模型。科大讯飞还发布了首部企业史《星火相传》,回顾了科大讯飞的创业精神谱系。

  • 文生视频大模型Sora引发热议:背后团队现身谢赛宁否认涉及

    Sora的发明者之一是毕业于上海交通大学的年轻科学家谢赛宁。谢赛宁在朋友圈发表回应,否认了与Sora的任何关联,并指出自己与该项目毫无关系。在人工智能监管与技术成熟之前,仅仅生成一些漂亮的图片是不够的,真相的捕捉和像《黑镜》中描述的故事很可能很快就会成为现实。

  • AI大模型哪家强?七大维度横评四款主流大模型

    2023年是大模型风潮大起的一年,目前市面上,文心一言、讯飞星火、通义千问等诸多国产大模型已经开放内测许久,这些大模型的技术能力以及由此带来的用户体验感均有所不同。国内国外百模大战之下,哪个大模型更强大,在各方面能力表现如何引人好奇。无论是讯飞星火是文心一言、通义千问,都是国产大模型的第一梯队,在当前的科技竞争、产业竞争的局势下,背后都�

  • Stable Video:使用AI生成高质量的视频内容

    Stable Video是一个基于AI的视频生成平台。用户可以通过文本或图像,将概念转化为引人入胜的视频。平台采用了最先进的深度学习技术,可以高质量生成各类视频内容,包括商业宣传视频、教学视频、演示视频等。优势是生成速度快,质量高,使用简单方便。定价采用创建视频数量的订阅模式。定位面向需要频繁生成高质量视频的企业客户。

  • Universal Manipulation Interface:机器人教学框架,无需在野机器人

    通用操作接口(UMI)是一个数据收集和策略学习框架,允许直接将现场人类演示中的技能转移到可部署的机器人策略。UMI采用手持夹具与仔细的界面设计相结合,实现便携、低成本和信息丰富的数据收集,用于挑战性的双手和动态操作演示。为促进可部署的策略学习,UMI结合了精心设计的策略界面,具有推理时延迟匹配和相对轨迹动作表示。从而产生的学习策略与硬件无关,并且可以在多个机器人平台上部署。配备这些功能,UMI框架解锁了新的机器人操作功能,仅通过为每个任务更改训练数据,允许泛化的动态、双手、精确和长时间的行为,从而实现零次调整。我们通过全面的真实环境实验演示了UMI的通用性和有效性,其中仅通过使用各种人类演示进行训练的UMI策略,在面对新环境和对象时实现了零次调整的泛化。

  • SwapStream:实时人脸互换直播工具

    SwapStream是一个基于云的实时人脸互换直播工具,用户可以通过浏览器轻松实现人脸互换的直播。它支持将任意人脸实时互换到直播视频中,同时可以多路流媒体直播到各种直播平台。主要功能包括:实时人脸互换,无需下载直接在浏览器使用,支持多种直播平台,可添加自定义RTMP直播通道等。优点是使用简单、扩展性强,适用于各类直播场景。

  • REECHO 睿声:睿声 - 超拟真瞬时语音克隆平台

    REECHO.AI 睿声是一个超拟真的人工智能语音克隆平台。用户可以上传语音样本,系统利用深度学习技术进行语音克隆,生成质量极高的 AI 语音,可以实现不同人物的语音风格转换。该平台提供语音创作、语音配音等服务,让更多人可以通过 AI 技术参与语音内容的创作,降低创作门槛。平台定位大众化,提供免费使用基础功能。

  • LongRoPE:将LLM上下文窗口扩展至200万令牌的技术

    LongRoPE是微软推出的技术,可以将预训练大型语言模型(LLM)的上下文窗口扩展到2048k(200万)令牌,实现从短上下文到长上下文的扩展,降低训练成本和时间,同时保持原有短上下文窗口性能。适用于提高语言模型在长文本上的理解和生成能力,提升机器阅读理解、文本摘要和长篇文章生成等任务。

  • Gemini for Google Workspace:Google Workspace的AI助手

    Gemini是Google为Gmail、文档、电子表格等Google Workspace提供的人工智能助手,可以帮助用户更高效地处理电子邮件、创建演示文稿等日常办公任务,具有企业级安全与隐私保护。推出Gemini for Workspace标志着谷歌对AI业务产品的重大重塑,使得谷歌之前混乱、不断变化的AI品牌形象变得更加清晰。尽管先前宣布的Duet AI尚未正式面向公众发布,但Gemini Business提供了方便的购买流程,任何Workspace商业客户都可以轻松订阅该服务。除了面向公众的套餐外,谷歌还推出了“Gemini Enterprise”版本,该版本没有使用次数限制,但需要通过“联系我们”的方式获取,无法直接在线购买。Enterprise版本的费用为每月每用户30美元,提供额外的AI会议功能,例如Gemini可以翻译100多种语言对的字幕,并即将可以自动记录会议笔记。

  • gemma.cpp:谷歌Gemma模型的轻量级C++推理引擎

    gemma.cpp是谷歌为Gemma模型开发的轻量级、独立的C++推理引擎。它专注于为Gemma 2B和7B模型提供简洁、直接的实现,旨在支持研究和实验用例,易于嵌入其他项目且具有高度的可修改性。gemma.cpp利用Google Highway库,优化了CPU推理性能。

  • Seudo:AI驱动的数据工作流引擎

    Seudo是一款AI驱动的数据工作流引擎,旨在快速、轻松、可扩展地进行数据伪装。我们强大的数据引擎结合AI助手,不仅为您提供了快速方便地转换数据的工具,还会分析您的数据并提供关键洞察和建议。Seudo支持多种关键转换操作,使您的数据集可以安全地与客户、同事和客户共享,包括个人数据的删除、稀有事件的屏蔽和日期时间戳的时间偏移。Seudo开发团队目前正在将我们的数据引擎转变为一个云门户,在那里用户可以构建、存储和管理您的伪装工作流。配合我们的API,Seudo可以无缝集成到任何现有的CI/CD工作流程或数据管道中。与此同时,请探索并享受我们的演示应用。

  • sora cand:AI视频生成工具

    Sora AI Video Generator是一款用于生成AI视频的工具。它可以根据提供的文本内容,自动合成出高质量的视频。该工具具有智能视频编辑、自动配乐、特效添加等功能,可以满足用户在影视制作、广告制作、社交媒体营销等领域的需求。定价方面,请访问官方网站了解详情。

  • Create a Meme:创建、分享、享受定制化的梗图

    Create a Meme是一个直观的梗图创建工具,用户可以使用该工具来创建自定义的梗图,并与他人分享。该工具提供了丰富的模板和编辑功能,使用户能够轻松地制作出有趣的梗图。Create a Meme还提供了一系列的Meme产品,包括第一梗图插件和第一梗图GPTs。

  • Thread:即时创建应用的线框图,传达您的构思

    Thread App是一个帮助您快速创建简单交互式线框图的工具,用于测试和分享您的构思。通过描述您想要构建的内容,Thread AI可以快速生成与您描述匹配的线框图。您还可以通过进一步的指令或手动编辑来自定义您的线框图。无论是设计师、开发者还是产品经理,Thread都是测试构思的最快捷方式。

  • ChatGPT Easy Folders:拖放文件夹,嵌套子文件夹,彩色文件夹,高级聊天记录搜索

    ChatGPT Easy Folders是一个简单而强大的工具,用于组织ChatGPT聊天记录。它可以创建文件夹和子文件夹,支持拖放操作,提供彩色文件夹和高级聊天记录搜索功能。

  • AI URL to Video:该插件使用人工智能提取网页的主要文本内容,并一键生成视频。

    FlexClip AI URL转视频是由FlexClip推出的在线AI 网页生成视频插件,可以提取网页的主要内容,并自动匹配适当的媒体资源来生成视频。在生成过程中,您可以编辑内容并替换视频和图片,以获得更满意的结果。

  • Hevolve AI:学习、研究、发现知识的AI助手

    Hevolve AI是一款AI助手,可以帮助用户学习、研究和发现知识。它提供个性化的学习体验、与用户进行人性化互动,并支持多语言教学。Hevolve AI可以根据用户的学习进度提供适时的内容,并通过互动评估和实时反馈提升学习效果。它还提供与教材互动学习、自适应内容传递等功能,致力于让学习变得简单、易用和愉快。

  • DrLambda:智能生成专业幻灯片和内容

    DrLambda是一个AI助手,可以将您的文档、网页、视频和推文转换为专业幻灯片和文档。它可以从多个来源合成内容,并实现精确的叙述。DrLambda提供了一系列工具,帮助您从灵感到印象的完美叙事。无论是研究、讲座设计,还是从任何来源提取信息,DrLambda都能帮助您轻松地整理和访问您的见解和信息。

  • ChatGTP Batch Delete History:ChatGPT批量删除历史记录

    ChatGPT Batch Delete History Bulk是一个Chrome插件,通过提供简单的批量删除聊天历史记录的解决方案,改进了ChatGPT的使用体验。它增强了ChatGPT的交互管理,确保用户隐私,并简化了清理对话记录的过程。主要功能包括:轻松批量删除、批量归档、批量取消归档和选择性时间筛选等。

  • ChatGPT Batch Tasks:批量运行ChatGPT任务

    ChatGPT Batch Tasks Excel是一个Chrome插件,帮助用户批量运行ChatGPT任务,无需OpenAI token费用。可以导出结果为CSV、Excel、JSON、Markdown或HTML格式。适用于内容生成、教育辅助、语言翻译和处理、技术文档编写、广告与营销创意等场景。

  • AI Directories:AI目录大全

    AI Directories是一个AI工具目录收集和提交平台,为用户提供快速提交AI产品到多个目录的服务。它能够帮助用户提升在线知名度、增加SEO价值、获得宝贵的反向链接和有机流量,并与志同道合的社区连接。

  • Gemma-7B-IT:谷歌7B参数指令调整模型

    Gemma-7B-IT是谷歌开发的7B参数指令调整模型,采用Gemini架构,专为提升数学、逻辑推理和代码生成能力。该模型在普通笔记本上即可运行,无需大量AI算力,适合多种应用场景。

  • Gemma-2B-IT:谷歌2B参数指令调整模型

    Gemma-2B-IT是谷歌推出的2B参数指令调整模型,基于Gemini架构,专为提高数学、推理和代码处理能力而设计。该模型在普通笔记本上即可运行,无需庞大的AI算力,适用于多种应用场景。

今日大家都在搜的词:

热文

  • 3 天
  • 7天