首页 > 业界 > 关键词  > 360智脑最新资讯  > 正文

实测|“360智脑”大升级后能图生图、文生视频、视频生文……看看你的工作是不是要被取代了

2023-06-14 20:38 · 稿源: TechWeb.com.cn

6月14日消息,360智脑推出了最新4.0版本,能力进行了大升级。

根据360集团创始人周鸿祎的介绍,自2023年3月29日以来,不到3个月的时间,360智脑从1.0迭代至4.0版本。

360智脑4.0具备跨模态生成能力,目前已经拥有文生文、文生图、文生表、图生图、图生文、视频生文、文生视频、文本剪视频能力。

最新的360智脑支持PC端/移动端使用,也就是说手机上也可以用了。而且支持语音输入能力,对于懒得打字/不会打字的人来说就很友好了。

支持语音输入

现场,周鸿祎还分别演示了360智脑的上述能力。有些是事先录好的视频,有些是现场直接演示。

目前360智脑4.0开放邀请测试,我们也会把能测试的功能进行试用,一起来看看360智脑目前达到什么水平了。

文生文能力,是ChatGPT为代表的大语言模型产品的代表能力,这也是360智脑最初版就有的能力。

文生图能力,在今年5月18日,360已正式发布了这项能力。

对这两项能力,在这里不多做叙述了。

直接进入360智脑4.0的几项新增跨模态生成能力看看。

1、图生图,应用场景有“生活照”秒变“证件照”

从现场播放的视频效果来看,可以把一张周鸿祎的生活照片,按需要及时生成为一张1寸红底证件照、2寸蓝底证件照等等。

用手机端360智脑,支持手机拍照后直接将手机拍图,生成想要尺寸的证件照。

这对PS无能人员来说简直是very good!

学生家长再也不用担心老师临时要收集孩子证件照了!

不知道拍证件照的照相师傅是不是感受到了职业压力。

现在,360智脑已开放了该能力的体验,我们附上找到体验入口的方法,方便大家找到。

自己体验入口:360智脑首页-数字人广场-点击更多-找到“证件照设计师“,点击进入就可以开始了。

我们也实测了一下效果,头发的ps痕迹略生硬外,其他都很完美,主要是够快,输入图片后,10秒就出图了。解放PS手残党。

2、文生视频 应用场景包括根据文本剪视频

顾名思义,就是用户输入一段文字,360智脑输出一个视频。

这部分内容同样是视频展示。

从提供的视频中,用户输入“企鹅在沙漠中洗澡”文字,360智脑就给出了4个相关小视频。

这个对剪视频的小伙伴是不是很有帮助?视频剪辑师有没有感受到亿点点压力……

3、视频生文

从周鸿祎现场播放的视频来看,这个“视频生文”功能主要用在监测领域。

比如,在一段视频中,用户输入“帮我检测红色小汽车”,360智脑就会把视频中所有的红色小车都标记出来。

同样的,如果用户输入“帮我检测建筑工地上的建筑材料”,同样,在视频中的这些内容会被标记出来。

周鸿祎演示的这“文生视频”和“视频生文”这两项能力,我们在目前360智脑开放的功能中还没有找到入口。大家姑且看看上面的演示视频评估一下效果吧。

4、自定义“数字人”

这次,360还基于大模型发布新产品“360 AI数字人广场”,拥有200 虚拟数字人角色。

同时,360智脑支持数字人定制,可以根据你自己的需要创造出一个数字人。

目前,360智脑提供了马斯克、诸葛亮、孙悟空等多个现实/虚拟人物的数字人产品。

比如,你可以和诸葛亮聊聊“如果战国有智能手机,汝会如何利用”之类的消磨时光的话题。看看他如何用三国时代的语言回答你。

和“诸葛亮‘聊天

周鸿祎现场创建了自己的数字分身作为“360发言人”。他表示,数字分身拥有他本人完整的私人知识库,能够复刻他的思维方式和人生经历,是有“灵魂”的数字人。

和周鸿祎数字人聊买360股票能不能赚钱

因此,周鸿祎将360的数字人定位为做“有灵魂的数字人”。不过前提是,让数字人学习到足够丰富的关于真人的知识。

360智脑在多模态等关键能力上完成迭代,360全部产品都将接入该能力。

周鸿祎认为,当前国内各家企业AI大模型的基础能力相差不大,接下来行业真正比拼的是应用落地能力,要思考如何让个人和企业更方便、简单地使用AI大模型应用。

因此,360将重点关注的应用场景有四个方面:面向消费者的用户个人AI助理,中小微企业SaaS化垂直应用,面向大型企业、政府、城市的私有化部署大模型,以及面向行业的垂直大模型。

同时,周鸿祎也预告:下个月发布360智脑5.0版本,该版本将发布插件平台。

今年以来,国内各大公司密集召开各种大模型发布会,在周鸿祎看来,这三个月相当于人工智能行业过去的三十年。国内厂商追跑GPT-4的速度比他想象得要快。

从ChatGPT加速的这场AIGC变革,也许比大家想象的要来得更早。在人工智能发展的大潮中,很多职业都面临洗牌。

创新工场董事长开复就曾预言”未来十年,翻译、简单的新闻报道、保安、销售、客服等领域的人,将约有90%会被人工智能全部或部分取代。”

举报

  • 相关推荐
  • 大家在看
  • 360智脑大模型全面接入360全家桶 正式面向公众开放

    360宣布,360智脑大模型全面接入360全家桶,正式面向公众开放。用户可通过ai.360.com一站式登录体验360智脑app、360搜索、360安全浏览器、LoRA360、AI数字员工等大模型服务。在产业数字化战略背景下,基于360智脑的企业级垂直大模型已经在金融、医疗、教育等近20个行业落地,为各行各业提供支持。

  • 信通院发布可信AI评估结果 360智脑能力达当前最高级别

    近日, 2023 南京人工智能产业发展大会正式开幕。会上,信通院发布可信 AI 评估结果,三六零(601360.SH,下称“360”)集团的自研认知型通用大模型 360 智脑以4+级别通过模型开发、模型能力两个模块验证,成为业界为数不多通过4+级别验证的大模型之一,这也是目前国产大模型达到的最 高能力级别。 此前,信通院联合大模型工作组百余家单位,共同研制了《大规模预训练模�

  • Pika Labs AI视频生成器现在可以嵌入文字和像了

    PikaLabs在Discord上部署的AI视频生成器增加了两项新功能。第一项名为“视频字母化”,可以将不同样式的字母和文字嵌入到短视频中。PikaLabs正不断丰富其AI视频生成器的功能,为用户提供更多定制化选择。

  • 一帧秒创:支持图文视频,AI数字人等功能

    一帧秒创是一款基于秒创AIGC引擎的智能AI内容生成平台,旨在为创作者和机构提供多种AI生成服务,包括文字续写、文字转语音、文生成图、图文转视频等多项创作服务。这个平台的核心特点是其智能分析技术,能够快速将文案、素材、AI语音和字幕等元素整合,创作出高质量的视频内容,无需复杂的编辑和制作过程。这些功能使一帧秒创成为一个全面的视频内容创作工具,为用户提供了从文字到视频的一站式解决方案,简化了视频制作过程,提高了创作效率。

  • AI视频生成框架AnimateDiff 高速运动视频依然保持稳定

    AnimateDiff是一款强大的工具,它允许您轻松地将文本转化为动画图像无需特定的调整。它为用户提供了无限的创意和探索空间,让您可以将文本描述转化为令人惊叹的动画场景。只需运行几个命令,就可以在本地主机上启动演示,通过用户友好的界面进行互动。

  • 快手AI持续发力 自研文生图大模型“可”亮相

    快手自研文生图大模型“可图”正式亮相。快手宣布在站内短视频评论开始内测AI文生图功能——快手AI玩评,用户可以通过输入各种创意文字,一键生成海量风格图片,可以更轻松、便捷地在评论区进行趣味互动。可图将会与快手的更多业务开展合作,用AI技术丰富业务的想象力,探索更多有趣、有价值的创新应用落地,让人机共创成为现实。

  • 从“博物君”到“无穷小亮”,从图文转型到短视频,成为粉丝千万的科普顶流,他怎么做到的?

    提起科普,你会想到什么,无聊?晦涩?小众?刷到“无穷小亮”的科普视频后,一定能改变你的刻板印象,他的科普幽默风趣,让人心情愉悦下,还学到了科学知识。“无穷小亮”本名叫张辰亮,他从《博物》杂志实习生升到副主编,接手《博物》官方微博从2万粉丝涨到1300万,随后转战短视频,又吸粉2372万,实在是厉害。除了网红外,他还是中国国家地理融媒体主任,多本畅�

  • 快手自研文生图大模型可Kolors开启内测

    快手自研的文生图大模型“可图”已于近期开启内测。该大模型具有强大的文本理解、丰富的细节刻画和多样的风格转化特点。快手在APP评论区已开始内测“AI玩评”功能,内测中的“AI玩评”功能可以根据用户输入的文字生成相应的图像,并提供多种风格选择。

  • 亿图脑图新版本支持思维导一键生成PPT、音视频等格式,办公提效再升级

    国产思维导图软件——亿图脑图MindMaster发布了全新版本V10.9.0,本次亿图脑图的升级给用户带来了极大的惊喜。全新升级的亿图脑图MindMaster不仅支持20格式的文件智能解析成思维导图支持思维导图一键生成PPT、音频、视频等内容形式;此外,亿图脑图独家首发文本编辑实时布局功能,位于行业内领先水平。期待在未来,亿图脑图MindMadster能为更多的用户提供更智能、更优质的使用体验。

  • 360开始“猛扑”AI数字员工

    如果仔细观察会发现,大家似乎很少再提“AIGC”,取代之的是“生成式AI”、“LLaMA2”以及“AI大模型”等新词。这场由“ChatGPT”引发的内容生产力大革命,已经慢慢走出了单一的“对话式场景”,并迅速蔓延到商业应用的各个场景,尤其是“AI数字员工”的出现,更是打响了互联网大厂AI大模型应用第一枪。我们也看到一个向好的现象:比如,自然语言处理和图像处理的领域,已经具备了足够多的工具和标准化云产品,几乎人人都能构建自己简易的大模型;再比如,现在最火的“炼丹师”还不是上班族,很可能是一群高中或初中生,他们愿意为自己热爱的二次元动漫深入研究,并常年活跃在QQ讨论群里。

  • Ouro:分享数字商品和服务,发现内在价值

    Ouro是一个平台,它允许用户分享和货币化他们的数字商品和服务,包括外部API、数据集、图像、视频等。通过利用AI技术,Ouro旨在提高用户的生产力,并通过共享专业知识实现财务自由。该平台支持各种数字内容的分享和货币化,并提供了一个社交化的工作环境,以促进社区支持和协作。

  • Sparky:AI驱动的日记应用,助你专注自我成长。

    Sparky是一个AI驱动的日记应用,旨在帮助用户通过记录和反思来提高个人生产力和生活质量。通过智能引导和个性化的反馈,Sparky鼓励用户专注于自我成长,从而实现更有意义的生活。产品背景信息显示,Sparky通过AI技术,为用户的日常任务和习惯管理提供支持,同时通过个性化的反思帮助用户更好地理解自己,促进个人发展。

  • LLaMA-Omni:低延迟、高质量的端到端语音交互模型

    LLaMA-Omni是一个基于Llama-3.1-8B-Instruct构建的低延迟、高质量的端到端语音交互模型,旨在实现GPT-4o级别的语音能力。该模型支持低延迟的语音交互,能够同时生成文本和语音响应。它在不到3天的时间内使用仅4个GPU完成训练,展示了其高效的训练能力。

  • AI奇点网:AI工具箱和AI资讯平台

    AI奇点网是一个专注于AI工具测评、AI应用案例分享、AI学习资源的综合性平台。它提供了丰富的AI工具和资讯,帮助用户了解和应用最新的人工智能技术,推动AI技术的普及和应用。

  • Question:智能问答系统,提供深入见解和答案。

    Question.ai是一个智能问答系统,能够理解并回答用户的各种问题。它使用先进的自然语言处理技术,提供准确、及时的信息。该系统的主要优点是能够处理复杂的查询,并以易于理解的方式提供答案。它适合需要快速、准确信息的用户,无论是个人还是企业。目前,该产品提供免费试用,但具体的定价信息尚未提供。

  • poolside:为软件工程挑战打造的先进基础AI模型

    poolside是一个为软件工程挑战而构建的先进基础AI模型,它通过在用户代码上进行微调,学习项目的独特之处,以理解通用模型无法理解的复杂性。它建立在poolside基础之上,每天都能变得更好。除了先进的代码编写模型,poolside还构建了一个直观的编辑器助手,并提供了一个开发者可以构建的API。poolside由Jason Warner和Eiso Kant于2023年4月创立,他们之前在AI和软件工程领域有着丰富的经验。

  • DataGemma RIG:用于检索和生成结合统计数据的文本模型

    DataGemma RIG是一系列微调后的Gemma 2模型,旨在帮助大型语言模型(LLMs)访问并整合来自Data Commons的可靠公共统计数据。该模型采用检索式生成方法,通过自然语言查询Data Commons的现有自然语言接口,对响应中的统计数据进行注释。DataGemma RIG在TPUv5e上使用JAX进行训练,目前是早期版本,主要用于学术和研究目的,尚未准备好用于商业或公众使用。

  • 有道AI PPT:智能PPT创作工具,一键生成专业演示文稿。

    有道AI PPT是一款基于人工智能技术的演示文稿创作工具,它通过理解用户输入的文本内容或主题,快速生成具有专业设计的PPT幻灯片。该产品利用先进的AI算法,简化了PPT的制作流程,提高了工作效率,尤其适合需要快速制作演示文稿的用户。产品背景信息显示,有道AI PPT由网易有道推出,依托于网易在人工智能领域的深厚技术积累。目前,产品提供有限次数的免费体验,具体价格和定位信息需要登录后查询。

  • DataGemma:连接大型语言模型与谷歌数据共享平台,减少AI幻觉现象。

    DataGemma是世界上首个开放模型,旨在通过谷歌数据共享平台的大量真实世界统计数据,帮助解决AI幻觉问题。这些模型通过两种不同的方法增强了语言模型的事实性和推理能力,从而减少幻觉现象,提升AI的准确性和可靠性。DataGemma模型的推出,是AI技术在提升数据准确性和减少错误信息传播方面的重要进步,对于研究人员、决策者以及普通用户来说,都具有重要的意义。

  • 汉语新解TextHuman:AI生成汉语词汇新颖解释及图像。

    汉语新解是一个基于AI技术的项目,它使用李继刚的Prompt模板对中文名词进行二次翻译,并生成美观的图像。该项目不仅提供了智能词汇解释功能,还支持SVG图像生成,使得每个解释都配有独特的视觉化展示。此外,它还提供了预设模板、图像下载与复制功能,以及响应式设计,以适配不同设备的屏幕,提供流畅的用户体验。

  • Bossjob App:东南亚首个聊天式职业平台,直接与老板对话,快速求职。

    Bossjob是一款面向东南亚市场的聊天式求职平台,它通过直接聊天和技能匹配的方式,为求职者和雇主提供快速、高质量的求职和招聘流程。该平台特别适合那些希望简化求职流程、快速找到工作机会的专业人士,以及希望快速招聘合适人才的雇主。Bossjob的主要优点包括AI驱动的职位匹配、直接与雇主聊天、灵活的工作选择(远程、混合或现场工作)以及快速的招聘流程。

  • seed-vc:零样本声音转换技术,实现音质与音色的高保真转换。

    seed-vc 是一个基于 SEED-TTS 架构的声音转换模型,能够实现零样本的声音转换,即无需特定人的声音样本即可转换声音。该技术在音频质量和音色相似性方面表现出色,具有很高的研究和应用价值。

  • 文字卡片生成器:AI驱动的创意文字卡片生成工具

    文字卡片生成器是一款利用人工智能技术,为用户提供创意文字卡片生成服务的在线工具。用户只需输入一个词语,AI即可在几秒钟内生成一张独特的文字卡片,卡片内容包含对输入词语的幽默或深刻点评。该产品以其快速生成、高质量输出、个性化定制等特点,满足了用户在社交媒体分享、创意表达等方面的需求。

  • Zion:无代码开发平台,快速搭建个性化应用

    Zion是一个无代码开发平台,它通过提供预置的大模型和完善的生态服务体系,使得用户无需编写代码即可构建AI应用、SaaS应用和消费级应用。该平台支持高效的运维方式和多端发布,包括网页、H5、小程序等,同时提供API连接、可视化开发、数据模型管理后台等功能,以满足不同业务场景的需求。Zion的目标是降低AI应用的使用成本和复杂度,提升开发效率,帮助用户快速实现数字化转型。

  • Pagen AI Landing Page Template:由Pagen AI创建的AI着陆页模板

    Pagen AI Landing Page Template是一个由Pagen AI创建的AI着陆页模板,使用Next.js和Shadcn UI构建。它允许用户快速搭建一个专业的着陆页面,用于展示AI相关的产品或服务。该模板易于定制,支持本地开发和预览,适合需要快速上线AI项目展示页面的开发者和企业使用。

  • Vchitect 2.0:由上海人工智能实验室开发的先进视频生成模型

    Vchitect 2.0(筑梦2.0)是一款由上海人工智能实验室开发的高级视频生成模型,旨在赋予视频创作新的动力。它支持20秒视频生成,灵活的宽高比,生成空间时间增强,以及长视频评估。Vchitect 2.0通过其先进的技术,能够将静态图像转换为5-10秒的视频,使用户能够轻松地将照片或设计转换为引人入胜的视觉体验。此外,Vchitect 2.0还支持长视频生成模型的评估,通过VBench平台,提供全面且持续更新的评估排行榜,支持多种长视频模型,如Gen-3、Kling、OpenSora等。

  • reader-lm-1.5b:将HTML内容转换为Markdown的AI模型

    Jreader-lm-1.5b是由Jina AI开发的一款文本生成模型,专门用于将HTML格式的内容转换为Markdown格式。这一技术对于需要进行内容转换的开发者和内容创作者来说非常重要,因为它可以自动完成格式转换,提高工作效率。该模型在Hugging Face平台上提供,支持多语言,并且可以在Google Colab上免费试用。

  • reader-lm-0.5b:将HTML内容转换为Markdown格式的模型

    Jina Reader-LM是一系列将HTML内容转换为Markdown内容的模型,适用于内容转换任务。该模型在精选的HTML及其对应Markdown内容上进行训练,能够高效地处理网页内容的格式转换,为内容创作者和开发者提供便利。

  • Reader-LM:将网页HTML内容转换为清晰的Markdown格式。

    Reader-LM是Jina AI开发的小型语言模型,旨在将网络中的原始、杂乱的HTML内容转换为清洁的Markdown格式。这些模型特别针对长文本处理进行了优化,支持多语言,并能够处理高达256K令牌的上下文长度。Reader-LM模型通过直接从HTML到Markdown的转换,减少了对正则表达式和启发式规则的依赖,提高了转换的准确性和效率。

  • NotebookLM Audio Overview:将文档转化为AI生成的音频讨论,便于学习和记忆。

    NotebookLM是一款帮助用户理解复杂信息的工具,通过摘要和提供相关引用来简化信息的获取。它现在提供了一个名为'Audio Overview'的新功能,用户可以通过一键操作,将文档、幻灯片、图表等转化为AI生成的音频讨论。这些讨论不仅总结了材料内容,还在主题之间建立联系,并且可以下载以便随时随地收听。尽管Audio Overview仍处于实验阶段,存在一些限制,例如生成大型笔记本的音频概述可能需要几分钟时间,并且AI主持人目前只能使用英语进行解释,有时可能会引入不准确的内容,用户还不能打断它们。但这个功能为那些通过听对话来学习和记忆效果更好的人提供了新的学习方式。

今日大家都在搜的词:

热文

  • 3 天
  • 7天