实测｜“360智脑”大升级后能图生图、文生视频、视频生文……看看你的工作是不是要被取代了

2023-06-14 20:38 · 稿源： TechWeb.com.cn

6月14日消息，360智脑推出了最新4.0版本，能力进行了大升级。

根据360集团创始人周鸿祎的介绍，自2023年3月29日以来，不到3个月的时间，360智脑从1.0迭代至4.0版本。

360智脑4.0具备跨模态生成能力，目前已经拥有文生文、文生图、文生表、图生图、图生文、视频生文、文生视频、文本剪视频能力。

最新的360智脑支持PC端/移动端使用，也就是说手机上也可以用了。而且支持语音输入能力，对于懒得打字/不会打字的人来说就很友好了。

支持语音输入

现场，周鸿祎还分别演示了360智脑的上述能力。有些是事先录好的视频，有些是现场直接演示。

目前360智脑4.0开放邀请测试，我们也会把能测试的功能进行试用，一起来看看360智脑目前达到什么水平了。

文生文能力，是ChatGPT为代表的大语言模型产品的代表能力，这也是360智脑最初版就有的能力。

文生图能力，在今年5月18日，360已正式发布了这项能力。

对这两项能力，在这里不多做叙述了。

直接进入360智脑4.0的几项新增跨模态生成能力看看。

1、图生图，应用场景有“生活照”秒变“证件照”

从现场播放的视频效果来看，可以把一张周鸿祎的生活照片，按需要及时生成为一张1寸红底证件照、2寸蓝底证件照等等。

用手机端360智脑，支持手机拍照后直接将手机拍图，生成想要尺寸的证件照。

这对PS无能人员来说简直是very good!

学生家长再也不用担心老师临时要收集孩子证件照了！

不知道拍证件照的照相师傅是不是感受到了职业压力。

现在，360智脑已开放了该能力的体验，我们附上找到体验入口的方法，方便大家找到。

自己体验入口：360智脑首页-数字人广场-点击更多-找到“证件照设计师“，点击进入就可以开始了。

我们也实测了一下效果，头发的ps痕迹略生硬外，其他都很完美，主要是够快，输入图片后，10秒就出图了。解放PS手残党。

2、文生视频应用场景包括根据文本剪视频

顾名思义，就是用户输入一段文字，360智脑输出一个视频。

这部分内容同样是视频展示。

从提供的视频中，用户输入“企鹅在沙漠中洗澡”文字，360智脑就给出了4个相关小视频。

这个对剪视频的小伙伴是不是很有帮助？视频剪辑师有没有感受到亿点点压力……

3、视频生文

从周鸿祎现场播放的视频来看，这个“视频生文”功能主要用在监测领域。

比如，在一段视频中，用户输入“帮我检测红色小汽车”，360智脑就会把视频中所有的红色小车都标记出来。

同样的，如果用户输入“帮我检测建筑工地上的建筑材料”，同样，在视频中的这些内容会被标记出来。

周鸿祎演示的这“文生视频”和“视频生文”这两项能力，我们在目前360智脑开放的功能中还没有找到入口。大家姑且看看上面的演示视频评估一下效果吧。

4、自定义“数字人”

这次，360还基于大模型发布新产品“360 AI数字人广场”，拥有200 虚拟数字人角色。

同时，360智脑支持数字人定制，可以根据你自己的需要创造出一个数字人。

目前，360智脑提供了马斯克、诸葛亮、孙悟空等多个现实/虚拟人物的数字人产品。

比如，你可以和诸葛亮聊聊“如果战国有智能手机，汝会如何利用”之类的消磨时光的话题。看看他如何用三国时代的语言回答你。

和“诸葛亮‘聊天

周鸿祎现场创建了自己的数字分身作为“360发言人”。他表示，数字分身拥有他本人完整的私人知识库，能够复刻他的思维方式和人生经历，是有“灵魂”的数字人。

和周鸿祎数字人聊买360股票能不能赚钱

因此，周鸿祎将360的数字人定位为做“有灵魂的数字人”。不过前提是，让数字人学习到足够丰富的关于真人的知识。

360智脑在多模态等关键能力上完成迭代，360全部产品都将接入该能力。

周鸿祎认为，当前国内各家企业AI大模型的基础能力相差不大，接下来行业真正比拼的是应用落地能力，要思考如何让个人和企业更方便、简单地使用AI大模型应用。

因此，360将重点关注的应用场景有四个方面：面向消费者的用户个人AI助理，中小微企业SaaS化垂直应用，面向大型企业、政府、城市的私有化部署大模型，以及面向行业的垂直大模型。

同时，周鸿祎也预告：下个月发布360智脑5.0版本，该版本将发布插件平台。

今年以来，国内各大公司密集召开各种大模型发布会，在周鸿祎看来，这三个月相当于人工智能行业过去的三十年。国内厂商追跑GPT-4的速度比他想象得要快。

从ChatGPT加速的这场AIGC变革，也许比大家想象的要来得更早。在人工智能发展的大潮中，很多职业都面临洗牌。

创新工场董事长开复就曾预言”未来十年，翻译、简单的新闻报道、保安、销售、客服等领域的人，将约有90%会被人工智能全部或部分取代。”

（举报）

相关推荐
大家在看

关键词：

【腾讯云】11.11云上盛惠！云服务器首年1.8折起，买1年送3个月！

11.11云上盛惠！海量产品 · 轻松上云！云服务器首年1.8折起，买1年送3个月！超值优惠，性能稳定，让您的云端之旅更加畅享。快来腾讯云选购吧！

Docker容器镜像
去看看

Docker容器镜像 60元/15天

爆款产品组合购
去看看

爆款产品组合购低至1元

腾讯云x NVIDIA加速计划
去看看

腾讯云x NVIDIA加速计划最高获赠10万元扶持基金

2核2G云服务器
去看看

2核2G云服务器 112元/1年

查看更多相关信息>>

腾讯云 12-20

广告
360智脑大模型全面接入360全家桶正式面向公众开放

360宣布，360智脑大模型全面接入360全家桶，正式面向公众开放。用户可通过ai.360.com一站式登录体验360智脑app、360搜索、360安全浏览器、LoRA360、AI数字员工等大模型服务。在产业数字化战略背景下，基于360智脑的企业级垂直大模型已经在金融、医疗、教育等近20个行业落地，为各行各业提供支持。
信通院发布可信AI评估结果 360智脑能力达当前最高级别

近日， 2023 南京人工智能产业发展大会正式开幕。会上，信通院发布可信 AI 评估结果，三六零（601360.SH，下称“360”）集团的自研认知型通用大模型 360 智脑以4+级别通过模型开发、模型能力两个模块验证，成为业界为数不多通过4+级别验证的大模型之一，这也是目前国产大模型达到的最高能力级别。此前，信通院联合大模型工作组百余家单位，共同研制了《大规模预训练模�
Pika Labs AI视频生成器现在可以嵌入文字和图像了

PikaLabs在Discord上部署的AI视频生成器增加了两项新功能。第一项名为“视频字母化”，可以将不同样式的字母和文字嵌入到短视频中。PikaLabs正不断丰富其AI视频生成器的功能，为用户提供更多定制化选择。

Pika AI头条
一帧秒创：支持图文转视频，AI数字人等功能

一帧秒创是一款基于秒创AIGC引擎的智能AI内容生成平台，旨在为创作者和机构提供多种AI生成服务，包括文字续写、文字转语音、文生成图、图文转视频等多项创作服务。这个平台的核心特点是其智能分析技术，能够快速将文案、素材、AI语音和字幕等元素整合，创作出高质量的视频内容，无需复杂的编辑和制作过程。这些功能使一帧秒创成为一个全面的视频内容创作工具，为用户提供了从文字到视频的一站式解决方案，简化了视频制作过程，提高了创作效率。

数字人
荐AI视频生成框架AnimateDiff 高速运动视频依然保持稳定

AnimateDiff是一款强大的工具，它允许您轻松地将文本转化为动画图像无需特定的调整。它为用户提供了无限的创意和探索空间，让您可以将文本描述转化为令人惊叹的动画场景。只需运行几个命令，就可以在本地主机上启动演示，通过用户友好的界面进行互动。

AnimateDiff
快手AI持续发力自研文生图大模型“可图”亮相

快手自研文生图大模型“可图”正式亮相。快手宣布在站内短视频评论开始内测AI文生图功能——快手AI玩评，用户可以通过输入各种创意文字，一键生成海量风格图片，可以更轻松、便捷地在评论区进行趣味互动。可图将会与快手的更多业务开展合作，用AI技术丰富业务的想象力，探索更多有趣、有价值的创新应用落地，让人机共创成为现实。
荐从“博物君”到“无穷小亮”，从图文转型到短视频，成为粉丝千万的科普顶流，他怎么做到的？

提起科普，你会想到什么，无聊?晦涩?小众?刷到“无穷小亮”的科普视频后，一定能改变你的刻板印象，他的科普幽默风趣，让人心情愉悦下，还学到了科学知识。“无穷小亮”本名叫张辰亮，他从《博物》杂志实习生升到副主编，接手《博物》官方微博从2万粉丝涨到1300万，随后转战短视频，又吸粉2372万，实在是厉害。除了网红外，他还是中国国家地理融媒体主任，多本畅�

短视频
快手自研文生图大模型可图Kolors开启内测

快手自研的文生图大模型“可图”已于近期开启内测。该大模型具有强大的文本理解、丰富的细节刻画和多样的风格转化特点。快手在APP评论区已开始内测“AI玩评”功能，内测中的“AI玩评”功能可以根据用户输入的文字生成相应的图像，并提供多种风格选择。
亿图脑图新版本支持思维导图一键生成PPT、音视频等格式，办公提效再升级

国产思维导图软件——亿图脑图MindMaster发布了全新版本V10.9.0，本次亿图脑图的升级给用户带来了极大的惊喜。全新升级的亿图脑图MindMaster不仅支持20格式的文件智能解析成思维导图支持思维导图一键生成PPT、音频、视频等内容形式；此外，亿图脑图独家首发文本编辑实时布局功能，位于行业内领先水平。期待在未来，亿图脑图MindMadster能为更多的用户提供更智能、更优质的使用体验。
荐360开始“猛扑”AI数字员工

如果仔细观察会发现，大家似乎很少再提“AIGC”，取代之的是“生成式AI”、“LLaMA2”以及“AI大模型”等新词。这场由“ChatGPT”引发的内容生产力大革命，已经慢慢走出了单一的“对话式场景”，并迅速蔓延到商业应用的各个场景，尤其是“AI数字员工”的出现，更是打响了互联网大厂AI大模型应用第一枪。我们也看到一个向好的现象:比如，自然语言处理和图像处理的领域，已经具备了足够多的工具和标准化云产品，几乎人人都能构建自己简易的大模型;再比如，现在最火的“炼丹师”还不是上班族，很可能是一群高中或初中生，他们愿意为自己热爱的二次元动漫深入研究，并常年活跃在QQ讨论群里。

数字员工

Chat With Llama 3:一个开源的聊天机器人，能够解释概念、写诗、编程、解逻辑谜题。

Chat With Llama 3 是一个开源的聊天机器人，由Meta AI开发。它能够进行多种智能对话，包括解释复杂概念、创作诗歌、编写代码、解决逻辑谜题，甚至帮助用户给宠物起名。这个聊天机器人的主要优点在于它的多功能性和开源性，使其可以被广泛地应用于各种场景，并且可以根据需要进行定制和改进。

人工智能聊天机器人开源

AI图片生成与搜索:释放创意，一键生成或搜索超过200万张AI图片。

AI图片生成与搜索是一个在线平台，利用先进的人工智能技术，允许用户快速生成或搜索各种风格的AI图片。该技术的重要性在于它能够极大提高设计和创意工作的效率，同时降低成本。产品的主要优点包括丰富的图片资源、高效的生成速度、以及用户友好的界面。产品背景信息显示，这是一个面向广大创意工作者和设计师的工具，旨在帮助他们快速实现创意构想。目前，该产品提供免费试用，但具体价格和定位信息未在页面中提供。

AI技术图像生成创意工具

OpenPerplex:，您的知识门户

OpenPerplex是一个提供广泛知识资源的在线平台，它通过整合多种信息源，为用户提供了一个便捷的知识获取渠道。该产品以其丰富的信息量、高效的检索能力和友好的用户界面而受到用户的青睐。它不仅适用于个人学习，也适合专业人士进行深入研究。

知识获取信息检索在线学习

JavaVision是一个基于Java开发的全能视觉智能识别项目，它不仅实现了PaddleOCR-V4、YoloV8物体识别、人脸识别、以图搜图等核心功能，还可以轻松扩展到其他领域，如语音识别、动物识别、安防检查等。项目特点包括使用SpringBoot框架、多功能性、高性能、可靠稳定、易于集成和灵活可拓展。JavaVision旨在为Java开发者提供一个全面的视觉智能识别解决方案，让他们能够以熟悉且喜爱的编程语言构建出先进、可靠且易于集成的AI应用。

人工智能计算机视觉人脸识别

RMBG:利用AI技术，快速高效地从您的图片中移除背景。

AI-Powered Background Removal（AI驱动的背景移除）是一款基于AI技术的在线工具，它能够快速且高效地从用户上传的图片中移除背景。该工具的主要优点在于其隐私保护和本地执行能力，即图片处理在用户设备上完成，无需上传至互联网，保证了数据的安全性和处理速度。此外，作为一款开源且完全免费的工具，它极大地释放了用户的创造力，无需担心成本问题。

AI技术背景移除图片编辑

SearchForJohn:一个专注于搜索功能的在线工具

SearchForJohn是一个在线搜索工具，旨在帮助用户快速找到所需的信息。它以简洁的界面和高效的搜索算法为特点，为用户提供了一个便捷的信息检索平台。该产品的主要优点包括快速响应、准确的搜索结果和用户友好的界面设计。SearchForJohn的背景信息显示，它是由一群对搜索技术充满热情的开发者创建的，旨在解决用户在信息过载时代中寻找特定信息的难题。目前，该产品提供免费试用，但具体价格和定位信息未在页面上明确展示。

搜索信息检索用户友好

OpenBioLLM-Llama3-8B:一款专为生物医学领域设计的开源大型语言模型

OpenBioLLM-8B是由Saama AI Labs开发的先进开源语言模型，专为生物医学领域设计。该模型在大量高质量的生物医学数据上进行了微调，能够理解并生成具有领域特定准确性和流畅性的文字。它在生物医学基准测试中的表现超越了其他类似规模的开源生物医学语言模型，并与更大的专有和开源模型如GPT-3.5和Meditron-70B相比也展现出更好的结果。

生物医学自然语言处理大型语言模型

小悟空AI:一站式智能工具集，助力创作与运营。

小悟空是一个集成了多种智能工具的网站，旨在提高个人和团队的创作效率和运营效果。它通过提供诸如文章生成、视频脚本创作、笔记创作等多样化功能，满足不同用户在内容创作、个人表达、学习教育等方面的需求。产品背景基于人工智能技术，结合大数据分析，为用户提供个性化、高质量的服务。价格定位为免费试用，部分功能付费，以适应不同用户的需求。

智能创作个性化服务效率提升

Jasper Chat:AI聊天，感觉出奇地人性化

Jasper Chat是一个先进的人工智能聊天工具，它通过数十亿的文章、论坛、视频文字稿和网络内容的学习，能够就复杂主题进行详细对话。它的设计易于使用，能够记住对话内容，快速生成有用、适用且独特的内容，并且支持30多种语言。Jasper Chat不仅功能强大，而且使用起来充满乐趣，可以用于写作诗歌、讲笑话、制作剧本或生成日常星座运势等。

人工智能聊天机器人内容生成

Transcript Generator:获取任何YouTube视频的转录文本，并使用AI生成文章。

YouTube Transcript Generator可以下载任何YouTube视频的转录文本，并提供复制、下载、搜索和转换等功能。通过AI将YouTube转录文本转换为文章或博客帖子。

工具转录文章

Undress AI Tool:通过强大的照片脱衣工具，免费无缝地脱掉任何人的衣服。

Undress AI Tool是一款强大的深度脱衣应用程序，可以修改图像，使人们看起来像是没有穿衣服。它使用先进的技术准确地修改照片，生成DeepNude和AI成人图像。该工具的主要优点是可以快速准确地创建深度脱衣图像。

AI图像处理深度学习人工智能

TinderProfile.ai:用AI生成的图片，提高约会匹配度

TinderProfile.ai是一个使用AI技术分析用户自拍和照片，生成一组高质量、专业外观的图片，以确保在约会档案上留下良好的第一印象，增加用户获得更多匹配的机会。

约会社交媒体在线形象

OpenBioLLM-70B:先进的开源生物医学大型语言模型，专为医疗领域设计。

OpenBioLLM-70B是由Saama AI Labs开发的先进开源语言模型，专为生物医学领域设计。该模型在大量高质量的生物医学数据上进行了微调，能够理解和生成具有领域特定准确性和流畅性的文字。它在生物医学基准测试中展示了超越其他类似规模开源生物医学语言模型的优越性能，并且在与更大的专有和开源模型如GPT-4、Gemini、Medtron-70B、Med-PaLM-1和Med-PaLM-2的比较中也展现了更好的结果。

生物医学自然语言处理文本生成

Fun Gifts:个性化AI生成的桌面游戏，上传照片即可打印和邮寄一款独特的AI生成的个性化记忆卡片游戏。

FunGifts.AI是一个提供个性化AI生成的记忆游戏的平台。用户可以上传照片，通过AI生成独特的艺术作品，并打印成为一款记忆卡片游戏。这款游戏拥有30张卡片，印有训练人物的AI艺术作品。FunGifts.AI提供快速的打印和寄送服务，为用户打造一款独一无二的记忆游戏。

个性化记忆游戏 AI生成

Lawdeck:是一款利用人工智能技术实现快速创建、编辑和共享法律文件的在线平台。

Lawdeck是一款利用人工智能技术的在线法律平台，旨在自动化律师事务所的80%例行工作。它可以通过分析输入的详细信息，为用户提供最佳的法律策略，并生成完整的文件供用户编辑和共享。

法律人工智能自动化

ChatALL:与多个AI聊天机器人同时对话，发现最佳答案

ChatALL是一款桌面客户端软件，它允许用户同时与多个大型语言模型（LLMs）基础的AI聊天机器人进行对话，帮助用户发现最佳的对话结果。这款软件的主要优点在于其能够并发发送提示给不同的AI机器人，从而快速比较它们在不同任务上的表现，并找到最适合的机器人。产品背景信息显示，ChatALL适合于希望从LLMs中找到最佳答案或创作的专家、研究人员以及LLM应用的开发者。目前，ChatALL是免费提供给用户的。

AI聊天多语言支持并发对话

TTS Generator AI:将任何文本内容转换为语音MP3，使用AI在几秒钟内生成声音！今天免费生成您的第一段语音！

TTS Generator AI是一款创新的免费在线文本转语音工具，利用先进的AI技术将书面文本转换为高质量、自然流畅的音频。该工具适用于各种用户，包括需要听觉学习材料的学生、想要听长篇文件的研究人员以及希望使其书面内容更易访问的专业人士。TTS工具的一大亮点是它能够支持各种文本格式，从简单的文本文件到复杂的PDF文件，使其非常灵活。

文本转语音 AI工具语音合成