11.11云上盛惠!海量产品 · 轻松上云!云服务器首年1.8折起,买1年送3个月!超值优惠,性能稳定,让您的云端之旅更加畅享。快来腾讯云选购吧!
视频分割是一项用途广泛的技术,把视频的前景和背景分离之后,导演们、视频制作者们就可以把两者作为两个不同的视觉层,便于后续的处理或者替换。对背景的修改可以传递不同的情绪、可以让前景的主人公显得去了另一个地方,又或者增强这条视频消息的影响力。不过,这项工作传统上都是由人工完成的,非常费时(比如需要逐帧把里面的人描选出来);省时的办法则需要一个专门的电影工作室,布置绿幕作为拍摄背景,从而实时替换成别的需要?
谷歌近日宣布,它将会在其翻译应用Google Translate中启用全新的神经网络机器翻译技术来支持印地语、俄国和越南语文本的翻译。
谷歌首席科学家Jeff Dean:Google的深度神经网络强在哪里,以及,有什么奇妙的特性?
6月21日,谷歌的图像识别神经网络不但可以识别图像,而且可以制造出人意料的奇幻景象。 机器有什么梦想?谷歌新发布的一些机器识别图像为我们给出了一个可能的答案:将不同的景物合成一种奇幻风景。 这些照片是由谷歌的图像识别神经网络产生的,该网络...
据国外媒体报道,斯坦福大学教授吴恩达(Andrew Ng)自两年前加入谷歌(微博)研发团队后,一直致力于研究人工智能技术。他通过打造拥有十亿个连接的“神经网络”,让电脑自主识别YouTube视频中的猫。现在这项人工神经网络技术正走出实验室,用于改进谷歌的搜索功能。
他通过打造拥有十亿个连接的“神经网络”,让电脑自主识别YouTube视频中的猫。现在这项人工神经网络技术正走出实验室,用于改进谷歌的搜索功能。
当谷歌开发最新版的Android移动操作系统时,这家网络巨头对这个操作系统解读用户语音命令的方式作出了一些重大的改变。当时谷歌基于所谓的“神经网络”安装了一个语音识别系统,这个“神经网络”是一种计算机化的学习系统,在很大程度上能像人脑那样运作。
通过网络阅读国外文献少不了翻译软件的帮助。很多用户都有过这样的体验,机翻虽然能够展示文章概貌,但在一些语句细节,包括断句、语气、语境的把握上仍有欠缺,往往还会影响翻译结果的准确性。对此,今年9月Google发布了翻译技术的突破性研究——神经网络机器翻译系统(GNMT:Google Neural Machine Translation)。
NeuralNetworkDiffusion是由新加坡国立大学高性能计算与人工智能实验室开发的神经网络扩散模型。该模型利用扩散过程生成高质量的图像,适用于图像生成和修复等任务。要了解更多关于NeuralNetworkDiffusion的信息并开始创作,欢迎访问官方网站。
亚马逊的研究人员在一篇论文中介绍了一种创新方法,旨在增强神经网络处理复杂表格数据时的性能。表格数据通常由行和列组成,看似简单,但当这些列在性质和统计特征上差异巨大时,就会变得复杂起来。这项研究为神经网络在处理复杂表格数据时的改进提供了新的思路和方法,有望在实际应用中取得更好的效果。
LiquidAI,一家由MIT孵化的新兴公司,近日成功完成了一轮接近4千万美元的种子轮融资,其目标是构建一种全新类型的人工智能,被称为液态神经网络。这一创新性的技术基于液态神经网络架构,旨在提供更为精简、可解释且动态适应的人工智能系统。该公司希望通过商业化液态神经网络技术,竞争构建GPT模型的基础模型公司,致力于打造超越传统GPT的最佳新型Liquid基础模型。
今天,苹果分享了一个温馨的广告,展示了其新推出的「个人声音」辅助功能,该功能适用于iPhone、iPad和Mac。图片来自Apple苹果公司在iOS17.iPadOS17和macOSSonoma中引入的个人声音功能允许那些面临失去语言能力风险的用户创建一个类似于他们实际声音的合成语音,以便他们能继续与他人交流。通过个人声音功能,苹果能够完全在设备端训练神经网络,从在保护用户隐私的同时提升语言辅助功能。
马里兰&NYU合力解剖神经网络,推出一种新的类反转方法,称为"Plug-InInversion",用于生成神经网络模型的可解释图像。在神经网络训练中,一些神经元可能永远输出0,被称为"死节点"这些节点可以通过优化算法生成诡异和恐怖的图像。PII方法为神经网络模型的解释提供了新的工具和途径,有望加深对模型内部行为的理解,进一步推动神经网络研究的发展。
最新研究表明,卷积神经网络在大规模数据集上能够与视觉变换器媲美,挑战了以往认为视觉变换器在这方面具有卓越性能的观点。在计算机视觉领域,ConvNets一直以来都是在各种基准测试中取得卓越性能的标准。这些结果突显了同时扩展计算和数据资源的重要性,为计算机视觉研究的未来带来了新的启示。
10月27日,全球顶级机器人开发商波士顿动力在官网展示了一项新的研究,通过将ChatGPT、Spot以及其他AI模型相结合,开发了一种会说话的导游机器狗。该机器狗能够根据文字、语音提示与人类进行交谈,同时提供了视觉问答功能,可以分析摄像头拍摄的画面,自动生成图像说明。波士顿动力以开发高度先进、灵活且具有实用性的机器人闻名,其产品在工业、研究和消费领域都有
35年来,认知科学、人工智能、语言学和哲学领域的研究人员一直在争论神经网络是否能实现类似人类的系统泛化。人们一直认为,AI无法像人类一样具有「系统泛化」能力,不能对没有经过训练的知识做到「举一反三」,几十年来这一直被认为是AI的最大局限之一。我们正一步步接近未来:机器不仅能理解人类的的语言能掌握细微的差别和语义,从促进更加无缝和直观的人机交互未来。
DeepSparse是一种突破性的CPU推理运行时,采用了复杂的稀疏性技术,从实现了神经网络推理的加速。稀疏性是指神经网络中存在许多连接权重为零的情况。多层次API:提供引擎、管道和服务器等多层次的API,以满足不同应用场景的需求。
SALMONN是一个多模态神经网络,能够直接处理和理解包括语音、音频事件和音乐在内的一般音频输入,并在多种语音和音频任务上取得竞争性表现。论文地址:https://arxiv.org/pdf/2310.13289v1.pdfSALMONN采用了两个互补的音频编码器,一个用于处理语音,另一个用于处理非语音音频事件,以实现对各种音频任务的优越性能。这一研究有望推动具有通用听觉能力的人工智能的发展。
人工智能初创公司AnthropicPBC近日宣布了一项重大突破,他们表示已找到一种更好地理解支撑其人工智能算法的神经网络行为的方法。这一研究成果有望在提高下一代人工智能的安全性和可靠性方面产生深远影响,使研究人员和开发者能够更好地控制其模型的行为。这可能对克服理解语言模型行为的挑战至关重要。
获得亚马逊40亿美元投资的ChatGPT主要竞争对手Anthropic在官网公布了一篇名为《朝向单义性:通过词典学习分解语言模型》的论文,公布了解释经网络行为的方法。由于神经网络是基于海量数据训练成,其开发的AI模型可以生成文本、图片、视频等一系列内容。理解神经网络行为,对增强大语言模型的安全性、准确性至关重要。
近日,特斯拉在硅谷车主俱乐部中发布了最新的FSD演示视频。从图中我们可以看到,特斯拉在FSD的加持下,在没有任何导航的情况下湖边的一条土路上行驶。马斯克曾多次强调特斯拉的视觉识别能力,并表示:道路是为生物神经网络和眼睛设计的,因此数字神经网络和摄像头将发挥最佳作用。
ResFields提出了一种新的神经网络结构,可以更好地表示复杂的时空信号。该方法的核心思想是在多层感知机中替换一个或多个层,使用依赖时间的可训练残差权重参数。核心优点:1.运行时间快,基础MLP结构不变,保持高效推理2.更好的泛化能力,保留MLP的正则化效果3.通用性强,可无缝集成大多数基于MLP的时空信号方法4.容易拓展,兼容各种先进技术研究为时空信号表示领域提供了一种简单有效的改进方案,具有重要研究价值。
研究人员利用一种称为图神经网络的深度学习算法,建立了一种模型,能够将化合物的结构映射到气味描述。该模型已成功预测人类小组如何描述新的气味,这可能是沿着长路征程中的重要一步,最终实现气味的数字化。要实现像通过互联网共享气味这样的可能性需要做更多工作。
【新智元导读】二十多年来,谷歌搜索无形地决定了在线内容的潮起潮落。但到了今天,它的文化意义、地位以及影响力首次受到了质疑。这家公司就是AltaVista。
谷歌计划在周三启动一项新的试点计划,部分员工只能使用没有接入互联网的台式机。这是为了降低网络攻击风险。谷歌正准备在全公司范围内推出各种人工智能工具,该公司试图提高其系统安全性,近几个月来,谷歌也一直在努力防止泄密。
谷歌更新了其隐私政策,声明保留在互联网上抓取数据以构建其AI工具的权利。更新后相关的谷歌隐私政策如下:据分析,这种做法超出了传统政策所涵盖的公司对其服务上发布的数据的使用范围,并扩展到所有公共互联网内容。Twitter和Reddit已经采取措施通过限制第三方对其API的访问来保护知识产权。
随着人工智能技术的不断发展和应用,图像分类技术在多个领域得到了广泛应用。并且伴随着深度学习的兴起,卷积神经网络已经成为了处理图像分类任务的主流模型。相信随着技术的不断发展和进步,该技术在未来会有更广泛的应用和更加出色的表现。
随着科学技术的不断发展,光学扫描全息成像技术越来越成为研究领域中的热门技术。该技术通过记录物体散射光的干涉图案来生成一个三维物体的全息图像。然而,由于其高复杂性和大量数据的处理需要,这项技术还存在许多挑战。为了解决这些问题,近年来,深度学习技术被应用于光学扫描全息重建,以提高重建全息图像的质量和速度。深度学习是一种基于神经网络的机�
在生成式人工智能领域中出现了一种新的趋势——面向网络安全的生成式人工智能,谷歌也想在这个领域获得先机。在日前的+RSA+2023+大会上,谷歌宣布了+Cloud+Security+AI+Workbench,这是一款由一种名为+Sec-PaLM+的专门的「安全」AI+语言模型驱动的网络安全套件。希望我们很快能看到结果,但在此期间,请对谷歌和微软的声明保持谨慎。
随着大数据时代的到来与崛起,人们开始愈加关注隐私安全和生命安全,当人们处于公共场所时,人们希望可以获得足够的安全保障,针对人身安全和隐私安全的要求刺激了生物识别技术的发展。生物识别,具体是指通过人工建模、大数据训练等方法训练计算机,使得计算机可以获取与人类相似甚至更好的识别能力。在生物识别领域中,人脸识别由于其生理特征的独特性占据�