11.11云上盛惠!海量产品 · 轻松上云!云服务器首年1.8折起,买1年送3个月!超值优惠,性能稳定,让您的云端之旅更加畅享。快来腾讯云选购吧!
最近谷歌致力于提高网页速度,今天谷歌实验室增加了一款新的分析工具叫Page Speed。
作为今年GoogleI/O2024大会的亮点之一,谷歌正式推出了名为MusicAISandbox的音乐制作工具。这一工具被称为是音乐创作的新风向标,能够通过AI提示来创作音乐循环,让音乐创作变得更加轻松和有趣。谷歌在此次大会上还推出了其他多个人工智能音乐工具,显示了他们在音乐领域的持续投入和创新。
5月15日凌晨,谷歌召开“I/O2024”,生成式AI成为本次大会的重点并发布了一系列产品和多款大模型。谷歌DeepMind发布了一款全新的AI代理产品ProjectAstra,可以像昨天OpenAI发布的GPT4o一样,实现跨文本、音频、视频多模态实时推理。同时为之前的智能RPA、AutoGPT等起到推波助澜的作用扩大认知和市场范围,极大培养了用户的习惯一个全民AI代理时代已经来临。
GoogleResearch最近开发了一种创新的时间序列预测模型,名为TimesFM。这项技术能够利用大量历史数据来学习事件的模式和趋势,进对新的、未见过的数据做出准确的预测。GoogleResearch的这一创新成果,无疑为时间序列预测领域带来了新的活力和可能性。
谷歌最近发布了面向企业、开发人员的全新代码模型CodeGemma,该模型参数小、性能强,同时对硬件要求较低。CodeGemma共有基础预训练、指令微调和快速推理三个版本,在基准测试中展现出优异的性能表现。以上为谷歌发布的CodeGemma模型的相关内容,更多详细信息可参考开源地址和技术报告。
谷歌今天发布了一个名为ObjectDrop的图像局部重绘项目,其效果令人印象深刻。这个项目成功模拟了物体对场景的影响,包括遮挡、反射和阴影,实现了逼真的物体移除和插入。这一成果对于图像处理和计算机视觉领域来说,是一个重要的突破。
欢迎来到【今日AI】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
谷歌最近发布了一项名为“Vlogger”的新视频框架,可以通过仅一张图片和录音即可生成一个本人演讲视频。这一框架基于扩散模型,包含音频到人体动作和文本到图像模型两部分。随着技术的不断进步和完善,相信Vlogger将在未来有更广泛的应用和发展。
Google发布了Gemini1.5Pro模型的技术报告,报告介绍了Gemini1.5Pro的模型架构、训练数据与基础设施、长文本评测和通用能力评测。Gemini1.5Pro是一个高效能的多模态混合专家模型,可以处理和分析来自数百万Token的信息,包括长篇文档和数小时的视频和音频内容。Gemini1.5Pro在处理跨多种媒体格式的长篇信息时表现出色,不仅在技术性能上超越了前代产品展现出了惊人的翻译能力,为多模态混合专家模型的发展开辟了新的可能性。
【新智元导读】谷歌在语言和声控计算机界面的漫长道路上又迈出了重要一步。最新ScreenAI视觉语言模型,能够完成各种屏幕QA问答、总结摘要等任务。谷歌研究人员表示,ScreenAI模型还需要在一些任务上进行更多研究,以缩小与GPT-4和Gemini等更大模型的差距。
谷歌研究最新发布的ScreenAI标志着语言和语音控制计算机界面的又一重要进展。这一AI模型不仅能理解用户界面和信息图表在回答基于信息图表的问题、总结内容以及导航用户界面等多项任务上,创下了新的性能标杆。为鼓励更多的发展,谷歌研究计划发布ScreenAI的评估数据集,其中ScreenQA已经提供了包含36,000张截图的86,000个问答对;更复杂的变体和包含截图及其文本描述的集合将会推出。
谷歌AI团队最近发布了一项名为MUSCATEL的全新时间感知框架,旨在对抗概念漂移问题,提升图像识别准确率。概念漂移一直是机器学习领域的难题,即数据分布随时间变化,影响模型持续有效性。谷歌发布的MUSCATEL方法为机器学习领域的概念漂移问题提供了一种创新的解决方案,为模型在大规模、动态数据集中持续准确地进行分类提供了新的思路和方法。
欢迎来到【每日AI】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
谷歌最新发布了基础世界模型Genie,这一模型拥有110亿参数,能够生成可交互的虚拟世界。Genie的出现让人们看到了人工智能在虚拟世界的无限可能性。Genie的出现将进一步推动虚拟世界的发展,为人类带来更多惊喜和可能性。
今天凌晨,谷歌宣布推出全球性能最强大、轻量级的开源模型系列Gemma。该模型共分为分为2B和7B两种尺寸版本,2B版本甚至可直接在笔记本电脑上运行。并且还实现了跨设备兼容,可以在笔记本电脑、台式机、物联网、移动设备和云端等多个主流设备类型上运行,支持广泛的AI功能。
Google于2月19日发布了Android15的首个开发者预览,然令人意外的是,该文章在整个内容中没有提及人工智能的任何信息。工程副总裁DaveBurke在文章中首先强调了PrivacySandbox在Android上的最新版本的加入,这被宣称既能提供“用户隐私”,又能提供“移动应用的有效个性化广告体验”。尽管Burke的文章中未提及,但预计Android15将在2024年的某个时候发布,可能会包含大量人工智能技术�
谷歌作为一家拥有上百万种类似产品的公司公司闻名这些产品的名称各不相同,毫无共同之处。然,当谈到人工智能工作时,双子座成为了唯一一个重要的名字。这意味着Gemini可能与Google一样大。
谷歌研究团队发布了一款名为Lumiere的先进人工智能视频生成器,引起了对深度伪造技术可能增加的担忧。Lumiere能够根据简单的文本提示创建逼真的五秒视频,其先进之处在于采用了"时空U-Net架构",通过一次传递即生成整个视频的时间持续序列。谷歌尚未回应有关Lumiere的进一步问题。
欢迎来到【AI视野】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
Lumiere是谷歌发布的第三个视频生成模型,这次的模型演示视频质量非常高,运动幅度和一致性表现也很好。除了视频生成,该模型还支持各种视频编辑和生成控制能力。该模型在将文本转换成视频方面取得了领先成果,并证明了该设计能够轻松应用于各种内容创作和视频编辑任务,包括将图像转换为视频、视频修补和风格化视频创作。
在许多3D场景捕获中,由于网格重建失败或者缺乏观测,例如,物体接触区域或难以触及的区域,场景中的某些部分经常会出现缺失的情况。谷歌和加州大学伯克利分校的研究人员提出了NeRFiller框架,可通过2D图像来修复残缺的3D场景,同时发现当图像形成2x2网格时,会生成更多3D一致性的修复效果。为了优化3D场景的几何形态,NeRFiller在室内场景中可加入了相对深度的监督,补全后预测深度,只对补全区域施加排序损失。
谷歌在推出其张量处理单元CloudTPUv5p和具有突破性的超级计算机架构AIHypercomputer时掀起了轩然大波。这些创新的发布,再加上资源管理工具DynamicWorkloadScheduler,标志着在处理组织的人工智能任务方面迈出了重要的一步。这些创新有望重新定义人工智能计算的格局,并为各行各业的突破性进展铺平道路。
真的要对比才看得相对清楚一点。比如这次谷歌发布的大模型产品,性能和综合水平,都是超过GPT的,这个时候你再看百度的大模型战略,发现有两大问题,第一个问题是太着急了,年初的时候,一遇到风口立马发布产品,有跟风和拉股价的嫌疑;第二是你发布的产品,如果没有碾压市面上的产品,那么就很容易被定性搞山寨。于是江湖吐槽说的那种“皮包公司”的标签,就很可能被贴上,到了这个时候,的确很难翻身了。
Gemini是Google推出的最新一代AI模型,Gemini具有多模态的能力,可以处理和结合文本、代码、音频、图像和视频等不同类型的信息。Gemini分为三种规模:Ultra、Pro和Nano,分别针对不同的复杂任务和设备。GeminiUltra目前正在进行严格的安全检查,计划在明年初向开发者和企业客户推出。
堪称改变游戏规则的视觉语言模型PaLI-3问世,引得大量科研人员关注。PaLI-3是谷歌最新推出的视觉语言模型,以更小的体量,更快的推理速度,达到了更强的性能。PaLI-3还未完全开源,但是开发人员已经发布了多语言和英文SigLIPBase、Large和So400M模型。
谷歌最新发布的PaLI-3视觉语言模型在小体量下实现了SOTA性能,引起广泛关注。这款模型以更小的体量和更快的推理速度实现更强大的性能,是谷歌去年推出的多模态大模型PaLI的升级版。这一创新有望影响视觉语言模型的未来发展方向,提供更高效的解决方案。
谷歌在10月4日举办的新闻发布会上正式发布了新一代安卓旗舰手机——Pixel8/Pro系列,搭载了TensorG3芯片和TitanM2安全芯片。TensorG3芯片始终与AI相关,运行更复杂的ML模型,为Pixel8和8Pro的几乎所有部分带来了AI增强功能。据此前发现的Geekbench6跑分数据,谷歌Pixel8Pro手机的单核得分仅为1760,多核得分仅为4442,表现并不算非常出色。
谷歌在2023年的MadebyGoogle发布会上发布了最新款的Pixel8和Pixel8Pro手机以及新版安卓系统Android14。谷歌还宣布,这两款手机以及未来的新功能都将提供长达7年的操作系统、安全和功能更新。国产手机厂商们应当“抄作业”,也应该关注如何延长其产品的软件更新周期。
谷歌在纽约举行了一年一度的MadebyGoogle2023发布会,除了推出最新的Pixel8和Pixel8Pro手机之外发布了新版安卓系统Android14以及由生成式AI加持的谷歌助手AssistantwithBard。谷歌宣布Android14正式版将支持锁屏自定义功能,用户可个性化设置不同的时钟样式和格式Pixel8和8Pro还提供了AI驱动的壁纸生成器,只需轻按几下即可创建前所未见的壁纸。Android14目前已经面向Pixel设备推出,今年晚些时候将在三星、iQOO、Nothing、一加、Oppo、Realme、夏普、索尼、传音、vivo和小米等设备上更新。
大语言模型不仅能让应用变得更智能,还将让机器人学会举一反三。在谷歌发布RT-1大模型仅半年后,专用于机器人的RT-2大模型于近期面世,它能让机器人学习互联网上的文本和图像,并具备逻辑推理能力。该模型为机器人智能带来显著升级——即便在机器人没有经历过的场景下,RT-2也通过学习让它根据指令完成任务。谷歌DeepMind机器人技术主管Vincent举例称,如果让以前的机�