11.11云上盛惠!海量产品 · 轻松上云!云服务器首年1.8折起,买1年送3个月!超值优惠,性能稳定,让您的云端之旅更加畅享。快来腾讯云选购吧!
【新智元导读】杀疯了!一夜之间,全球最强端侧多模态模型再次刷新,仅用8B参数,击败了多模态巨无霸GeminiPro、GPT-4V。其OCR长难图识别刷新SOTA,图像编码速度暴涨150倍。我们也将持续回报社区,开源更多优秀模型、数据、infra工具等,将开源开放的星火播撒世界协作创新之苍穹。
这些天的硅谷,乱成了一锅粥。OpenAICEO山姆-奥特曼直接在社交平台公开嘲讽谷歌的审美过于差劲,他表示:我努力不去过多思考我们的竞争对手,但我无法不去思考OpenAI和谷歌之间的美学差异。哪怕到了AI时代,这个法则也同样适用。
【新智元导读】I/O大会上,谷歌Gemini1.5Pro一系列更新让开发者们再次沸腾。最新技术报告中,最引人注目的一点是,数学专业版1.5Pro性能碾压GPT-4Turbo、Claude3Opus,成为全球最强的数学模型。对于GPT-4Turbo来说,随着提供的图像增多,其准确性反下降更多细节参见最新技术报告。
GoogleDeepMind发布了一份长达150页的技术报告,详细介绍了Gemini1.5Pro和Gemini1.5Flash两个模型的性能特点和架构以及这个多模态大型模型的最新进展。Gemini1.5于今年2月上线,通过工程优化、MoE架构等策略显著提升了性能和速度。Gemini1.5的技术报告展示了谷歌在大型多模态模型领域的最新进展,其性能的提升和应用潜力为未来的AI技术发展提供了新的方向。
【新智元导读】OpenAI半小时的发布会让很多人第一反应是直呼「失望」,但随着官网放出更多demo以及更多网友开始试用,大家才发现GPT-4o真的不可小觑,不仅在各种基准测试中稳拿第一有很多发布会从未提及的惊艳功能。OpenAI在发布会上官宣GPT-4o之后,各路大神也开始了对这个新模型的测评,结果就是,GPT-4o在多项基准测试上都展现了SOTA的实力。随着大模型之战愈演愈烈,相信对于开源和闭源的激烈讨论依旧会持续下去。
Google即将向学校提供GeminiAI,并专门针对教育工作者和年满18岁的学生提供服务,承诺会将他们的数据用于AI模型训练或与他人分享。Google将在WorkspaceforEducation账户上提供额外的Gemini隐私保护,无需额外付费。这个计划将为教育工作者和学生提供更安全和私的学习环境,同时Chromebooks的无障碍功能也将为视力障碍或低视力的人士提供更好的使用体验。
谷歌在其2024年GoogleI/O大会上宣布,Gmail将获得一次AI升级。根据谷歌的介绍,Gmail用户能够利用其GeminiAI技术搜索、总结和起草邮件。Gemini1.5Pro将作为一个可选升级在WorkspaceLabs中提供,供那些想要尝试其的用户使用。
Google正在更新Android的Gemini,以使其AI能够更好地了解屏幕上的内容。这次更新将使Gemini发挥出其最佳例之一,即在用户日常生活中帮助他们理解有限的数据。谷歌的Gemini在Android上的更新将在未来几个月内向“数亿设备”推出,并且还有更多上下文功能正在开发中。
谷歌计划将其GeminiAI技术直接嵌入到Chrome浏览器的桌面中。在谷歌于本周二举行的I/O大会上,宣布Chrome126版本将采用GeminiNano来为浏器内的AI功能提供支持,包括文本生成等功能。与Edge浏器的Copilot相比,GeminiNano在本地设备上运行,提供更快速和隐私保护的AI体验。
谷歌在其I/O大会上大肆宣传其Gemini接管搜索,但其中一个最引人注目的演示再次暴露了迄今为止所有大型语言模的一个致命缺陷:自信满满地给出错误答案。在“Gemini时代的搜索”展示片段中,谷演示了视频搜索功能,允许你通过对视频剪辑说话进行搜索。)这已经是谷歌第二次展示自家AI给出错误答案的炫酷展示素材了——去年,Bard聊天机器人自信满满地谎称詹姆斯韦伯太空望远镜是第一个拍摄到太阳系外行星的望远镜。
昨天被OpenAI提前截胡的谷歌,今天不甘示弱地开启反击!大杀器ProjectAstra效果不输GPT-4o,文生视频模型Veo硬刚Sora,用AI彻底颠覆谷歌搜索,Gemini1.5Pro达到200万token上下文……谷歌轰出一连串武器,对OpenAI贴脸开大。谷歌I/O2024如期来了,眼花缭乱地发布了一堆更新。在性能方面,全新的Gemma27B不仅超越了规模大了2倍还多的模型还能在GPU或单个TPU主机上高效运行。
今天凌晨,谷歌正式召开了I/O大会,宣布谷歌已全面进入Gemini时代。在一年前的I/O大会上,谷歌才首次发布Gemini大模型今年大模型、AI等已经成为了绝对的主角,甚至连新版安卓都没提。谷歌还称希望Gemini凭借其多模态、长上下文和智能体,使谷歌不断接近最终目标:让AI助力每个人。
GoogleI/O2024开发者大会在谷歌山景城总部附近的海岸线圆形剧场隆重开幕。在这场科技盛宴中,谷歌率先分享了Gemini大模型的最新突破。随着Gemini模型的进一步升级和扩展,我们有理由相信谷歌将继续引领AI技术的发展潮流,为开发者提供更加高效、智能的工具和平台。
在今天凌晨举行的I/O开发者大会上,谷歌表示即将推出Android15,并且还剧透了一些新功能。会上谷歌宣布,为安卓系统引入AI诈骗电话检测功能,在通话中提醒可能存在的诈骗行为,并鼓励用户结束此类通话。目前还不知道这项诈骗检测功能将于何时推出,但谷歌表示该功能默认禁用状态,需要用户手动启用才能生效,这应该是在等Android15系统。
北京时间今天凌晨1:00,GoogleI/O2024开发者大会在谷歌山景城总部附近的海岸线圆形剧场召开。谷歌率先介绍了Gemini大模型最新进展。除了能生成创意文本、代码外,Gemini1.5Pro最大的特色是能根据用户输入的文本提示,理解、总结上传的视频、音频内容进行深度总结。
谷歌在I/O大会上宣布,Android15已融入谷歌Gemini大模型,支持诸如AI语音助理防诈骗、画圈图片搜索、理解图片给出更符合用户需求的答案等功能,Android15Beta2将在明天正式推出。全新升级后的谷歌Gemini已经展现出较强的理解、推理、创作和实时互动能力,实现了对OpenAI多模态模型的全面超越。并且Android15支持短信和彩信应用以及预加载的RCS应用,以便使用卫星通信连接收发信息。
谷歌近日正式公布了其备受期待的I/O开发者大会——GoogleI/O2024,将于美国当地时间5月14日拉开帷幕。此次大会不仅将展示谷歌在科技领域的最新成果,更预示着Android15与AI技术的新纪元。我们期待在大会上见证谷歌在科技领域的更多突破和创新。
GeminiAI助手宣布了一项新的功能,即将支持播放YouTubeMusic中的音乐。这一更新将极大地提升用户的体验,让音乐播放变得更加简单和流畅。它不仅简化了播放流程可能鼓励更多的用户尝试使用GeminiAI助手,从推动智能助手的普及和应用。
在RSA大会上,Google宣布了一项重要的产品更新:GoogleThreatIntelligence,这是一款结合了Mandiant专业知识、VirusTotal社区资源以及Google全球设备和电子邮件情报的全新威胁情报解决方案。该产品旨在帮助企业更快地获得威胁洞察,并有效保护自己免受网络威胁。GoogleThreatIntelligence的API定价为每百万tokens输入1元、输出2元,价格具有竞争力,鼓励企业使用。
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解:https://top.aibase.com/1、这个五一假期,小红书被Remini“黏土AI”攻占了在五一假期里,小红书平台上出现了一种新的流行趋势——“黏土AI”滤镜,迅速占领了小红书的首页,成为用户们热议的焦点。�
昨天的文章刚说到Gemini的一些更新,这不,GoogleChrome又一项突破性更新,该更新通过简单的“@”符号启用,可以直接访问智能AI助手Gemini。随时启动AI对话这一改变让用户无需打开新的标签页或应用,直接在浏览器顶部操作区就可以启动对话。GoogleChrome的此次更新只是开始,AI技术在未来的发展道路上还有很多可能性,值得我们持续关注和期待。
TwelveLabs最新发布了Pegasus-1的公测版本,这款视频-语言基础模型在视频理解领域取得了新突破。Pegasus-1是一款具有约17亿参数的视频-语言模型,能够以卓越的准确性和细节处理能力从视频输入中生成语言描述。Pegasus-1的不断进化与创新,为视频理解技术开辟新的可能性。
如何复盘大模型技术爆发的这一年?除了直观的感受,你还需要一份系统的总结。斯坦福HAI研究所发布了第七个年度的AIIndex报告,这是关于人工智能行业现状的最全面的报告之一。该指数中的其他图表显示,不同人群的观点存在显著差异,年轻人更倾向于乐观地看待人工智能将如何改变他们的生活。
香港中文大学终身教授贾佳亚团队最近推出了一款名为Mini-Gemini的多模态模型,该模型在多模态任务榜单上取得了显著成绩,其性能堪比GPT-4与DALLE3的结合。Mini-Gemini模型以其更精确的图像理解能力、更高质量的训练数据和更强的图像解析推理能力著称。这一成果不仅为开源社区带来了新的活力,也为多模态模型的发展和应用开辟了新的可能性。
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
Google宣布开放其AI模型Gemini1.5Pro的API,这一版本在原有基础上进行了大幅度的功能扩展,现已在180多个国家提供。Gemini1.5Pro引入了对原生音频的理解能力,以及文件API和系统指令等新功能。这个新模型在MTEB基准测试中取得了更强的检索性能,超过了具有可比维度的所有现有模型。
Gemini1.5Pro是Google开发者平台推出的下一代AI模型。它支持语音理解、系统指令、JSON输出等新功能,并推出了新一代文本嵌入模型Gecko,性能大幅提升。要了解更多关于Gemini1.5Pro的信息,并开始体验这一先进的AI模型,请访问Gemini1.5Pro官网。
4月10日凌晨,谷歌在官网正式发布了Gemini1.5Pro,现在可在180多个国家/地区使用。除了能生成创意文本、代码之外,Gemini1.5Pro最大的特色是能根据用户输入的文本提示,理解、总结上传的视频、音频内容进行深度总结,并且支持100万tokens上下文。Gemini1.5Pro已经全面开放使用了,有兴趣的小伙伴赶紧去试试吧。
欢迎来到【今日AI】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。