11.11云上盛惠!海量产品 · 轻松上云!云服务器首年1.8折起,买1年送3个月!超值优惠,性能稳定,让您的云端之旅更加畅享。快来腾讯云选购吧!
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解:https://top.aibase.com/1、谷歌Gemini即将发布五个新功能:Imagen3、定制GPT等谷歌即将推出Gemini产品系列的新功能,包括Imagen3、Gemini定制GPT等,备受期待。格拉斯利表示OpenAI的政策限制了举报人的权利,呼
【新智元导读】斯坦福炒虾机器人团队时隔半年再出新作,谷歌最强Gemini1.5Pro加持,MobilityVLA让机器人在836平方米的办公室里轻松导航。还记得年初爆火的斯坦福炒虾机器人吗?时隔半年,原班人马联合谷歌研究人员,重磅推出全新机器人自主导航的基础模型——MobilityVLA。软件和硬件设施的制造以及两者的结合,成为机器人制作领域最为头疼的难题。
OpenAI和谷歌接连两场发布会,把AI视频推理卷到新高度。但业界还缺少可以全面评估大模型视频推理能力的基准。综合实验结果可以看出,当前的多模态大模型在视频理解,尤其是长视频理解方向仍然有很长进步空间,一方面是要提升模型的多模态长上下文理解能力,Gemini1.5Pro最高支持百万长度的上下文窗口,这是其表现优异的依仗,另一方面也亟需构建相应的高质量长视频理解数据集,这方面当下仍处于空白。
在2024年度WWDC全球开发者大会上,苹果软件工程高级副总裁CraigFedrighi确认了与OpenAI旗下的ChatGPT达成合作的计划,并透露了未来与更多第三方AI模型合作的意向。Fedrighi在采访中表示:我们期待在未来与其它AI模型集成,例如谷歌的Gemini。苹果公司还宣布了一系列新的人工智能功能,称之为苹果智能”,除了在Siri中加入ChatGPT外,OpenAI的技术还被用于在苹果操作系统中支持人工智能写作摘要等。
苹果在2024年WWDC的主题演讲中宣布了与OpenAI合作,使ChatGPT模型可以通过Siri进行访问。苹果高级副总裁CraigFederighi确认了公司计划与其他第三方模型进行合作,首次提到的合作伙伴是谷歌的Gemini模型。通过与谷歌的Gemini模型合作,苹果将为用户提供更多AI模型选择,进一步丰富了其人工智能生态系统。
苹果正在筹划与谷歌人工智能部门进行合作,将后者的Gemini大型语言模型融入苹果的智能生态系统。这一合作将标志着两大科技巨头在人工智能领域的全面接轨,有望为用户带来前所未有的智能化体验。这一设置得到了用户和隐私组织的广泛赞许。
Chrome团队宣布,正在探索“内置AI”概念,即浏览器将具有内置AI模型,以便为浏览器功能和网络平台API启用设备上的AI。官方介绍称,借助内置AI,您的网站或Web应用将能够针对基础模型和专家模型运行各种AI任务无需担心部署和管理上述模型。这意味着您的网站和Web应用可以离线使用或采用可变连接方式,按预期运行。
全球数百万用户陷入困境,因为OpenAI的旗舰聊天机器人ChatGPT在美东时间4日下午出现系统故障,持续时间长达近8个小时。这一事件影响到了ChatGPT的所有用户,包括网站、APP和桌面应用,让用户无法正常使用这一关键工具。值得注意的是,ChatGPT在过去90天内发生了十几次中断,但通常在不到一个小时的时间内就得到了解决,周二的故障是最严重的一次。
Opera浏览器近日宣布将Google的GeminiAI模型整合到其现有的AriaAI扩展中,为用户提供更多最新信息和更多对话响应。Aria是Opera去年发布的AI助手,可以回答用户查询、编写代码和执行其他任务。Opera浏览器与Google的GeminiAI模型的集成使得用户可以通过Aria获得更多最新信息,并以对话方式与AI助手交流,为用户提供更加便捷和智能的浏览体验。
GoogleLLC的ChromeOSChromebookPlus笔记本电脑系列今日收到内置人工智能更新Gemini,将协助用户撰写、编辑和提升其照片效果。ChromebookPlus全面获得新功能,将帮助用户更好地利用其手机、掌控日程并提高工作效率。这将允许用户创建演示或反应GIF,因此他们可以为说明或技术支持快速轻松地制作解释GIF,其他用户也可以创建有趣的表情包。
经过与GoogleCloud的合作,今日Aria宣布融入了Google的Gemini模型,为其AI浏览器带来了一次重大升级。Aria作为自家ComposerAI引擎的驱动,以其与50多个模型系列共计150多个本地LLM变体的支持著称。值得关注的本地LLM项目还包括CodeLlama,Phi-2和Mixtral等,它们将在AI社区中继续发挥重要作用,推动人工智能技术的不断进步和创新。
LLama3-V模型正式发布,这是一种全新的SOTA开源VLM模型。LLama3-V不仅优于LLaVA在与GPT4-V、GeminiUltra、ClaudeOpus相比的性能表现上也不逊色,同时模型体积只有它们的1/100。这一消息让人兴奋不已,相信随着LLama3-V的问世,将会给人工智能领域带来全新的发展和突破。
Google在I/O2024大会上宣布的一项新功能——Gemini,已在GoogleMessages应用中向稳定用户广泛推出。这项新功能紧随GeminiAdvanced中的Gemini1.5Pro和YouTubeMusicGeminiExtension等最近推出的功能。这次更新标志着Google在提升用户交互体验方面的持续努力,通过引入Gemini功能,GoogleMessages用户将能够享受到更加丰富和个性化的通信体验。
【新智元导读】杀疯了!一夜之间,全球最强端侧多模态模型再次刷新,仅用8B参数,击败了多模态巨无霸GeminiPro、GPT-4V。其OCR长难图识别刷新SOTA,图像编码速度暴涨150倍。我们也将持续回报社区,开源更多优秀模型、数据、infra工具等,将开源开放的星火播撒世界协作创新之苍穹。
这些天的硅谷,乱成了一锅粥。OpenAICEO山姆-奥特曼直接在社交平台公开嘲讽谷歌的审美过于差劲,他表示:我努力不去过多思考我们的竞争对手,但我无法不去思考OpenAI和谷歌之间的美学差异。哪怕到了AI时代,这个法则也同样适用。
【新智元导读】I/O大会上,谷歌Gemini1.5Pro一系列更新让开发者们再次沸腾。最新技术报告中,最引人注目的一点是,数学专业版1.5Pro性能碾压GPT-4Turbo、Claude3Opus,成为全球最强的数学模型。对于GPT-4Turbo来说,随着提供的图像增多,其准确性反下降更多细节参见最新技术报告。
GoogleDeepMind发布了一份长达150页的技术报告,详细介绍了Gemini1.5Pro和Gemini1.5Flash两个模型的性能特点和架构以及这个多模态大型模型的最新进展。Gemini1.5于今年2月上线,通过工程优化、MoE架构等策略显著提升了性能和速度。Gemini1.5的技术报告展示了谷歌在大型多模态模型领域的最新进展,其性能的提升和应用潜力为未来的AI技术发展提供了新的方向。
【新智元导读】OpenAI半小时的发布会让很多人第一反应是直呼「失望」,但随着官网放出更多demo以及更多网友开始试用,大家才发现GPT-4o真的不可小觑,不仅在各种基准测试中稳拿第一有很多发布会从未提及的惊艳功能。OpenAI在发布会上官宣GPT-4o之后,各路大神也开始了对这个新模型的测评,结果就是,GPT-4o在多项基准测试上都展现了SOTA的实力。随着大模型之战愈演愈烈,相信对于开源和闭源的激烈讨论依旧会持续下去。
Google即将向学校提供GeminiAI,并专门针对教育工作者和年满18岁的学生提供服务,承诺会将他们的数据用于AI模型训练或与他人分享。Google将在WorkspaceforEducation账户上提供额外的Gemini隐私保护,无需额外付费。这个计划将为教育工作者和学生提供更安全和私的学习环境,同时Chromebooks的无障碍功能也将为视力障碍或低视力的人士提供更好的使用体验。
谷歌在其2024年GoogleI/O大会上宣布,Gmail将获得一次AI升级。根据谷歌的介绍,Gmail用户能够利用其GeminiAI技术搜索、总结和起草邮件。Gemini1.5Pro将作为一个可选升级在WorkspaceLabs中提供,供那些想要尝试其的用户使用。
Google正在更新Android的Gemini,以使其AI能够更好地了解屏幕上的内容。这次更新将使Gemini发挥出其最佳例之一,即在用户日常生活中帮助他们理解有限的数据。谷歌的Gemini在Android上的更新将在未来几个月内向“数亿设备”推出,并且还有更多上下文功能正在开发中。
谷歌计划将其GeminiAI技术直接嵌入到Chrome浏览器的桌面中。在谷歌于本周二举行的I/O大会上,宣布Chrome126版本将采用GeminiNano来为浏器内的AI功能提供支持,包括文本生成等功能。与Edge浏器的Copilot相比,GeminiNano在本地设备上运行,提供更快速和隐私保护的AI体验。
谷歌在其I/O大会上大肆宣传其Gemini接管搜索,但其中一个最引人注目的演示再次暴露了迄今为止所有大型语言模的一个致命缺陷:自信满满地给出错误答案。在“Gemini时代的搜索”展示片段中,谷演示了视频搜索功能,允许你通过对视频剪辑说话进行搜索。)这已经是谷歌第二次展示自家AI给出错误答案的炫酷展示素材了——去年,Bard聊天机器人自信满满地谎称詹姆斯韦伯太空望远镜是第一个拍摄到太阳系外行星的望远镜。
昨天被OpenAI提前截胡的谷歌,今天不甘示弱地开启反击!大杀器ProjectAstra效果不输GPT-4o,文生视频模型Veo硬刚Sora,用AI彻底颠覆谷歌搜索,Gemini1.5Pro达到200万token上下文……谷歌轰出一连串武器,对OpenAI贴脸开大。谷歌I/O2024如期来了,眼花缭乱地发布了一堆更新。在性能方面,全新的Gemma27B不仅超越了规模大了2倍还多的模型还能在GPU或单个TPU主机上高效运行。
今天凌晨,谷歌正式召开了I/O大会,宣布谷歌已全面进入Gemini时代。在一年前的I/O大会上,谷歌才首次发布Gemini大模型今年大模型、AI等已经成为了绝对的主角,甚至连新版安卓都没提。谷歌还称希望Gemini凭借其多模态、长上下文和智能体,使谷歌不断接近最终目标:让AI助力每个人。
GoogleI/O2024开发者大会在谷歌山景城总部附近的海岸线圆形剧场隆重开幕。在这场科技盛宴中,谷歌率先分享了Gemini大模型的最新突破。随着Gemini模型的进一步升级和扩展,我们有理由相信谷歌将继续引领AI技术的发展潮流,为开发者提供更加高效、智能的工具和平台。
在今天凌晨举行的I/O开发者大会上,谷歌表示即将推出Android15,并且还剧透了一些新功能。会上谷歌宣布,为安卓系统引入AI诈骗电话检测功能,在通话中提醒可能存在的诈骗行为,并鼓励用户结束此类通话。目前还不知道这项诈骗检测功能将于何时推出,但谷歌表示该功能默认禁用状态,需要用户手动启用才能生效,这应该是在等Android15系统。
北京时间今天凌晨1:00,GoogleI/O2024开发者大会在谷歌山景城总部附近的海岸线圆形剧场召开。谷歌率先介绍了Gemini大模型最新进展。除了能生成创意文本、代码外,Gemini1.5Pro最大的特色是能根据用户输入的文本提示,理解、总结上传的视频、音频内容进行深度总结。
谷歌在I/O大会上宣布,Android15已融入谷歌Gemini大模型,支持诸如AI语音助理防诈骗、画圈图片搜索、理解图片给出更符合用户需求的答案等功能,Android15Beta2将在明天正式推出。全新升级后的谷歌Gemini已经展现出较强的理解、推理、创作和实时互动能力,实现了对OpenAI多模态模型的全面超越。并且Android15支持短信和彩信应用以及预加载的RCS应用,以便使用卫星通信连接收发信息。