11.11云上盛惠!海量产品 · 轻松上云!云服务器首年1.8折起,买1年送3个月!超值优惠,性能稳定,让您的云端之旅更加畅享。快来腾讯云选购吧!
Chrome团队宣布,正在探索“内置AI”概念,即浏览器将具有内置AI模型,以便为浏览器功能和网络平台API启用设备上的AI。官方介绍称,借助内置AI,您的网站或Web应用将能够针对基础模型和专家模型运行各种AI任务无需担心部署和管理上述模型。这意味着您的网站和Web应用可以离线使用或采用可变连接方式,按预期运行。
全球数百万用户陷入困境,因为OpenAI的旗舰聊天机器人ChatGPT在美东时间4日下午出现系统故障,持续时间长达近8个小时。这一事件影响到了ChatGPT的所有用户,包括网站、APP和桌面应用,让用户无法正常使用这一关键工具。值得注意的是,ChatGPT在过去90天内发生了十几次中断,但通常在不到一个小时的时间内就得到了解决,周二的故障是最严重的一次。
英伟达的RTXRemixmodders最近推出了与Comfyui兼容的新节点,这标志着游戏模组制作和资源增强方面的一大进步。通过这个新节点,模组制作者现在可以直接在Comfyui界面中对已有的游戏资产进行放大和重新绘制,这大大简化了游戏资源的编辑和升级过程。通过不断开放RTXRemix平台,NVIDIA希望能够激励全球的模组制作者创作出更多令人惊叹的RTX重新制作作品,推动游戏社区的创新和发展。
Opera浏览器近日宣布将Google的GeminiAI模型整合到其现有的AriaAI扩展中,为用户提供更多最新信息和更多对话响应。Aria是Opera去年发布的AI助手,可以回答用户查询、编写代码和执行其他任务。Opera浏览器与Google的GeminiAI模型的集成使得用户可以通过Aria获得更多最新信息,并以对话方式与AI助手交流,为用户提供更加便捷和智能的浏览体验。
GoogleLLC的ChromeOSChromebookPlus笔记本电脑系列今日收到内置人工智能更新Gemini,将协助用户撰写、编辑和提升其照片效果。ChromebookPlus全面获得新功能,将帮助用户更好地利用其手机、掌控日程并提高工作效率。这将允许用户创建演示或反应GIF,因此他们可以为说明或技术支持快速轻松地制作解释GIF,其他用户也可以创建有趣的表情包。
经过与GoogleCloud的合作,今日Aria宣布融入了Google的Gemini模型,为其AI浏览器带来了一次重大升级。Aria作为自家ComposerAI引擎的驱动,以其与50多个模型系列共计150多个本地LLM变体的支持著称。值得关注的本地LLM项目还包括CodeLlama,Phi-2和Mixtral等,它们将在AI社区中继续发挥重要作用,推动人工智能技术的不断进步和创新。
LLama3-V模型正式发布,这是一种全新的SOTA开源VLM模型。LLama3-V不仅优于LLaVA在与GPT4-V、GeminiUltra、ClaudeOpus相比的性能表现上也不逊色,同时模型体积只有它们的1/100。这一消息让人兴奋不已,相信随着LLama3-V的问世,将会给人工智能领域带来全新的发展和突破。
当魔性表情包被放进短视频,其传播效果是否会加倍?最近,一种被大家喊作“猫meme”的短视频风靡全网。不只是个人创作者,甚至很多企业官方账号都制作起了猫meme短视频,通过猫咪以及其他动物夸张、生动的表情包来展示自己想要表达的情绪和信息。创作者需要在视频制作方式和趣味性上下功夫,以拉近与观众的距离,吸引更多观众自发参与视频的创作和传播过程,从中�
Google在I/O2024大会上宣布的一项新功能——Gemini,已在GoogleMessages应用中向稳定用户广泛推出。这项新功能紧随GeminiAdvanced中的Gemini1.5Pro和YouTubeMusicGeminiExtension等最近推出的功能。这次更新标志着Google在提升用户交互体验方面的持续努力,通过引入Gemini功能,GoogleMessages用户将能够享受到更加丰富和个性化的通信体验。
苹果将于WWDC2024上首次分享自己的人工智能故事,预计推出包括与OpenAI的合作伙伴关系在内的基本人工智能功能。据彭博社的马克・古尔曼在PowerOn时事通讯中透露,这些功能可能包括AI生成的表情符号和语音备忘录的自动生成转录等。还有传言称iPhone的主屏幕布局也将有所改变,用户可以自由排列应用图标不再受iOS强制的从上到下、从左到右的排列方式限制。
随着Temu的入局,“半托管”正成为今年跨境电商最火热的主题。今年3月15日,Temu在最大市场之一美国试行半托管模式,并启动多个类目的招商。半托管模式之后,Temu们仍然需要找到新的模式框架,为“不可能三角”找到更多答案,才能在不断变化的市场环境中“站位消费者”,并为自身和商家创造更大增量价值。
表情符号爱好者们有福了!Unicode联盟在其官方网站上发布了一些即将到来的表情符号示例,预示着iOS和Android设备上很快将增添更多有趣的表情。其中最引人注目的新表情符号之一,是带有眼袋的眼睛表情。随着技术的不断进步和文化的多元化,表情符号已经成为跨越语言和文化差异的全球通用语言。
苹果公司有望在iOS18.4更新中,为用户带来一系列全新的Emoji表情。根据UnicodeConsortium的最新动态,Unicode16版本的测试评审期已经开启,并将持续至7月2日。上一次苹果引入新表情符号是在2024年3月发布的iOS17.4更新中,当时新增的表情符号包括青柠、可食用棕色蘑菇、凤凰、断裂的链条、垂直点头和水平摇头等。
【新智元导读】杀疯了!一夜之间,全球最强端侧多模态模型再次刷新,仅用8B参数,击败了多模态巨无霸GeminiPro、GPT-4V。其OCR长难图识别刷新SOTA,图像编码速度暴涨150倍。我们也将持续回报社区,开源更多优秀模型、数据、infra工具等,将开源开放的星火播撒世界协作创新之苍穹。
这些天的硅谷,乱成了一锅粥。OpenAICEO山姆-奥特曼直接在社交平台公开嘲讽谷歌的审美过于差劲,他表示:我努力不去过多思考我们的竞争对手,但我无法不去思考OpenAI和谷歌之间的美学差异。哪怕到了AI时代,这个法则也同样适用。
【新智元导读】I/O大会上,谷歌Gemini1.5Pro一系列更新让开发者们再次沸腾。最新技术报告中,最引人注目的一点是,数学专业版1.5Pro性能碾压GPT-4Turbo、Claude3Opus,成为全球最强的数学模型。对于GPT-4Turbo来说,随着提供的图像增多,其准确性反下降更多细节参见最新技术报告。
这届企业官号,终于癫成了00后想要的样子。在抖音、B站、小红书等平台,不少企业/品牌的官号被00后运营接管,一改往日的内容风格,加入猫meme视频大军。随着一批又一批年轻消费者出现,品牌官号勇闯互联网的故事或许也将越来越新颖有趣。
GoogleDeepMind发布了一份长达150页的技术报告,详细介绍了Gemini1.5Pro和Gemini1.5Flash两个模型的性能特点和架构以及这个多模态大型模型的最新进展。Gemini1.5于今年2月上线,通过工程优化、MoE架构等策略显著提升了性能和速度。Gemini1.5的技术报告展示了谷歌在大型多模态模型领域的最新进展,其性能的提升和应用潜力为未来的AI技术发展提供了新的方向。
【新智元导读】OpenAI半小时的发布会让很多人第一反应是直呼「失望」,但随着官网放出更多demo以及更多网友开始试用,大家才发现GPT-4o真的不可小觑,不仅在各种基准测试中稳拿第一有很多发布会从未提及的惊艳功能。OpenAI在发布会上官宣GPT-4o之后,各路大神也开始了对这个新模型的测评,结果就是,GPT-4o在多项基准测试上都展现了SOTA的实力。随着大模型之战愈演愈烈,相信对于开源和闭源的激烈讨论依旧会持续下去。
正如不是所有的淘金者都能满载归,一无所获往往是多数。作为机器人产业链中的AI技术企业,INDEMIND在行业整体迅猛发展的过程中,已经成为先行者。
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解:https://top.aibase.com/1、李彦宏:百度搜索已有11%结果由AI生成在百度2024年第一季度财报电话会上,百度创始人李彦宏深入探讨了公司的业务表现和未来发展方向,强调人工智能技术对用户体验的推动�
Google即将向学校提供GeminiAI,并专门针对教育工作者和年满18岁的学生提供服务,承诺会将他们的数据用于AI模型训练或与他人分享。Google将在WorkspaceforEducation账户上提供额外的Gemini隐私保护,无需额外付费。这个计划将为教育工作者和学生提供更安全和私的学习环境,同时Chromebooks的无障碍功能也将为视力障碍或低视力的人士提供更好的使用体验。
谷歌推出了一款名为PaliGemma的开源视觉语言模型,该模型结合了图像处理和语言理解的能力,旨在支持多种视觉语言任务,如图像和短视频字幕生成、视觉问答、图像文本理解、物体检测、文件图表解读以及图像分割等。PaliGemma的关键特点:多任务支持:PaliGemma能够处理多种视觉语言相关的任务,提供广泛的应用场景。开源的特性意味着PaliGemma可以被社区广泛地使用、改进和集成到各种产品和服务中。
上传一张图片,点击黏土特效,你将收获一张“小羊肖恩”风格的全新卡通照,无论是图片里的人、物、景,每个细节都如同黏土捏得一样立体。黏土特效在社交平台风靡,拥有该功能的AI修图应用程序Remini也随即收获了下载量。随着AI生图模型开始进入手机应用时,这样的试炼将反向检测底层模型的扎实度,我们也期待更多的测试能让模型们更优质。
谷歌在其2024年GoogleI/O大会上宣布,Gmail将获得一次AI升级。根据谷歌的介绍,Gmail用户能够利用其GeminiAI技术搜索、总结和起草邮件。Gemini1.5Pro将作为一个可选升级在WorkspaceLabs中提供,供那些想要尝试其的用户使用。
Google正在更新Android的Gemini,以使其AI能够更好地了解屏幕上的内容。这次更新将使Gemini发挥出其最佳例之一,即在用户日常生活中帮助他们理解有限的数据。谷歌的Gemini在Android上的更新将在未来几个月内向“数亿设备”推出,并且还有更多上下文功能正在开发中。
谷歌计划将其GeminiAI技术直接嵌入到Chrome浏览器的桌面中。在谷歌于本周二举行的I/O大会上,宣布Chrome126版本将采用GeminiNano来为浏器内的AI功能提供支持,包括文本生成等功能。与Edge浏器的Copilot相比,GeminiNano在本地设备上运行,提供更快速和隐私保护的AI体验。
谷歌在其I/O大会上大肆宣传其Gemini接管搜索,但其中一个最引人注目的演示再次暴露了迄今为止所有大型语言模的一个致命缺陷:自信满满地给出错误答案。在“Gemini时代的搜索”展示片段中,谷演示了视频搜索功能,允许你通过对视频剪辑说话进行搜索。)这已经是谷歌第二次展示自家AI给出错误答案的炫酷展示素材了——去年,Bard聊天机器人自信满满地谎称詹姆斯韦伯太空望远镜是第一个拍摄到太阳系外行星的望远镜。
昨天被OpenAI提前截胡的谷歌,今天不甘示弱地开启反击!大杀器ProjectAstra效果不输GPT-4o,文生视频模型Veo硬刚Sora,用AI彻底颠覆谷歌搜索,Gemini1.5Pro达到200万token上下文……谷歌轰出一连串武器,对OpenAI贴脸开大。谷歌I/O2024如期来了,眼花缭乱地发布了一堆更新。在性能方面,全新的Gemma27B不仅超越了规模大了2倍还多的模型还能在GPU或单个TPU主机上高效运行。