11.11云上盛惠!海量产品 · 轻松上云!云服务器首年1.8折起,买1年送3个月!超值优惠,性能稳定,让您的云端之旅更加畅享。快来腾讯云选购吧!
本文汇总了AI领域最新动态:1)Cursor Pro取消500次请求限制;2)稀宇科技推出视频生成模型Hailuo02;3)谷歌发布轻量级AI模型Gemini2.5Flash-Lite;4)科大讯飞星火X1升级版7月上线;5)腾讯元宝推出AI编程模式;6)OpenAI将下架GPT-4.5 API;7)苹果Speech API转录速度超Whisper 55%;8)百度推出数字人互动直播间;9)Meta曾试图高薪挖角OpenAI人才;10)Krea1公测开放,解决"AI感"问题;11)特斯拉Grok车载AI助手即将上线;12)谷歌Gemini新增视频分析功能。
谷歌在I/O开发者大会上发布第三代视频生成模型Veo+3,对标OpenAI的Sora。该模型不仅能基于文本和图像生成高质量视频,还能为人物对话、鸟鸣等场景自动匹配音效,实现更逼真的视听体验。目前Veo+3面向美国Gemini Ultra订阅用户,月费249.99美元,并将纳入企业级Vertex AI平台。谷歌同期还发布了升级版图像模型Imagen 4、电影制作工具Flow等AI产品。值得注意的是,谷歌在AI图像生成领域并非一帆风顺,此前Imagen 3曾因生成含历史错误的图像引发争议。
新版AI模型缩短了响应时间,节约了运算成本;还推出了新的AI芯片“Ironwood”。谷歌发布了新的AI模型“Gemini2.5Flash”,据称,这款AI模型的性能比OpenAI和DeepSeek的AI产品“更高效”。谷歌计划在三星今年上半年推出的AI伴侣机器人Ballie上搭载生成式AI模型。
谷歌正式推出Gemini2.5系列。作为该系列的首发版本,实验版Gemini2.5Pro在多项基准测试中均达到最先进水平,并以显著优势登顶LMArena排行榜首位。?在不采用多数投票等增加计算成本的测试阶段技术情况下?,该模型已在GPQA与2025年AIME等数学与科学类基准测试中排名榜首。
在DeepSeek的强烈攻势下,这次轮到谷歌坐不住了。该公司全面发布Gemini2.0Flash、Gemini2.0Flash-Lite以及新一代旗舰大模型Gemini2.0Pro实验版本,并且还在GeminiApp中推出了其推理模型Gemini2.0FlashThinking。我们一直在等的大模型技术革命,已经在很多领域出现了。
今年10月,OpenAI高级研究科学家、德扑AI之父NoamBrown,曾在美国旧金山举办的TEDAI大会上提出了一个惊人的理论——让AI模型思考20秒所带来的性能提升,相当于将模型扩大100,000倍并训练100,000倍的时间。Noam所指的技术便是System1/2thinking,也是OpenAI最新模型o1正在使用的技术。这种分工执行使得AIAgent能够同时处理快速的对话和复杂的规划,极大提高了用户体验。
谷歌DeepMind的研究人员提出了一种创新多轮强化学习方法——SCoRe。多数大模型不具备自我纠错或能力较差,尤其是在数学和代码领域在给出错误答案后,会一直坚持错误答案,影响模型的准确率。其自我纠正能力分别提升了15.6%和9.1%。
今天谷歌正式推出了Pixel9系列手机,搭载了一系列的AI功能,知名苹果爆料人马克古尔曼不禁感叹:很难相信苹果在AI领域至少落后了2-3年。”谷歌的新款Pixel9系列手机最引人注目的是其语音助手GeminiLive,该功能与苹果的Siri形成直接竞争。谷歌此次发布新款手机的时间也值得关注,通常在10月发布新品的谷歌,这次选择在9月苹果新机发布前推出,也显示出其在AI手机市场的先发制人策略。
随着GPT-4o、Gemini等多模态大模型的出现,对训练数据的需求呈指数级上升。无论是自然语言文本理解、计算机视觉还是语音识别,使用精心标注的数据集能带来显著的性能提升,同时大幅减少所需的训练数据量。JEST在多个任务上都取得了显著的数据筛选效率,例如,当过滤90%的数据时,JEST仅需使用6700万样本即可达到传统方法使用30亿样本的性能水平,相当于效率提升13倍和算力降低了10倍,同时还能帮助大模型提升大约6%的性能。
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解:https://top.aibase.com/1、谷歌发布全新Gemma22B模型,性能超越GPT-3.5-Turbo与Mixtral-8x7B谷歌推出了性能卓越的Gemma22B模型,拥有20亿参数,在多种硬件环境下表现优异。报告提出多项建议,包括责任从分发未�