AI日报：谷歌Gemini引入类GPTs功能Gems；DeepMind推AI实时渲染引擎GameNGen；一男子用AI合成视频造谣被抓；OpenAI推神秘加速器Converge 2

2024-08-29 14:58 · 稿源：站长之家

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解:https://top.aibase.com/

1、谷歌推定制化聊天机器人 “Gem”，让你创建专属AI虚拟助手

谷歌正式推出Gemini订阅用户可定制聊天机器人Gem，满足个性化需求。Gem支持健身伙伴、烹饪助手、写作编辑等功能，用户通过简单指令赋予机器人独特人格。Gem覆盖150多个国家和地区，提供多种现成Gem选择，增强用户互动体验。Gem的推出是谷歌追赶OpenAI的举措，为用户提供更多选择和灵活性。

【AiBase提要:】
🌟 谷歌推出Gemini订阅用户可定制聊天机器人Gem，满足个性化需求。
🤖 Gem提供多种现成选择，包括学习教练、创意伙伴等，增强用户互动体验。
🌍 Gem支持150多个国家和地区，覆盖大多数语言，为用户提供更广泛的服务。

2、Google DeepMind推出AI实时渲染引擎GameNGen，玩家操作即刻生成画面

Google DeepMind最新推出的游戏引擎GameNGen颠覆了传统游戏图像生成方式，实时生成游戏画面，质量高且逼真，为游戏开发带来全新可能性。

【AiBase提要:】
🎮 实时生成游戏画面:GameNGen能根据玩家操作即时创造下一帧游戏画面，展示AI技术强大之处。
🚀 高质量画面模拟:画面几乎以假乱真，玩家难以察觉是AI生成，展示技术实力。
🔮 深远影响游戏产业:提升开发效率、个性化游戏体验、创造无限变化的游戏世界，改变硬件需求与创作方式。
详情链接:https://gamengen.github.io/

3、大动作!Midjourney确认进军硬件领域，强势开启招募新团队

Midjourney宣布进军硬件市场，引发业界关注。公司招募新团队成员，前苹果工程经理将领导硬件部门。竞争加剧，Midjourney更新用户界面并提供免费图像生成服务。AI硬件市场前景不确定，但行业发展仍具潜力。

【AiBase提要:】
🔍 Midjourney宣布正式进军硬件领域，招新团队成员。
🚀 前苹果工程经理Ahmad Abbas将领导硬件部门，产品形态尚未公开。
🆚 Midjourney更新用户界面，向所有用户提供免费图像生成服务。

4、揭秘OpenAI神秘加速器Converge2，低调背后暗藏玄机?

本文揭示了OpenAI的Converge2加速器计划的神秘面纱，探讨其低调运作背后的潜在秘密。文章透露了Open AI Startup Fund的投资动向，以及新加入的公司，展现了OpenAI在科技领域的影响力和活动。参与者能够接触到OpenAI的未发布技术，引发人们对其内部操作的猜测和关注。

【AiBase提要:】
🕵️‍♂️ 神秘加速器: Converge2计划的神秘面纱，为何保持沉默?
💸 资金动态: Open AI Startup Fund的投资动向，以及新加入的公司。
🤖 技术接触: 参与者能够接触到OpenAI的哪些未发布技术?

5、苹果最新iOS更新引AI照片魔法消除功能

苹果最新发布的iOS更新引入了令人瞩目的AI消除功能，让用户可以轻松删除照片中不需要的物体，提升照片编辑体验。这一功能与谷歌的魔法橡皮擦功能相似，展示了苹果在AI技术方面的创新。除了照片消除功能，苹果还推出了一系列智能化功能，如写作工具、通知摘要等，提升用户设备体验。用户可期待更多AI技术创新。

【AiBase提要:】
🌟 用户可一键删除照片中的不需要物体，提升照片编辑效率。
🖼️ AI技术自动生成背景，保证照片质量不受影响，提升编辑体验。
📱 功能目前仅限美国英文用户，期待更多地区上线，拓展用户群。

6、无惧放大镜找茬!DiPIR可无缝地在真实环境中插入任何虚拟物体

DiPIR是一项创新技术，旨在解决将虚拟物体无缝插入真实场景的技术难题。其独特工作原理结合了扩散模型和逆向渲染过程，精确恢复场景光照信息，使虚拟物体与环境自然融合。

【AiBase提要:】
⚙️ 结合扩散模型和逆向渲染，精确恢复场景光照信息，解决技术难题。
🌟 适用广泛，处理不同光照条件下的场景，生成逼真图像。
🔮 支持动态场景插入物体和多视角合成虚拟物体，应用前景广阔。
详情链接:https://research.nvidia.com/labs/toronto-ai/DiPIR/

7、太扯!一男子用AI合成视频造谣被抓，AI造假后果很严重

近期发生的一起事件再次提醒我们，利用AI技术合成虚假内容可能带来严重后果。一名男子利用AI技术合成视频发布虚假信息，结果被警方抓获，警示我们在使用AI工具时要谨慎小心，避免造成不良影响。

【AiBase提要:】
🚨 利用AI技术合成虚假内容已经成为常态，警示我们警惕虚假信息的传播
💡 事件中男子利用AI技术合成视频发布不实信息，最终被警方抓获
💰 男子的行为不仅引发社会关注，还涉嫌寻衅滋事罪，AI造假后果严重
详情点此查看：https://www.aibase.com/zh/news/11368

8、OpenAI 最新融资计划曝光:估值超过1000亿美元

OpenAI 正在进行新一轮的融资谈判，预计估值将超过1000亿美元，引发人们对这家人工智能公司的关注。这轮融资将为 OpenAI 提供更多资金支持，推动技术研发与市场推广。公司计划拓展与各行业的合作，推动人工智能在多个领域的应用。

【AiBase提要:】
🌟 OpenAI 正在进行新一轮融资，预计估值将超过1000亿美元。
🚀 此轮融资将为 OpenAI 提供更多资金，支持技术研发与市场推广。
🤝 OpenAI 计划拓展与各行业的合作，推动人工智能在多个领域的应用。

9、英伟达财报逆市上扬:AI热潮推动营收飙升122%

英伟达最新财报显示，收入达300.4亿美元，年增122%，超出市场预期。尽管股价下跌，但英伟达在 AI 芯片市场的领先地位依旧稳固。投资者对英伟达的期待高涨，但AI投资尚未带来显著利润回报，未来发展仍需观察。

【AiBase提要:】
🌟 英伟达收入达300.4亿美元，年增122%，超预期。
💻 数据中心收入同比增长154%，反映出AI需求强劲。
📉 尽管股价下跌，英伟达在AI芯片市场领先地位稳固。

10、iPhone17系列或搭载12GB RAM:AI大模型部署更轻松

iPhone17系列有望搭载12GB RAM，为部署更大规模的端侧AI大模型提供充足空间。这一升级将满足未来AI技术发展需求，引领智能手机市场技术革新。

【AiBase提要:】
📱12GB RAM将为更大规模AI大模型提供充足空间，解决内存容量不足问题。
🚀 iPhone17预期升级是对AI技术发展的积极响应，精准把握智能手机市场趋势。
💡 智能手机内存容量成为性能重要指标，iPhone17的12GB RAM配置预示技术革新、智能未来

11、PPT高手来了!Plus AI智能演示文稿助手

在当今快节奏的商业和教育环境中，高效率的演示文稿制作工具变得越来越重要。Plus AI作为新兴的人工智能驱动型演示文稿制作工具，近期引起了业界的关注。该工具简化了演示文稿的创建和编辑过程，适用于PowerPoint和Google Slides等主流平台。

【AiBase提要:】
🚀 文本转演示模式:用户只需输入文本，AI即可生成相应演示文稿，便利快速可视化大量信息。
💡 多格式转换:支持将PDF和Word等文档直接转换为演示文稿，增加文件处理灵活性。
🎨 预设模板和辅助功能:提供数百种模板，运行于PowerPoint和Google Slides，支持共享主题和自定义指令，保持演示风格一致。
详情链接:https://top.aibase.com/tool/plus-ai

（举报）

相关推荐

关键词：

Gemini

当GPT-5遇上Gemini 2.5，谁更适合你的业务？这份对比报告说了算

某跨境电商CTO复盘会上展示：GPT-5 Standard处理百万级商品描述时，费用比Gemini 2.5 Flash-Lite高35%，响应速度慢0.8秒。大模型选型面临参数迷雾、场景错配、隐藏成本三重困境。AIbase选型对比平台通过真实数据测试，提供透明价格拆解和性能雷达图，帮助规避预算陷阱。实测显示GPT-5在合同逻辑分析准确率高3.2%，而Gemini表格解析速度快40%、月总成本低26%。工具可动态追踪官方调价，生成定制化决策报告，用数据替代经验主义，提升技术选型效率。

大模型选型参数迷雾场景错配
谷歌透露Gemini每次回答消耗能量：相当于微波炉运行1秒钟

近日，谷歌发布了一份技术报告，详细说明了其Gemini大模型在每次查询中消耗的能源量。据谷歌介绍，这是迄今为止大型人工智能公司发布的最透明估算，也是研究人员期待已久的报告。报告称，Gemini应用的文字回答平均每次消耗0.24瓦特小时（Wh）的能量，大约相当于运行微波炉一秒钟，并排放0.03克二氧化碳当量。据此前媒体报道，谷歌近日发布Gemini系列最轻量版本Gemma 3

谷歌 Gemini大模型能源消耗
豆包1.5轻量版 vs Gemini 2.5闪存版：生成5000字深度文章，哪个模型更合适？

AIbase选型工具通过多维度数据对比，帮助用户精准选择AI模型。文章以豆包和Gemini为例，展示平台如何解决模型选型痛点：自动生成对比报告，评估关键指标如术语准确性、本土案例适配度等。实际案例显示，使用该工具后内容团队效率提升40%，编辑成本下降65%。核心价值在于用数据驱动决策，规避局部优势导致的全局误判，实现场景化精准匹配。

文章搜索核心标签 AI选型
Gemini 2.5 Flash-Lite与 DeepSeek-V3 深度对比：谁在性价比上更胜一筹？

面对琳琅满目的大模型API，开发团队常陷入选择困境。文章指出，2024年既是机遇也是挑战的时代，闭源模型选择丰富但性能与成本平衡复杂。通过AIbase等数据驱动平台进行客观对比至关重要。以Gemini 2.5 Flash-Lite和DeepSeek-V3为例，前者综合能力强适合多语言场景，后者在代码生成和成本控制上优势明显。建议开发者明确需求，通过实际测试验证模型表现，理性选择最适合的方案。

大模型API 模型选型 AI开发
别再猜了！手把手教你用数据选择AI模型，我的Gemini 2.5 Flash-Lite vs DeepSeek选型心得

开发者分享模型选择心路历程：从盲目试错到数据驱动。曾因追求低价模型导致成本飙升，后通过AIbase平台对比Gemini 2.5 Flash-Lite和DeepSeek-V3，基于价格、上下文长度和代码能力等数据，最终选择更适合代码生成任务的DeepSeek-V3。强调没有“最好”的模型，只有“最适合”的模型，建议开发者善用专业工具进行数据驱动决策，避免隐性成本。
自研遇阻！苹果考虑用谷歌Gemini升级Siri

苹果正与谷歌就使用Gemini AI引擎为新一代Siri提供技术支持进行初步谈判，这一动向表明苹果可能进一步将人工智能能力外包，成为其AI战略的关键一步。据知情人士透露，这家iPhone制造商近期已与Alphabet旗下谷歌接触，商讨合作构建一款定制化AI模型，以用于明年预计推出的新版本Siri。谷歌目前已开始训练一款可在苹果服务器上运行的模型。苹果在生成式人工智能领域起步�

苹果谷歌 Siri
荐AI日报：字节视频模型Waver 1.0发布；百度AI搜索APP“梯子AI”发布；谷歌推全新Gemini 2.5 Flash图像编辑模型

本文汇总了AI领域最新动态：谷歌推出Gemini 2.5 Flash图像编辑模型，字节发布Waver 1.0视频生成工具；百度“梯子AI”提供无广告搜索；文心快码新增终端编码功能；腾讯游戏VISVISE工具集提升动画制作效率；自动驾驶配送机器人RM5进军外卖行业；DeepSeek V3.1出现字符Bug已修复；谷歌翻译升级实时同传和AI陪练；全球首现AI勒索软件PromptLock威胁网络安全；Anthropic推出Chrome浏览器AI助手Claude。

AI Gemini 2.5
Google Gemini vs Deepseek：谁更适合你的业务场景？AI大模型选型终极对比指南

企业在选择大模型时面临两难：国际大厂的Gemini技术先进，但国内DeepSeek性价比突出。AIbase平台通过真实场景测试数据指出：1）跨境电商客服场景中，Gemini多语言识别准确率提升12%，但需注意API延迟问题；2）金融研报分析场景下，DeepSeek支持128K长文本且成本仅为Gemini的1/3。决策关键：抛开参数迷雾，聚焦成本、响应速度、语言支持和场景匹配四大维度。AIbase提供可视化对比工具，3分钟生成专属选型报告，让技术决策不再玄学。

大模型选型 Gemini对比DeepSeek LLM评测
iPad mini对比完败！华为MatePad Mini明天发布价格曝光或3999元起

明天华为要举行新品发布会，除了新的三折叠屏手机外，还有MatePad Mini。现在，有博主曝光了华为MatePad Mini不同内存版本的价格，具体来说：12GB 256GB售价为3999元；12GB 512GB售价为4499元；12GB 512GB柔光版售价为4999元。汇总之前曝光的消息，华为MatePad Mini将推出多个版本，包括标准版、柔光版（配备防眩光屏幕，适合手写笔创作）、插卡版（支持5G网络和通话功能）、read版”（�

华为MatePad Mini 三折叠屏手机
34Q9 垂直整合重塑 Mini LED 格局

2025年9月1日，雷鸟推出34Q9 Mini LED电竞显示器，定价3999元。该产品采用2304分区Mini LED背光和HVA面板，实现1ms响应速度和4000:1对比度，精准切入3000-4000元市场空档。凭借华星光电供应链优势，产品在画质、色域（97% DCI-P3）及多设备兼容性（90W Type-C）上表现突出，覆盖电竞玩家、内容创作者和多设备用户三大群体。业界认为该产品可能重塑中高端显示器市场格局，加速Mini LED技术普及。

今日大家都在搜的词：

热文

3 天
7天

AI日报：谷歌Gemini引入类GPTs功能Gems；DeepMind推AI实时渲染引擎GameNGen；一男子用AI合成视频造谣被抓；OpenAI推神秘加速器Converge 2

当GPT-5遇上Gemini 2.5，谁更适合你的业务？这份对比报告说了算

谷歌透露Gemini每次回答消耗能量：相当于微波炉运行1秒钟

豆包1.5轻量版 vs Gemini 2.5闪存版：生成5000字深度文章，哪个模型更合适？

Gemini 2.5 Flash-Lite与 DeepSeek-V3 深度对比：谁在性价比上更胜一筹？

别再猜了！手把手教你用数据选择AI模型，我的Gemini 2.5 Flash-Lite vs DeepSeek选型心得

自研遇阻！苹果考虑用谷歌Gemini升级Siri

荐AI日报：字节视频模型Waver 1.0发布；百度AI搜索APP“梯子AI”发布；谷歌推全新Gemini 2.5 Flash图像编辑模型

Google Gemini vs Deepseek：谁更适合你的业务场景？AI大模型选型终极对比指南

iPad mini对比完败！华为MatePad Mini明天发布价格曝光或3999元起

34Q9 垂直整合重塑 Mini LED 格局

今日大家都在搜的词：

热文

雷军凌晨3点就奔赴阅兵观礼台佩戴小米AI眼镜前往

AI日报：腾讯开源3D世界模型HunyuanWorld-Voyager；即梦AI系列

人去世了朋友圈会消失？微信客服回应：建议保持账号活跃

腾讯回应被米哈游起诉：没正式程序不能违规提供QQ用户资料

《亮剑》开播20周年：今日全弹幕重返B站

蜜雪冰城上半年净赚27亿：全球门店破5.3万家加速全球化布局

小米澎湃OS 3超级岛适配应用公布加速推进多场景适配

AI日报：抖音打击AI技术滥用行为；OpenAI 收购开发数据分析平台

曝苹果Vision Air头显2027年登场：售价腰斩重量更轻

雷军凌晨3点就奔赴阅兵观礼台佩戴小米AI眼镜前往

首发iPhone 17系列！苹果Apple Store官方旗舰店入驻抖音商城

华为MatePad Mini外观公布支持蜂窝网络通话功能

AI日报：AI内容新规正式生效；美团推出开源大模型LongCat；阶跃

AI日报：腾讯开源3D世界模型HunyuanWorld-Voyager；即梦AI系列

人去世了朋友圈会消失？微信客服回应：建议保持账号活跃

苹果新增三款过时产品 iPhone 8 Plus被列为复古产品

腾讯回应被米哈游起诉：没正式程序不能违规提供QQ用户资料

抖音升级AI内容标识功能上线两项核心功能

小米汽车8月交付量超3万台全年交付量有望冲击42万

站长商机