首页 > 业界 > 关键词  > Gemini最新资讯  > 正文

AI日报:谷歌Gemini引入类GPTs功能Gems;DeepMind推AI实时渲染引擎GameNGen;一男子用AI合成视频造谣被抓;OpenAI推神秘加速器Converge 2

2024-08-29 14:58 · 稿源:站长之家

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解:https://top.aibase.com/

1、谷歌推定制化聊天机器人 “Gem”,让你创建专属AI虚拟助手

谷歌正式推出Gemini订阅用户可定制聊天机器人Gem,满足个性化需求。Gem支持健身伙伴、烹饪助手、写作编辑等功能,用户通过简单指令赋予机器人独特人格。Gem覆盖150多个国家和地区,提供多种现成Gem选择,增强用户互动体验。Gem的推出是谷歌追赶OpenAI的举措,为用户提供更多选择和灵活性。

image.png

【AiBase提要:】

🌟 谷歌推出Gemini订阅用户可定制聊天机器人Gem,满足个性化需求。

🤖 Gem提供多种现成选择,包括学习教练、创意伙伴等,增强用户互动体验。

🌍 Gem支持150多个国家和地区,覆盖大多数语言,为用户提供更广泛的服务。

2、Google DeepMind推出AI实时渲染引擎GameNGen,玩家操作即刻生成画面

Google DeepMind最新推出的游戏引擎GameNGen颠覆了传统游戏图像生成方式,实时生成游戏画面,质量高且逼真,为游戏开发带来全新可能性。

【AiBase提要:】

🎮 实时生成游戏画面:GameNGen能根据玩家操作即时创造下一帧游戏画面,展示AI技术强大之处。

🚀 高质量画面模拟:画面几乎以假乱真,玩家难以察觉是AI生成,展示技术实力。

🔮 深远影响游戏产业:提升开发效率、个性化游戏体验、创造无限变化的游戏世界,改变硬件需求与创作方式。

详情链接:https://gamengen.github.io/

3、大动作!Midjourney确认进军硬件领域,强势开启招募新团队

Midjourney宣布进军硬件市场,引发业界关注。公司招募新团队成员,前苹果工程经理将领导硬件部门。竞争加剧,Midjourney更新用户界面并提供免费图像生成服务。AI硬件市场前景不确定,但行业发展仍具潜力。

image.png

【AiBase提要:】

🔍 Midjourney宣布正式进军硬件领域,招新团队成员。

🚀 前苹果工程经理Ahmad Abbas将领导硬件部门,产品形态尚未公开。

🆚 Midjourney更新用户界面,向所有用户提供免费图像生成服务。

4、揭秘OpenAI神秘加速器Converge2,低调背后暗藏玄机?

本文揭示了OpenAI的Converge2加速器计划的神秘面纱,探讨其低调运作背后的潜在秘密。文章透露了Open AI Startup Fund的投资动向,以及新加入的公司,展现了OpenAI在科技领域的影响力和活动。参与者能够接触到OpenAI的未发布技术,引发人们对其内部操作的猜测和关注。

【AiBase提要:】

🕵️‍♂️ 神秘加速器: Converge2计划的神秘面纱,为何保持沉默?

💸 资金动态: Open AI Startup Fund的投资动向,以及新加入的公司。

🤖 技术接触: 参与者能够接触到OpenAI的哪些未发布技术?

5、苹果最新iOS更新引AI照片魔法消除功能

苹果最新发布的iOS更新引入了令人瞩目的AI消除功能,让用户可以轻松删除照片中不需要的物体,提升照片编辑体验。这一功能与谷歌的魔法橡皮擦功能相似,展示了苹果在AI技术方面的创新。除了照片消除功能,苹果还推出了一系列智能化功能,如写作工具、通知摘要等,提升用户设备体验。用户可期待更多AI技术创新。

【AiBase提要:】

🌟 用户可一键删除照片中的不需要物体,提升照片编辑效率。

🖼️ AI技术自动生成背景,保证照片质量不受影响,提升编辑体验。

📱 功能目前仅限美国英文用户,期待更多地区上线,拓展用户群。

6、无惧放大镜找茬!DiPIR可无缝地在真实环境中插入任何虚拟物体

DiPIR是一项创新技术,旨在解决将虚拟物体无缝插入真实场景的技术难题。其独特工作原理结合了扩散模型和逆向渲染过程,精确恢复场景光照信息,使虚拟物体与环境自然融合。

image.png

【AiBase提要:】

⚙️ 结合扩散模型和逆向渲染,精确恢复场景光照信息,解决技术难题。

🌟 适用广泛,处理不同光照条件下的场景,生成逼真图像。

🔮 支持动态场景插入物体和多视角合成虚拟物体,应用前景广阔。

详情链接:https://research.nvidia.com/labs/toronto-ai/DiPIR/

7、太扯!一男子用AI合成视频造谣被抓,AI造假后果很严重

近期发生的一起事件再次提醒我们,利用AI技术合成虚假内容可能带来严重后果。一名男子利用AI技术合成视频发布虚假信息,结果被警方抓获,警示我们在使用AI工具时要谨慎小心,避免造成不良影响。

image.png

【AiBase提要:】

🚨 利用AI技术合成虚假内容已经成为常态,警示我们警惕虚假信息的传播

💡 事件中男子利用AI技术合成视频发布不实信息,最终被警方抓获

💰 男子的行为不仅引发社会关注,还涉嫌寻衅滋事罪,AI造假后果严重

详情点此查看:https://www.aibase.com/zh/news/11368

8、OpenAI 最新融资计划曝光:估值超过1000亿美元

OpenAI 正在进行新一轮的融资谈判,预计估值将超过1000亿美元,引发人们对这家人工智能公司的关注。这轮融资将为 OpenAI 提供更多资金支持,推动技术研发与市场推广。公司计划拓展与各行业的合作,推动人工智能在多个领域的应用。

【AiBase提要:】

🌟 OpenAI 正在进行新一轮融资,预计估值将超过1000亿美元。

🚀 此轮融资将为 OpenAI 提供更多资金,支持技术研发与市场推广。

🤝 OpenAI 计划拓展与各行业的合作,推动人工智能在多个领域的应用。

9、英伟达财报逆市上扬:AI热潮推动营收飙升122%

英伟达最新财报显示,收入达300.4亿美元,年增122%,超出市场预期。尽管股价下跌,但英伟达在 AI 芯片市场的领先地位依旧稳固。投资者对英伟达的期待高涨,但AI投资尚未带来显著利润回报,未来发展仍需观察。

【AiBase提要:】

🌟 英伟达收入达300.4亿美元,年增122%,超预期。

💻 数据中心收入同比增长154%,反映出AI需求强劲。

📉 尽管股价下跌,英伟达在AI芯片市场领先地位稳固。

10、iPhone17系列或搭载12GB RAM:AI大模型部署更轻松

iPhone17系列有望搭载12GB RAM,为部署更大规模的端侧AI大模型提供充足空间。这一升级将满足未来AI技术发展需求,引领智能手机市场技术革新。

【AiBase提要:】

📱12GB RAM将为更大规模AI大模型提供充足空间,解决内存容量不足问题。

🚀 iPhone17预期升级是对AI技术发展的积极响应,精准把握智能手机市场趋势。

💡 智能手机内存容量成为性能重要指标,iPhone17的12GB RAM配置预示技术革新、智能未来

11、PPT高手来了!Plus AI智能演示文稿助手

在当今快节奏的商业和教育环境中,高效率的演示文稿制作工具变得越来越重要。Plus AI作为新兴的人工智能驱动型演示文稿制作工具,近期引起了业界的关注。该工具简化了演示文稿的创建和编辑过程,适用于PowerPoint和Google Slides等主流平台。

【AiBase提要:】

🚀 文本转演示模式:用户只需输入文本,AI即可生成相应演示文稿,便利快速可视化大量信息。

💡 多格式转换:支持将PDF和Word等文档直接转换为演示文稿,增加文件处理灵活性。

🎨 预设模板和辅助功能:提供数百种模板,运行于PowerPoint和Google Slides,支持共享主题和自定义指令,保持演示风格一致。

详情链接:https://top.aibase.com/tool/plus-ai

举报

  • 相关推荐
  • 全球优质AI语音大模型盘点:Whisper、Gemini Speech

    本文分析了当前主流AI语音大模型的核心优势与应用场景。全球顶尖模型包括:OpenAI Whisper(多语言识别与翻译)、Google Gemini(情感化语音生成)、Meta AudioCraft(音乐创作与风格转换)。国内讯飞星火(方言识别)、阿里通义(电商客服)、百度文心(车载场景)表现突出。技术突破点在于云端协同架构、零样本克隆和情感语音合成。选择模型需考虑语言支持、场景适配、部署

  • AI日报:美图发布影像AI Agent RoboNeo;1.8bit量化Kimi K2模型上线;亚马逊推AI代码编辑器 Kiro

    【AI日报】今日AI领域重要动态:1)美图推出RoboNeo,通过自然语言指令实现图片精修、品牌设计等全能影像处理;2)Unsloth AI将Kimi K2模型量化至1.8bit,体积缩减78%保持性能;3)谷歌Gemini嵌入模型登顶MTEB榜单,超越OpenAI;4)亚马逊发布免费AI代码编辑器Kiro,集成Claude模型;5)Claude新增应用工具目录功能提升工作效率;6)MiniMax完成近3亿美元融资,估值超40亿美元;7)UTCP新协议让AI代理直

  • 谷歌推出终端AI编程工具Gemini CLI Gemini CLI安装使用教程一览

    近日,谷歌在AI编程领域推出了一款备受瞩目的终端AI编程工具——Gemini CLI。这款免费开源的工具一经发布,便在开发者群体中引发了广泛关注,其强大的功能和免费开源的特性,使其在众多同类产品中脱颖而出,甚至让一些竞争对手如Claude Code相形见绌。 如果您对AI编程工具感兴趣,想要了解更多类似的产品,可以访问 [AIbase - 智能匹配最适合您的AI产品和网站](https://top.aiba

  • 「6月26日AI日报」可灵AI推全球首部AIGC单元剧;谷歌开源AI智能体Gemini CLI

    AI行业近期动态汇总:1)豆包AI编程升级为"应用创作1.0",支持可视化编辑和实时预览,降低开发门槛;2)谷歌开源Gemini CLI工具,集成Gemini 2.5 Pro模型,提供免费编程助手;3)Anthropic推出"Artifacts"功能,用户无需编程即可在Claude中创建AI应用;4)出门问问发布TicNote+硬件产品,内置Shadow AI技术;5)OpenAI将Codex CLI重构为Rust语言以提升性能;6)谷歌发布Imagen4文生图模型,突�

  • 最强Agent?3分钟看懂Kimi K2真的好用吗?

    Moonshot AI于2025年7月11日发布开源大模型Kimi K2,主打代码编写、数学推理和Agent工具调用功能。该模型采用MoE架构(1T参数,激活32B),在SWE-Bench等测试中表现优异,数学推理得分达97.4。支持128k上下文、工具调用和API集成,定价为输入4元/百万tokens、输出16元/百万tokens。相比闭源模型,Kimi K2具有开源免费、成本低等优势,适合开发者和企业使用。同时推荐AIbase平台,可系统比较�

  • AI日报:腾讯混元推3D生成大模型Hunyuan3D-PolyGen;钉钉AI表格重磅来袭;阿里推多模态大语言模型HumanOmniV2

    本文介绍了AI领域多项重要进展:1)腾讯推出首个美术3D生成大模型Hunyuan3D-PolyGen,显著提升建模效率;2)阿里发布多模态大模型HumanOmniV2,准确率达69.33%;3)钉钉AI表格实现1小时处理千项任务;4)百度PaddleOCR3.1版本在多语种识别和文档翻译方面升级;5)微软推出Deep Research智能体,自动化研究流程;6)香港理工与OPPO联合开源视频超清框架DLoRAL;7)谷歌开源MCP工具箱简化AI与数据库集成;8)Win11将推出AI动态壁纸功能。这些创新展示了AI在3D生成、多模态理解、办公效率、视觉处理等领域的突破性进展。

  • AI日报:智谱上线PPT生成功能AI Slides;可灵 AI 发布可图2.1模型

    本文介绍了AI日报栏目及近期AI领域多项突破性进展:1)智谱推出免费AI Slides工具,基于GLM模型快速生成高质量PPT;2)可灵AI发布可图2.1模型,支持180多种风格图像生成;3)NVIDIA推出DiffusionRenderer技术,实现视频到可编辑3D场景转换;4)墨刀AI新增30秒生成高保真原型功能;5)Higgsfield推出Soul ID工具,10张照片即可生成虚拟形象;6)谷歌DeepMind开源GenAI Processors工具库;7)谷歌Veo新增图像转视频功能;8)Mistral AI发布专为代码建模的Devstral2507系列模型。这些创新展示了AI在内容生成、3D建模、产品设计等领域的快速发展。

  • A日报:B站升级动漫视频生成模型AniSora V3;字节开源4D视频生成框架EX-4D;DeepSWE开源AI Agent系统强势登顶

    AI日报栏目汇总了近期AI领域的重要进展:1)字节跳动开源EX-4D框架,可将单目视频转换为多视角4D视频;2)B站开源动漫视频生成模型AniSora V3,支持多种风格;3)DeepSWE+开源基于Qwen3-32B的AI Agent系统;4)字节开源3亿参数图像编辑模型VINCIE-3B;5)Stability AI推出移动端音频生成模型Stable Audio Open Small;6)谷歌发布免费教育AI工具套件Gemini for Education;7)Topview推出革命性AI数字人带货技术Avatar

  • 秘塔AI也终于悄悄上线了DeepResearch。

    测试完以后,我觉得这玩意,还是值得我将近通宵写一篇的。 深度研究,也就是DeepResearch。 我过去写过很多次秘塔AI了,因为我自己的搜索习惯,现在基本就是,大活上ChatGPT用DeepResearch,常识问答直接找豆包,一般的AI搜索就是秘塔AI。 当然很多ChatBot产品都有AI搜索,但是我自己这两年,还是习惯用秘塔AI和Perplexity这样形态的原生AI搜索产品了,这可能就是习惯的力量吧。

  • 剑指谷歌Chrome!OpenAI即将推出AI浏览器

    据媒体报道,OpenAI即将推出的AI浏览器,利用人工智能技术彻底重塑用户的网络浏览体验,直接向占据市场主导地位的谷歌 Chrome 发起挑战。 凭借庞大的每周4亿活跃ChatGPT用户基础,OpenAI的浏览器若被广泛接纳,将对谷歌的广告生态系统、网络数据流和搜索流量构成实质性威胁。谷歌Chrome长期以来是Alphabet广告业务的基石,为其精准广告投放和将流量导向自家搜索引擎提供了关�