AI日报：谷歌Gemini 1.5 Flash可免费使用；哩布哩布完成数亿元融资；苹果AI新功能将推迟至iOS 18.1版本

2024-07-29 14:59 · 稿源：站长之家

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解:https://top.aibase.com/

1、告别P图困扰!Diffree直接通过文字描述就可无痕添加物体

在这个AI技术飞速发展的时代，Diffree作为一项能让设计师和摄影师们欢呼雀跃的AI图像处理技术，通过文本引导实现在图片中无缝添加新物体，降低了图像编辑门槛，让每个人都能成为创造者。

【AiBase提要:】
🎨 Diffree利用文本引导功能，根据简单文字描述在图像中添加新物体，实现无缝融合。
🔍 基于"文本到图像"模型，Diffree通过训练学会生成图像内容，利用"Stable Diffusion"扩散模型预测新物体位置。
✨ Diffree不仅能单次添加物体，还能多次添加并保持背景一致性，在实验证明中表现优越，降低了图像编辑难度。
详情链接:https://top.aibase.com/tool/diffree

2、谷歌推Alchemist技术实现图片材质精准编辑

谷歌研究团队最近推出了一项突破性技术Alchemist，使用户能够精确编辑图片中物品的材质属性，无需专业技能。这项技术基于经过微调的Text-to-Image生成模型，通过合成数据集和修改模型架构实现精细控制。实验结果显示技术有效改变物品外观，应用前景广阔。尽管存在局限性，但研究团队对其潜力充满信心，有望为图像编辑领域带来革命性变革。

【AiBase提要:】
✨ 突破性技术Alchemist实现精准编辑图片材质属性，无需专业技能。
🌟 实验结果显示技术有效改变物品外观，应用前景广阔。
💡 研究团队对Alchemist技术的潜力充满信心，有望为图像编辑领域带来革命性变革。
详情链接:https://prafullsharma.net/alchemist/

3、Google Gemini重大更新Gemini1.5Flash可免费使用

Google近日宣布了其AI助手Gemini的一系列重大更新，旨在提高用户体验并扩大其应用范围。更新涵盖了性能提升、新功能引入以及用户群体的扩展。Gemini1.5Flash版本带来了免费版Gemini的全面升级，提升了响应速度、推理能力和图像理解。

【AiBase提要:】
✨ Gemini1.5Flash版本全面升级，提升性能和功能。
🔗 文件上传功能即将推出，便于处理复杂任务。
🌐 Gemini功能将推广到更多平台和地区，支持更多语言。

4、苹果新AI功能或将推迟至iOS18.1版本发布

苹果公司备受期待的新AI功能 Apple Intelligence 可能无法赶上iOS18的首次发布。尽管用户对于新功能的推迟可能感到失望，但这也展现了苹果注重产品稳定性和完善度的态度。

【AiBase提要:】
📅 新AI功能可能推迟至iOS18.1版本发布，Beta测试将在本周开始。
📉 升级版Siri等其他AI更新或推迟至2025年才能与用户见面。
📈 苹果公司在整合AI技术到产品中时更注重稳定性和完善度，而非急于赶上发布日期。

5、Llama4启动训练 Meta科学家揭秘Llama3.1训练背后的故事

在播客节目Latent Space中，Meta的科学家Thomas Scialom揭开了Llama3.1的研发秘籍，透露了Llama4的神秘面纱。文章深入探讨了Llama3.1的诞生背后的平衡挑战与技术突破，展示了Meta在AI领域的领先地位和未来展望。

【AiBase提要:】
🔍 Llama3.1的诞生是参数规模、训练时间与硬件限制的完美平衡，挑战GPT-4o，展现了Meta的技术实力。
🔑 在研发过程中重视训练数据总量，选择增加训练token数，通过15T的token海洋实现知识深度与广度的飞跃。
💡 创新地选择合成数据进行后训练，尝试多种模型评估与改进方法，展示了Meta在AI技术上的探索与突破。

6、亚马逊云发布Amazon Q Apps:允许用户构建自己的生成式 AI 应用程序

在亚马逊云科技纽约峰会上，亚马逊云科技发布了Amazon Q Apps服务，为用户提供便捷的生成式AI应用程序构建方式。这项服务将AI技术应用变得更加简单易用，为用户提供了更多机会探索AI应用的可能性。

【AiBase提要:】
🚀 Amazon Q Apps服务让用户可以根据简单描述创建应用程序，无需技术背景也能使用。
💻 Amazon Q Developer集成到Amazon SageMaker Studio，为机器学习模型开发带来便捷。
🔒 Amazon Bedrock更新了功能，帮助用户轻松访问高性能大语言模型和构建安全、隐私的生成式AI应用程序。

7、AI离人类有多远?一个晾衣问题暴露GPT-4致命缺陷

在Quanta Magazine的播客中，华盛顿大学计算机教授Yejin Choi与主持人Steven Strogatz展开了关于人工智能的深刻对话，探讨AI是否需要具备身体和情感才能发展出与人类相似的常识。虽然大型语言模型（LLM）在语言能力上取得进展，但在理解基本常识方面仍存在挑战。Choi教授的实验室致力于教授AI常识，认为AI应该拥有情商和意识，以更人性化地与人类互动。

【AiBase提要:】
🧠 LLM表现接近人类智能，但训练方式与人类不同
🤖 AI在理解基本常识方面存在挑战，如ChatGPT回答问题出错
📚 Choi教授实验室研究教授AI常识，通过提供声明性知识帮助神经网络学习
详情链接:https://www.quantamagazine.org/will-ai-ever-have-common-sense-20240718/

8、AI图像生成平台LiblibAI完成数亿元融资创国内行业新高

LiblibAI是国内领先的AI图像生成平台，最近完成了数亿元人民币的三轮融资，创下国内AI图像赛道的最大总融资纪录。公司快速发展得益于明确的产品战略和强大的社区生态，面临的挑战是平衡先进模型发展速度与用户需求。团队成员来自知名高校，具备丰富的互联网和设计行业背景，为公司的持续创新提供支持。

【AiBase提要:】
🚀 LiblibAI完成数亿元融资，创下国内AI图像赛道最大总融资纪录。
💡 公司快速发展得益于明确的产品战略和强大的社区生态，积累近1000万专业AI图像创作者。
⚖️ 面临的挑战是平衡先进模型发展速度与用户需求，团队强调用AI-native思维设计产品。

9、Hierarchical3D Gaussian:实时渲染大规模高质量3D场景

在虚拟现实和计算机图形学领域，Hierarchical3D Gaussian方法突破了传统瓶颈，实现了高质量3D场景的实时渲染，提升了视觉效果和处理效率。该方法采用分块训练和层级优化技术，具有广泛应用潜力。

【AiBase提要:】
🌟 突破传统瓶颈: Hierarchical3D Gaussian解决了超大数据集渲染的瓶颈问题，提升了视觉效果和处理效率。
🚀 高效训练与渲染: 采用分块训练和层级优化技术，使得超大规模场景的实时渲染成为现实。
📈 广泛应用潜力: Hierarchical3D Gaussian能处理数万张图像的复杂场景，并适应各种资源条件，展现了显著的实用性。
详情链接:https://top.aibase.com/tool/hierarchical-3d-gaussian

（举报）

相关推荐

关键词：

Gemini

新Siri或明年春季发布苹果公司或引入谷歌Gemini大模型 AI技术

苹果因自研大模型项目遇瓶颈，决定引入谷歌Gemini大模型升级Siri，计划每年支付约10亿美元获取定制化Gemini 2.5 Pro使用权。该模型拥有1.2万亿参数，将全面负责Siri的信息摘要、任务规划及复杂指令执行等核心功能，支持多模态交互和超长文本处理。升级版Siri预计2026年春季随iOS 26.4推送，后续将在WWDC大会展示进一步整合。苹果选择谷歌主要因成本优势、长期合作基础及Gemini领先性能。

苹果谷歌Gemini Siri升级
今年双11，为什么买百吋电视更推荐RGB-Mini LED？

今年双11，百吋电视因用户消费升级与居住改善需求增长显著。京东数据显示其销量同比增长200%，反映用户不再满足“够用”尺寸，而是追求影院级沉浸体验。百吋电视受追捧源于超高清内容普及与技术门槛降低，但需注意大屏对显示技术要求更高。RGB-Mini LED技术通过红绿蓝三原色独立背光实现精准控光，解决传统电视色彩与亮度矛盾，如海信UX等产品以高色域、分区控光提升画质。选购时需关注画质芯片与屏幕抗反射能力，确保色彩真实与观看舒适。尺寸是基础，画质才是灵魂。

百吋电视消费升级家庭观影
视觉暴击！海信RGB-Mini LED电视乌镇实测《黑神话》，拉满沉浸感

在2025世界互联网大会乌镇峰会上，海信与《黑神话：悟空》合作展示RGB-Mini LED电视技术，精准还原游戏画面细节，如武器光泽、服饰纹理，引发玩家排队体验。该技术突破传统显示方案，通过RGB三原色发光芯片实现100% BT.2020色域和108bits控光精度，消除色彩失真，呈现“真、纯、透”视觉效果。海信E8S Pro作为代表机型，凭借12项影音优化功能，成为体验3A大作的理想设备，彰显“好游戏+好设备”的双重魅力。

游戏科学黑神话海信
被AI引用才是真的流量：写出让GPT、Gemini主动引用的AI搜索友好型内容（实操清单 + 工具推荐）

本文系统介绍生成式引擎优化(GEO)的核心方法，帮助内容从“给人看”升级为“AI友好型”。关键策略包括：1.采用结构化写作框架，在开头设置可直接回答问题的“黄金段落”；2.运用分步清单、数据标注、FAQ等模块提升内容引用率；3.通过多平台同步分发增加曝光；4.使用AIBase等工具量化监测内容被AI引用的频率与场景，并给出5天落地执行表。

AI搜索友好型内容创作 GEO Generative
荐AI日报：豆包视频1.0pro fast发布；谷歌Gemini新功能上线；百度推上体体育大模型 2.0

本期AI日报聚焦多项技术突破：火山引擎发布豆包视频生成模型1.0pro+fast，速度提升3倍且价格下降72%；百度与上海体育大学推出“上体体育大模型2.0”，拓展AI在运动员训练等场景应用；谷歌Gemini新增一键生成PPT功能；美团发布LongCat-Video模型，支持5分钟连贯视频生成；xAI推出虚拟女友Mika引发热议；MiniMax开源高性能M2编码模型；OpenAI上线企业知识管理功能；另报道20岁辍学生开发的AI笔记工具Turbo AI半年用户破500万，展现年轻创业者的技术影响力。

AI 视频生成火山引擎
中国顶级画质+法国顶奢音效！海信RGB-Mini LED电视UX在巴黎歌剧院秀出影音王炸组合

近日，海信与法国高端音响品牌帝瓦雷在巴黎歌剧院联合举办跨界盛典，推出全球首款RGB-Mini LED电视116UX，搭载双方定制的“双剧场级音响”系统，内置6.2.2声道HiFi音响与20个发声单元，实现360°环绕声场。通过精准声学调校，还原交响乐与人声细节，营造“余音绕梁”的沉浸体验。双方还成立联合实验室，推动帝瓦雷专利算法首次应用于电视。多款旗舰产品同步搭载合作音频系统，为家庭用户带来殿堂级影音享受。

海信RGB-Mini LED电视帝瓦雷音响
荐MiniMax M2：所有坑都踩过，才能做出所有人都能用上的Agent

最近一个月，基础模型似乎又有点多起来。但若仔细去看这些模型厂商的动作，大体还是走出了两条路。一种是在诸多难点里选择一个死磕，成为这个单点上的SOTA。这种路线可以快速在开发者群体留下一个明确的印象，但也可能限制住了一家模型公司的“基座”属性。另一种则是在各个模态上全面前进，在一个最全面的基础模型蓝图里不停交出一个个关键拼图。已经有了全

基础模型 MiniMax M2
荐MiniMax让AI语音有了新基建

熟悉MiniMax的人都了解这家公司的调性——不鸣则已，一鸣惊人。要么选择低调，要么发动技术连招，其发展路径呈现出鲜明的“技术深潜”与“节点式爆发“的双重特征。十月的最后一周，再次进入MiniMax式技术迭代新周期。MiniMax模型“全家桶”全面向Agent方向进化，基础文本模型M1升级至M2，“专为Agent和代码而生”;视频模型升级至Hailuo2.3，Hailuo Video Agent迭代为“全模态全�

MiniMax 技术迭代 Agent
iPad mini 8外观巨变：去掉扬声器开孔

iPad mini 8将采用全新设计，去掉扬声器开孔并提升防水性能，同时苹果也在为iPad mini 8研发一套新的扬声器系统。据悉，iPad mini 8可能采用屏幕激励器方案，通过驱动屏幕振动来发出声音，其原理是将振动机械能直接传输到屏幕，然后让屏幕代替传统扬声器振膜发声。具体来说，它是通过在机身内部的微驱动单元（激励器）来激励中框，从而带动屏幕振动发声。

iPad mini 8
苹果iPad mini将支持防水：看齐iPhone

苹果正研发新一代防水iPad mini，采用无扬声器开孔设计降低进水风险，防水性能接近iPhone。与iPhone采用粘合剂密封不同，iPad mini通过全新扬声器系统实现防水。现售款无官方防水认证，而新款预计2026年上市，可能搭载OLED屏幕并涨价约100美元（现起售价499美元）。

iPad mini 防水性能

今日大家都在搜的词：

热文

3 天
7天

AI日报：谷歌Gemini 1.5 Flash可免费使用；哩布哩布完成数亿元融资；苹果AI新功能将推迟至iOS 18.1版本

新Siri或明年春季发布苹果公司或引入谷歌Gemini大模型 AI技术

今年双11，为什么买百吋电视更推荐RGB-Mini LED？

视觉暴击！海信RGB-Mini LED电视乌镇实测《黑神话》，拉满沉浸感

被AI引用才是真的流量：写出让GPT、Gemini主动引用的AI搜索友好型内容（实操清单 + 工具推荐）

荐AI日报：豆包视频1.0pro fast发布；谷歌Gemini新功能上线；百度推上体体育大模型 2.0

中国顶级画质+法国顶奢音效！海信RGB-Mini LED电视UX在巴黎歌剧院秀出影音王炸组合

荐MiniMax M2：所有坑都踩过，才能做出所有人都能用上的Agent

荐MiniMax让AI语音有了新基建

iPad mini 8外观巨变：去掉扬声器开孔

苹果iPad mini将支持防水：看齐iPhone

今日大家都在搜的词：

热文

华为Mate 80系列已在华为商城开启预约

华为Mate 80 Pro Max外观公布：采用双圆环设计

华为Mate 80/Pro/Pro Max/RS开启预约：全系直屏设计

AI日报：阿里千问APP公测；Veo 3.1上线多图参考；超级小爱AI大

阿里巴巴回应千问崩了：状态良好欢迎来问

华为Mate X7外观公布搭载全新折叠玄武架构

荣耀500系列官宣将于11月24日发布

一加Ace 6T官宣将于本月发布：首发骁龙8 Gen5

小米超级小爱AI大模型推出随心修图功能

参与开发iPhoneAir设计师离职转投AI初创公司

影视飓风CEO在相亲角被大妈吐槽网友：大妈不识货

腾讯发布2025第三季度财报：营收1928.69亿元同比增长 15%

小米澎湃OS 3第三批正式版推送：支持小米14、K70系列等

华为Mate 80系列已在华为商城开启预约

华为Mate 80 Pro Max外观公布：采用双圆环设计

AI日报：李飞飞Marble 3D世界模型公测；OpenAI首次推出ChatGPT

AI日报：百度发布文心5.0；可灵2.5Turbo模型上线“首尾帧”功能

荣耀500系列开启预约：Pro版外观首次亮相

华为Mate 80/Pro/Pro Max/RS开启预约：全系直屏设计

iPhone Pocket正式开售：联名三宅一生售价1299元起

站长商机