AI日报：百度发布一见视觉大模型v4.5；Adobe支持用AI做动画设计；Familia.AI推“复活亲人”软件

2024-10-12 15:15 · 稿源：站长之家

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解:https://top.aibase.com/

1、百度智能云一见视觉大模型v4.5发布

百度智能云一见视觉大模型平台v4.5的发布，为工业行业带来了革命性变革，提供高效的视觉智能解决方案，极大地提高了企业的运营效率和安全性。

【AiBase 提要：】
🌟 升级后平台解决了 95% 视觉需求，提高了多行业运营效率。
🚀 七大核心优势包括自动化调优、零代码编排和丰富模型库。
🔧 在矿山行业，工作效率从 55 人天降至两天，显著节省人力。
详情链接:https://yijian.cloud.baidu.com/

2、OpenAI 推新框架 Swarm:简化多智能体系统构建与管理

在人工智能迅速发展的今天，OpenAI推出了Swarm框架，旨在简化多智能体的管理与协调。Swarm专注于让智能体之间的交互、执行和测试变得更加轻量且高效，帮助开发者更方便地管理多个AI智能体的互动。通过关注简约和可控性，Swarm克服了多智能体系统管理中的重大挑战，为各种应用场景提供了实际的解决方案。

【AiBase提要:】
🌟 Swarm框架旨在简化多智能体系统的管理与协调，使开发者能够更高效地进行AI智能体的互动。
⚙️ 通过引入智能体和任务交接两个基本概念，Swarm实现了灵活的任务管理与协调。
🚀 Swarm的轻量级和可控性为研究者和开发者提供了理想的解决方案，促进多智能体系统的可靠应用。
详情链接:https://github.com/openai/swarm

3、Adobe Express 新增功能: AI 支持动画和创作工具

Adobe本周宣布了Adobe Express的一系列新功能，旨在为需要创建网页和图形的主流用户提供更高的集成度和创作能力。新功能包括与Creative Cloud应用程序的更紧密集成，以及用于文本和形状的新工具。用户可以更轻松地与InDesign和Lightroom进行协作和共享内容。AI Firefly支持的功能让用户更容易为设计添加动感和动画，还可以改写、缩短文本，甚至翻译成46种语言。

【AiBase提要:】
✨ 更高集成度和创作能力，与Creative Cloud更紧密集成
🔥 AI Firefly支持，为设计添加动感和动画，文本处理更便捷
💼 多家企业客户使用，包括ABB、Ad Council、Aon等

4、Familia.AI推“复活亲人”软件，支持视频通话

Familia.AI在旧金山发布了AI家庭应用，旨在拉近家庭成员距离，传承家族记忆。创始人Luvaglio对应用潜力充满信心，强调增强家庭联系并保存。

【AiBase提要:】
🏠 AI家庭应用旨在拉近家庭成员距离，传承家族记忆。
🤖 Familia.AI提供与AI家人的互动，解决家庭关系挑战，提供情感慰藉。
💬 应用作为数字家族传承宝贵遗产，捕捉家人精髓，重现已故亲人特质。

5、小红书新流量密码?用这个Flux LoRA一键出“神图”，比棉花娃娃还火

社交平台上的真人转卡通玩法愈发盛行，Flux LoRA是最新衍生玩法，可在生成真人照片基础上叠加卡通人物，类似抖音的棉花娃娃效果。在抖音和小红书广受欢迎，一图加音乐即可获得数万点赞。

【AiBase提要:】
🔥 社交平台新玩法:Flux LoRA一键生成真人+卡通照片。
💡 类似棉花娃娃效果:真人照片+卡通形象叠加，白边突出对比。
👍 流行度高:在抖音和小红书上备受欢迎，一图加音乐即可获得数万点赞。
详情链接:https://huggingface.co/Shakker-Labs/FLUX.1-dev-LoRA-One-Click-Creative-Template

6、苹果AI研究团队发现大模型推理短板一句话就把OpenAI o1干废了

在这篇文章中，苹果公司的AI研究团队揭示了大型语言模型在数学推理上的局限性，通过一个简单的数学问题展示了模型处理逻辑问题时的局限性。研究者们指出，即使是最先进的LLMs在面对微小干扰时也可能出现错误的答案，暴露了这些模型在逻辑推理方面的不足。这项研究提醒我们要更深入地了解AI技术的工作原理和局限性。

【AiBase提要:】
🧠 大型语言模型在数学推理上存在局限性，容易受到微小干扰影响
🔍 LLMs在处理逻辑问题时并不真正理解问题的本质，而是复制训练数据中的推理步骤
💡 提高模型表现可能需要更多上下文数据，对于复杂干扰模型可能无法正确处理
详情链接:https://techcrunch.com/2024/10/11/researchers-question-ais-reasoning-ability-as-models-stumble-on-math-problems-with-trivial-changes/

7、Meta 和谷歌推动广告商使用生成式人工智能制作假日广告

在假日季节，Meta 和谷歌推出了生成式人工智能工具，鼓励广告商使用AI制作假日广告。尽管一些广告公司表示客户不愿意完全采用生成式人工智能，但AI在广告创意中逐渐崭露头角，为小型企业提供更多广告制作可能性。

【AiBase提要:】
🤖 Meta 和谷歌推出生成式人工智能工具，鼓励广告商使用AI制作假日广告。
💡 生成式人工智能可帮助小型企业制作更多广告，无需媒体购买者或代理商。
💰 创意AI功能的发展可能为品牌带来更多利润，尤其在视频制作方面AI生成具有潜力。

8、研究:谷歌凭借TPU芯片提供了世界上最大的AI计算能力

根据Epoch AI的分析，谷歌凭借自主研发的TPU芯片拥有全球最大的人工智能计算能力。尽管Nvidia在AI芯片市场主导，但谷歌在单一公司中AI计算能力最强。AI芯片市场快速变化，各大公司积极布局，Nvidia的Blackwell GPU供应已售罄。

【AiBase提要:】
🌟 谷歌的TPU芯片计算能力相当于至少60万个Nvidia H100GPU，成为全球最大的AI计算能力提供者。
💼 Nvidia在AI芯片市场依然占据主导地位，自2022年销售了相当于300万个H100GPU的计算能力。
📈 AI芯片市场快速变化，各大公司如AMD、英特尔和华为等也在积极布局，Nvidia的Blackwell GPU需求火爆，供应已售罄。

9、2024年美国39家AI初创公司融资金额破亿

2024年，人工智能（AI）公司在创业投资市场仍占据重要地位，投资者对AI领域充满信心。AI公司共筹集189亿美元资金，占风险投资的28%，OpenAI完成66亿美元融资创历史纪录。国外科技媒体Techcrunch整理了2024年迄今筹集1亿美元以上资金的美国AI公司。

【AiBase提要:】
🚀 人工智能公司持续受到投资者青睐，今年共筹集189亿美元资金，OpenAI单轮融资达66亿美元，创历史最大纪录。
💡 投资者对AI领域充满信心，AI公司占风险投资的28%，显示市场对AI的持续看好。
💰 Techcrunch整理的2024年美国39家AI初创公司中，多家公司完成1亿美元以上融资，展现AI行业蓬勃发展态势。

（举报）

相关推荐

关键词：

百度

Sora App的AI视频社交，给了百度们新希望

Sora2发布两周后，百度的蒸汽机AI视频模型，和谷歌Veo3.1撞了档期。两家公司选择同期发布并非有多默契，而是Sora2带来的压迫感促使它们不得不加快脚步。奥尔特曼将形容Sora2为“创意领域的ChatGPT3.5时刻”，不仅在物理逻辑、画面连贯性、真实感和音画同步等方面实现了质的飞跃，还把Sora从一个“文本到视频”的工具进化成一个“创意到生态”的平台。这无疑是扔在AI视�

文章搜索核心标签 AI视频模型
百度智能云这项开源，让 DeepSeek-V3.2 推理服务吞吐提升 2 倍

10月28日，百度智能云联合SGLang社区开源针对DeepSeek-V3.2优化的多token预测（MTP）技术代码。该技术通过批量生成和集中验证机制，使模型解码吞吐量提升超2倍，突破传统自回归解码的序列化瓶颈。此次开源的MTP方案已完成与DeepSeek-V3.2稀疏注意力架构的深度适配，并经过百度内部业务验证，开发者可"开箱即用"获得稳定可靠的推理加速能力。

百度智能云 DeepSeek-V3.2 MTP技术
百度网盘正式适配安卓实况照片：iOS和安卓可跨系统互传

近日，百度网盘针对安卓用户推出重磅功能更新，正式适配安卓系统实况照片（Live Photo）的存储与播放需求，一举解决安卓阵营长期存在的动态照片管理痛点。此次升级不仅实现了iOS与安卓设备间实况照片的无障碍互传，更在画质保留、格式兼容等方面带来突破性体验。据更新日志显示，安卓用户上传实况照片至百度网盘后，可直接在
实时调度36万真人医生，百度健康AI管家有医靠更可信

10月18日，百度健康发布AI健康管家，首创“AI+真人”双保障模式。该产品在训练阶段引入36万医生标注数据，生成建议后由真人医生二次核验，确保专业安全。覆盖诊前、诊中、诊后全环节，提供数十项AI功能，包括科普问答、用药咨询、报告解读等。用户可通过百度APP搜索使用，定位为7*24小时个人健康助手，有效解决在线医疗服务时效性难题。

百度健康AI管家 AI+真人协同 AI健康助手
荐AI日报：豆包视频1.0pro fast发布；谷歌Gemini新功能上线；百度推上体体育大模型 2.0

本期AI日报聚焦多项技术突破：火山引擎发布豆包视频生成模型1.0pro+fast，速度提升3倍且价格下降72%；百度与上海体育大学推出“上体体育大模型2.0”，拓展AI在运动员训练等场景应用；谷歌Gemini新增一键生成PPT功能；美团发布LongCat-Video模型，支持5分钟连贯视频生成；xAI推出虚拟女友Mika引发热议；MiniMax开源高性能M2编码模型；OpenAI上线企业知识管理功能；另报道20岁辍学生开发的AI笔记工具Turbo AI半年用户破500万，展现年轻创业者的技术影响力。

AI 视频生成火山引擎
百度升级文心助手AIGC创作能力：支持8种模态一键调用多工具

百度搜索近日宣布对文心助手进行全面升级，显著增强其AIGC多模态创作与智能任务解决能力。目前，该平台已支持AI图片、视频、音乐、播客等8种内容形态的生成，并支持用户一键调用多种工具，应对生活、健康、教育、工作等多场景需求。数据显示，百度搜索用户通过文心助手日均生成的AIGC内容量已突破千万。与此同时，百度还发布了行业首个开放式实时互动数字人智�

百度搜索文心助手 AIGC
荐AI日报：谷歌Gemini 3.0 Pro小范围推送；爱诗科技完成1亿元B+轮融资；百度发布文档解析模型 PaddleOCR-VL

谷歌Gemini 3.0 Pro开始小范围推送，强化推理与多模态能力；百度发布全球领先文档解析模型PaddleOCR-VL，重塑OCR技术格局；爱诗科技完成亿元B+轮融资，ARR突破4000万美元；Anthropic推出Claude“skills”功能，提升AI工作效率；Pinterest推出AI内容限制工具，用户可自定义减少生成式图像；开源多模态模型LLaVA-OneVision-1.5超越Qwen2.5-VL；OpenAI视频生成模型Sora 2上线微软Azure平台，进入公共预览阶段；旅行搜索引擎Kayak推出“AI模式”，简化旅行规划与预订流程。

谷歌Gemini AI日报 DeepMind
百度百科词条总量突破3000万，联合《大学科普》等多机构推出科普专刊

10月24日，百度百科联合《大学科普》推出“繁星计划”主题专刊，作为该刊2025年第3期面向全国高校发行，助力权威科普传播。同日，繁星计划新增北京林业大学林学院等5家合作机构，扩大行业影响力。该计划自2024年12月启动，已联合10万专家、500家机构共建超100万专业词条，百度百科词条总量突破3000万。通过与权威期刊合作，百度百科旨在为高校学子搭建连接前沿科学与知识普及的桥梁，践行“让知识轻松可及”的使命。

百度百科繁星计划知识传播
AI日报：微软发布首款自研图像生成模型 MAI-Image-1；百度世界大会时间公布；AI大牛开源nanochat教学工具

微软发布首款自研图像生成模型MAI-Image-1，跻身LMArena前十，注重实用性与光影效果；百度世界2025大会将聚焦大模型与AI全球化战略；Meta新技术使RAG推理速度提升30倍；开源项目nanochat实现低成本构建聊天AI；谷歌NotebookLM新增动漫视频生成功能；中国农大发布神农大模型3.0助力智慧农业；腾讯启动"青云奖学金"培养AI人才；苹果FS-DFM模型长文本生成效率提升128倍；谷歌Lens整合AI图像编辑功能；港大与美团提出CodePlot-CoT方法，通过代码绘图解决数学难题，性能提升21%。

AI 图像生成微软
免费神器！一键检测你的内容在AI搜索中的可见度，抢占品牌曝光先机

文章指出AI搜索时代，品牌若未被ChatGPT、文心一言等主流AI模型抓取推荐，将面临流量流失、品牌曝光下降及营销成本增加的风险。为解决这一问题，推荐使用AIBase平台的免费GEO排名查询工具，可检测品牌在各大AI搜索中的可见度、排名及竞品对比，并提供优化建议，帮助提升AI曝光率，抢占流量高地。

AI搜索品牌曝光内容排名

今日大家都在搜的词：

热文

3 天
7天

AI日报：百度发布一见视觉大模型v4.5；Adobe支持用AI做动画设计；Familia.AI推“复活亲人”软件

Sora App的AI视频社交，给了百度们新希望

百度智能云这项开源，让 DeepSeek-V3.2 推理服务吞吐提升 2 倍

百度网盘正式适配安卓实况照片：iOS和安卓可跨系统互传

实时调度36万真人医生，百度健康AI管家有医靠更可信

荐AI日报：豆包视频1.0pro fast发布；谷歌Gemini新功能上线；百度推上体体育大模型 2.0

百度升级文心助手AIGC创作能力：支持8种模态一键调用多工具

荐AI日报：谷歌Gemini 3.0 Pro小范围推送；爱诗科技完成1亿元B+轮融资；百度发布文档解析模型 PaddleOCR-VL

百度百科词条总量突破3000万，联合《大学科普》等多机构推出科普专刊

AI日报：微软发布首款自研图像生成模型 MAI-Image-1；百度世界大会时间公布；AI大牛开源nanochat教学工具

免费神器！一键检测你的内容在AI搜索中的可见度，抢占品牌曝光先机

今日大家都在搜的词：

热文

iPhone锁屏滑动相机能关闭了苹果iOS 26.1 RC准正式版发布

AI日报：Hailuo 2.3发布；豆包AI编程史诗级升级；马斯克推出AI

AI日报：豆包推全自动多人配音系统；Adobe Firefly Image 5重磅

华为余承东：鸿蒙智行全系交付突破100万台仅用43个月

一加Ace 6开启预售：售价2599元起

鸿蒙智行：全新问界M7上市36天交付破20000台

美股4万亿美元市值上市公司已达3家苹果、微软、英伟达组成三巨

网信办宣布开展“整治网络直播打赏乱象”专项行动

20周年款iPhone将配自研相机并搭载自研定制LOFIC传感器

小米17 Pro系列妙享背屏全新掌机游戏等新功能上线

iPhone锁屏滑动相机能关闭了苹果iOS 26.1 RC准正式版发布

一加15今晚发布定位全能水桶机

AI日报：豆包视频1.0pro fast发布；谷歌Gemini新功能上线；百度

AI日报：Hailuo 2.3发布；豆包AI编程史诗级升级；马斯克推出AI

AI日报：豆包推全自动多人配音系统；Adobe Firefly Image 5重磅

红米REDMI K90全方位提升雷军：是不是越来越有旗舰气质

余承东曝鸿蒙智行新款享界S9将于11月上市

iPhone18发布或推迟苹果明年9月只发Pro系列和Fold折叠屏

华为余承东：鸿蒙智行全系交付突破100万台仅用43个月

一加Ace 6开启预售：售价2599元起

站长商机