首页 > 业界 > 关键词  > 百度最新资讯  > 正文

AI日报:百度发布一见视觉大模型v4.5;Adobe支持用AI做动画设计;Familia.AI推“复活亲人”软件

2024-10-12 15:15 · 稿源:站长之家

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解:https://top.aibase.com/

1、百度智能云一见视觉大模型v4.5发布

百度智能云一见视觉大模型平台v4.5的发布,为工业行业带来了革命性变革,提供高效的视觉智能解决方案,极大地提高了企业的运营效率和安全性。

image.png

【AiBase 提要:】

🌟 升级后平台解决了 95% 视觉需求,提高了多行业运营效率。

🚀 七大核心优势包括自动化调优、零代码编排和丰富模型库。

🔧 在矿山行业,工作效率从 55 人天降至两天,显著节省人力。

详情链接:https://yijian.cloud.baidu.com/

2、OpenAI 推新框架 Swarm:简化多智能体系统构建与管理

在人工智能迅速发展的今天,OpenAI推出了Swarm框架,旨在简化多智能体的管理与协调。Swarm专注于让智能体之间的交互、执行和测试变得更加轻量且高效,帮助开发者更方便地管理多个AI智能体的互动。通过关注简约和可控性,Swarm克服了多智能体系统管理中的重大挑战,为各种应用场景提供了实际的解决方案。

image.png

【AiBase提要:】

🌟 Swarm框架旨在简化多智能体系统的管理与协调,使开发者能够更高效地进行AI智能体的互动。

⚙️ 通过引入智能体和任务交接两个基本概念,Swarm实现了灵活的任务管理与协调。

🚀 Swarm的轻量级和可控性为研究者和开发者提供了理想的解决方案,促进多智能体系统的可靠应用。

详情链接:https://github.com/openai/swarm

3、Adobe Express 新增功能: AI 支持动画和创作工具

Adobe本周宣布了Adobe Express的一系列新功能,旨在为需要创建网页和图形的主流用户提供更高的集成度和创作能力。新功能包括与Creative Cloud应用程序的更紧密集成,以及用于文本和形状的新工具。用户可以更轻松地与InDesign和Lightroom进行协作和共享内容。AI Firefly支持的功能让用户更容易为设计添加动感和动画,还可以改写、缩短文本,甚至翻译成46种语言。

image.png

【AiBase提要:】

✨ 更高集成度和创作能力,与Creative Cloud更紧密集成

🔥 AI Firefly支持,为设计添加动感和动画,文本处理更便捷

💼 多家企业客户使用,包括ABB、Ad Council、Aon等

4、Familia.AI推“复活亲人”软件,支持视频通话

Familia.AI在旧金山发布了AI家庭应用,旨在拉近家庭成员距离,传承家族记忆。创始人Luvaglio对应用潜力充满信心,强调增强家庭联系并保存。

image.png

【AiBase提要:】

🏠 AI家庭应用旨在拉近家庭成员距离,传承家族记忆。

🤖 Familia.AI提供与AI家人的互动,解决家庭关系挑战,提供情感慰藉。

💬 应用作为数字家族传承宝贵遗产,捕捉家人精髓,重现已故亲人特质。

5、小红书新流量密码?用这个Flux LoRA一键出“神图”,比棉花娃娃还火

社交平台上的真人转卡通玩法愈发盛行,Flux LoRA是最新衍生玩法,可在生成真人照片基础上叠加卡通人物,类似抖音的棉花娃娃效果。在抖音和小红书广受欢迎,一图加音乐即可获得数万点赞。

1.jpg

【AiBase提要:】

🔥 社交平台新玩法:Flux LoRA一键生成真人+卡通照片。

💡 类似棉花娃娃效果:真人照片+卡通形象叠加,白边突出对比。

👍 流行度高:在抖音和小红书上备受欢迎,一图加音乐即可获得数万点赞。

详情链接:https://huggingface.co/Shakker-Labs/FLUX.1-dev-LoRA-One-Click-Creative-Template

6、苹果AI研究团队发现大模型推理短板 一句话就把OpenAI o1干废了

在这篇文章中,苹果公司的AI研究团队揭示了大型语言模型在数学推理上的局限性,通过一个简单的数学问题展示了模型处理逻辑问题时的局限性。研究者们指出,即使是最先进的LLMs在面对微小干扰时也可能出现错误的答案,暴露了这些模型在逻辑推理方面的不足。这项研究提醒我们要更深入地了解AI技术的工作原理和局限性。

image.png

【AiBase提要:】

🧠 大型语言模型在数学推理上存在局限性,容易受到微小干扰影响

🔍 LLMs在处理逻辑问题时并不真正理解问题的本质,而是复制训练数据中的推理步骤

💡 提高模型表现可能需要更多上下文数据,对于复杂干扰模型可能无法正确处理

详情链接:https://techcrunch.com/2024/10/11/researchers-question-ais-reasoning-ability-as-models-stumble-on-math-problems-with-trivial-changes/

7、Meta 和谷歌推动广告商使用生成式人工智能制作假日广告

在假日季节,Meta 和谷歌推出了生成式人工智能工具,鼓励广告商使用AI制作假日广告。尽管一些广告公司表示客户不愿意完全采用生成式人工智能,但AI在广告创意中逐渐崭露头角,为小型企业提供更多广告制作可能性。

【AiBase提要:】

🤖 Meta 和谷歌推出生成式人工智能工具,鼓励广告商使用AI制作假日广告。

💡 生成式人工智能可帮助小型企业制作更多广告,无需媒体购买者或代理商。

💰 创意AI功能的发展可能为品牌带来更多利润,尤其在视频制作方面AI生成具有潜力。

8、研究:谷歌凭借TPU芯片提供了世界上最大的AI计算能力

根据Epoch AI的分析,谷歌凭借自主研发的TPU芯片拥有全球最大的人工智能计算能力。尽管Nvidia在AI芯片市场主导,但谷歌在单一公司中AI计算能力最强。AI芯片市场快速变化,各大公司积极布局,Nvidia的Blackwell GPU供应已售罄。

【AiBase提要:】

🌟 谷歌的TPU芯片计算能力相当于至少60万个Nvidia H100GPU,成为全球最大的AI计算能力提供者。

💼 Nvidia在AI芯片市场依然占据主导地位,自2022年销售了相当于300万个H100GPU的计算能力。

📈 AI芯片市场快速变化,各大公司如AMD、英特尔和华为等也在积极布局,Nvidia的Blackwell GPU需求火爆,供应已售罄。

9、2024年美国39家AI初创公司融资金额破亿

2024年,人工智能(AI)公司在创业投资市场仍占据重要地位,投资者对AI领域充满信心。AI公司共筹集189亿美元资金,占风险投资的28%,OpenAI完成66亿美元融资创历史纪录。国外科技媒体Techcrunch整理了2024年迄今筹集1亿美元以上资金的美国AI公司。

【AiBase提要:】

🚀 人工智能公司持续受到投资者青睐,今年共筹集189亿美元资金,OpenAI单轮融资达66亿美元,创历史最大纪录。

💡 投资者对AI领域充满信心,AI公司占风险投资的28%,显示市场对AI的持续看好。

💰 Techcrunch整理的2024年美国39家AI初创公司中,多家公司完成1亿美元以上融资,展现AI行业蓬勃发展态势。

举报

  • 相关推荐
  • 百度网盘正式适配安卓实况照片:iOS和安卓可跨系统互传

    近日,百度网盘针对安卓用户推出重磅功能更新,正式适配安卓系统实况照片(Live Photo)的存储与播放需求,一举解决安卓阵营长期存在的动态照片管理痛点。此次升级不仅实现了iOS与安卓设备间实况照片的无障碍互传,更在画质保留、格式兼容等方面带来突破性体验。 据更新日志显示,安卓用户上传实况照片至百度网盘后,可直接在

  • 实时调度36万真人医生,百度健康AI管家有医靠更可信

    10月18日,百度健康发布AI健康管家,首创“AI+真人”双保障模式。该产品在训练阶段引入36万医生标注数据,生成建议后由真人医生二次核验,确保专业安全。覆盖诊前、诊中、诊后全环节,提供数十项AI功能,包括科普问答、用药咨询、报告解读等。用户可通过百度APP搜索使用,定位为7*24小时个人健康助手,有效解决在线医疗服务时效性难题。

  • 百度升级文心助手AIGC创作能力:支持8种模态 一键调用多工具

    百度搜索近日宣布对文心助手进行全面升级,显著增强其AIGC多模态创作与智能任务解决能力。 目前,该平台已支持AI图片、视频、音乐、播客等8种内容形态的生成,并支持用户一键调用多种工具,应对生活、健康、教育、工作等多场景需求。 数据显示,百度搜索用户通过文心助手日均生成的AIGC内容量已突破千万。与此同时,百度还发布了行业首个开放式实时互动数字人智�

  • AI日报:谷歌Gemini 3.0 Pro小范围推送;爱诗科技完成1亿元B+轮融资;百度发布文档解析模型 PaddleOCR-VL

    谷歌Gemini 3.0 Pro开始小范围推送,强化推理与多模态能力;百度发布全球领先文档解析模型PaddleOCR-VL,重塑OCR技术格局;爱诗科技完成亿元B+轮融资,ARR突破4000万美元;Anthropic推出Claude“skills”功能,提升AI工作效率;Pinterest推出AI内容限制工具,用户可自定义减少生成式图像;开源多模态模型LLaVA-OneVision-1.5超越Qwen2.5-VL;OpenAI视频生成模型Sora 2上线微软Azure平台,进入公共预览阶段;旅行搜索引擎Kayak推出“AI模式”,简化旅行规划与预订流程。

  • AI日报:微软发布首款自研图像生成模型 MAI-Image-1;百度世界大会时间公布;AI大牛开源nanochat教学工具

    微软发布首款自研图像生成模型MAI-Image-1,跻身LMArena前十,注重实用性与光影效果;百度世界2025大会将聚焦大模型与AI全球化战略;Meta新技术使RAG推理速度提升30倍;开源项目nanochat实现低成本构建聊天AI;谷歌NotebookLM新增动漫视频生成功能;中国农大发布神农大模型3.0助力智慧农业;腾讯启动"青云奖学金"培养AI人才;苹果FS-DFM模型长文本生成效率提升128倍;谷歌Lens整合AI图像编辑功能;港大与美团提出CodePlot-CoT方法,通过代码绘图解决数学难题,性能提升21%。

  • 我国首个政务大模型安全国家标准发布 百度深度参与制定

    日前,我国首个针对政务大模型的安全国家标准《政务大模型应用安全规范》(下称《规范》)正式发布。百度作为核心参编单位,凭借其在人工智能安全及政务服务领域的深厚积累,深度参与了该标准的制定工作,为政务大模型的安全选用、部署运行、护栏建设和合规落地提供了专业支持。《规范》由国家工业信息安全发展研究中心牵头,联合百度等国内领先企业共同制定�

  • GEO排名查询工具:AI时代下的品牌可见度监控指南

    随着ChatGPT等生成式AI平台爆发,用户获取信息方式发生根本转变,传统搜索引擎优化(SEO)正被生成引擎优化(GEO)取代。文章指出,品牌在Google排名第一却可能在AI平台无人知晓,因此AI搜索排名成为2024年B2B营销新焦点。GEO需关注三大核心指标:品牌在AI回答中的提及频次、竞品对比排名、提及语境质量。有效的GEO工具应具备多平台覆盖、真实场景模拟、多维度分析能力,并通过四步实施:建立基准数据、识别优化机会、制定优化方案、持续监控迭代。GEO并非替代SEO,而是其延伸,两者需协同推进。

  • 创新蜂窝孔道!康姿百德清雅款磁性床垫为您筑牢睡眠卫生防线

    康姿百德清雅款磁性床垫采用独特蜂巢透气结构,将舒适性与健康性完美结合。其核心设计灵感源于自然界蜂巢,通过内部蜂巢型透气孔道实现高效空气流通,有效排出湿气,保持床垫干爽,抑制细菌滋生。这不仅提升了睡眠舒适度,更从卫生角度守护用户健康,尤其适合易过敏人群。该床垫标志着睡眠科技的新纪元,成为追求高品质生活人士的理想选择。

  • 最高补贴20%!海尔冰箱换新补贴再加码,百款热门型号可用

    海尔冰箱启动亿元换新补贴活动,最高补贴20%,单品补贴上限2000元,覆盖全国上万家门店。用户可通过云闪付APP领券核销,选择包括“麦浪”“和悦”等明星产品,搭载磁控全空间保鲜科技,实现高效保鲜与静音运行(31分贝)。针对不同家装风格提供复古风、奶油风等个性化选择,满足一体化嵌入需求。活动响应“以旧换新”政策,助力消费者升级健康饮食生活。

  • 双11买百吋电视,如何避免陷入“格列佛效应”?

    文章借《格列佛游记》比喻,指出选购百吋电视不应仅关注尺寸,而需重视画质系统。以海信U8系列为例,其通过"光色同控"技术、AI画质芯片及低反射率屏幕,精准处理色彩与光影细节,避免画面失真。配合分区控光与高亮度,实现沉浸式观影。强调双十一购物应追求整体体验,而非单纯放大尺寸。

今日大家都在搜的词: