首页 > 原创 > 关键词  > AI设计最新资讯  > 正文

AI日报:Lovart AI上线“元素拆分”功能;Xcode 26.1.1发布;阿里云通义模型大规模赋能双11

2025-11-12 16:04 · 稿源:站长之家

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解https://app.aibase.com/zh

1、Lovart AI上线“元素拆分”功能,一张海报秒变可编辑PSD

文章介绍了Lovart AI推出的“元素拆分”功能,该功能能够将海报图像智能拆分为文字层、主体层和背景层,实现零门槛精细编辑。同时,文章指出该技术在处理复杂场景时仍有提升空间,并展望了其未来在视频领域的应用潜力。

image.png

【AiBase提要:】

🎨 AI设计平台Lovart推出“元素拆分”功能,实现海报的智能分层编辑。

💡 文字、主体与背景可独立修改,支持字体、颜色及排版调整。

🚀 未来可能扩展至视频帧元素拆分,提升动态内容创作效率。

详情链接:https://www.lovart.ai/zh

2、苹果重磅更新!Xcode 26.1.1发布,ChatGPT互动流畅无阻

苹果公司发布了Xcode 26.1.1版本,重点优化了AI编码助手性能、修复了多个开发问题,并新增了设备诊断功能,提升了开发者的整体工作效率。

【AiBase提要:】

🧠 提升了编码助手的内存使用效率,改善大型项目处理体验。

🔍 修复文件内文本查找工具返回行号错误的问题。

🛠 新增终端命令收集设备诊断日志功能,简化调试流程。

3、阿里云通义模型首次大规模赋能双11,单日翻译调用量突破14亿次

阿里云的通义系列模型在双11中首次实现大规模应用,展示了AI大模型在电商领域的强大效率和实用价值。特别是在跨语种交易和信息处理方面,通义Qwen-MT等翻译模型承担了大量任务,单日调用量突破14亿次。

【AiBase提要:】

✅ 阿里云通义模型首次在双11中大规模应用,标志着AI大模型在电商领域的深度整合。

✅ 通义系列模型在跨语种交易和信息处理中扮演核心角色,承担了亿级商品的翻译任务。

✅ 单日翻译调用量突破14亿次,凸显了AI大模型在高并发、大规模数据任务中的强大效率。

4、历史手稿破译,Gemini 3 首次逼近“人类专家”

Gemini3在历史手稿破译中展现出惊人的识别能力和隐性推理能力,其表现已接近或达到专业人类转录水平,重新定义了AI在人文学科中的边界。

【AiBase提要:】

🧠 Gemini3在字符错误率(CER)和词错误率(WER)上实现突破,接近人类专家水平。

🔍 它能识别复杂手写字体表格,并优于受过专业训练的学生。

💡 面对模糊数字,Gemini3能完成多步换算并得出抽象建模结论,展现隐性推理能力。

5、OpenAI在德败诉!AI训练使用歌词被认定侵权,欧洲生成式AI版权监管迎来分水岭

德国慕尼黑地方法院裁定OpenAI未经许可使用德国音乐人歌词训练AI模型构成版权侵权,并责令赔偿。该判决明确了原创歌词无论是否被转化或嵌入模型参数,均需获得授权,挑战了AI行业对训练数据的合理使用惯例。此案被视为欧洲生成式AI版权治理的关键先例,可能推动‘授权优先、付费使用’成为默认规则。

【AiBase提要:】

📌 德国法院明确指出,受版权保护的原创歌词使用必须获得授权,无论是否被转化或嵌入模型参数。

💡 此案为欧洲生成式AI版权治理的关键先例,或将推动‘授权优先、付费使用’成为AI训练数据的默认规则。

💰 音乐产业维权成功,其他领域权利人可能效仿,AI公司面临系统性法律风险。

6、全新开源语音模型 Maya1:实现实时、富有表现力的文本转语音

Maya1是一个具有30亿参数的开源文本转语音模型,能够实时生成富有表现力的音频。它结合自然语言描述和文本输入,支持多种情感标签,提升语音表现力,并可在单个 GPU 上运行。

image.png

【AiBase提要:】

🎧 Maya1是一个30亿参数的开源文本转语音模型,能够实时生成富有表现力的音频。

💡 支持自然语言描述和情感标签,提升语音的表现力和可控性。

🚀 可在单个 GPU 上运行,提供高效的推理和部署工具。

详情链接:https://huggingface.co/spaces/maya-research/maya1

7、报道称Meta 首席 AI 科学家 Yann LeCun 计划离职创办新公司,聚焦世界模型研究

Yann LeCun,Meta 的首席 AI 科学家,计划离开公司创办专注于世界模型研究的初创企业。这一决定发生在 Meta 正在重组其 AI 部门以应对竞争压力的背景下。LeCun 对当前 AI 技术的发展持怀疑态度,并强调需要进一步探索更智能的 AI 系统。

【AiBase提要:】

🌟 Yann LeCun 计划离开 Meta,创办聚焦世界模型的新公司。

🔍 Meta 正在重组其 AI 部门以应对竞争对手的压力。

🤖 LeCun 对当前 AI 技术的宣传持怀疑态度,认为仍需进一步发展。

8、“AI 才女”罗福莉官宣加入小米,将致力于构建“物理世界的智能”

罗福莉的加入标志着小米在AI大模型研究和AGI领域的进一步发展,她的专业背景和才华将为小米带来新的动力。

【AiBase提要:】

🧠 罗福莉加入小米,致力于构建“物理世界的智能”

💰 有传言称雷军曾以千万年薪挖角罗福莉

🚀 小米在AGI领域投入增强,向“物理世界的智能”迈进

举报

  • 相关推荐
  • 修图神器PS引入ChatGPT:用户一句话即可编辑

    Adobe正式宣布,在ChatGPT中推出Photoshop、Express和Acrobat的集成功能。 用户现可通过对话界面,直接在ChatGPT内调用这些工具进行创作、编辑与文档处理。 Adobe数字媒体总裁David Wadhwani表示,此次集成将Adobe的创意创新能力与ChatGPT的便捷交互相结合,助力更多人轻松实现创作。 这一发布基于Adobe在对话式人工智能和模型上下文协议(MCP)领域的持续创新。此前,Adobe已推出Acrobat Stud

  • 微信公众号编辑器哪个好用?推荐这款带AI自动排版的工具

    2025年微信公众号数量突破3000万,内容创作者日均花费3.2小时排版。在此背景下,高效排版工具至关重要。小墨鹰编辑器以96%的AI识别准确率和30秒极速排版能力脱颖而出,成为行业优选。其核心优势包括:AI智能排版技术30秒完成全文排版,效率提升3600%;支持25万+素材智能匹配;海量素材库持续更新,覆盖45个行业;操作便捷,支持多端同步。用户反馈显示,使用后排版时间从3小时缩短至10分钟,团队效率提升18倍。小墨鹰凭借持续创新的AI技术和强大素材库支持,服务500万用户,真正实现“让排版不再是负担”,是公众号运营者值得信赖的排版伙伴。

  • 全国首款!极光 JPush 荣获信通院鸿蒙版 SDK 安全测评证书

    在万物互联的智能时代,操作系统安全基石与生态构建至关重要。极光旗下核心产品JPush SDK(鸿蒙版)凭借卓越的安全架构与技术表现,成功通过中国信通院严格检测,荣获“SDK安全专项行动检验(鸿蒙系统)证书”。这是全国首款、也是目前唯一一款获得该项权威认证的鸿蒙版SDK。此次认证不仅标志着极光在鸿蒙原生应用开发领域的技术实力达到行业顶尖水平,更为整个鸿�

  • AI日报:北京发布人工智能产业白皮书;字节发布视频编辑模型Vidi2;快手将发布Kling Omni

    本期AI日报聚焦多项AI领域进展:北京发布人工智能产业白皮书,预计2025年核心产值超4500亿元;字节跳动推出120亿参数视频模型Vidi2,实现视频编辑自动化;西藏首个千亿参数藏语大模型“阳光清言”问世,助力高原AI发展;快手Kling Omni即将发布,支持导演级精准控制,可生成2分钟带原生音频长视频;Meta推出Matrix框架,革新多智能体合成数据生成;国产家庭机器人F1亮相,具备多项家务能力,计划明年上市;豆包App升级语音功能,支持四种方言对话,提升老年人使用体验;豆包手机助手技术预览版发布,旨在提供更高效交互。

  • AI日报:Medeo AI新版视频Agent上线:OpenAI正式发布GPT-5.2;钉钉AI功能大升级

    本期AI日报聚焦多款AI产品更新:Medeo AI新版视频Agent支持自然语言一键改剧本,降低创作门槛;钉钉8.1.10将AI融入职场沟通,提升效率;OpenAI低调上线GPT-5.2,延迟显著降低,逻辑一致性提升,并推出支持私有化部署的成人模式;迪士尼投资100亿美元与OpenAI合作,推动IP在生成式AI中的创新应用;谷歌Gemini Deep Research开放API,供开发者构建研究应用;Cohere推出Rerank 4,上下文窗口扩展至32K,提升企业搜索精度;拓竹科技推出3D手办生成器“印你”,依托腾讯混元3D模型,简化3D建模流程;谷歌NotebookLM升级,为Ultra会员提供更高权限,优化智能笔记体验。

  • OPPO上线AI妙听:可将文章转双人播客 配有BGM

    OPPO ColorOS设计总监陈希分享了ColorOS新功能AI妙听。 AI妙听可将把文章一键转成播客,让原本只能读”的内容,也能用听”的方式获取。 值得一提的是,该功能并非单纯的TTS文本转语音,机械朗读,而是将内容进行重构,并以双人播客的形式呈现,配有背景音乐,用户的听感更好。 陈希表示,越来越多人喜欢听播客,不只是方便,它是一种

  • 中关村AI北纬社区发布 北京市首个人工智能OPC服务计划

    随着人工智能技术加速演进与创业模式持续创新,“一人创业公司”(OPC)正成为推动“人工智能+”行动落地的重要创新力量。12月8日,中关村AI北纬社区联动海淀校友驿站、海淀大学生实习实践平台、AI北纬社区夜校,正式发布北京市首个人工智能OPC服务计划,探索打造人工智能OPC友好社区,让更多青年创业者“在这里,用AI孵化AI”,定义AI的千万种可能。

  • 特斯拉FSD更新:允许车主在自动驾驶模式下发短信

    马斯克日前确认特斯拉FSD系统新增功能,允许用户在自动驾驶状态下发送短信。 今日,特斯拉更新FSD,该功能已随FSD v14.2.1版本推送,目前特斯拉正开放该软件免费试用。 有记者随即用2024款Model 3实测,验证其功能可行性。 实测显示,记者设定短途行程后按下开启自动驾驶”按钮,车辆便自动启动。 全程7分钟内,他用手机持续发消息,车辆未阻止操作,仅在途中提示轻握�

  • 微算法科技(NASDAQ:MLGO)深度学习区块链技术:构建“信任+智能”双引擎的数字新生态

    文章探讨了区块链与深度学习技术的互补性。区块链凭借去中心化与不可篡改特性构建信任基石,但静态数据存储与有限处理能力制约了复杂场景下的深度分析与智能决策。深度学习虽具备强大模式识别与数据挖掘能力,却在跨设备协作中面临数据孤岛与隐私泄露的双重挑战。微算法科技提出的深度学习区块链技术,通过将深度学习的动态分析能力与区块链的分布式信任体系深度融合,开创了“信任+智能”双引擎驱动的数字新生态。该技术以区块链网络为协作枢纽,多设备终端为计算节点,构建分布式智能系统,通过设备本地训练、参数安全共享、全局模型聚合的闭环流程,实现数据隐私保护与模型协同进化的双重目标。这一融合不仅拓展了区块链在预测、诊断等复杂场景的应用边界,也通过参数共享替代原始数据传输,从根本上规避数据泄露风险,推动数字生态从“单点智能”向“全局智能”升级。

  • OpenAI调查:AI工具使员工日均节省1小时

    OpenAI近期一项针对9000名员工的大型调查显示,其AI工具已帮助许多员工每天节省40至60分钟的专业工作时间,其中数据科学、工程、传播与会计等岗位的感受尤其明显。整体而言,四分之三的受访者认为AI提升了自己的工作速度或输出质量。 尽管AI热潮已持续三年,外界对其是否真正带来生产力红利仍存质疑。MIT今年8月的研究指出,绝大多数企业在生成式AI上的投入未能获得回�

今日大家都在搜的词: