AI日报：文生图新顶流？神秘蓝莓模型横空出世；阿里妈妈开源AI图像修复模型；谷歌斥资27亿美元重聘AI专家

2024-09-29 15:07 · 稿源：站长之家

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解:https://top.aibase.com/

1、神秘蓝莓模型横空出世:AI文生图界的新霸主还是营销噱头?

神秘蓝莓模型的出现引发了业界广泛关注和热议。其表现在AI竞技场上迅速登顶，成为文生图领域的新霸主。然而，关于蓝莓的真实身份却引发了网友们的猜测和讨论，充满了神秘色彩和悬念。

【AiBase提要:】
🌟 蓝莓模型凭借出色表现力压知名对手，成为文生图界新霸主。
💡 蓝莓模型与Flux有密切联系，引发猜测和讨论。
🔍 蓝莓模型在实力展现中表现出色，但存在文本处理等方面的改进空间。
详情链接:https://artificialanalysis.ai/text-to-image/arena

2、谷歌斥资27亿美元重聘AI专家，竟是Character.AI创办人

谷歌为了重聘AI专家诺亚・沙泽尔，支付了惊人的27亿美元。沙泽尔的初创公司Character.AI在此交易中也获得了数亿收益。硅谷科技巨头们正争相抢夺AI研究人才，市场泡沫隐忧渐显。

【AiBase提要:】
💰 谷歌为了重聘AI专家诺亚・沙泽尔，支付了惊人的27亿美元。
🔍 沙泽尔的初创公司Character.AI在此交易中也获得了数亿收益。
🤖 硅谷科技巨头们正争相抢夺AI研究人才，市场泡沫隐忧渐显。

3、阿里妈妈开源全新AI图像修复模型FLUX-Controlnet-Inpainting

阿里妈妈创意团队开源了FLUX-Controlnet-Inpainting AI图像修复模型，结合FLUX.1-dev和ControlNet优势，能高质量修复图像。模型理解用户语言描述，可精准修复图像并改变风格。目前处于alpha测试阶段，未来将持续优化并发布更新版本。

【AiBase提要:】
🔧 结合FLUX.1-dev和ControlNet优势，高质量修复图像。
🎨 模型理解用户语言描述，精准修复图像并改变风格。
🚀 处于alpha测试阶段，未来持续优化并发布更新版本。
详情链接:https://github.com/alimama-creative/FLUX-Controlnet-Inpainting

4、一款免费开源电子书转有声书AI工具:支持语音克隆

Drew Thomasson最近发布的开源项目ebook2audiobookXTTS利用Calibre和Coqui TTS将电子书转换为有声读物，提供高质量的阅读体验。工具支持多语言、自定义语音克隆，具有高效转换、多语言支持和简单操作的特点。

【AiBase提要:】
🔥 高效转换: 利用Calibre实现多种电子书格式转换，自动章节检测。
🌍 多语言支持: 默认支持英语，还包括西班牙语、法语、德语等，满足全球用户需求。
🎤 任选语音克隆: 用户可使用自定义语音文件，打造独特听觉体验。
详情链接:https://github.com/DrewThomasson/ebook2audiobookXTTS

5、越聪明越会撒谎?研究警告 AI 误导性回答日益严重!

人工智能聊天机器人变得越来越强大，但研究显示它们的撒谎概率也在增加。越大的语言模型，错误答案的比例越高。研究者建议为AI设定回答阈值，鼓励其拒绝回答不确定的问题。

【AiBase提要:】
🔍 AI聊天机器人变得更强大，但撒谎的概率也增加。
📉 越大的语言模型，错误答案的比例越高。
🤖 研究者建议为AI设定回答阈值，鼓励其拒绝回答不确定的问题。

6、ORYX: 多模态大型语言模型改变AI视觉理解

在人工智能快速发展的今天，ORYX多模态大型语言模型正在改变我们对AI视觉理解的认知。这个由清华大学、腾讯和南洋理工大学联合开发的AI系统堪称视觉处理领域的"变形金刚"，具有处理任意分辨率视觉输入和动态压缩能力。

【AiBase提要:】
🔍 ORYX是专门设计用于处理图像、视频和3D场景时空理解的AI模型。
🌟 ORYX的核心优势在于能够理解视觉内容，洞察内容之间的关联和背后的故事。
💡 ORYX展现出了惊人的潜力，能深入理解视频内容、准确把握3D空间中物体的位置和关系。
详情链接:https://arxiv.org/pdf/2409.12961

7、给油画做CT!AI一眼看破拉斐尔艺术名画的创作秘诀

近年来，无损成像技术在绘画研究和保护领域取得了飞速发展。意大利研究人员成功将深度学习算法应用于MA-XRF数据集的光谱分析，开发出新的分析方法。该方法在处理MA-XRF数据集中的XRF光谱方面表现出色，为艺术品分析领域带来重大进步。

【AiBase提要:】
🔍 深度学习算法在MA-XRF数据集的光谱分析中取得突破
💡 新方法能更准确地量化荧光线强度，消除传统分析方法的伪影
🎨 人工智能技术为更准确、高效地分析XRF光谱提供新思路
详情链接:https://www.science.org/doi/10.1126/sciadv.adp6234

8、OpenAI计划五年内将ChatGPT价格翻倍，2029目标年收入达1000亿美元

最近曝光的OpenAI内部文件显示，他们计划在未来五年内将ChatGPT的价格翻倍，同时目标实现2029年的1000亿美元收入。这一举动引起了广泛关注，同时也揭示了OpenAI在人工智能领域的雄心壮志。

【AiBase提要:】
🚀 OpenAI计划未来五年内将ChatGPT价格翻倍至44美元，目标实现1000亿美元年收入。
📈 过去一年OpenAI收入增长三倍，今年ChatGPT预计带来27亿美元收入。
💻 Microsoft是OpenAI最大的成本来源，其投资回流影响了双方的估值和股价。

9、Hugging Face新里程碑:免费AI模型数量突破一百万，用户每10秒就会创建新AI 存储库

Hugging Face宣布AI模型数量超过一百万，展示专业化解决方案增长趋势。平台每10秒创建新仓库，推动AI应用普及。

【AiBase提要:】
🌟 Hugging Face的公开AI模型数量突破一百万，显示专业化解决方案增长趋势。
🛠️ 平台每10秒创建一个新仓库，包括模型、数据集和应用空间。
📈 未来AI模型数量有望与代码仓库相当，推动各行各业的AI应用。

10、谷歌 DeepMind 发布 AlphaChip:AI 加速芯片设计，效率提升惊人!

谷歌 DeepMind 最新发布的 AI 系统 AlphaChip 旨在加速和优化芯片设计，引领芯片行业进步。AlphaChip 已在谷歌最新 TPU 系列中取得显著布局优化，展现出惊人的效率提升。开源资源让外部研究人员能够利用预训练模型进行应用，进一步推动芯片设计领域的发展。

【AiBase提要:】
🌟 AlphaChip 是谷歌 DeepMind 推出的 AI 系统，旨在加速和优化芯片设计。
🔍 该系统已在谷歌的最新 TPU 系列中应用，并实现了显著的布局优化。
📚 DeepMind 将部分 AlphaChip 资源开源，外部研究人员可以利用这些资源进行预训练和应用。

11、德国法院允许非营利组织LAION抓取受版权保护的图像用于AI训练

在德国汉堡的法庭裁决引发了AI训练数据收集和使用的新讨论，为AI发展的法律框架提供重要参考。裁决允许LAION非商业科学研究使用版权图像，引发争议。

【AiBase提要:】
🤖 德国法院裁定LAION非营利性质下使用版权图像符合法律
🔍 裁决强调数据集免费用于研究目的，支持AI研究机构数据收集
⚖️ 法院未解决更广泛文本和数据挖掘例外适用性问题，未来AI与版权关系仍存疑

12、全新开源爬虫工具Crawl4AI:极速抓取网页内容并进行数据提取

在驱动的人工智能时代，大型语言模型如GPT-3和BERT对高质量数据的需求不断增加。Crawl4AI作为开源工具解决了传统网络爬虫的局限性，提供了适合LLM训练的高效且可定制的解决方案，输出格式包括JSON和Markdown，极大地促进了数据收集的简单高效。适用于多种LLM驱动的应用场景，为研究人员和开发者简化机器学习和人工智能项目数据获取流程。

【AiBase提要:】
🚀 Crawl4AI是一个开源工具，旨在简化和优化LLM训练所需的数据收集过程。
🌐 该工具支持并行处理和动态内容抓取，增强了数据收集的效率和灵活性。
📊 Crawl4AI输出的数据格式如JSON和Markdown，便于后续处理和应用。
详情链接:https://github.com/unclecode/crawl4ai

13、不用畏惧AI了!69%工作技能不太可能被生成式AI取代

最近Indeed Hiring Lab发布的研究表明，尽管生成式AI在职场中展现潜力，但并不意味着白领职位会被迅速取代。69%的工作技能被认为不太可能被生成式AI取代，会计行业的技能受AI影响最大。AI目前更擅长简单任务，复杂问题仍需人类解决。虽然AI前景光明，但短期内仍需要人类智慧和创造力。

【AiBase提要:】
✨69%的工作技能被认为不太可能被生成式AI取代。
💼 会计行业的技能受AI影响最大，有78%可能被取代。
📈 AI目前更擅长简单任务，复杂问题仍需人类解决。

14、OpenAI今年营收37亿美元，亏损或达50亿美元

OpenAI近期财务状况备受关注，预计今年亏损50亿美元，营收37亿美元。公司上个月收入增长1700%，预计明年销售额将达116亿美元。正在进行融资，估值或超过1500亿美元。考虑重组为盈利性质公司，以提高透明度和员工流动性。

【AiBase提要:】
📉 OpenAI预计今年亏损50亿美元，营收37亿美元，明年销售额可能达116亿美元。
💼 公司正在进行超额认购的融资，估值有望超过1500亿美元，吸引多家投资者参与。
🔄 OpenAI正考虑重组为盈利性质的公司，以提高透明度并帮助员工实现流动性。

（举报）

相关推荐

关键词：

蓝莓模型

来教装展，看全栈自主可控国产教育大模型何以赋能教学？

10月24-26日，第86届中国教育装备展在青岛举行。科大讯飞以“全栈自主可控国产教育大模型”为核心，展示五大智慧教育场景：智慧教学通过AI黑板实现师生协同，提升效率；科学教育推出AI虚拟科学家互动平台，激发探索精神；身心健康方案构建体育健康闭环与心理服务体系；教育治理推出数据驱动决策平台；学前教育引入游戏化学习产品。目前方案已覆盖全国5万余所学校，服务超1.3亿师生，展现AI从工具升级为“教育伴侣”的价值。

教育装备展示会人工智能+教育智慧教学
升级版“蓝心小V”亮相，豆包大模型助力vivo打造AI原生体验

vivo发布全新OriginOS 6系统，升级私人助手“蓝心小V”。该系统依托蓝心大模型与豆包大模型协同，实现精准意图识别与多模态交互，支持新闻、教育、天气等场景的智能问答。通过火山引擎联网搜索及内容整合，提供低延迟、高情感语音响应。同时拓展无障碍服务，为视障用户提供实时视觉辅助。未来将持续深化AI生态建设，打造更智能便捷的原生体验。

originOS6 蓝心小V AI原生操作系统
荐只有0.9B的PaddleOCR-VL，却是现在最强的OCR模型。

这几天，OCR这个词，绝对是整个AI圈最火的词。因为DeepSeek-OCR，甚至让OCR这个赛道文艺复兴，又给直接带火了。整个Hugging Face的趋势版里，前4有3个OCR，甚至Qwen3-VL-8B也能干OCR的活，说一句全员OCR真的不过分。然后在我上一篇讲DeepSeek-OCR文章的评论区里，有很多朋友都在把DeepSeek-OCR跟PaddleOCR-VL做对比，也有很多人都在问，能不能再解读一下百度那个OCR模型（也就是PaddleOCR-VL

OCR DeepSeek-OCR PaddleOCR-VL
快手进军AI Coding，开发工具、模型和Maas平台齐登场

10月23日，快手StreamLake发布全新AI编程产品矩阵，以“工具+模型+平台”三位一体战略布局AI Coding领域。核心产品包括智能开发助手CodeFlicker、自研高性能编码模型KAT-Coder系列及企业级服务平台快手万擎。CodeFlicker提供全流程开发支持，KAT-Coder在权威测试中性能超越GPT-5，平台保障99.95%服务可用性。该生态旨在通过技术普惠，为企业与开发者提供颠覆性研发体验，推动AI编程普及。

AI编程快手StreamLake CodeFlicker
向AI构建能力，用模型产出价值，让金融优质发展

2025年云栖大会在杭州举行，聚焦“云智一体+碳硅共生”主题，展现中国前沿科技生命力。阿里云智能集团副总裁张鹰介绍，“通义点金”平台全新升级，致力于构建金融行业垂直模型，打造具备业务洞察力的“专家级智能体”。核心突破包括：通过飞轮平台实现模型与业务双向螺旋上升，构建可观测、可评测、可迭代能力；赋予模型“自知之明”，精准调用工具并内化人类逻辑思维；建立多层次交叉验证测评体系，确保金融级严谨性。未来将持续推动通用模型与金融专业知识的有机结合，助力金融业务核心效能提升。

云栖大会人工智能大模型
金融行业用好大模型，只有“垂直”一个解

文章探讨大模型在金融等复杂业务场景的落地挑战，指出通用模型难以满足行业对准确性、可解释性及合规性的高要求。垂直模型通过内化行业核心知识与能力，成为解决复杂业务问题的关键路径。实践显示，金融垂直模型已在营销、客服、风控等场景实现显著成效，如提升效率80%、降低风险。未来需通过数据飞轮、深度适配等技术实现模型持续迭代，构建一站式金融垂直模型生产工场。

金融大模型垂直模型 Agentic
火山 AI 搜索引擎升级：大模型时代重塑用户体验与业务增长

火山引擎近日升级企业级AI搜索助手，底层模型升级至豆包大模型1.6，全面提升搜索、推荐、问答能力。该平台支持“开箱即用”，企业可快速构建专属对话式搜索助手，已在电商导购、视频新闻、AI搜图、智能硬件等多场景落地，帮助优化产品体验，为业务增长注入新动能。

火山AI搜索引擎豆包大模型1.6 企业级搜推AI助手
AI日报：OpenAI发布浏览器Atlas；通义Qwen3-VL新增2B、32B两个模型尺寸；百川发布循环证据增强大模型

本文汇总AI领域最新动态：OpenAI推出集成ChatGPT的Atlas浏览器，实现多任务自主处理；阿里通义千问新增2B/32B视觉语言模型，手机可流畅运行；谷歌AI Studio升级Vibe Coding功能，简化应用开发流程；百川发布医疗大模型M2Plus，通过循证推理降低误诊率；奇瑞墨甲机器人实现L3级技术突破，计划多行业应用；YouTube推出AI肖像识别工具，打击虚假内容；三星宣布2026年推出AI眼镜，融合AR与语音助手；Claude客户端更新，支持截图分析和语音交互功能。

AI OpenAI ChatGPT
全新开源的DeepSeek-OCR，可能是最近最惊喜的模型。

AI圈虽然天天卷，但是很多的模型，真的越来越无聊了。每天就是跑分又多了几个点。直到昨天，DeepSeek久违的发了一个新模型。 DeepSeek-OCR。这玩意，是真的有点酷。

DeepSeek-OCR AI模型 OCR技术
火山引擎：豆包大模型日均tokens使用量突破30万亿

今日在FORCE LINK AI创新巡展武汉站上，字节跳动旗下火山引擎披露最新大模型token调用数据。火山引擎总裁谭待现场表示，豆包大模型使用量从2024年5月1200亿tokens增长253倍至今年9月的超30万亿tokens。在企业市场，据IDC9月报告，2025年上半年，中国公有云大模型调用量达536.7万亿tokens。

火山引擎豆包大模型 token调用数据

今日大家都在搜的词：

热文

3 天
7天

AI日报：文生图新顶流？神秘蓝莓模型横空出世；阿里妈妈开源AI图像修复模型；谷歌斥资27亿美元重聘AI专家

来教装展，看全栈自主可控国产教育大模型何以赋能教学？

升级版“蓝心小V”亮相，豆包大模型助力vivo打造AI原生体验

荐只有0.9B的PaddleOCR-VL，却是现在最强的OCR模型。

快手进军AI Coding，开发工具、模型和Maas平台齐登场

向AI构建能力，用模型产出价值，让金融优质发展

金融行业用好大模型，只有“垂直”一个解

火山 AI 搜索引擎升级：大模型时代重塑用户体验与业务增长

AI日报：OpenAI发布浏览器Atlas；通义Qwen3-VL新增2B、32B两个模型尺寸；百川发布循环证据增强大模型

全新开源的DeepSeek-OCR，可能是最近最惊喜的模型。

火山引擎：豆包大模型日均tokens使用量突破30万亿

今日大家都在搜的词：

热文

华为nova Flip S小折叠开售：首发3388元起

雷军回应K90定价：最近内存涨价太多希望大家理解这份诚意

REDMI K90标准版12+512GB降价300元小米回应：可退差价

苹果首款2nm手机芯片上热搜 A20由iPhone 18系列首发

小米汽车发布跨年购置税补贴方案至高不超15000元

卢伟冰：REDMI K90标准版12+512首销月直降300 售价2899元

五大升级！红米REDMI K90标准版采用6.59英寸黄金中尺寸

AI日报：阿里夸克“C计划”曝光；Veo3.1将增加视频“精确编辑”

iOS 26液态玻璃效果能关了苹果iOS 26.1 Beta 4新增液态玻璃开

华为nova Flip S小折叠开售：首发3388元起

兰博基尼联名！REDMI K90 Pro Max冠军版官宣

真我GT8发布：售价2899元起骁龙8至尊版双芯

微信三大更新放出上热搜涉及群聊消息处理、消息撤回等

AI日报：OpenAI发布浏览器Atlas；通义Qwen3-VL新增2B、32B两个

余承东官宣华为路由X3 Pro 采用“日照金山”设计

红米REDMI K90标准版亮相：质感、工艺脱胎换骨

站长商机

AI日报：文生图新顶流？神秘蓝莓模型横空出世；阿里妈妈开源AI图像修复模型；​谷歌斥资27亿美元重聘AI专家

今日大家都在搜的词：

热文

站长商机

AI日报：文生图新顶流？神秘蓝莓模型横空出世；阿里妈妈开源AI图像修复模型；谷歌斥资27亿美元重聘AI专家