AI视野：文心大模型4.0将发布;Stability AI发布移动端语言模型Stable LM3B;OpenAI举办ChatGPT应用开发大赛；视觉中国、华为云携手打造视觉大模型

2023-10-09 14:48 · 稿源：站长之家

文头.jpg

🤖📈💻💡大模型动态

百度正在加速训练文心大模型4.0，并计划在10月17日的百度世界大会上发布。这一新版本将是文心大模型3.5的重要升级，重点提升基础模型能力，尤其在逻辑推理、代码和数学等方面取得显著进展。

AiBase提要:
🚀百度正快速推进文心大模型4.0的训练，预计将在10月17日的百度世界大会上发布。
🧠 这一新版本将显著提升文心大模型的核心能力，包括理解、生成、逻辑和记忆，尤其在逻辑推理、代码和数学方面表现突出。
📈 如果一切顺利，文心大模型4.0的中文能力可能将超越GPT-4。

美图视觉大模型3.0发布

美图公司在15周年生日会上发布了自研AI视觉大模型MiracleVision3.0版本，将广泛应用于影像与设计领域，助力电商、广告、游戏、动漫、影视五大行业，提高工作效率。

微信截图_20231009144150.png

AiBase提要:

📸 MiracleVision3.0发布，提高影像细节描绘

🖌️ 核心特性包括"奇思妙想"和"智能创作"

🏭 适用于电商、广告、游戏、动漫、影视五大行业，优化工作流程

贾佳亚团队开源全球首个70B长文本大语言模型LongAlpaca

香港中文大学的贾佳亚团队联合MIT发布了全球首个70B参数的长文本开源大语言模型LongAlpaca。该模型支持将文本长度扩展至10万级 tokens，而只需极少的计算资源。

GitHub项目地址:

https://github.com/dvlab-research/LongLoRA

论文地址:

https://browse.arxiv.org/pdf/2309.12307.pdf

AiBase提要:
1. 🚀 LongAlpaca-70B:全球首个长文本大语言模型。
2. 💡 文本长度扩展:只需极少计算资源，支持10万级 tokens。
3. 📚 多方应用:分析论文、区分会议风格、解读名著章节等。

Stability AI发布移动端语言模型Stable LM3B

StabilityAI发布了最新的语言模型Stable LM3B，为便携式数字设备设计，参数规模30亿，性能高、可移植，具有环保特性。

微信截图_20231009090925.png

AiBase提要:
🔍 参数规模30亿，性能卓越
📈 减少资源消耗、降低运行成本
🌱 具备环保特性，广泛应用潜力

视觉中国与华为云合作携手打造视觉大模型

视觉中国与华为云签署合作协议，基于华为云盘古大模型合作打造视觉大模型，助力多模态大模型生态建设。

AiBase提要:
🤝 合作协议签署:视觉中国与华为云正式签署合作协议，共同合作打造视觉大模型。
🌐 优质内容与科技驱动:视觉中国以人工智能、大数据等技术，聚合4亿多的数字内容，构建智能交易与服务平台。
📈 助力生态建设:合作将助力多模态大模型生态建设，加速人工智能在互联网行业的创新应用。

多用途大语言模型SynthIA-7B-v1.3:可用于教学、写作等多领域

SynthIA-7B-v1.3是一款拥有七十亿参数的大型语言模型，经过Orca风格数据训练，可执行多种任务，包括文本生成、语言翻译、创作原创内容和提供深入问题回答。

项目网址:https://huggingface.co/migtissera/SynthIA-7B-v1.3

AiBase提要:
📚 在文学领域，SynthIA-7B-v1.3可生成文章、博客、故事和诗歌，为创作者提供灵感。
🔬 对研究人员而言，它是强大的辅助工具，用于假设开发、论文摘要和报告撰写。
🏫 在教育领域，可用于创建定制课程材料、解答学生问题和评估作业，提供更多教育可能性。
💼 在商业领域，SynthIA-7B-v1.3用于优化企业流程，包括产品/服务创意、客户支持回复和市场营销，提高企业效率。

📰🤖📢AI新鲜事

OpenAI举办ChatGPT应用开发大赛:吸引226个团队参加

OpenAI最近举办了一场名为“ChatGPT应用开发大赛”的活动，吸引了226个团队的热情参与。这次大赛旨在推动生成式AI技术的实际应用和发展，并在首尔举行，得到了SKT等机构的支持。

AiBase提要:
🏆 OpenAI举办ChatGPT应用开发大赛，吸引了226个团队热情参与
🌐 活动旨在推动生成式AI实际应用
👥20个团队进入决赛，两个团队获得一等奖

ChatGPT成DALL·E3秘密版主自动修改敏感内容

DALL·E3的新功能引发轰动，但OpenAI也增加了图像生成的安全措施。技术报告揭示了ChatGPT如何改写Prompt以确保合规性，包括拒绝敏感内容、使用分类器、维护屏蔽列表以及改进图像输出分类器。

论文地址:https://cdn.openai.com/papers/DALL_E_3_System_Card.pdf

AiBase提要:
📢 DALL·E3功能炙手可热，但OpenAI加强了安全措施
🚫 ChatGPT改写Prompt以防敏感内容，使用分类器保持合规
🔒 图像输出分类器升级，降低风险，提高安全性

美图与中国移动云盘达成合作后者将可使用AI图片处理功能

美图公司与中国移动互联网有限公司达成战略合作，共同探索云上规模和价值，提供了强大的云端存储和AI图片处理功能。

微信截图_20231009081746.png

AiBase提要:
🤝 合作伙伴: 美图公司与中国移动互联网有限公司达成战略合作。
📦 云端存储: 利用中国移动云盘的云端存储和共享服务能力，美图公司实现了影像拍摄和处理的同步备份。
🖼️ AI图片处理: 用户可以在中国移动云盘内使用多种AI图片处理功能，包括文生图、图生图等。

靠一张AI图卖出上千件?这届网友被国风毛衣裙骗惨了

最近话题“国风毛衣裙的第一批受害者”登上了各大平台热搜，微博话题阅读量超3404万，抖音“国风毛衣”话题下的视频播放量达1.3亿。

AiBase提要:
🔍 淘宝等平台售卖国风毛衣裙，卖家用AI图欺骗消费者，引发翻车现象。
🛒 消费者对虚假宣传提出投诉，呼吁平台加强监管，要求标注AI生成内容。
👗 商家使用AI模特图可能影响消费者理性判断，引发讨论虚假宣传问题。

AI大模型数据标注员月入不过5000元，单价从5毛降到4分

Tech 星球报道指出，数据标注员们的工资采用最原始的计件制，大多数从业者每月收入不超过5000元。这些标注员中有各种背景，包括专科毕业生、家庭主妇和转行者。而在2017年，AI技术兴起时，数据标注员们能够赚取可观的收入，仅一个2D拉框项目就可以赚取5毛钱。

AiBase提要:
👩‍💼 低薪问题:数据标注师郑雯每小时只赚2毛钱，揭示了数据标注行业的低薪困境。
💰 价格下跌:数据标注价格从5毛降到4分，导致从业者的收入减少，反映行业竞争激烈。
🏭 规模化需求:数据标注公司需要规模化，以满足大厂的订单需求，但员工流动性大导致质量和周期不稳定。

李嘉诚早在2012年就布局AI 投资DeepMind母公司

李嘉诚早在2012年投资阿尔法狗母公司DeepMind，成为大模型领域的先行者，如今持续布局高科技领域，投资众多AI和大模型公司，取得不俗成就。

AiBase提要:
1. 🚀 早期布局:李嘉诚在2012年投资DeepMind，取得丰厚回报，成为大模型领域的先行者。
2. 🌟 持续投资:他不断扩大对AI领域的投资，涵盖机器人、生物医疗等多个领域，积极参与大模型公司的融资。
3. 💡 高科技热情:李嘉诚深感兴趣于新科技，认为科技革命带来无尽投资机会，不断寻找颠覆性创新项目。

ChatGPT预测狗狗币在2024年价格将达到1美元

ChatGPT通过预测狗狗币未来价格，认为投资狗狗币具有战略意义，预计在2024年第一季度将达到1美元。然而，需要谨慎行事，因为狗狗币的价格仍可能面临短期下跌风险。

AiBase提要:
📈 投资狗狗币有战略意义。
💰 预计2024年第一季度狗狗币价格将达到1美元。
⚠️ 谨慎投资，仍存在短期下跌风险。

研究称:数字水印保护可被轻松绕过

研究指出，AI生成深度伪造图像的风险日益增加，数字水印保护容易绕过，但设计强大的数字水印仍可能成为解决方案。

AiBase提要:
🔍 风险上升:AI技术使深度伪造图像易于生成，引发虚假信息和欺诈问题。
💧 数字水印问题:研究显示数字水印保护容易被轻松绕过，增加信息泄漏和欺诈风险。
🛡 解决方案挑战:尽管数字水印存在挑战，设计强大的数字水印仍有可能成为问题的解决方案。

🤖📱💼AI应用

微软确认 Windows Copilot 并非所有人都能在 Windows11上使用

Windows Copilot 是 Windows11Moment4更新的一部分，于9月26日开始向普通用户推出。但并非所有人都可以使用 Copilot。目前，Copilot 仅在美国（以及北美）、英国以及亚洲和南美洲的一些国家可用。

AiBase提要:
🌐 地区受限:Copilot仅在美国、英国以及亚洲和南美洲的一些国家可用，欧洲由于隐私法暂时不支持。
🤖 功能受限:Copilot目前只能在特定Windows应用程序中工作，不支持更深入的Windows集成或第三方应用。
🕵️ 尝试方法:用户可以尝试通过创建桌面快捷方式来在不受支持的地区使用Copilot。

文字转视频工具Moonvalley:用简单提示可生成高质量视频

Moonvalley是一款强大的文字转视频生成AI模型，只需简单的文字描述即可生成高清视频和动画，适用于艺术创作和商业广告等领域。

项目网址:https://moonvalley.ai/

Discord传送门:discord.gg/moonvalley

AiBase提要:
🌟 创作无需专业技能，凭借几行文本提示即可生成电影级视觉效果。
🌟 多种风格可选，包括超现实主义、动漫、幻想等，满足不同需求。
🌟 Moonvalley由优秀的人工智能团队开发，获得了著名创业加速器和风投公司的资助，目前免费使用。

免费AI漫画生成器AI Comic Factory 生成图片支持无损放大

AI Comic Factory是一个免费开源的AI漫画生成器，使用LLM + SDXL开发。它能够根据用户提供的提示词生成漫画，并支持无损放大、保存和打印。近来，AI Comic Factory的流行度急剧上升，广泛应用于社交平台和短视频应用。其受欢迎的原因在于其简单易用的特性，用户只需输入关键词，AI就能生成精美的漫画作品，无需学习成本，适用于各年龄层。

QQ截图20231009091844.jpg

体验地址:https://huggingface.co/spaces/jbilcke-hf/ai-comic-factory

AiBase提要:
🧩 智能漫画生成:AI Comic Factory可以将用户提供的文本、故事情节或概念转化为漫画画面，自动选择配色方案、布局和字体。
🎨 多样化的风格选择:AI Comic Factory提供多种漫画风格和主题供用户选择，满足不同创作需求。
🌐 社区分享和合作:用户可以将漫画作品分享到社区中，与其他创作者互动、合作和获取灵感。这个社区是学习和成长的资源。

👨‍💻💡🎯聚焦开发者

谷歌 DeepMind 推出 Promptbreeder:一种自我进化的 AI 系统

谷歌的 DeepMind 团队推出了 Promptbreeder（PB），这是一种自我推理和完善的人工智能系统，可以在特定领域内生成有效的提示语。PB 通过自我改进提示语来提高大型语言模型(LLMs)的性能，不需要更新参数。这一技术有望广泛应用于提升人工智能在多个领域的表现。

AiBase提要:
🧬 自我改进能力: PromptBreeder（PB）是一种具有自我参照能力的人工智能系统，能够在特定领域内生成任务提示语。
🧩 进化算法: PB利用维持多样性的进化算法不断改进提示语，提高大型语言模型性能，包括常识推理和伦理学。
🚀 未来展望: PB的无需参数更新的自我改进策略有望影响未来更广泛、更强大的语言模型的发展。

MonoXiver:新AI算法将2D照片转换为3D地图

MonoXiver是北卡罗莱纳州立大学刘贤鹏团队开发的一种利用AI从二维图片中提取三维信息的方法，只需一个普通的单目摄像头，即可构建相机周围可靠的三维地图，适用于自动驾驶等领域。

AiBase提要:
📸 MonoXiver利用单目摄像头的2D图像生成可靠的三维地图。
🚗 这一方法对自主驾驶汽车的环境感知与导航具有重要意义。
🌐 MonoXiver还适用于机器人、环境监测、医学成像等领域。

Google DeepMind提出DRaFT算法以高效优化扩散模型

Google DeepMind最新提出的DRaFT算法用于高效优化扩散模型，提高了文本到图像生成等实际应用的效率和性能，成为机器学习领域的有价值工具。

论文地址:https://arxiv.org/abs/2309.17400

AiBase提要:
🚀 Google DeepMind提出直接奖励微调（DRaFT）方法，高效微调扩散模型，最大化可微奖励函数。
💡 引入DRaFT-K和DRaFT-LV算法，限制反向传播步数，提高效率，优于全反向传播。
🔬DRaFT在Stable Diffusion1.4上应用，效率远超强化学习的微调基线，尤其DRaFT-LV效率最高。

（举报）

相关推荐

关键词：

文心大模型

登榜LMArena！文心大模型5.0-Preview文本能力国内第一

11月8日，文心全新模型ERNIE-5.0-Preview-1022在LMArena大模型竞技场排名中位列全球第二、中国第一。该模型在创意写作、复杂长问题理解和指令遵循方面表现突出，超越多款国内外主流模型。创意写作可高效生成文章、营销文案等内容；复杂长问题理解适用于学术问答、报告分析等任务；指令遵循能力支持智能助理、代码生成等场景，为多领域内容生产提供高效支撑。

文心模型 ERNIE-5.0 创意写作
小米超级小爱AI大模型推出随心修图功能

小米宣布超级小爱AI大模型推出随心修图功能，用户只需一句话即可轻松修出具有大片质感的照片。该功能有两种使用方式：在相册大图页面直接唤醒AI或通过应用上传照片并输入指令。使用需满足版本要求：超级小爱需v7.8.50及以上，相册编辑功能需v2.1及以上，相册本身需v4.3.0.30及以上。目前仅限Xiaomi HyperAI机型支持在相册大图页使用。超级小爱于2024年12月面向正式版用户开放升级，支持全局多模态交互和自然语音搜索，提升使用体验。

小米超级小爱 AI大模型
突破大模型对齐瓶颈，北大团队携手昇腾打通产业应用通路

北大杨耀东团队研发Align-Anything多模态对齐框架，以RLHF为核心解决传统反馈信息有限问题，覆盖文本、图像、音频等全模态数据。该框架集成专用评估工具Eval-Anything，已在昇腾平台实现智慧医疗、网络安全等领域规模化落地。通过构建安全治理体系，显著提升大模型安全水位，同时保持通用能力。团队联合推出课程培养人才，深化产学研协同，为多模态大模型发展提供关键技术支撑。

多模态大模型产业智能化升级模型训练与推理
2025乌镇峰会：易鑫发布汽车金融行业首个Agentic大模型XinMM-AM1

易鑫集团在2025世界互联网大会乌镇峰会上发布汽车金融行业首个Agentic大模型XinMM-AM1。该模型具备300亿参数、响应延迟低于200ms等技术优势，能提升获客、风控与运营效率，优化用户体验。通过全链路智能决策能力，推动行业从"单点智能"转向"整体高效"。配套SaaS平台已覆盖超4万家经销商及百余家金融机构，显著提高融资通过率与业务质量，填补领域技术空白，引领汽车金融智能化发展。

汽车金融 Agentic大模型 XinMM-AM1
荐AI日报：百度发布文心5.0；可灵2.5Turbo模型上线“首尾帧”功能；微博推出 VibeThinker-1.5B

本期AI日报聚焦多项技术突破：OpenAI推出GPT-5.1，提升对话自然度与响应速度；百度发布原生全模态大模型文心5.0，支持跨文本图像生成；微博开源VibeThinker-1.5B模型，以低成本实现高效推理；可控视频生成模型新增首尾帧控制功能；李飞飞团队推出商用3D世界生成工具Marble；东北大学开源多语言翻译模型支持60种语言；谷歌Gemini语音功能升级实现更自然交互；阿里启动“千问”项目对标ChatGPT，全面布局C端AI应用竞争。

AI视频生成可灵2.5Turbo 首尾帧功能
荐AI日报：阿里千问APP公测；Veo 3.1上线多图参考；超级小爱AI大模型“随心修图”上线

本期AI日报聚焦多项技术突破：阿里千问APP公测，基于Qwen3模型对标ChatGPT；谷歌Veo 3.1支持三图融合生成8秒视频；小米推出"随心修图"功能与7B多模态模型Miloco；谷歌Flow集成Nano Banana模型实现智能抠图；多模态AI工具DeepEyesV2可执行代码与网络搜索；NotebookLM升级支持图像导入检索；JetBrains推出DPAI Arena测试编码AI性能。全球AI竞争持续升温，产品迭代加速。

AI 阿里巴巴千问APP
Billus AI高交会全球首发多模态大模型以AI Agent重构创意产业文明进化路径

2025年11月15日，Billus AI在高交会首发多模态大模型Billus0.57EDIT及“超级员工智能体”初阶版，依托自研生存式大模型与AI Agent技术，打破创意领域垂直局限，构建覆盖文创、时尚、艺术等全场景智能创作生态。该模型通过自然语言指令直达创意成果，实现从平面图到施工图的全流程高效生成。同时，Billus AI同步打造“创意设计超级员工+产业链智能体”体系，探索生成式创意与供应链智能推荐的新商业路径，助力行业从“经验驱动”向“数据智能”跃迁。

高交会 Billus毕鲁斯多模态大模型
易鑫正式发布汽车金融行业首个Agentic大模型

易鑫在2025世界互联网大会乌镇峰会上发布汽车金融行业首个Agentic大模型XinMM-AM1。该模型参数量约300亿，响应延迟低于200毫秒，支持语音实时交互，单卡吞吐达370 tokens/秒，可提升获客、风控与运营效率，解决行业周期长、交互多、决策复杂等难题。易鑫作为AI驱动的金融科技平台，研发投入超20亿元，率先实现AI全场景应用，将持续推动智能汽车金融生态建设。

汽车金融大模型易鑫
新Siri或明年春季发布苹果公司或引入谷歌Gemini大模型 AI技术

苹果因自研大模型项目遇瓶颈，决定引入谷歌Gemini大模型升级Siri，计划每年支付约10亿美元获取定制化Gemini 2.5 Pro使用权。该模型拥有1.2万亿参数，将全面负责Siri的信息摘要、任务规划及复杂指令执行等核心功能，支持多模态交互和超长文本处理。升级版Siri预计2026年春季随iOS 26.4推送，后续将在WWDC大会展示进一步整合。苹果选择谷歌主要因成本优势、长期合作基础及Gemini领先性能。

苹果谷歌Gemini Siri升级
大模型+反诈+算力三重突破腾讯云三项成果闪耀金融科技应用场景大赛

10月30日，2025金融街论坛年会金融科技大会公布“金融科技应用场景大赛”终评结果。腾讯云“金融反电诈治理方案”与“基于TCS的AI异构算力管理平台”凭借技术创新性与场景落地能力，从全国89家机构的280个项目中脱颖而出，双双荣获“十佳应用奖”。腾讯混元大模型信贷助手方案获“探索实践奖”。三大方案在金融风控、算力基座及大模型应用三个关键领域展现突出优势，获专家团高度认可。大赛自2021年启动，已成为金融科技领域极具影响力的赛事平台。

金融科技应用场景大赛腾讯云

今日大家都在搜的词：

热文

3 天
7天

AI视野：文心大模型4.0将发布;Stability AI发布移动端语言模型Stable LM3B;OpenAI举办ChatGPT应用开发大赛；视觉中国、华为云携手打造视觉大模型

登榜LMArena！文心大模型5.0-Preview文本能力国内第一

小米超级小爱AI大模型推出随心修图功能

突破大模型对齐瓶颈，北大团队携手昇腾打通产业应用通路

2025乌镇峰会：易鑫发布汽车金融行业首个Agentic大模型XinMM-AM1

荐AI日报：百度发布文心5.0；可灵2.5Turbo模型上线“首尾帧”功能；微博推出 VibeThinker-1.5B

荐AI日报：阿里千问APP公测；Veo 3.1上线多图参考；超级小爱AI大模型“随心修图”上线

Billus AI高交会全球首发多模态大模型以AI Agent重构创意产业文明进化路径

易鑫正式发布汽车金融行业首个Agentic大模型

新Siri或明年春季发布苹果公司或引入谷歌Gemini大模型 AI技术

大模型+反诈+算力三重突破腾讯云三项成果闪耀金融科技应用场景大赛

今日大家都在搜的词：

热文

华为Mate X7外观公布搭载全新折叠玄武架构

AI日报：xAI推出Grok 4.1；OceanBase发布首款AI数据库seekdb；

董明珠再回应玫瑰空调：创新尝试打造家电艺术品

华为Mate X7今日开启预订搭载第二代红枫影像等配置

苹果回应iPhone17PM被湿巾擦掉色：高浓度酒精或是诱因

参与开发iPhoneAir设计师离职转投AI初创公司

AI日报：谷歌Gemini 3 Pro Preview模型上线；Cloudflare文件异

华为FreeBuds Pro 5悦彰耳机价格公布：1449元支持星闪音频

小米端到端辅助驾驶“Xiaomi HAD增强版”将于11月12日发布

小米AI眼镜推出1.4.16.0固件版本支持英语口语陪练

华为Mate 80系列已在华为商城开启预约

华为Mate 80 Pro Max外观公布：采用双圆环设计

华为Mate 80/Pro/Pro Max/RS开启预约：全系直屏设计

AI日报：阿里千问APP公测；Veo 3.1上线多图参考；超级小爱AI大

华为Mate X7外观公布搭载全新折叠玄武架构

阿里巴巴回应千问崩了：状态良好欢迎来问

AI日报：xAI推出Grok 4.1；OceanBase发布首款AI数据库seekdb；

荣耀500系列官宣将于11月24日发布

一加Ace 6T官宣将于本月发布：首发骁龙8 Gen5

小米超级小爱AI大模型推出随心修图功能

站长商机