首页 > 业界 > 关键词  > 文心大模型最新资讯  > 正文

AI视野:文心大模型4.0将发布;Stability AI发布移动端语言模型Stable LM3B;OpenAI举办ChatGPT应用开发大赛;视觉中国、华为云携手打造视觉大模型

2023-10-09 14:48 · 稿源:站长之家

文头.jpg

🤖📈💻💡大模型动态

文心大模型4.0将发布

百度正在加速训练文心大模型4.0,并计划在10月17日的百度世界大会上发布。这一新版本将是文心大模型3.5的重要升级,重点提升基础模型能力,尤其在逻辑推理、代码和数学等方面取得显著进展。

AiBase提要:

🚀百度正快速推进文心大模型4.0的训练,预计将在10月17日的百度世界大会上发布。

🧠 这一新版本将显著提升文心大模型的核心能力,包括理解、生成、逻辑和记忆,尤其在逻辑推理、代码和数学方面表现突出。

📈 如果一切顺利,文心大模型4.0的中文能力可能将超越GPT-4。

美图视觉大模型3.0发布

美图公司在15周年生日会上发布了自研AI视觉大模型MiracleVision3.0版本,将广泛应用于影像与设计领域,助力电商、广告、游戏、动漫、影视五大行业,提高工作效率。

微信截图_20231009144150.png

AiBase提要:

📸 MiracleVision3.0发布,提高影像细节描绘

🖌️ 核心特性包括"奇思妙想"和"智能创作"

🏭 适用于电商、广告、游戏、动漫、影视五大行业,优化工作流程

贾佳亚团队开源全球首个70B长文本大语言模型LongAlpaca

香港中文大学的贾佳亚团队联合MIT发布了全球首个70B参数的长文本开源大语言模型LongAlpaca。该模型支持将文本长度扩展至10万级 tokens,而只需极少的计算资源。

image.png

GitHub项目地址:

https://github.com/dvlab-research/LongLoRA

论文地址:

https://browse.arxiv.org/pdf/2309.12307.pdf

AiBase提要:

1. 🚀 LongAlpaca-70B:全球首个长文本大语言模型。

2. 💡 文本长度扩展:只需极少计算资源,支持10万级 tokens。

3. 📚 多方应用:分析论文、区分会议风格、解读名著章节等。

Stability AI发布移动端语言模型Stable LM3B

StabilityAI发布了最新的语言模型Stable LM3B,为便携式数字设备设计,参数规模30亿,性能高、可移植,具有环保特性。

微信截图_20231009090925.png

AiBase提要:

🔍 参数规模30亿,性能卓越

📈 减少资源消耗、降低运行成本

🌱 具备环保特性,广泛应用潜力

视觉中国与华为云合作 携手打造视觉大模型

视觉中国与华为云签署合作协议,基于华为云盘古大模型合作打造视觉大模型,助力多模态大模型生态建设。

AiBase提要:

🤝 合作协议签署:视觉中国与华为云正式签署合作协议,共同合作打造视觉大模型。

🌐 优质内容与科技驱动:视觉中国以人工智能、大数据等技术,聚合4亿多的数字内容,构建智能交易与服务平台。

📈 助力生态建设:合作将助力多模态大模型生态建设,加速人工智能在互联网行业的创新应用。

多用途大语言模型SynthIA-7B-v1.3:可用于教学、写作等多领域

SynthIA-7B-v1.3是一款拥有七十亿参数的大型语言模型,经过Orca风格数据训练,可执行多种任务,包括文本生成、语言翻译、创作原创内容和提供深入问题回答。

项目网址:https://huggingface.co/migtissera/SynthIA-7B-v1.3

AiBase提要:

📚 在文学领域,SynthIA-7B-v1.3可生成文章、博客、故事和诗歌,为创作者提供灵感。

🔬 对研究人员而言,它是强大的辅助工具,用于假设开发、论文摘要和报告撰写。

🏫 在教育领域,可用于创建定制课程材料、解答学生问题和评估作业,提供更多教育可能性。

💼 在商业领域,SynthIA-7B-v1.3用于优化企业流程,包括产品/服务创意、客户支持回复和市场营销,提高企业效率。

📰🤖📢AI新鲜事

OpenAI举办ChatGPT应用开发大赛:吸引226个团队参加

OpenAI最近举办了一场名为“ChatGPT应用开发大赛”的活动,吸引了226个团队的热情参与。这次大赛旨在推动生成式AI技术的实际应用和发展,并在首尔举行,得到了SKT等机构的支持。

image.png

AiBase提要:

🏆 OpenAI举办ChatGPT应用开发大赛,吸引了226个团队热情参与

🌐 活动旨在推动生成式AI实际应用

👥20个团队进入决赛,两个团队获得一等奖

ChatGPT成DALL·E3秘密版主 自动修改敏感内容

DALL·E3的新功能引发轰动,但OpenAI也增加了图像生成的安全措施。技术报告揭示了ChatGPT如何改写Prompt以确保合规性,包括拒绝敏感内容、使用分类器、维护屏蔽列表以及改进图像输出分类器。

image.png

论文地址:https://cdn.openai.com/papers/DALL_E_3_System_Card.pdf

AiBase提要:

📢 DALL·E3功能炙手可热,但OpenAI加强了安全措施

🚫 ChatGPT改写Prompt以防敏感内容,使用分类器保持合规

🔒 图像输出分类器升级,降低风险,提高安全性

美图与中国移动云盘达成合作 后者将可使用AI图片处理功能

美图公司与中国移动互联网有限公司达成战略合作,共同探索云上规模和价值,提供了强大的云端存储和AI图片处理功能。

微信截图_20231009081746.png

AiBase提要:

🤝 合作伙伴: 美图公司与中国移动互联网有限公司达成战略合作。

📦 云端存储: 利用中国移动云盘的云端存储和共享服务能力,美图公司实现了影像拍摄和处理的同步备份。

🖼️ AI图片处理: 用户可以在中国移动云盘内使用多种AI图片处理功能,包括文生图、图生图等。

靠一张AI图卖出上千件?这届网友被国风毛衣裙骗惨了

最近话题“国风毛衣裙的第一批受害者”登上了各大平台热搜,微博话题阅读量超3404万,抖音“国风毛衣”话题下的视频播放量达1.3亿。

图片

AiBase提要:

🔍 淘宝等平台售卖国风毛衣裙,卖家用AI图欺骗消费者,引发翻车现象。

🛒 消费者对虚假宣传提出投诉,呼吁平台加强监管,要求标注AI生成内容。

👗 商家使用AI模特图可能影响消费者理性判断,引发讨论虚假宣传问题。

AI大模型数据标注员月入不过5000元,单价从5毛降到4分

Tech 星球报道指出,数据标注员们的工资采用最原始的计件制,大多数从业者每月收入不超过5000元。这些标注员中有各种背景,包括专科毕业生、家庭主妇和转行者。而在2017年,AI技术兴起时,数据标注员们能够赚取可观的收入,仅一个2D拉框项目就可以赚取5毛钱。

AiBase提要:

👩‍💼 低薪问题:数据标注师郑雯每小时只赚2毛钱,揭示了数据标注行业的低薪困境。

💰 价格下跌:数据标注价格从5毛降到4分,导致从业者的收入减少,反映行业竞争激烈。

🏭 规模化需求:数据标注公司需要规模化,以满足大厂的订单需求,但员工流动性大导致质量和周期不稳定。

李嘉诚早在2012年就布局AI 投资DeepMind母公司

李嘉诚早在2012年投资阿尔法狗母公司DeepMind,成为大模型领域的先行者,如今持续布局高科技领域,投资众多AI和大模型公司,取得不俗成就。

AiBase提要:

1. 🚀 早期布局:李嘉诚在2012年投资DeepMind,取得丰厚回报,成为大模型领域的先行者。

2. 🌟 持续投资:他不断扩大对AI领域的投资,涵盖机器人、生物医疗等多个领域,积极参与大模型公司的融资。

3. 💡 高科技热情:李嘉诚深感兴趣于新科技,认为科技革命带来无尽投资机会,不断寻找颠覆性创新项目。

ChatGPT预测狗狗币在2024年价格将达到1美元

ChatGPT通过预测狗狗币未来价格,认为投资狗狗币具有战略意义,预计在2024年第一季度将达到1美元。然而,需要谨慎行事,因为狗狗币的价格仍可能面临短期下跌风险。

image.png

AiBase提要:

📈 投资狗狗币有战略意义。

💰 预计2024年第一季度狗狗币价格将达到1美元。

⚠️ 谨慎投资,仍存在短期下跌风险。

研究称:数字水印保护可被轻松绕过

研究指出,AI生成深度伪造图像的风险日益增加,数字水印保护容易绕过,但设计强大的数字水印仍可能成为解决方案。

AiBase提要:

🔍 风险上升:AI技术使深度伪造图像易于生成,引发虚假信息和欺诈问题。

💧 数字水印问题:研究显示数字水印保护容易被轻松绕过,增加信息泄漏和欺诈风险。

🛡 解决方案挑战:尽管数字水印存在挑战,设计强大的数字水印仍有可能成为问题的解决方案。

🤖📱💼AI应用

微软确认 Windows Copilot 并非所有人都能在 Windows11上使用

Windows Copilot 是 Windows11Moment4更新的一部分,于9月26日开始向普通用户推出。但并非所有人都可以使用 Copilot。目前,Copilot 仅在美国(以及北美)、英国以及亚洲和南美洲的一些国家可用。

AiBase提要:

🌐 地区受限:Copilot仅在美国、英国以及亚洲和南美洲的一些国家可用,欧洲由于隐私法暂时不支持。

🤖 功能受限:Copilot目前只能在特定Windows应用程序中工作,不支持更深入的Windows集成或第三方应用。

🕵️ 尝试方法:用户可以尝试通过创建桌面快捷方式来在不受支持的地区使用Copilot。

文字转视频工具Moonvalley:用简单提示可生成高质量视频

Moonvalley是一款强大的文字转视频生成AI模型,只需简单的文字描述即可生成高清视频和动画,适用于艺术创作和商业广告等领域。

image.png

项目网址:https://moonvalley.ai/

Discord传送门:discord.gg/moonvalley

AiBase提要:

🌟 创作无需专业技能,凭借几行文本提示即可生成电影级视觉效果。

🌟 多种风格可选,包括超现实主义、动漫、幻想等,满足不同需求。

🌟 Moonvalley由优秀的人工智能团队开发,获得了著名创业加速器和风投公司的资助,目前免费使用。

免费AI漫画生成器AI Comic Factory 生成图片支持无损放大

AI Comic Factory是一个免费开源的AI漫画生成器,使用LLM + SDXL开发。它能够根据用户提供的提示词生成漫画,并支持无损放大、保存和打印。近来,AI Comic Factory的流行度急剧上升,广泛应用于社交平台和短视频应用。其受欢迎的原因在于其简单易用的特性,用户只需输入关键词,AI就能生成精美的漫画作品,无需学习成本,适用于各年龄层。

QQ截图20231009091844.jpg

体验地址:https://huggingface.co/spaces/jbilcke-hf/ai-comic-factory

AiBase提要:

🧩 智能漫画生成:AI Comic Factory可以将用户提供的文本、故事情节或概念转化为漫画画面,自动选择配色方案、布局和字体。

🎨 多样化的风格选择:AI Comic Factory提供多种漫画风格和主题供用户选择,满足不同创作需求。

🌐 社区分享和合作:用户可以将漫画作品分享到社区中,与其他创作者互动、合作和获取灵感。这个社区是学习和成长的资源。

👨‍💻💡🎯聚焦开发者

谷歌 DeepMind 推出 Promptbreeder:一种自我进化的 AI 系统

谷歌的 DeepMind 团队推出了 Promptbreeder(PB),这是一种自我推理和完善的人工智能系统,可以在特定领域内生成有效的提示语。PB 通过自我改进提示语来提高大型语言模型(LLMs)的性能,不需要更新参数。这一技术有望广泛应用于提升人工智能在多个领域的表现。

AiBase提要:

🧬 自我改进能力: PromptBreeder(PB)是一种具有自我参照能力的人工智能系统,能够在特定领域内生成任务提示语。

🧩 进化算法: PB利用维持多样性的进化算法不断改进提示语,提高大型语言模型性能,包括常识推理和伦理学。

🚀 未来展望: PB的无需参数更新的自我改进策略有望影响未来更广泛、更强大的语言模型的发展。

MonoXiver:新AI算法将2D照片转换为3D地图

MonoXiver是北卡罗莱纳州立大学刘贤鹏团队开发的一种利用AI从二维图片中提取三维信息的方法,只需一个普通的单目摄像头,即可构建相机周围可靠的三维地图,适用于自动驾驶等领域。

image.png

AiBase提要:

📸 MonoXiver利用单目摄像头的2D图像生成可靠的三维地图。

🚗 这一方法对自主驾驶汽车的环境感知与导航具有重要意义。

🌐 MonoXiver还适用于机器人、环境监测、医学成像等领域。

Google DeepMind提出DRaFT算法以高效优化扩散模型

Google DeepMind最新提出的DRaFT算法用于高效优化扩散模型,提高了文本到图像生成等实际应用的效率和性能,成为机器学习领域的有价值工具。

image.png

论文地址:https://arxiv.org/abs/2309.17400

AiBase提要:

🚀 Google DeepMind提出直接奖励微调(DRaFT)方法,高效微调扩散模型,最大化可微奖励函数。

💡 引入DRaFT-K和DRaFT-LV算法,限制反向传播步数,提高效率,优于全反向传播。

🔬DRaFT在Stable Diffusion1.4上应用,效率远超强化学习的微调基线,尤其DRaFT-LV效率最高

举报

  • 相关推荐
  • 登榜LMArena!文心大模型5.0-Preview文本能力国内第一

    11月8日,文心全新模型ERNIE-5.0-Preview-1022在LMArena大模型竞技场排名中位列全球第二、中国第一。该模型在创意写作、复杂长问题理解和指令遵循方面表现突出,超越多款国内外主流模型。创意写作可高效生成文章、营销文案等内容;复杂长问题理解适用于学术问答、报告分析等任务;指令遵循能力支持智能助理、代码生成等场景,为多领域内容生产提供高效支撑。

  • 小米超级小爱AI大模型推出随心修图功能

    小米宣布超级小爱AI大模型推出随心修图功能,用户只需一句话即可轻松修出具有大片质感的照片。该功能有两种使用方式:在相册大图页面直接唤醒AI或通过应用上传照片并输入指令。使用需满足版本要求:超级小爱需v7.8.50及以上,相册编辑功能需v2.1及以上,相册本身需v4.3.0.30及以上。目前仅限Xiaomi HyperAI机型支持在相册大图页使用。超级小爱于2024年12月面向正式版用户开放升级,支持全局多模态交互和自然语音搜索,提升使用体验。

  • 突破大模型对齐瓶颈,北大团队携手昇腾打通产业应用通路

    北大杨耀东团队研发Align-Anything多模态对齐框架,以RLHF为核心解决传统反馈信息有限问题,覆盖文本、图像、音频等全模态数据。该框架集成专用评估工具Eval-Anything,已在昇腾平台实现智慧医疗、网络安全等领域规模化落地。通过构建安全治理体系,显著提升大模型安全水位,同时保持通用能力。团队联合推出课程培养人才,深化产学研协同,为多模态大模型发展提供关键技术支撑。

  • 2025乌镇峰会:易鑫发布汽车金融行业首个Agentic大模型XinMM-AM1

    易鑫集团在2025世界互联网大会乌镇峰会上发布汽车金融行业首个Agentic大模型XinMM-AM1。该模型具备300亿参数、响应延迟低于200ms等技术优势,能提升获客、风控与运营效率,优化用户体验。通过全链路智能决策能力,推动行业从"单点智能"转向"整体高效"。配套SaaS平台已覆盖超4万家经销商及百余家金融机构,显著提高融资通过率与业务质量,填补领域技术空白,引领汽车金融智能化发展。

  • AI日报:百度发布文心5.0;可灵2.5Turbo模型上线“首尾帧”功能;微博推出 VibeThinker-1.5B

    本期AI日报聚焦多项技术突破:OpenAI推出GPT-5.1,提升对话自然度与响应速度;百度发布原生全模态大模型文心5.0,支持跨文本图像生成;微博开源VibeThinker-1.5B模型,以低成本实现高效推理;可控视频生成模型新增首尾帧控制功能;李飞飞团队推出商用3D世界生成工具Marble;东北大学开源多语言翻译模型支持60种语言;谷歌Gemini语音功能升级实现更自然交互;阿里启动“千问”项目对标ChatGPT,全面布局C端AI应用竞争。

  • AI日报:阿里千问APP公测;Veo 3.1上线多图参考;超级小爱AI大模型“随心修图”上线

    本期AI日报聚焦多项技术突破:阿里千问APP公测,基于Qwen3模型对标ChatGPT;谷歌Veo 3.1支持三图融合生成8秒视频;小米推出"随心修图"功能与7B多模态模型Miloco;谷歌Flow集成Nano Banana模型实现智能抠图;多模态AI工具DeepEyesV2可执行代码与网络搜索;NotebookLM升级支持图像导入检索;JetBrains推出DPAI Arena测试编码AI性能。全球AI竞争持续升温,产品迭代加速。

  • Billus AI高交会全球首发多模态大模型 以AI Agent重构创意产业文明进化路径

    2025年11月15日,Billus AI在高交会首发多模态大模型Billus0.57EDIT及“超级员工智能体”初阶版,依托自研生存式大模型与AI Agent技术,打破创意领域垂直局限,构建覆盖文创、时尚、艺术等全场景智能创作生态。该模型通过自然语言指令直达创意成果,实现从平面图到施工图的全流程高效生成。同时,Billus AI同步打造“创意设计超级员工+产业链智能体”体系,探索生成式创意与供应链智能推荐的新商业路径,助力行业从“经验驱动”向“数据智能”跃迁。

  • 易鑫正式发布汽车金融行业首个Agentic大模型

    易鑫在2025世界互联网大会乌镇峰会上发布汽车金融行业首个Agentic大模型XinMM-AM1。该模型参数量约300亿,响应延迟低于200毫秒,支持语音实时交互,单卡吞吐达370 tokens/秒,可提升获客、风控与运营效率,解决行业周期长、交互多、决策复杂等难题。易鑫作为AI驱动的金融科技平台,研发投入超20亿元,率先实现AI全场景应用,将持续推动智能汽车金融生态建设。

  • 新Siri或明年春季发布 苹果公司或引入谷歌Gemini大模型 AI技术

    苹果因自研大模型项目遇瓶颈,决定引入谷歌Gemini大模型升级Siri,计划每年支付约10亿美元获取定制化Gemini 2.5 Pro使用权。该模型拥有1.2万亿参数,将全面负责Siri的信息摘要、任务规划及复杂指令执行等核心功能,支持多模态交互和超长文本处理。升级版Siri预计2026年春季随iOS 26.4推送,后续将在WWDC大会展示进一步整合。苹果选择谷歌主要因成本优势、长期合作基础及Gemini领先性能。

  • 大模型+反诈+算力三重突破 腾讯云三项成果闪耀金融科技应用场景大赛

    10月30日,2025金融街论坛年会金融科技大会公布“金融科技应用场景大赛”终评结果。腾讯云“金融反电诈治理方案”与“基于TCS的AI异构算力管理平台”凭借技术创新性与场景落地能力,从全国89家机构的280个项目中脱颖而出,双双荣获“十佳应用奖”。腾讯混元大模型信贷助手方案获“探索实践奖”。三大方案在金融风控、算力基座及大模型应用三个关键领域展现突出优势,获专家团高度认可。大赛自2021年启动,已成为金融科技领域极具影响力的赛事平台。

今日大家都在搜的词: