意不意外！斯坦福科学家仅用600美元就克隆了OpenAI的ChatGPT

2023-03-21 09:41 · 稿源：站长之家

站长之家（ChinaZ.com）3月21日消息:如果说复制了一个OpenAI的ChatGPT的成本仅需600美元你会不会感到意外呢?事实上，斯坦福的科学家们真的做到了。

上周，斯坦福大学基础模型研究中心上周宣布，其研究人员使用 OpenAI 的 GPT API 对 Meta 的 LLaMA7B 大型语言模型（LLM）进行了“微调”，而且价格非常便宜。

结果就是斯坦福大学研究人员用600美元的成本，复制了OpenAI的GPT-3模型，并给自己的模型起了一个有趣的名字:Alpaca。他们利用了开放AI提供的预训练数据集和一些开源代码，只用了两个月就完成了复制。他们还在网上发布了自己的模型和代码，供其他人使用和改进。

这些科学家在其惊人简单的预算明细中表示，根据研究人员使用专有模型训练Alpaca所花费的时间，他们在 OpenAI 的 API 上投入“不到500美元”，在 LLaMA 上投入“不到100美元”。

虽然GPT-3是一个非常昂贵和复杂的模型，但是它并不是不可复制或独一无二的。复制品Alpaca模型虽然比GPT-3小很多，但是在一些任务上表现得很好，甚至超过了GPT-3。尽管如此，Alpaca确实也有“语言模型的几种常见缺陷，包括幻觉、毒性和刻板印象”。

这也可以当作一个典型的例子，证明了 OpenAI 这样的软件可能是容易复制的。

（举报）

相关推荐

关键词：

荐AI日报：豆包大模型1.6-vision发布；DeepSeek发布V3.2-exp模型；Claude Sonnet4.5发布

本期AI日报聚焦多项技术突破：DeepSeek发布V3.2-exp模型，通过稀疏注意力机制降低API成本50%；Anthropic推出Claude Sonnet 4.5，在编码任务表现卓越；ChatGPT新增即时结账功能，实现对话界面直接购物；OpenAI将推出AI版TikTok，所有内容由Sora2模型生成；百度地图升级小度想想2.0，提供智能出行服务；蚂蚁集团开源万亿参数模型Ring-1T-preview；DeepMind提出“帧链”概念，推动视频模型实现全面�

AI DeepSeek 稀疏注意力
破解海外旅游语言困境，时空壶新T1以端侧模型开启全球畅行

国庆假期临近，海外旅游热度攀升，语言沟通成为游客面临的主要障碍。网络不稳定更使依赖在线翻译工具的旅行者陷入困境。时空壶新T1翻译机通过端侧AI模型，实现无网或弱网环境下的流畅翻译，支持31种语言互译，覆盖全球98%主流旅游地。其离线翻译准确率达90%，响应迅速，并具备拍照翻译和降噪功能，有效解决机场、餐厅等嘈杂场所的沟通难题。新T1助力游客跨越语言壁垒，尽享无忧旅程，真正实现“无网也能畅行全球”。

海外旅游语言沟通翻译机
美团发布高效推理模型LongCat-Flash-Thinking：部分性能接近GPT5

9月23日，美团LongCat团队发布全新高效推理模型LongCat-Flash-Thinking。该模型在保持极致速度的同时，性能更强大、更专业，在逻辑、数学、代码、智能体等多个领域的推理任务中达到全球开源模型最先进水平（SOTA），部分任务性能接近闭源模型GPT5-Thinking。它增强了智能体自主调用工具能力，扩展了形式化定理证明能力，成为国内首个结合深度思考、工具调用与非形式化、形式化推理的大语言模型。在数学、代码、智能体等高复杂度任务上表现尤为突出，多项基准测试成绩领先开源及闭源顶尖模型，已在HuggingFace、Github全面开源。

高效推理模型 LongCat-Flash-Thinking 开源模型
微算法科技（NASDAQ: MLGO）融合二次矩阵变换模型，研发基于区块链的可溯源IP版权保护算法

微算科技（NASDAQ: MLGO）研发基于区块链的可溯源IP版权保护算法，解决现有技术效率低、可追溯性差等痛点。该方案融合二次矩阵变换、分布式随机嵌入与位置映射函数，实现版权从产生到交易流转的全链路精准追踪与安全保护。凭借区块链的不可篡改特性，算法有效抵御重放攻击，确保版权信息稳定可靠，有望拓展至专利、商标等知识产权领域，推动全球版权保护生态健全高效。

知识产权版权保护区块链技术
GEO排名查询工具推荐:霸屏AI大模型答案的核心方法，做好AI大模型排名优化

随着AI大模型成为用户获取信息的主要入口，AIBase推出GEO排名查询工具，帮助品牌监测在豆包、DeepSeek、文心一言等主流AI平台中的曝光情况。该工具支持多平台检测、关键词追踪、可视化数据展示，可精准分析品牌是否被推荐、出现频次及具体场景，为制定AI大模型排名优化策略提供数据支撑。在GEO时代，抢占AI回答推荐位意味着获得全新流量入口。

AI大模型 GEO排名查询生成引擎优化
强强联手！深度求索、寒武纪同步发布DeepSeek-V3.2模型架构和基于vLLM的模型适配源代码

2025年9月29日，深度求索公司发布新一代模型架构DeepSeek-V3.2，引发行业关注。寒武纪同步宣布适配该模型并开源vLLM-MLU推理引擎代码。新发布的DeepSeek-V3.2-Exp是实验性版本，在V3.1-Terminus基础上引入稀疏注意力机制，优化长文本训练和推理效率。目前官方应用端已同步更新，API大幅降价。此次模型体积达671GB，下载需8-10小时。业内专家指出，此次快速适配表明双方早有深度技术协�

DeepSeek-V3.2 大模型架构稀疏注意力机制
性能超越GPT-4o及Qwen2.5-VL，百度超轻量小模型PP-OCRv5 Blog持续登顶Hugging Face热度第一

百度发布超轻量级文字识别模型PP-OCRv5，仅0.07B参数却实现媲美700亿参数大模型的OCR精度。在多项测试中超越GPT-4o等通用视觉大模型，尤其在文本定位和边界框精度上表现优异。该模型支持5种文字类型识别，适用于教育、医疗、法律等多行业数字化需求，累计下载量超900万，是GitHub上唯一Star数超5万的中国OCR项目。

PP-OCRv5 轻量级OCR 文字识别模型
荐AI日报：阿里推多模态模型Qwen3-Omni；谷歌推出AP2协议；百度推出Qianfan-VL 模型

本期AI日报聚焦多领域技术突破：阿里云推出全球首个全模态AI模型Qwen3-Omni，支持文本、图像、音频和视频统一处理；百度发布多尺寸视觉理解模型Qianfan-VL，优化企业级应用。苹果扩展Image Playground平台，引入ChatGPT等第三方模型。谷歌与PayPal合作推出AP2协议，推动AI支付安全创新。钉钉上线AI表格助手，支持自然语言生成表格。DeepSeek开源V3.1-Terminus模型，性能显著提升。Kimi推出Agent会员服务，智元机器人开源全球首个通用具身智能模型GO-1，降低技术门槛促进行业创新。

AI模型全模态阿里云
OpenAI发布GPT-5-Codex：可完成7小时单次编程任务

OpenAI宣布推出新一代AI编程模型GPT-5-Codex，其最大亮点是创新的动态时间分配系统。不同于传统AI追求秒级响应”，该模型可根据任务复杂度灵活调整处理时长，从数秒到7小时不等，以更接近人类专家的决策方式优化代码质量。 GPT-5-Codex产品负责人亚历山大恩比里科斯解释称，传统模型在任务初期即固定计算资源，而GPT-5-Codex能实时评估需求：动态决定加速推进、暂停语法核�

GPT-5-Codex 动态时间分配 AI编程模型
易鑫发布Agentic大模型，破解汽车金融风控与效率痛点

9月12日，易鑫集团在“IT Value Summit数字价值年会”上入选“2025创新场景年度AI应用TOP榜”，成为汽车金融科技领域唯一上榜企业。首席科技官贾志峰指出，易鑫以AI为核心驱动力，通过自研大模型“智鑫多维”等技术，显著提升风控水平与融资通过率，推动行业智能化转型。平台已连接全国4.2万家经销商及上百家金融机构，服务覆盖牧民、基层员工等多元群体，体现技术普惠价值。未来将持续加大科技创新投入，深化国内普惠金融服务，并探索技术出海，助力全球汽车金融行业迈向更高水平智能化。此次上榜不仅是对其技术实力的认可，更反映出行业正加速拥抱智能化变革。

AI应用汽车金融金融科技

今日大家都在搜的词：

热文

3 天
7天

意不意外！斯坦福科学家仅用600美元就克隆了OpenAI的ChatGPT

荐AI日报：豆包大模型1.6-vision发布；DeepSeek发布V3.2-exp模型；Claude Sonnet4.5发布

破解海外旅游语言困境，时空壶新T1以端侧模型开启全球畅行

美团发布高效推理模型LongCat-Flash-Thinking：部分性能接近GPT5

微算法科技（NASDAQ: MLGO）融合二次矩阵变换模型，研发基于区块链的可溯源IP版权保护算法

GEO排名查询工具推荐:霸屏AI大模型答案的核心方法，做好AI大模型排名优化

强强联手！深度求索、寒武纪同步发布DeepSeek-V3.2模型架构和基于vLLM的模型适配源代码

性能超越GPT-4o及Qwen2.5-VL，百度超轻量小模型PP-OCRv5 Blog持续登顶Hugging Face热度第一

荐AI日报：阿里推多模态模型Qwen3-Omni；谷歌推出AP2协议；百度推出Qianfan-VL 模型

OpenAI发布GPT-5-Codex：可完成7小时单次编程任务

易鑫发布Agentic大模型，破解汽车金融风控与效率痛点

今日大家都在搜的词：

热文

苹果iOS18.7.1正式版更新发布重要安全修复

OPPO A6开售：售价1599元起搭载7000mAh六年长寿电池

AI日报：豆包大模型1.6-vision发布；DeepSeek发布V3.2-exp模型

罗永浩替小米说公道话：海报小字是行业陋习

腾讯QQ闪传功能上线支持单文件最大10GB传输

苹果iOS 26.0.1正式版发布：修复iPhone 17系列Wi-Fi、拍照等Bu

OPPO Find X9系列定档：10月16日发布

王腾小红书账号注销快手账号已被封禁抖音账号已私密视频号已

鸿蒙智行享界S9T上市13天大定破 15000 台

鸿蒙智行9月交付新车52916台：全系累计交付突破95万台

小米17破今年国产手机首销纪录卢伟冰：需求远超预期

苹果iOS18.7.1正式版更新发布重要安全修复

苹果将推出iPhone 17e：搭载A19 芯片支持灵动岛

OPPO A6开售：售价1599元起搭载7000mAh六年长寿电池

AI日报：豆包大模型1.6-vision发布；DeepSeek发布V3.2-exp模型

小米17系列开售5分钟破25年国产手机首销纪录

AI日报：蚂蚁开源高性能思考模型Ring-flash-2.0；通义7款模型屠

AI日报：腾讯重磅发布混元图像3.0；快手发布KAT系列Agentic Co

罗永浩替小米说公道话：海报小字是行业陋习

iPhone调休闹钟上热搜苹果客服回应：需手动设置

站长商机