首页 > 业界 > 关键词  > 拼字游戏最新资讯  > 正文

“血亏,我花3000+元用Claude做游戏,结果还不如去「白嫖」Gemini 2.5……”

2025-04-27 09:15 · 稿源:

声明:本文来自于微信公众号CSDN(ID:CSDNnews),授权站长之家转载发布。

几周前,在某个夜深人静的夜晚,我突然想到了个点子:要不抽空做个 Scrabble 风格的拼字游戏?想着这几年现在 AI 编码助手这么火,干脆我也来试试吧。

结果就是:一通狂轰滥炸的提示词、417美元(约合人民币3042元)的 Claude API 费用、外加摄入几乎“致死量”的咖啡之后,我终于做出了一个能玩的游戏——LetterLinks。

图片

花了417美元,用 Claude 做游戏的“痛苦”过程

由于没啥经验,我一开始给 Claude 的提示词非常简单:“给我做个像 Scrabble 的游戏。”对的,没有 UI 草图、没有流程图,连样式要求都没有,但 Claude 就能直接吐出一大串工作代码——说实话,那一刻我真的有些震惊。

比如,我提出希望加个技能等级系统,以展示玩家的成长轨迹,Claude 不仅理解了,还主动把这个功能给我加上了。虽然还有些小 bug,但总体效果我自己还挺满意的,能明显看出来是 Claude 和我一起“写”出来的。

不过相比优点,Claude“拉垮”的地方显然更多:

  • 灾难级别的上下文窗口

项目代码量一多,Claude 就控制不住地开始失智。到了1.5万行代码左右,它已经变成了“啊,你刚才说什么了”的智障程度:

我:“请修复一下主题检测中的 bug。”

Claude:“不好意思,主题检测是啥?”

我:“……就是我们上周一直在搞的那个啊!”

后来,我几乎每隔一会就得用 /claude compact 命令压缩上下文。

  • 最烦人的那句:“我找到了!”

整个开发过程中,我最怕 Claude 说那句“我找到了!”:

Claude:“我找到 bug 了!一定是这行代码。”

(执行修复……Bug 依然存在)

Claude:“哦我懂了,真正的 bug 其实在这里……”

Claude 就一直这么反复,直到我开始质疑人生。更别提它有时候自信满满地“修复”一个问题,结果又顺带引入了三个新 bug。

  • 花费飙升,钱包在痛

而真正让我破防的,是那飞速上涨的账单:

第1周:核心逻辑基本写完,花了大概100美元;

最后1周:一个小小的动画效果,却因为 Claude 忘记了整个代码结构需要“重学”,又花了我20美元……

  • 你说测试?不存在的

Claude 写代码的水平还可以,但它永远无法验证自己写的对不对。所以,每一次小改动都变成:Claude 写代码 → 我测试 → 我反馈问题 → Claude 道歉再试……重复以上步骤,直到我一度想要转行。

如果你问我花417美元买这体验值不值?嗯……我觉得其实还行吧,毕竟找个外包开发可能至少得2000-3000美元。

但你要说这达到了广告里那种“AI coding 美梦”?那真不至于——Claude 充其量就是一个有点想法但需要全程盯着的小实习生,偶尔能灵光乍现,但也可能把项目毁个精光。

用 Gemini2.5+ Cursor 的开发体验如何,比 Claude 好多少?

意料之中,当时许多人听完我做 LetterLinks 的经历,反应大多是:“游戏不错,但你居然为了个 AI 写的半成品掏这么多钱,真傻。”

于是隔了半个月,我又做了一个类似的拼字游戏,名字叫 Gridagram——但这回,几乎是全程用 Gemini2.5Pro+Cursor 完成的。

图片

你猜,这次我花了多少钱?答案:0元!

而且相比之前“花417美元+摄入致死量咖啡提神”的Claude 开发体验,说实话,这次用 Gemini 的体验真是好太多了。

  • 成本为零:根本性上的变化

先说最直接的改变——不用花钱。从 Claude 的 API 费用417美元,到Gemini2.5+Cursor 的免费方案,这种转变简直是天壤之别。这意味着什么?我终于可以放心大胆地折腾和试验 了!

  • 上下文窗口更长,理解能力也更强

如上文所说,Claude 最大的问题之一,就是上下文窗口太容易失效,我总得重新贴代码、解释逻辑。但 Gemini 配合 Cursor 后,情况大为改善:Cursor 能自动把文件结构、diff、项目上下文传给 Gemini,整个过程就像有个记性不错的队友。

虽然 Gemini 偶尔还是需要手动提醒,但多数情况下它基本都“知道我在做什么”,这点比Claude好多了,很大程度上改善了我的开发过程。

  • 更像真实的结对开发

我个人体验下来,在 Cursor 里的对话流程更像是在和一个搭档结对开发,而不是在和一个聊天机器人自言自语。比如:

“读下 useLetterSelection.ts 的50-100行。” → 它会准确读取。

“好的,在这里添加一个 useEffect 来更新 currentWord。” → 它会立刻生成 edit_file 调用。

“运行 git add,commit,push;npm run build,firebase deploy。”→ 它会自动执行终端命令。

从分析到写代码再到部署,这一整套链条都可以在 IDE 里顺畅跑完,体验比 Claude 网页版要丝滑很多。

  • Debug 更理性、不搞什么“花活”

虽然 Gemini 也会犯错,但它不会像 Claude 那样频繁陷入 “我找到 bug 啦”→“哦不对,我重新找”→“这次真的找对了!”这种几乎逼疯我的死循环。

我们一起修过的 bug 包括:桌面端拖拽、移动端回退、旋转选词、单词预览状态更新等问题——虽然Gemini 也不总是第一次就改对,但它的 bug 相对更容易识别也更容易修复。

也不是完全没有问题

不过,我也还是要说一句:但别高兴太早,AI 依然是 AI。

(1)仍需人类监督与测试

有一件事必须说清楚——Gemini 不可能自动写出完美、无 bug 的代码。它还是会引入回归问题、偶尔也会误解需求,你仍然自己测试所有内容。此外 Gemini 不会玩游戏或查看 UI,也只能靠你来验证实际效果。

(2)仍会出现幻觉和错误编辑

Gemini 有时候会“想当然”,做一些奇怪修改,比如删掉还在用的变量、错误地合并代码块,结果直接导致构建失败。所以你可能需要手动修复,或者让它重来一遍。此时,Cursor 的 Reapply 工具有时候能帮上点忙。

(3)架构还得你自己来定

它可以根据你的需求实现功能,但并不会帮你设计架构、做高层决策。你可以把它看作一个 手速飞快但需要你指挥的中级开发者,你要告诉它具体要做什么,它才能给你反馈。

所以,到底值不值得?

和之前花费417美元的 Claude 开发体验比?一句话总结:Gemini2.5+ Cursor 简直值爆了。

“0元开发”固然很香,但真正让我决定继续用 Gemini 的,是它上下文处理能力的进步,以及 Cursor 提供的无缝集成体验。

如果说 Claude 更像一个有才但健忘、还经常搞砸项目的实习生,那 Gemini2.5Pro 在 Cursor 里,就像是一个偶尔抽风但非常能干的中级工程师:开发速度超快、基本都很稳定可靠、能更好地理解项目上下文……不过还是那句话,AI 还是需要你的清晰指令及测试验证。

至于我的下一步计划,应该还是会继续用这类有 IDE 深度集成 的 AI 编程助手:Claude 给我的是“试试 AI 写代码”的体验,而 Gemini 给我的则是“AI 成为日常开发助手”的实感——两者根本不在一个维度。

最后,我也很想听听其他开发者用 Gemini2.5做项目的体验,特别是在 Cursor 里或其他 IDE 里的。你们有没有什么好用的提示词技巧,或者特别推荐的工作流程?

原文链接:https://www.reddit.com/r/ChatGPTCoding/comments/1k46x92/i_got_slammed_on_here_for_spending_417_making_a/

https://www.reddit.com/r/ClaudeAI/comments/1jpddbf/i_blew_417_on_claude_code_to_build_a_word_game/

举报

  • 相关推荐
  • AI日报:阿里夸克“C计划”曝光;Veo3.1将增加视频“精确编辑”功能;Anthropic推出Claude Code网页版

    今日AI领域动态:阿里夸克启动"C计划"布局对话式AI应用,剑指字节"豆包";Anthropic推出Claude Code网页版,支持浏览器直接编码;谷歌Veo新增视频"精确编辑"功能,提升创作效率;Fish Audio升级S1语音克隆模型,10秒即可复刻真人声音;AWS美东故障影响ChatGPT等多项服务;DeepSeek-OCR推出"视觉记忆压缩"机制破解AI记忆瓶颈;Adobe推出AI Foundry服务,支持企业定制品牌AI模型;Anthropic发布Claude for Life Sciences,加速生命科学研究。

  • 只有0.9B的PaddleOCR-VL,却是现在最强的OCR模型。

    ​这几天,OCR这个词,绝对是整个AI圈最火的词。因为DeepSeek-OCR,甚至让OCR这个赛道文艺复兴,又给直接带火了。 整个Hugging Face的趋势版里,前4有3个OCR,甚至Qwen3-VL-8B也能干OCR的活,说一句全员OCR真的不过分。 然后在我上一篇讲DeepSeek-OCR文章的评论区里,有很多朋友都在把DeepSeek-OCR跟PaddleOCR-VL做对比,也有很多人都在问,能不能再解读一下百度那个OCR模型(也就是PaddleOCR-VL

  • AI +游戏,何以撑起百亿市场?

    今年以来,生成式AI技术在游戏领域的应用步伐显著加快。在Steam平台上,使用生成式AI技术的游戏数量呈现出惊人增长,激增了800%。行业预测显示,在今年新上市的游戏中,这一应用比例预计将达到20%。 游戏厂商的布局也明显提速。头部公司正持续加码技术中台与垂类模型的构建:腾讯搭建了混元与GiiNEX协同的双引擎生态;网易则着力构建AIUGC地图系统并升级游戏内的AI对手模�

  • 对话逗逗AI:猛涨千万用户背后,不抢屏幕时间,不做超级app,也不止于游戏了

    ​当你在游戏里卡关半小时,烦躁地想切出去搜攻略;或者在开放世界里孤独“跑图”,无聊到只能听歌的时候,如果这屏幕上突然冒出一个“小可爱”,一边帮你找路,一边陪你吐槽,感觉会如何? 这就是逗逗AI正在做的事。它不是一个需要你切换点开的APP,而是一个以虚拟形象或悬浮球形式,能看到你的游戏界面,听到你的声音,和你随时互动的AI玩伴。 我们来看一个顶

  • AI日报:Hailuo 2.3发布;豆包AI编程史诗级升级;马斯克推出AI百科全书Grokipedia

    本期AI日报聚焦多领域突破:海螺AI 2.3实现视频生成技术跃升,支持双模式免费试用;豆包AI编程工具实现零基础可视化开发;马斯克推出AI百科Grokipedia;Mistral发布企业级AI开发平台;Anthropic推出金融版Claude,显著提升分析师效率;Pinterest升级AI购物助手功能;英伟达推出全能模型OmniVinci刷新性能纪录;DeepSeek模型在港大美股交易竞赛中以10.61%年化回报率夺冠。

  • 华为陈浩:AI UBB三重跃迁,激发商业新增长

    在2025年UBBF全球超宽带高峰论坛上,华为运营商业务总裁陈浩发表演讲,提出AI与超宽带融合的“三重跃迁”战略:深度上,从带宽销售转向体验保障,通过AI精准优化云游戏、4K直播等应用;广度上,业务从连接延伸至家庭智能、中小企业数智化服务及企业感知应用,提升ARPU;高度上,推动网络从工单驱动迈向L4级自动驾驶,实现智能运维。华为通过实践案例展示了如何助力运营商抓住AI机遇,激发新增增长。

  • 2025 VDC游戏技术分会召开,多维技术创新定义游戏新体验

    2025年vivo开发者大会于10月10日在深圳召开,游戏技术分会以“极致·共生”为主题,展示了vivo在游戏领域的最新技术成果与合作案例。大会聚焦移动游戏技术爆发新阶段,强调通过软硬件协同实现性能、触控、图形等关键技术突破,为玩家带来多维一体的极致体验。vivo推出自研电竞芯片Q3及图形SDK,支持超分、超帧与光线追踪技术,并与《王者荣耀》《无限暖暖》等游戏深度合作,优化帧率、触控响应及功耗表现。未来vivo将持续夯实技术底座,通过VGS平台携手开发者共建游戏生态,推动移动游戏产业体验升级。

  • 从游戏出海到AI应用出海 世纪华通建树海外AI市场

    世纪华通凭借成熟产品矩阵与全球化运营能力,成为中国游戏企业出海标杆。随着国内AI技术突破,公司加速拓展全球化赛道,推动AI应用落地海外市场。旗下极测信息与日本信华信合作,将核心产品“AI自主检测系统”引入日本自动化测试市场。该系统突破传统工具局限,实现测试用例自动生成与智能优化,效率提升超50%,已获行业权威认可。此次合作印证中国AI技术在垂直领域的全球价值,并凸显公司“ALL IN AI”战略——通过多元化产品覆盖产业需求,让AI成为全球化竞争核心势能。

  • DeepSeek开源3B OCR模型:长文本识别达97%精度

    DeepSeek在GitHub开源新一代OCR模型,采用创新光学二维映射压缩技术,在长文本识别场景实现97%准确率。模型通过动态压缩生成最优视觉特征令牌,较传统方法减少60%计算冗余。实验显示在1:20压缩率下仍保持60%以上准确率,显著优于同类模型。该技术路径为OCR系统小型化提供解决方案,其动态压缩策略对大型语言模型的记忆管理机制具有重要启示。

  • GEO如何改变ChatGPT搜索和Perplexity的游戏规则

    本文对比ChatGPT与Perplexity两大AI搜索平台:ChatGPT作为全能型助手,整合搜索与多任务处理,但存在信息时效性不足;Perplexity专注垂直搜索,强调引用透明与权威来源。针对AI搜索优化(GEO),提出差异化策略:面向ChatGPT需构建结构化知识库、强化品牌实体识别;面向Perplexity需注重权威数据引用和元数据优化。文章还介绍了AIBase的GEO监测工具,通过曝光率等指标量化内容在AI生态中的可见度,并给出可落地的优化行动方案。

今日大家都在搜的词: