写了3万字后,我发现了ChatGPT和Claude的真正差距
上周三下午,我同时打开两个浏览器窗口。左边是ChatGPT,右边是Claude。我要完成一个任务:让它们各写一篇8000字的市场分析报告。
这不是我第一次测试AI写作工具。但这次不一样——我要看它们处理长内容的能力。不是聊天,不是写诗,是实打实的万字级长文。
结果让我有点意外。
长文本的起点:记忆力的分水岭
先说个硬伤。ChatGPT的上下文窗口是128K tokens,Claude是200K tokens。数字很抽象,说人话就是:Claude一次能记住更多内容。
我做了个测试。给两个AI各喂了一本300页的行业白皮书(约15万字),然后让它们写摘要。
ChatGPT读到后面忘了前面。它会重复开头提到的数据,但对中段的关键信息记忆模糊。Claude好一些,能准确引用第200页和第250页的数据。
这不是玄学。据Anthropic官方数据,Claude的200K上下文窗口在长文本处理上准确率比GPT-4高约30%。
但记忆力强不代表文章写得好。接下来的测试才见真章。
结构能力:谁不会写跑题?
写长文最怕什么?跑题。开头说A,写到一半拐到B,结尾又回到A。这是AI写长内容的通病。
我让两个工具写一篇关于“新能源汽车电池回收”的5000字分析,要求分五个章节,每章有数据支撑。
ChatGPT交上来的东西:第一章讲市场规模,第二章突然跳到锂电池技术路线,第三章又绕回政策法规。章节之间像拼凑的,没有逻辑递进。
Claude的结构明显更好。它从“现状-问题-技术-政策-趋势”这个逻辑链条展开,每章结尾都有一句过渡到下一章。读下来不跳脱。
说真的,Claude在长文结构规划上更像一个老编辑。ChatGPT像个急于展示知识储备的新手。
细节把控:魔鬼藏在数据里
写长文最怕数据出错。特别是行业报告,一个数字错了整篇文章废了。
我故意在提示词里埋了个陷阱。我让两个AI引用“2024年全球新能源汽车销量”,但没给具体数据。这意味着它们要自己生成。
ChatGPT写的是“2024年全球新能源汽车销量达1800万辆”。这个数字看着挺像那么回事,但据中国汽车工业协会数据,实际是约1400万辆。ChatGPT编高了近30%。
Claude直接拒绝了。它回复:“我没有2024年的完整统计数据,建议您查阅中国汽车工业协会或IEA的官方报告。”
一个敢编,一个认怂。你觉得哪个更靠谱?
创作风格:冷与热的对决
长内容不只是堆数据,还要有可读性。我让两个AI写一篇关于“AI对设计师影响”的3000字评论文章。
ChatGPT的风格:客观、中立、像维基百科。每个观点都带引用,但读起来像在念教科书。
Claude的风格:有立场、有温度。它会说“我认为AI不会取代设计师,但会改变设计师的工作方式”,然后给出三个具体理由。它有观点,不是简单的信息罗列。
我让一位资深设计师朋友盲评两篇文章。他说:“第一篇像AI写的,第二篇像人写的。”第二篇是Claude写的。
谁更擅长修改自己的文章?
写长文很少一稿过。我让两个AI修改自己写的文章:把5000字压缩到3000字,不能丢关键信息。
ChatGPT压缩后的文章:删掉了大量细节,只保留骨架。读起来像大纲,不像文章。
Claude压缩后的文章:保留了核心论点和关键数据,删掉了冗余的修饰。读起来还是完整的文章。
这个测试我做了三次,结果类似。Claude在信息压缩上更聪明,知道什么该留什么该删。
最后的结论
半个月测试下来,我的判断是这样的:
如果你写的是创意文案、短篇内容、需要快速产出,ChatGPT更合适。它生成速度快,风格灵活。
如果你写的是研究报告、行业分析、技术文档这类长内容,Claude更靠谱。它结构更好,数据更准,修改能力更强。
但说真的,两个工具都不完美。ChatGPT容易编数据,Claude有时过于谨慎。最好的策略是什么?用Claude搭框架,用ChatGPT填充细节,最后自己再过一遍。
毕竟,AI是工具,不是作者。真正的好文章,还得靠人把关。