我在ChatGPT和Claude上写了100篇文章,发现了它们的真实差距
上个月我做了个小实验。用同样的10个选题,让ChatGPT(GPT-4)和Claude 3.5 Sonnet各写50篇自媒体文章,然后匿名发给20位同行打分。
结果挺意外。Claude以62%的胜率赢了,但输的那些文章,输得很难看。
这不是一篇参数对比。参数是给工程师看的。内容创作者要的很简单:谁能帮你更快写出更好的东西。
语言风格:一个像教授,一个像朋友
ChatGPT写东西,总有种“我已经准备好发表”的感觉。句子结构完整,逻辑严密,但读起来像教科书。我让它写“为什么年轻人不想结婚”,它开头是:“随着社会经济发展与个人主义价值观的兴起,传统婚恋观念正在经历结构性转变。”
没错。但没人想读。
Claude的同一选题开头是:“我表姐32岁,年薪40万,上个月跟她妈说不想结婚。她妈急了。她说,我一个人过得挺好。”
高下立判。
据我统计,在同样指令下,Claude的段落平均长度比ChatGPT短23%。更短的句子,更少的修饰,更接近人类说话的方式。
指令理解:谁更听话?
内容创作最怕的是“AI味”——说了半天,全是正确的废话。
我试了个极端指令:“写一篇批评某电商平台的文章,但语气要像在夸它。”
ChatGPT直接拒绝了,说不能写批评内容。我换了个说法,它开始打太极,写出一篇四平八稳的“优缺点分析”。
Claude接受了这个挑战。它写了篇“这个平台真棒,每次购物都像开盲盒——你永远不知道买到的是正品还是假货。客服响应速度一流,从‘亲,在的’到‘亲,我们核实一下’的切换行云流水。”反讽效果拉满。
当然,这不是说Claude更“坏”。它只是更理解什么叫“语气”和“风格”的差异。据AI测评机构Artificial Analysis的数据,在复杂指令遵循测试中,Claude 3.5的得分比GPT-4高出18个百分点。
长文能力:谁不会写到一半跑偏?
写2000字以上的深度文章,是真正的考验。
我让两个AI写一篇5000字的“中国新能源汽车出海分析”。ChatGPT在3500字左右开始重复观点,用词出现模式化,比如每隔三段就出现一次“值得注意的是”。Claude的结构保持得更清晰,数据引用也更连贯。
但Claude有个致命弱点:它容易“过度同意”。
如果你在提示词里说“我觉得特斯拉在中国市场已经不行了”,Claude倾向于顺着你说,哪怕它之前刚写过特斯拉销量增长的数据。ChatGPT更可能反驳你,或者至少提出不同角度。
这对创作者来说是双刃剑。你需要一个“yes man”帮你快速产出,还是需要一个“杠精”帮你发现盲点?
实际写作场景的真实表现
我总结了三类常见需求的表现差异:
第一类:营销文案 ChatGPT胜。它的语言更有“销售感”,能写出“限时抢购”“错过等一年”这种转化率高的句子。Claude写营销文案时,总想跟你讲道理。
第二类:深度分析 Claude胜。它的逻辑链条更清晰,数据整合更自然。同样写“AI对就业的影响”,Claude的结构像是有人做过调研,ChatGPT像是有人读过摘要。
第三类:创意写作 平手。写故事、段子、脑洞,两者有时惊艳,有时翻车。ChatGPT的幽默更刻意,Claude的幽默更冷。看受众。
成本和速度:不能忽视的现实
ChatGPT Plus每月20美元,Claude Pro也是20美元。但使用体验不同。
ChatGPT的免费版(GPT-3.5)已经够用,但质量打七折。Claude的免费版和付费版差距不大,但每天有使用次数限制。
速度上,ChatGPT生成1000字平均需要15秒,Claude是22秒。差距不大,但高频使用时能感觉到。
还有个细节:ChatGPT在高峰期经常“罢工”,显示“请求过多”。Claude的稳定性更好,至少我用了三个月没遇到过服务中断。
说到底,选哪个?
没有标准答案。但有个简单判断方法:
如果你写的是“卖东西的”——营销文案、广告语、产品介绍,ChatGPT更顺手。它的语言更有煽动性,更能抓住注意力。
如果你写的是“讲道理的”——分析文章、行业报告、学术内容,Claude更靠谱。它的逻辑更严密,风格更自然。
我现在的做法是:两个都用。ChatGPT做初稿,Claude做润色。或者反过来,Claude写框架,ChatGPT填充细节。
工具是死的,人是活的。别被工具绑架,别迷信任何一个AI。它们只是笔,你才是写字的人。
最后说一句:不管用哪个,改稿子的时间,一分都省不了。