2 月 12 日,字节跳动发布了 Seedance 2.0。马斯克评价三个字:"It's happening fast." 社交媒体上一片欢呼,短视频平台瞬间涌入了海量 AI 生成的视频内容。

但我刷了几天之后,感受到的不是兴奋,而是一种越来越强烈的不适——廉价和塑料感。可能因为我喜欢电影和拍摄吧,那些画面看起来什么都对,但什么都不对。

带着这种说不清道不明的抵触感,我和 Claude Opus 4.6 进行了一次长对话。本来只是想理清自己的感受,结果聊着聊着,触碰到了一些更深层的东西——关于 AI 的「平均化效应」、关于创作中的「灵魂」到底是什么、以及在一个所有人都在为 AI 欢呼的时代,我们还要被半成品困扰多久。

以下是这次对话中我们碰撞出的一些思考。


新恐怖谷:那种说不清的不舒服

左侧是手工陶碗中带有水滴和落瓣的真花,右侧是完美无瑕但毫无生命力的塑料复制品

我先坦白了自己的矛盾:我是 LLM 的重度用户,文字层面的 AI 确实带来了巨大的效率提升。图像生成弱一些,但也有帮助。唯独视频——看了太多 Seedance 2.0 生成的东西之后,内心的抵触越来越明显。

Claude 把这种感受定义为一种新形态的恐怖谷效应。传统的恐怖谷是机器人长得「差一点像人」时最让人不适。而 AI 视频制造的是一种更复杂的恐怖谷——它在很多维度上已经「够像了」,但在一些微妙的地方又不对。人的大脑对运动、表情、光影变化有几十年的观看经验积累,哪怕说不出哪里不对,身体会先于意识告诉你「这不是真的」。

这个分析让我意识到,作为一个喜欢拍摄的人,这种不适感会被放大很多倍。一个镜头的呼吸感、演员微表情的不可预测性、光线在真实空间中的散射方式——这些都是长期观影积累出来的审美直觉。AI 视频模拟的是「看起来像电影」的表面特征,但它缺少真实拍摄中那种「不完美的有机感」

我们还聊到一个根本性的问题:语言本身就是一种有损压缩。脑海中的画面是高维度的——情绪、氛围、质感、节奏、空间关系——而 prompt 只能线性地、离散地去逼近它。用文字描述一个镜头,就像用坐标点去描述一条曲线。点再多,它还是点,不是曲线本身。

至于「能不能和真实拍摄一样」,Claude 的判断是这个标准本身可能是个伪命题。真实拍摄的价值不只是画面的逼真度,而是整个创作过程——导演的选择、演员的诠释、现场的意外、剪辑的节奏。AI 即使在像素级别做到了无法区分,它产出的东西和真正拍出来的东西在「意义」上可能永远不一样。

就像一幅 AI 生成的梵高风格画作可以骗过眼睛,但它背后没有那个割掉耳朵的人。


平均化效应:AI 为什么总差点意思

多条支流汇聚成一条银白色洪流,象征 AI 各领域加速趋同

对话进行到这里,我提出了一个自己观察已久的框架:AI 学习大量数据之后,本质上输出的是「平均值」——海量内容的统计最优解。

对于 90% 以上的人来说,平均就已经很好了。一个人只能在一两个领域擅长,其余领域的储备基本都低于平均水平。所以当 AI 能帮你在不擅长的领域也做到「平均」,大多数人会感到振奋——不擅长的东西自己也能做了。

但问题来了:这些人会输出大量「平均」的东西,这些内容又会被 AI 学习,进一步强化平均。循环往复。

Claude 听完后说,这其实是一个很精准的悖论:AI 的平均化效应对不同的人产生的是完全相反的作用力。对于平均线以下的人,AI 把他们往上拉,这是好事。但对于平均线以上的人,如果不加警惕,AI 会把你往下拽——不是因为它能力不够,而是因为它太容易让你停止挣扎了。

这一点我深有体会。AI 给出的「平均答案」往往看起来已经挺好了,足够交差了,足够发出去了。放在以前,你会因为做不出来而被迫继续想、继续打磨。现在这个摩擦力消失了。而恰恰是那些被迫多想的时刻,才是真正产生突破性想法的地方。

所以我在对话中强调了一句话:一定不能不思考。听起来简单,但在 AI 时代做起来越来越难。

当然,我们也达成了一个共识——AI 作为讨论伙伴来激发灵感,是它最被低估的用法。它的价值不在于给你答案,而在于它的知识广度可以帮你建立意想不到的连接。比如构思一个旅行纪录片时,AI 可以帮你调出塔可夫斯基怎么处理时间、侯孝贤怎么用长镜头传递情绪、甚至跨到文学领域看博尔赫斯怎么处理空间叙事。但最终决定用哪个、怎么融合、为什么在这里而不是那里——这些判断只能是你自己的

能分辨「差不多」和「真正好」之间那条线的能力,在这个时代反而成了最稀缺的能力。


在场与灵魂:不可替代的东西

聊到这里,话题自然转向了一个更私人的问题:如果我未来想做旅游博主、想执导电影,AI 会替代掉我吗?

我的感受是,AI 生成的视频总感觉缺少灵魂——缺少那种精心早起、在严峻的天气出门,所拍摄出具有呼吸感、独一无二的素材,以及那个时刻所具有的感受。看了太多、生成太多图片之后,反而降低了自己的审美能力。门槛变低,用的人越来越多,又不会去打磨,千篇一律越来越严重。

Claude 对此给出了一个很精炼的概括:旅游博主和电影导演这两件事有一个共同的核心——你必须在场

早起等一个光线、在大风里稳住机器、在一个意想不到的瞬间按下快门——这些不只是「素材采集」,它们是你和那个时刻之间发生的关系。观众之所以被打动,不是因为画面多精致,而是因为他们能感受到镜头后面有一个活生生的人,在那个特定的时刻做出了一个选择。这就是我说的「呼吸感」——它不是一种画面参数,而是一种创作者存在感的传递

AI 没有「在场」的能力,也没有「非拍不可」的冲动。

电影更是如此。一部好电影的力量不来自任何单一环节,而来自从构思到最终剪辑之间无数次的取舍和判断。一段 prompt 能生成一个画面,但它生成不了「为什么选择在这个时刻切这个镜头」背后的那个原因。

AI 降低了执行门槛,但同时抬高了思考门槛。以前会用 Photoshop 就是竞争力,以前能写代码就是竞争力。现在这些都在被拉平。真正拉开差距的变成了:你能不能想到别人想不到的东西,你能不能在 AI 给你十个选项的时候知道哪个是对的——甚至知道十个都不对。

说到底,AI 最终会变成像摄影机一样的工具。摄影机的发明没有让每个人都成为库布里克,反而让库布里克更加突出了。工具越普及,真正有想法的人越稀缺、越有价值。


中间层塌陷:未来的分水岭

对话的最后,我们聊到了 AI 对整个内容行业的结构性影响。

我认为,未来 AI 会逐渐挤兑掉「不用心」的作品。用心写 prompt 生成的内容质量更高也更容易,相比之下低质量的真人拍摄内容反而会没有竞争力。低成本、烂片会被淘汰——这反而不是坏事。

Claude 把这个趋势概括为「中间层塌陷」:以前内容市场是一个金字塔——底层是大量低质量内容,中间是还行但不出彩的「及格线作品」,顶层是真正优秀的作品。AI 正在把底部和中间层压缩成一个很薄的平面。当 AI 能以几乎零成本产出「及格线」水平的东西,那些原来靠「我虽然不出彩但好歹是真人做的」来生存的内容就失去了存在的理由。

有多少烂片的存在只是因为「反正拍了就能上」?有多少短视频只是因为「有个人举着手机就算内容」?当 AI 把底线抬高之后,观众的阈值也会随之提高,这反而逼着整个行业往上走。

但一部真正好的电影,它的价值链条太长了——选题的眼光、剧本的打磨、选角的直觉、现场和演员的互动、剪辑时对节奏的感知、配乐和画面之间的化学反应——每一个环节都包含大量无法被形式化的隐性知识和审美判断。一部作品真正的灵魂,恰恰藏在那些「说不清楚但你能感受到」的缝隙里。

一个人坐在悬崖边缘,脚下是一望无际的平坦云海,只有少数山峰穿透云层迎接日出

写在最后

这次对话让我更清晰地看到了自己的位置。我追求的不是「生成内容」而是「创造体验」。一个旅游博主的核心竞争力不是画面多好看,而是你去了那个地方、你有了那个感受、你做出了那个选择把它记录下来。这些东西背后是一个完整的人,不是一串 token。

未来的分水岭不是「会不会用 AI」,而是「有没有值得用 AI 去放大的东西」。

如果你有真正好的想法、真正独特的视角、真正打磨过的审美,AI 就是一个超级放大器。如果你没有,AI 只会帮你更高效地生产平庸。

在一个所有人都在为 AI 生成的流量内容欢呼的时候,能感到不舒服,本身就是一种审美能力。