← All notes

Stay Rational. Think Long. Update Often.

April 7, 2025 RationalityLong HorizonsUpdate Your Priors

Reading notes on thinking clearly and playing long games. Draws on Stanovich and Baron for the cognitive science — why IQ ≠ rationality, and how most thinking errors come from searching too little or too unfairly. Applied to business cases: Pinduoduo's capacity for short-term pain, Wang Xing on shedding sunk costs, Huang Zheng's first-principles discipline. Core thesis: long horizons are a skill, not a personality trait — and fixing mistakes early is always the cheapest option.


段永平: 理性想长远。其次是尽量理性尽量想长远。然后是理性面对结果。

段永平: 其实我最大的财富就是我犯过的这些错误,巴菲特也是。“我唯一能肯定的一点是,未来我们都会继续犯错”。发现错误要尽快改,不管多大的代价都可能是最小的代价。

赫伯特·西蒙(旅行定理): 不要盲目崇拜未经思考的见闻,在图书馆里往往能学到比盲目旅行更多的东西。


理性是什么?

思考”思考”本身:什么是理性,目的是什么?


拼多多:“承受痛苦的能力”

“承受痛苦的能力”(Capacity to Suffer)是价值投资领域(尤其是 Thomas Russo 和 Mohnish Pabrai 经常提到)的核心概念。“悖逆于市场和同罪人去行事的能力”,实际上指向企业如何摆脱机构驱使力(Institutional Imperative)——即那种为了不显得”掉队”而不得不跟随的压力。

什么是”承受痛苦的能力”?

在财务层面,这指一家公司为了长期利益,在短期内主动且大规模地恶化其财务报表的能力。

为何能”悖逆于市场”?

大多数职业经理人都背负着”平庸之罪”:

与亚马逊、伯克希尔的相似性

这三家公司本质上都在利用”长期的跨度”来打击”短期的对手”:

深度洞察:对抗”一致性偏见”

普通管理层一旦宣称”要盈利”,就会被锁定在盈利轨道上,不敢再投入。拼多多保持了极其不透明(很少开发布会,很少解释战略)的封闭性。这种”傲慢”其实是为了保护内部决策不被外界嘈杂污染,从而保住了那份”逆行”的能力。

总结 — 拼多多的”承受痛苦的能力”本质上是战略上的高维碾压。当竞争对手因为害怕报表难看、害怕股东质疑而不敢放手一搏时,拼多多用短期的极度财务痛苦换取了长期的、难以撼动的市场统治力。


黄峥像 AlphaZero:疯狂进化,关键是理性

AlphaZero 式的”冷酷进化”:从第一性原理出发

AlphaZero 不学习人类棋谱,只通过游戏规则进行亿万次自我对弈。

“不交流”背后的战略:避开”共识”的陷阱

他不跟顶级投资人频繁社交,并非出于傲慢,而是为了保持决策的”纯净度”。

极度理性的”本分”

黄峥频繁提到”本分”,这在拼多多内部其实就是一种算法指令。


王兴:既往不恋,纵情向前

“既往不恋,纵情向前”是美团创始人王兴最著名的座右铭,也是美团企业文化的核心。

1. 既往不恋:放下”沉没成本”

人们最容易犯的错误就是因为舍不得已经投入的资源,而坚持一个错误的航向。

2. 纵情向前:保持”高频进化”

如果说”既往不恋”是清理缓存,那么”纵情向前”就是高速运转的处理器。

核心思维模型:反熵增

从底层逻辑看,这八个字在对抗熵增:

“既往不恋”是断舍离的勇气,“纵情向前”是全速奔跑的韧性。


理性 = 算法心智(IQ)+ 反省心智(思维倾向)+ 心智程序(思维模型)

《超越智商》— 基思·斯坦诺维奇(Keith E. Stanovich)

这本书的核心目标是打破社会对”智商(IQ)“的迷信。斯坦诺维奇认为:聪明(高智商)不等于理性。智商只是大脑的”马力”,而理性才是大脑的”方向盘”。

核心观点:智商被高估了,理性被忽视了

智力不等于理性 — 传统的智力测试只测量了”算法心智”(计算速度、记忆力、逻辑推理),但完全忽略了”反省心智”(信念评估、目标设定、决策判断)。一个人可以拥有极高的算法心智(IQ 140),但在反省心智上极其低下——这就解释了为什么很多大学教授、金融精英会陷入庞氏骗局或做出糟糕的人生决策。

大脑的三重心智模型 — 斯坦诺维奇在卡尼曼”双系统”的基础上,将系统 2(慢思考)进一步拆解:

  1. 自主心智 — 对应系统 1。本能、直觉、情绪。反应快,不需要占用认知资源。
  2. 算法心智 — 对应智商(IQ)。负责处理复杂信息、维持工作记忆。大脑的硬件算力。
  3. 反省心智 — 理性的核心。负责发起对直觉的监控、评估信念是否符合现实。大脑的操作系统。智力测试只测”算法心智”。

理性障碍(Dysrationalia) — 尽管具有足够的智力,但无法进行理性思考和行动的状态。就像阅读障碍一样,这是一种真实的缺陷,但社会对理性缺陷视而不见,尽管其社会危害往往更大。

为什么聪明人会做蠢事?

1. 认知吝啬鬼 — 有能力但不愿用 人类大脑进化的默认设置是”能不用脑就不用脑”。当面临难题时,我们倾向于用一个简单的直觉问题来替代它,而不是启动复杂的算法心智。即使是数学系学生,在面对简单的逻辑陷阱时,如果不刻意压制直觉,也会和普通人一样犯错。

2. 心智程序缺陷 — 愿用但没工具 理性不仅需要脑力,还需要知识工具。如果你没有学习过概率论、逻辑学、科学实证思维,哪怕你智商再高,面对复杂的现代问题时也是”裸奔”。更可怕的是”懂歪了”(污化)——智商高的人往往更擅长通过复杂的逻辑自洽来捍卫错误的信念,而不是放弃它。

3. “我方立场偏差”独立于智商 智商高低与”是否能客观公正地看待对立观点”几乎零相关。高智商有时甚至是诅咒:更强的计算能力意味着能想出更多理由来合理化偏见。他们不是在追求真理,而是在像律师一样为自己先入为主的观点辩护。

总结公式

理性 = 算法心智(IQ)+ 反省心智(思维倾向)+ 心智程序(知识工具)

智商主要由基因决定,很难改变;但理性是可以习得的。通过学习概率、统计、逻辑和心理学(安装正确的”心智程序”),并养成”反省”的习惯,可以显著提高决策质量。

一句话总结 — 智商决定了你处理信息的速度(CPU 频率),而理性决定了你处理信息的质量和方向(操作系统与算法)。若没有理性,高智商只会被用来更高效地犯错。


《思维与决策》— 绝大多数思维错误,不是因为推理能力差,而是因为搜索得不够或不公平

乔纳森·巴伦(Jonathan Baron)的经典著作,被视为”判断与决策(JDM)“领域的百科全书式教材。如果说斯坦诺维奇的《超越智商》是在呼吁人们重视理性,那么巴伦的这本书就是在定义什么是”理性”,并给出了极其详尽的操作手册。

核心框架:思考的”搜索-推理”模型

巴伦将所有思维活动拆解为一个机械的过程,由两个基本操作组成:

核心结论 — 绝大多数的思维错误(非理性),不是因为推理能力差,而是因为搜索得不够(过早停止)或搜索得不公平(只搜对自己有利的)。

三种模型的区分

巴伦严格区分了研究思维的三个维度:

核心概念

主动开放式思维(AOT) — 对抗非理性的终极武器。人类思维最大的陷阱是”我方立场偏差”:我们只搜索支持自己观点的证据。AOT 的核心:主动去搜索反驳自己的证据,主动去搜索其他的可能性。

忽略偏差(Omission Bias) — 人们认为”因为我不作为(Inaction)导致的伤害”比”因为我作为(Action)导致的同等伤害”更轻微。案例:接种疫苗有万分之一的概率致死,但不接种感染病毒有千分之一的概率致死。理性上必须接种(风险降低 10 倍),但很多父母选择不接种,因为”如果我给孩子打针导致他死了,是我杀了他;如果他不打针病死了,那是天意。“这种直觉严重阻碍了公共政策和个人最优决策。

沉没成本与现状偏差 — 沉没成本已经花掉且无法回收,理性的决策只看未来的后果。但人类很难做到。我们也过度偏爱”维持现状”,因为改变带来的后悔感比维持现状导致的后悔感更强烈。

多属性效用理论(MAUT) — 直觉决策往往不靠谱,因为我们无法在脑子里同时处理多个维度的权衡。操作:① 列出选项;② 列出评估维度(权重);③ 打分;④ 加权求和。看似简单,却是克服”认知局限”和”情绪干扰”最有效的处方性工具。

这本书在知识版图中的位置

  1. 《社会心理学》(迈尔斯)— 展示了环境如何影响我们的行为
  2. 《学会提问》(布朗)— 提供了批判性思维的基础工具
  3. 《认知心理学及其启示》(安德森)— 解释了大脑的底层硬件和软件原理
  4. 《超越智商》(斯坦诺维奇)— 指出了智力与理性的分离
  5. 《思维与决策》(巴伦) — 集大成者。涵盖上述内容,并引入了数学和逻辑的规范性标准

巴伦的核心教诲 — 思考不是为了自嗨,也不是为了证明自己是对的。思考是为了决策,决策是为了实现目标。任何无助于实现目标的思维习惯——固守成见、害怕改变、情绪化归因——都是需要通过主动开放式思维去修正的 Bug。

福特的负面案例

一个企业家因为早期的巨大成功,将自己的”成功经验”极端化、僵化,并用绝对权力强行延续这种过时模式,最终扼杀了创新并导致企业走向灾难。

一、成功神话的铸就

要理解福特的失败,必须先理解他的成功是多么的惊天动地。在 1910-1920 年代,他几乎是全球的”神”,一手缔造了三个神话:

1920 年代初,福特汽车占据美国 60% 的市场份额。全世界都认为福特找到了商业和社会的”终极真理”。

二、”权力的错乱”:从创新者到暴君

这是悲剧的开始。福特”相信了新闻中对自己的赞美”,不再认为自己是”制造商”,而是”社会先知”。权力的错乱体现在三个层面:

A. 产品的僵化:”我比顾客更懂他们要什么”

当”神话”缔造完成,福特就停止了创新。他坚信顾客唯一需要的就是”廉价”和”耐用”,T 型车是完美的终极形态。

B. 组织的僵化:”我比高管更懂如何管理”

一个”相信自己是神”的创始人,无法容忍任何质疑。

C. 文化的僵化:”我比员工更懂他们该如何生活”

“5 美元日薪”并非无条件。福特为此成立了庞大的社会学部门(Sociological Department),调查员会闯入工人家中检查私生活——是否喝酒、是否赌博、家庭是否整洁。后期更雇佣打手组建内部秘密警察,公司内部充满恐怖和猜疑。

三、终极警示:神话的破灭

1927 年,福特被迫承认 T 型车彻底失败,被迫关闭工厂长达 6 个月转向生产 Model A。这 6 个月的停产真空中,通用汽车和克莱斯勒疯狂抢占市场。福特从此再也没有夺回过市场第一。

结论:对创始人和投资者的提醒

福特的悲剧在于他混淆了”自我”与”公司”。这是所有成功创始人和投资者的终极提醒:

你最大的优势(打破常规),最终会变成你最大的负债(维护常规)。


最大化人生总效用,而非账面价值

有两个按钮:① 100% 概率得到 100 万;② 50% 概率得到 1 个亿。你选哪个?

这是我早年写的《概率权》开篇。罗振宇看到并加以推荐,让”孤独大脑”出圈,极大改变了我的退休生活。

几种解答:

  1. 根据期望值理论,按钮②价值 5000 万;
  2. 很多人仍愿选确定的 100 万,因为他们无法忍受 50% 概率的什么都拿不到;
  3. 开放地想:假如你拥有选择②的权利,可将这 5000 万的选择权以 2000 万卖给一个有承受力的人;
  4. 继续优化:你可以只用 100 万(低首付)卖掉这个权利,但要求购买者中得 1 个亿时和你分成。

从期望值角度看,选 100 万是”不理性的”——我在文中称这是为了确定性甩卖自己的概率权

但今天,我打算”自我推翻”一下。

选 100 万,真的很”短视”吗?

假如你无法将概率权以高于 100 万的价格卖给别人,你还会选按钮②吗?

要回答这个问题,我们需要从期望值,跃迁到一个更温暖的人性尺度——”效用”

“期望值”假设每一块钱的价值都等同。但 18 世纪的”圣彼得堡悖论”早已揭示其谬误。丹尼尔·伯努利据此提出效用理论:金钱的价值在于它能带给人的主观幸福感,而这种幸福感遵循”边际效用递减”法则。

从 0 到 100 万,对一个普通人而言,可能意味着从负债到自立,从焦虑到安稳,是从生存状态到生活状态的”相变”,其带来的效用是巨大的。而从 100 万到 1 个亿,生活无疑会更奢华,但幸福感的提升远不如前者那般天翻地覆——这多出来的 9900 万,只是锦上添花。

为了一个效用增量有限的机会,去冒 50% 的风险,失去那个能让人生”重启”的基石,这不划算。

最关键的前提是:你要知道,自己想过一种什么样的人生。

构建并忠于自己的”人生效用函数”。对你而言,什么最重要?多少才算”足够”?否则,人很容易去追逐一些外界看来”更正确”却不符合自己内心效用的目标,反而带来消耗和迷失。

理性的重新定义:它不是最大化账面价值,而是最大化人生总效用。