Stay Rational. Think Long. Update Often.

Reading notes on thinking clearly and playing long games. Draws on Stanovich and Baron for the cognitive science — why IQ ≠ rationality, and how most thinking errors come from searching too little or too unfairly. Applied to business cases: Pinduoduo's capacity for short-term pain, Wang Xing on shedding sunk costs, Huang Zheng's first-principles discipline. Core thesis: long horizons are a skill, not a personality trait — and fixing mistakes early is always the cheapest option.

段永平： 理性想长远。其次是尽量理性尽量想长远。然后是理性面对结果。

段永平： 其实我最大的财富就是我犯过的这些错误，巴菲特也是。“我唯一能肯定的一点是，未来我们都会继续犯错”。发现错误要尽快改，不管多大的代价都可能是最小的代价。

赫伯特·西蒙（旅行定理）： 不要盲目崇拜未经思考的见闻，在图书馆里往往能学到比盲目旅行更多的东西。

理性是什么？

思考”思考”本身：什么是理性，目的是什么？

认知理性（Epistemic Rationality） — 地图准不准？你对世界的看法是否符合世界的真实样子。
- 核心动作：寻找证据、更新概率、消除偏见。
- 逻辑：贝叶斯更新。当你看到新证据时，你必须根据证据强度，按比例修改你的”地图”。
工具理性（Instrumental Rationality） — 能不能带我去目的地？
- 在给定资源和限制下，你采取的手段是否能最大化实现你的目标？
- 不停思考目标是什么，本身也是一种理性。
- 核心动作：效用最大化。如果你的目标是减肥，但你每天吃炸鸡，这就是工具性的”不理性”。
- 从演化的角度，理性存在不是为了让我们变成”杠精”，而是解决非常现实的问题：
  - A. 减少”惊奇”（演化驱动） — 根据自由能原理，大脑本质上是一个预测机器。理性的目的是最小化预测误差。“思考是为了让我们的想法替我们去死。“——卡尔·波普尔。理性是模拟现实成本最低的方式。
  - B. 获得自主权（心理驱动） — 理性是将我们从生物本能（基因的奴役）和社会直觉（模因的奴役）中解放出来的唯一工具。理性的目的是夺回”我是谁”的定义权。
  - C. 社会协调（沟通驱动） — 情感是私人的，但逻辑是公共的。理性的目的是建立一个可共识的框架，让不同背景的人能通过证据而非暴力达成合作。
真正的理性包含一个极其理性的结论：人不可能完全理性。
- 思考思考本身，是为了发现大脑这个软件的 Bug。理性的本质不是”永远正确”，而是”承认错误”。它不消灭情感，而是给情感套上缰绳，确保你的生命之车奔向你真正想要的地方。
- 有限理性 — 我们的脑力有限、时间有限。在餐馆花三小时研究菜单以找出”全局最优解”反而是极大的不理性。
- 非理性也是理性的 — 有时直觉、情感和快思考（System 1）能帮我们避开危险或建立信任，这在演化博弈中是高效的。

拼多多：“承受痛苦的能力”

“承受痛苦的能力”（Capacity to Suffer）是价值投资领域（尤其是 Thomas Russo 和 Mohnish Pabrai 经常提到）的核心概念。“悖逆于市场和同罪人去行事的能力”，实际上指向企业如何摆脱机构驱使力（Institutional Imperative）——即那种为了不显得”掉队”而不得不跟随的压力。

什么是”承受痛苦的能力”？

在财务层面，这指一家公司为了长期利益，在短期内主动且大规模地恶化其财务报表的能力。

账面之痛 — 拼多多（以及当年的亚马逊）在很长一段时间内表现为巨额亏损。不是因为经营失败，而是因为他们将每一分钱都投入了未来的资产：百亿补贴、物流基建、Temu 的全球推广。
估值之痛 — 当市场要求利润、要求分红时，拼多多却选择继续烧钱，导致股价剧烈波动，甚至被机构投资者集体抛弃。能够忍受这种被市场”唾弃”的孤独，就是 Capacity to Suffer。

为何能”悖逆于市场”？

大多数职业经理人都背负着”平庸之罪”：

从众压力 — 如果大家都在省钱裁员，我也跟着，即便公司倒了，我也没错；但如果我在大家都省钱时大规模投入，一旦失败，我就是”罪人”。
拼多多的特质 — 通过极其扁平、高度集权的决策结构（由黄峥奠定），成功对抗了这种压力。它不追求财报的平滑美观，而是追求第一性原理。当阿里和京东都在向上追求”品质”和”高客单价”时，拼多多顶着”山寨”骂名深耕下沉市场。这种逆着社会心理行事的能力，背后是对底层商业逻辑的极端自信。

与亚马逊、伯克希尔的相似性

这三家公司本质上都在利用”长期的跨度”来打击”短期的对手”：

亚马逊 — 贝佐斯将所有利润投入基建，甚至举债扩张。他认为”自由现金流”比”账面净利润”重要得多，能承受华尔街连续十年的质疑。
伯克希尔 — 巴菲特和芒格能忍受在牛市中拿着几千亿现金”一股不买”，忍受被市场嘲笑为”落伍者”。这种不跟随”同罪人”追高暴利的能力，是他们最大的护城河。
拼多多 — 在农业科研上的投入，以及 Temu 的海外补贴，短期内是极大的利润压力，但拉长到 10 年看，正在构建竞争者因为不敢亏损而无法模仿的壁垒。

深度洞察：对抗”一致性偏见”

普通管理层一旦宣称”要盈利”，就会被锁定在盈利轨道上，不敢再投入。拼多多保持了极其不透明（很少开发布会，很少解释战略）的封闭性。这种”傲慢”其实是为了保护内部决策不被外界嘈杂污染，从而保住了那份”逆行”的能力。

总结 — 拼多多的”承受痛苦的能力”本质上是战略上的高维碾压。当竞争对手因为害怕报表难看、害怕股东质疑而不敢放手一搏时，拼多多用短期的极度财务痛苦换取了长期的、难以撼动的市场统治力。

黄峥像 AlphaZero：疯狂进化，关键是理性

AlphaZero 式的”冷酷进化”：从第一性原理出发

AlphaZero 不学习人类棋谱，只通过游戏规则进行亿万次自我对弈。

摆脱路径依赖 — 很多传统电商大佬靠”地推”、“物流”或”流量生意”打出来，带有强烈的时代经验。而黄峥是典型的第一性原理实践者。他看电商不是看”货”，而是看”人的集合”（如他论文里提到的保险与资本分配逻辑）。
疯狂迭代 — 拼多多初期的砍一刀、游戏化界面，在精英眼中是”土”，但在算法逻辑中是获客成本最低的最优解。他像 AlphaZero 一样，只追求获客与转化的效率，而不受”审美”或”行业惯例”的束缚。

“不交流”背后的战略：避开”共识”的陷阱

他不跟顶级投资人频繁社交，并非出于傲慢，而是为了保持决策的”纯净度”。

噪音隔离 — 顶级投资人的圈子本质上是一个”共识圈”。黄峥通过物理和社交上的隔离，确保自己的思考是”离线计算”的结果，而不是被圈子”投喂”的信息。
不寻找认同 — 平庸的创业者需要大佬的背书来证明自己是对的；而黄峥式的理性认为，“正确”来源于逻辑的自洽和数据的反馈，而不是大佬的点头。

极度理性的”本分”

黄峥频繁提到”本分”，这在拼多多内部其实就是一种算法指令。

排除情绪干扰 — 多数人在面对舆论压力时会产生情绪化决策。黄峥的理性在于，他能像 AI 一样屏蔽噪音：只要供应链和价格优势还在，只要用户还在用脚投票，其他的都是干扰项。
功成身退的算法优化 — 在拼多多如日中天时选择卸任：当系统已经跑通，个人作为”变量”的边际效应递减，理性的最优解就是让位给系统。

王兴：既往不恋，纵情向前

“既往不恋，纵情向前”是美团创始人王兴最著名的座右铭，也是美团企业文化的核心。

1. 既往不恋：放下”沉没成本”

人们最容易犯的错误就是因为舍不得已经投入的资源，而坚持一个错误的航向。

对失败不纠结 — 面对局部失利，不沉溺于挫败感。
对成功不自满 — 这一点更难。美团在团购领域称霸后，并没有守着那一亩三分地，而是迅速把团购积攒的优势”清零”，投入到外卖、酒旅等新战场。
本质 — 这种心态要求极度的理性：决策只取决于”未来”的价值，而不取决于”过去”的投入。

2. 纵情向前：保持”高频进化”

如果说”既往不恋”是清理缓存，那么”纵情向前”就是高速运转的处理器。

长期主义的乐观 — 这里的”纵情”不是放纵，而是一种对未来充满好奇和激情的信念感。即便前方充满不确定性，也要敢于投入、敢于竞争。
探索边界 — 王兴推崇《有限与无限的游戏》。他认为商业不是为了结束游戏，而是为了让游戏一直玩下去。只要哪里有效率提升的空间，美团就杀向哪里。
行动导向 — 与其在纠结中浪费时间，不如在快速迭代中寻找答案。

核心思维模型：反熵增

从底层逻辑看，这八个字在对抗熵增：

既往 = 已经形成的结构、流程和负担（熵）
向前 = 引入负熵（新的能量、信息、机会）

“既往不恋”是断舍离的勇气，“纵情向前”是全速奔跑的韧性。

理性 = 算法心智（IQ）+ 反省心智（思维倾向）+ 心智程序（思维模型）

《超越智商》— 基思·斯坦诺维奇（Keith E. Stanovich）

这本书的核心目标是打破社会对”智商（IQ）“的迷信。斯坦诺维奇认为：聪明（高智商）不等于理性。智商只是大脑的”马力”，而理性才是大脑的”方向盘”。

核心观点：智商被高估了，理性被忽视了

智力不等于理性 — 传统的智力测试只测量了”算法心智”（计算速度、记忆力、逻辑推理），但完全忽略了”反省心智”（信念评估、目标设定、决策判断）。一个人可以拥有极高的算法心智（IQ 140），但在反省心智上极其低下——这就解释了为什么很多大学教授、金融精英会陷入庞氏骗局或做出糟糕的人生决策。

大脑的三重心智模型 — 斯坦诺维奇在卡尼曼”双系统”的基础上，将系统 2（慢思考）进一步拆解：

自主心智 — 对应系统 1。本能、直觉、情绪。反应快，不需要占用认知资源。
算法心智 — 对应智商（IQ）。负责处理复杂信息、维持工作记忆。大脑的硬件算力。
反省心智 — 理性的核心。负责发起对直觉的监控、评估信念是否符合现实。大脑的操作系统。智力测试只测”算法心智”。

理性障碍（Dysrationalia） — 尽管具有足够的智力，但无法进行理性思考和行动的状态。就像阅读障碍一样，这是一种真实的缺陷，但社会对理性缺陷视而不见，尽管其社会危害往往更大。

为什么聪明人会做蠢事？

1. 认知吝啬鬼 — 有能力但不愿用 人类大脑进化的默认设置是”能不用脑就不用脑”。当面临难题时，我们倾向于用一个简单的直觉问题来替代它，而不是启动复杂的算法心智。即使是数学系学生，在面对简单的逻辑陷阱时，如果不刻意压制直觉，也会和普通人一样犯错。

2. 心智程序缺陷 — 愿用但没工具 理性不仅需要脑力，还需要知识工具。如果你没有学习过概率论、逻辑学、科学实证思维，哪怕你智商再高，面对复杂的现代问题时也是”裸奔”。更可怕的是”懂歪了”（污化）——智商高的人往往更擅长通过复杂的逻辑自洽来捍卫错误的信念，而不是放弃它。

3. “我方立场偏差”独立于智商 智商高低与”是否能客观公正地看待对立观点”几乎零相关。高智商有时甚至是诅咒：更强的计算能力意味着能想出更多理由来合理化偏见。他们不是在追求真理，而是在像律师一样为自己先入为主的观点辩护。

总结公式

理性 = 算法心智（IQ）+ 反省心智（思维倾向）+ 心智程序（知识工具）

智商主要由基因决定，很难改变；但理性是可以习得的。通过学习概率、统计、逻辑和心理学（安装正确的”心智程序”），并养成”反省”的习惯，可以显著提高决策质量。

一句话总结 — 智商决定了你处理信息的速度（CPU 频率），而理性决定了你处理信息的质量和方向（操作系统与算法）。若没有理性，高智商只会被用来更高效地犯错。

《思维与决策》— 绝大多数思维错误，不是因为推理能力差，而是因为搜索得不够或不公平

乔纳森·巴伦（Jonathan Baron）的经典著作，被视为”判断与决策（JDM）“领域的百科全书式教材。如果说斯坦诺维奇的《超越智商》是在呼吁人们重视理性，那么巴伦的这本书就是在定义什么是”理性”，并给出了极其详尽的操作手册。

核心框架：思考的”搜索-推理”模型

巴伦将所有思维活动拆解为一个机械的过程，由两个基本操作组成：

搜索 — 大脑在记忆或环境中寻找：
1. 可能性（选项）
2. 证据（支持或反对可能性的信息）
3. 目标（评价标准）
推理 — 根据搜索到的证据和目标，对可能性进行评估和排序

核心结论 — 绝大多数的思维错误（非理性），不是因为推理能力差，而是因为搜索得不够（过早停止）或搜索得不公平（只搜对自己有利的）。

三种模型的区分

巴伦严格区分了研究思维的三个维度：

规范性模型 — 我们”应该”怎么思考？基于数学、逻辑学和概率论。这是理性的”黄金标准”。
描述性模型 — 我们”实际”怎么思考？基于心理学实验（启发式、前景理论）。这是人类的”出厂设置”。
处方性模型 — 如何从”实际”走向”应该”？考虑到认知局限，需要什么样的辅助工具（清单、决策树）来逼近规范性模型。

核心概念

主动开放式思维（AOT） — 对抗非理性的终极武器。人类思维最大的陷阱是”我方立场偏差”：我们只搜索支持自己观点的证据。AOT 的核心：主动去搜索反驳自己的证据，主动去搜索其他的可能性。

忽略偏差（Omission Bias） — 人们认为”因为我不作为（Inaction）导致的伤害”比”因为我作为（Action）导致的同等伤害”更轻微。案例：接种疫苗有万分之一的概率致死，但不接种感染病毒有千分之一的概率致死。理性上必须接种（风险降低 10 倍），但很多父母选择不接种，因为”如果我给孩子打针导致他死了，是我杀了他；如果他不打针病死了，那是天意。“这种直觉严重阻碍了公共政策和个人最优决策。

沉没成本与现状偏差 — 沉没成本已经花掉且无法回收，理性的决策只看未来的后果。但人类很难做到。我们也过度偏爱”维持现状”，因为改变带来的后悔感比维持现状导致的后悔感更强烈。

多属性效用理论（MAUT） — 直觉决策往往不靠谱，因为我们无法在脑子里同时处理多个维度的权衡。操作：① 列出选项；② 列出评估维度（权重）；③ 打分；④ 加权求和。看似简单，却是克服”认知局限”和”情绪干扰”最有效的处方性工具。

这本书在知识版图中的位置

《社会心理学》（迈尔斯）— 展示了环境如何影响我们的行为
《学会提问》（布朗）— 提供了批判性思维的基础工具
《认知心理学及其启示》（安德森）— 解释了大脑的底层硬件和软件原理
《超越智商》（斯坦诺维奇）— 指出了智力与理性的分离
《思维与决策》（巴伦） — 集大成者。涵盖上述内容，并引入了数学和逻辑的规范性标准

巴伦的核心教诲 — 思考不是为了自嗨，也不是为了证明自己是对的。思考是为了决策，决策是为了实现目标。任何无助于实现目标的思维习惯——固守成见、害怕改变、情绪化归因——都是需要通过主动开放式思维去修正的 Bug。

福特的负面案例

一个企业家因为早期的巨大成功，将自己的”成功经验”极端化、僵化，并用绝对权力强行延续这种过时模式，最终扼杀了创新并导致企业走向灾难。

一、成功神话的铸就

要理解福特的失败，必须先理解他的成功是多么的惊天动地。在 1910-1920 年代，他几乎是全球的”神”，一手缔造了三个神话：

产品神话（T 型车）：可靠、廉价、”为大众而生”的工业奇迹。
生产神话（流水线）：将汽车组装时间从 12 小时缩短到 90 分钟，这是一场革命。
社会神话（5 美元日薪）：在平均日薪 2-3 美元时代，他不仅创造了机器，还创造了能买得起这台机器的”中产阶级”。

1920 年代初，福特汽车占据美国 60% 的市场份额。全世界都认为福特找到了商业和社会的”终极真理”。

二、”权力的错乱”：从创新者到暴君

这是悲剧的开始。福特”相信了新闻中对自己的赞美”，不再认为自己是”制造商”，而是”社会先知”。权力的错乱体现在三个层面：

A. 产品的僵化：”我比顾客更懂他们要什么”

当”神话”缔造完成，福特就停止了创新。他坚信顾客唯一需要的就是”廉价”和”耐用”，T 型车是完美的终极形态。

著名语录：”顾客可以选择任何他想要的颜色，只要它是黑色的。”
当通用汽车开始提供更多颜色、更舒适的座椅时，福特嘲笑这些是”肤浅的”——并用绝对权力扼杀了公司内部所有试图改进的声音。

B. 组织的僵化：”我比高管更懂如何管理”

一个”相信自己是神”的创始人，无法容忍任何质疑。

驱逐天才：威廉·诺德森 (William Knudsen) 因建议改进 T 型车而被羞辱，最终加入通用汽车，成为 GM 总裁，带领 GM 彻底击败了福特。
压制亲人：他的儿子埃德塞尔·福特力主开发更现代的车型，但亨利一次又一次公开羞辱他，否决提案，剥夺权力。

C. 文化的僵化：”我比员工更懂他们该如何生活”

“5 美元日薪”并非无条件。福特为此成立了庞大的社会学部门（Sociological Department），调查员会闯入工人家中检查私生活——是否喝酒、是否赌博、家庭是否整洁。后期更雇佣打手组建内部秘密警察，公司内部充满恐怖和猜疑。

三、终极警示：神话的破灭

1927 年，福特被迫承认 T 型车彻底失败，被迫关闭工厂长达 6 个月转向生产 Model A。这 6 个月的停产真空中，通用汽车和克莱斯勒疯狂抢占市场。福特从此再也没有夺回过市场第一。

结论：对创始人和投资者的提醒

福特的悲剧在于他混淆了”自我”与”公司”。这是所有成功创始人和投资者的终极提醒：

对于创始人：警惕”相信自己的神话”。过去的成功只是因为你”恰好做对了某件事”，而不是因为你是”全知全能的神”。最危险的时刻，就是你被称为”教父”或”先知”的时刻。
对于投资者：最大的风险之一是”创始人僵化”。当创始人开始沉迷于谈论自己的”哲学”和”过去的辉煌”，而不是恐惧地关注”今天的竞争对手”和”明天的客户需求”时，这就是明确的卖出信号。

你最大的优势（打破常规），最终会变成你最大的负债（维护常规）。

最大化人生总效用，而非账面价值

有两个按钮：① 100% 概率得到 100 万；② 50% 概率得到 1 个亿。你选哪个？

这是我早年写的《概率权》开篇。罗振宇看到并加以推荐，让”孤独大脑”出圈，极大改变了我的退休生活。

几种解答：

根据期望值理论，按钮②价值 5000 万；
很多人仍愿选确定的 100 万，因为他们无法忍受 50% 概率的什么都拿不到；
开放地想：假如你拥有选择②的权利，可将这 5000 万的选择权以 2000 万卖给一个有承受力的人；
继续优化：你可以只用 100 万（低首付）卖掉这个权利，但要求购买者中得 1 个亿时和你分成。

从期望值角度看，选 100 万是”不理性的”——我在文中称这是为了确定性甩卖自己的概率权。

但今天，我打算”自我推翻”一下。

选 100 万，真的很”短视”吗？

假如你无法将概率权以高于 100 万的价格卖给别人，你还会选按钮②吗？

要回答这个问题，我们需要从期望值，跃迁到一个更温暖的人性尺度——”效用”。

“期望值”假设每一块钱的价值都等同。但 18 世纪的”圣彼得堡悖论”早已揭示其谬误。丹尼尔·伯努利据此提出效用理论：金钱的价值在于它能带给人的主观幸福感，而这种幸福感遵循”边际效用递减”法则。

从 0 到 100 万，对一个普通人而言，可能意味着从负债到自立，从焦虑到安稳，是从生存状态到生活状态的”相变”，其带来的效用是巨大的。而从 100 万到 1 个亿，生活无疑会更奢华，但幸福感的提升远不如前者那般天翻地覆——这多出来的 9900 万，只是锦上添花。

为了一个效用增量有限的机会，去冒 50% 的风险，失去那个能让人生”重启”的基石，这不划算。

最关键的前提是：你要知道，自己想过一种什么样的人生。

构建并忠于自己的”人生效用函数”。对你而言，什么最重要？多少才算”足够”？否则，人很容易去追逐一些外界看来”更正确”却不符合自己内心效用的目标，反而带来消耗和迷失。

理性的重新定义：它不是最大化账面价值，而是最大化人生总效用。