Reading notes on thinking clearly and playing long games. Draws on Stanovich and Baron for the cognitive science — why IQ ≠ rationality, and how most thinking errors come from searching too little or too unfairly. Applied to business cases: Pinduoduo's capacity for short-term pain, Wang Xing on shedding sunk costs, Huang Zheng's first-principles discipline. Core thesis: long horizons are a skill, not a personality trait — and fixing mistakes early is always the cheapest option.
段永平: 理性想长远。其次是尽量理性尽量想长远。然后是理性面对结果。
段永平: 其实我最大的财富就是我犯过的这些错误,巴菲特也是。“我唯一能肯定的一点是,未来我们都会继续犯错”。发现错误要尽快改,不管多大的代价都可能是最小的代价。
赫伯特·西蒙(旅行定理): 不要盲目崇拜未经思考的见闻,在图书馆里往往能学到比盲目旅行更多的东西。
理性是什么?
思考”思考”本身:什么是理性,目的是什么?
-
认知理性(Epistemic Rationality) — 地图准不准?你对世界的看法是否符合世界的真实样子。
- 核心动作:寻找证据、更新概率、消除偏见。
- 逻辑:贝叶斯更新。当你看到新证据时,你必须根据证据强度,按比例修改你的”地图”。
-
工具理性(Instrumental Rationality) — 能不能带我去目的地?
- 在给定资源和限制下,你采取的手段是否能最大化实现你的目标?
- 不停思考目标是什么,本身也是一种理性。
- 核心动作:效用最大化。如果你的目标是减肥,但你每天吃炸鸡,这就是工具性的”不理性”。
- 从演化的角度,理性存在不是为了让我们变成”杠精”,而是解决非常现实的问题:
- A. 减少”惊奇”(演化驱动) — 根据自由能原理,大脑本质上是一个预测机器。理性的目的是最小化预测误差。“思考是为了让我们的想法替我们去死。“——卡尔·波普尔。理性是模拟现实成本最低的方式。
- B. 获得自主权(心理驱动) — 理性是将我们从生物本能(基因的奴役)和社会直觉(模因的奴役)中解放出来的唯一工具。理性的目的是夺回”我是谁”的定义权。
- C. 社会协调(沟通驱动) — 情感是私人的,但逻辑是公共的。理性的目的是建立一个可共识的框架,让不同背景的人能通过证据而非暴力达成合作。
-
真正的理性包含一个极其理性的结论:人不可能完全理性。
- 思考思考本身,是为了发现大脑这个软件的 Bug。理性的本质不是”永远正确”,而是”承认错误”。它不消灭情感,而是给情感套上缰绳,确保你的生命之车奔向你真正想要的地方。
- 有限理性 — 我们的脑力有限、时间有限。在餐馆花三小时研究菜单以找出”全局最优解”反而是极大的不理性。
- 非理性也是理性的 — 有时直觉、情感和快思考(System 1)能帮我们避开危险或建立信任,这在演化博弈中是高效的。
拼多多:“承受痛苦的能力”
“承受痛苦的能力”(Capacity to Suffer)是价值投资领域(尤其是 Thomas Russo 和 Mohnish Pabrai 经常提到)的核心概念。“悖逆于市场和同罪人去行事的能力”,实际上指向企业如何摆脱机构驱使力(Institutional Imperative)——即那种为了不显得”掉队”而不得不跟随的压力。
什么是”承受痛苦的能力”?
在财务层面,这指一家公司为了长期利益,在短期内主动且大规模地恶化其财务报表的能力。
- 账面之痛 — 拼多多(以及当年的亚马逊)在很长一段时间内表现为巨额亏损。不是因为经营失败,而是因为他们将每一分钱都投入了未来的资产:百亿补贴、物流基建、Temu 的全球推广。
- 估值之痛 — 当市场要求利润、要求分红时,拼多多却选择继续烧钱,导致股价剧烈波动,甚至被机构投资者集体抛弃。能够忍受这种被市场”唾弃”的孤独,就是 Capacity to Suffer。
为何能”悖逆于市场”?
大多数职业经理人都背负着”平庸之罪”:
- 从众压力 — 如果大家都在省钱裁员,我也跟着,即便公司倒了,我也没错;但如果我在大家都省钱时大规模投入,一旦失败,我就是”罪人”。
- 拼多多的特质 — 通过极其扁平、高度集权的决策结构(由黄峥奠定),成功对抗了这种压力。它不追求财报的平滑美观,而是追求第一性原理。当阿里和京东都在向上追求”品质”和”高客单价”时,拼多多顶着”山寨”骂名深耕下沉市场。这种逆着社会心理行事的能力,背后是对底层商业逻辑的极端自信。
与亚马逊、伯克希尔的相似性
这三家公司本质上都在利用”长期的跨度”来打击”短期的对手”:
- 亚马逊 — 贝佐斯将所有利润投入基建,甚至举债扩张。他认为”自由现金流”比”账面净利润”重要得多,能承受华尔街连续十年的质疑。
- 伯克希尔 — 巴菲特和芒格能忍受在牛市中拿着几千亿现金”一股不买”,忍受被市场嘲笑为”落伍者”。这种不跟随”同罪人”追高暴利的能力,是他们最大的护城河。
- 拼多多 — 在农业科研上的投入,以及 Temu 的海外补贴,短期内是极大的利润压力,但拉长到 10 年看,正在构建竞争者因为不敢亏损而无法模仿的壁垒。
深度洞察:对抗”一致性偏见”
普通管理层一旦宣称”要盈利”,就会被锁定在盈利轨道上,不敢再投入。拼多多保持了极其不透明(很少开发布会,很少解释战略)的封闭性。这种”傲慢”其实是为了保护内部决策不被外界嘈杂污染,从而保住了那份”逆行”的能力。
总结 — 拼多多的”承受痛苦的能力”本质上是战略上的高维碾压。当竞争对手因为害怕报表难看、害怕股东质疑而不敢放手一搏时,拼多多用短期的极度财务痛苦换取了长期的、难以撼动的市场统治力。
黄峥像 AlphaZero:疯狂进化,关键是理性
AlphaZero 式的”冷酷进化”:从第一性原理出发
AlphaZero 不学习人类棋谱,只通过游戏规则进行亿万次自我对弈。
- 摆脱路径依赖 — 很多传统电商大佬靠”地推”、“物流”或”流量生意”打出来,带有强烈的时代经验。而黄峥是典型的第一性原理实践者。他看电商不是看”货”,而是看”人的集合”(如他论文里提到的保险与资本分配逻辑)。
- 疯狂迭代 — 拼多多初期的砍一刀、游戏化界面,在精英眼中是”土”,但在算法逻辑中是获客成本最低的最优解。他像 AlphaZero 一样,只追求获客与转化的效率,而不受”审美”或”行业惯例”的束缚。
“不交流”背后的战略:避开”共识”的陷阱
他不跟顶级投资人频繁社交,并非出于傲慢,而是为了保持决策的”纯净度”。
- 噪音隔离 — 顶级投资人的圈子本质上是一个”共识圈”。黄峥通过物理和社交上的隔离,确保自己的思考是”离线计算”的结果,而不是被圈子”投喂”的信息。
- 不寻找认同 — 平庸的创业者需要大佬的背书来证明自己是对的;而黄峥式的理性认为,“正确”来源于逻辑的自洽和数据的反馈,而不是大佬的点头。
极度理性的”本分”
黄峥频繁提到”本分”,这在拼多多内部其实就是一种算法指令。
- 排除情绪干扰 — 多数人在面对舆论压力时会产生情绪化决策。黄峥的理性在于,他能像 AI 一样屏蔽噪音:只要供应链和价格优势还在,只要用户还在用脚投票,其他的都是干扰项。
- 功成身退的算法优化 — 在拼多多如日中天时选择卸任:当系统已经跑通,个人作为”变量”的边际效应递减,理性的最优解就是让位给系统。
王兴:既往不恋,纵情向前
“既往不恋,纵情向前”是美团创始人王兴最著名的座右铭,也是美团企业文化的核心。
1. 既往不恋:放下”沉没成本”
人们最容易犯的错误就是因为舍不得已经投入的资源,而坚持一个错误的航向。
- 对失败不纠结 — 面对局部失利,不沉溺于挫败感。
- 对成功不自满 — 这一点更难。美团在团购领域称霸后,并没有守着那一亩三分地,而是迅速把团购积攒的优势”清零”,投入到外卖、酒旅等新战场。
- 本质 — 这种心态要求极度的理性:决策只取决于”未来”的价值,而不取决于”过去”的投入。
2. 纵情向前:保持”高频进化”
如果说”既往不恋”是清理缓存,那么”纵情向前”就是高速运转的处理器。
- 长期主义的乐观 — 这里的”纵情”不是放纵,而是一种对未来充满好奇和激情的信念感。即便前方充满不确定性,也要敢于投入、敢于竞争。
- 探索边界 — 王兴推崇《有限与无限的游戏》。他认为商业不是为了结束游戏,而是为了让游戏一直玩下去。只要哪里有效率提升的空间,美团就杀向哪里。
- 行动导向 — 与其在纠结中浪费时间,不如在快速迭代中寻找答案。
核心思维模型:反熵增
从底层逻辑看,这八个字在对抗熵增:
- 既往 = 已经形成的结构、流程和负担(熵)
- 向前 = 引入负熵(新的能量、信息、机会)
“既往不恋”是断舍离的勇气,“纵情向前”是全速奔跑的韧性。
理性 = 算法心智(IQ)+ 反省心智(思维倾向)+ 心智程序(思维模型)
《超越智商》— 基思·斯坦诺维奇(Keith E. Stanovich)
这本书的核心目标是打破社会对”智商(IQ)“的迷信。斯坦诺维奇认为:聪明(高智商)不等于理性。智商只是大脑的”马力”,而理性才是大脑的”方向盘”。
核心观点:智商被高估了,理性被忽视了
智力不等于理性 — 传统的智力测试只测量了”算法心智”(计算速度、记忆力、逻辑推理),但完全忽略了”反省心智”(信念评估、目标设定、决策判断)。一个人可以拥有极高的算法心智(IQ 140),但在反省心智上极其低下——这就解释了为什么很多大学教授、金融精英会陷入庞氏骗局或做出糟糕的人生决策。
大脑的三重心智模型 — 斯坦诺维奇在卡尼曼”双系统”的基础上,将系统 2(慢思考)进一步拆解:
- 自主心智 — 对应系统 1。本能、直觉、情绪。反应快,不需要占用认知资源。
- 算法心智 — 对应智商(IQ)。负责处理复杂信息、维持工作记忆。大脑的硬件算力。
- 反省心智 — 理性的核心。负责发起对直觉的监控、评估信念是否符合现实。大脑的操作系统。智力测试只测”算法心智”。
理性障碍(Dysrationalia) — 尽管具有足够的智力,但无法进行理性思考和行动的状态。就像阅读障碍一样,这是一种真实的缺陷,但社会对理性缺陷视而不见,尽管其社会危害往往更大。
为什么聪明人会做蠢事?
1. 认知吝啬鬼 — 有能力但不愿用 人类大脑进化的默认设置是”能不用脑就不用脑”。当面临难题时,我们倾向于用一个简单的直觉问题来替代它,而不是启动复杂的算法心智。即使是数学系学生,在面对简单的逻辑陷阱时,如果不刻意压制直觉,也会和普通人一样犯错。
2. 心智程序缺陷 — 愿用但没工具 理性不仅需要脑力,还需要知识工具。如果你没有学习过概率论、逻辑学、科学实证思维,哪怕你智商再高,面对复杂的现代问题时也是”裸奔”。更可怕的是”懂歪了”(污化)——智商高的人往往更擅长通过复杂的逻辑自洽来捍卫错误的信念,而不是放弃它。
3. “我方立场偏差”独立于智商 智商高低与”是否能客观公正地看待对立观点”几乎零相关。高智商有时甚至是诅咒:更强的计算能力意味着能想出更多理由来合理化偏见。他们不是在追求真理,而是在像律师一样为自己先入为主的观点辩护。
总结公式
理性 = 算法心智(IQ)+ 反省心智(思维倾向)+ 心智程序(知识工具)
智商主要由基因决定,很难改变;但理性是可以习得的。通过学习概率、统计、逻辑和心理学(安装正确的”心智程序”),并养成”反省”的习惯,可以显著提高决策质量。
一句话总结 — 智商决定了你处理信息的速度(CPU 频率),而理性决定了你处理信息的质量和方向(操作系统与算法)。若没有理性,高智商只会被用来更高效地犯错。
《思维与决策》— 绝大多数思维错误,不是因为推理能力差,而是因为搜索得不够或不公平
乔纳森·巴伦(Jonathan Baron)的经典著作,被视为”判断与决策(JDM)“领域的百科全书式教材。如果说斯坦诺维奇的《超越智商》是在呼吁人们重视理性,那么巴伦的这本书就是在定义什么是”理性”,并给出了极其详尽的操作手册。
核心框架:思考的”搜索-推理”模型
巴伦将所有思维活动拆解为一个机械的过程,由两个基本操作组成:
- 搜索 — 大脑在记忆或环境中寻找:
- 可能性(选项)
- 证据(支持或反对可能性的信息)
- 目标(评价标准)
- 推理 — 根据搜索到的证据和目标,对可能性进行评估和排序
核心结论 — 绝大多数的思维错误(非理性),不是因为推理能力差,而是因为搜索得不够(过早停止)或搜索得不公平(只搜对自己有利的)。
三种模型的区分
巴伦严格区分了研究思维的三个维度:
- 规范性模型 — 我们”应该”怎么思考?基于数学、逻辑学和概率论。这是理性的”黄金标准”。
- 描述性模型 — 我们”实际”怎么思考?基于心理学实验(启发式、前景理论)。这是人类的”出厂设置”。
- 处方性模型 — 如何从”实际”走向”应该”?考虑到认知局限,需要什么样的辅助工具(清单、决策树)来逼近规范性模型。
核心概念
主动开放式思维(AOT) — 对抗非理性的终极武器。人类思维最大的陷阱是”我方立场偏差”:我们只搜索支持自己观点的证据。AOT 的核心:主动去搜索反驳自己的证据,主动去搜索其他的可能性。
忽略偏差(Omission Bias) — 人们认为”因为我不作为(Inaction)导致的伤害”比”因为我作为(Action)导致的同等伤害”更轻微。案例:接种疫苗有万分之一的概率致死,但不接种感染病毒有千分之一的概率致死。理性上必须接种(风险降低 10 倍),但很多父母选择不接种,因为”如果我给孩子打针导致他死了,是我杀了他;如果他不打针病死了,那是天意。“这种直觉严重阻碍了公共政策和个人最优决策。
沉没成本与现状偏差 — 沉没成本已经花掉且无法回收,理性的决策只看未来的后果。但人类很难做到。我们也过度偏爱”维持现状”,因为改变带来的后悔感比维持现状导致的后悔感更强烈。
多属性效用理论(MAUT) — 直觉决策往往不靠谱,因为我们无法在脑子里同时处理多个维度的权衡。操作:① 列出选项;② 列出评估维度(权重);③ 打分;④ 加权求和。看似简单,却是克服”认知局限”和”情绪干扰”最有效的处方性工具。
这本书在知识版图中的位置
- 《社会心理学》(迈尔斯)— 展示了环境如何影响我们的行为
- 《学会提问》(布朗)— 提供了批判性思维的基础工具
- 《认知心理学及其启示》(安德森)— 解释了大脑的底层硬件和软件原理
- 《超越智商》(斯坦诺维奇)— 指出了智力与理性的分离
- 《思维与决策》(巴伦) — 集大成者。涵盖上述内容,并引入了数学和逻辑的规范性标准
巴伦的核心教诲 — 思考不是为了自嗨,也不是为了证明自己是对的。思考是为了决策,决策是为了实现目标。任何无助于实现目标的思维习惯——固守成见、害怕改变、情绪化归因——都是需要通过主动开放式思维去修正的 Bug。
福特的负面案例
一个企业家因为早期的巨大成功,将自己的”成功经验”极端化、僵化,并用绝对权力强行延续这种过时模式,最终扼杀了创新并导致企业走向灾难。
一、成功神话的铸就
要理解福特的失败,必须先理解他的成功是多么的惊天动地。在 1910-1920 年代,他几乎是全球的”神”,一手缔造了三个神话:
- 产品神话(T 型车):可靠、廉价、”为大众而生”的工业奇迹。
- 生产神话(流水线):将汽车组装时间从 12 小时缩短到 90 分钟,这是一场革命。
- 社会神话(5 美元日薪):在平均日薪 2-3 美元时代,他不仅创造了机器,还创造了能买得起这台机器的”中产阶级”。
1920 年代初,福特汽车占据美国 60% 的市场份额。全世界都认为福特找到了商业和社会的”终极真理”。
二、”权力的错乱”:从创新者到暴君
这是悲剧的开始。福特”相信了新闻中对自己的赞美”,不再认为自己是”制造商”,而是”社会先知”。权力的错乱体现在三个层面:
A. 产品的僵化:”我比顾客更懂他们要什么”
当”神话”缔造完成,福特就停止了创新。他坚信顾客唯一需要的就是”廉价”和”耐用”,T 型车是完美的终极形态。
- 著名语录:”顾客可以选择任何他想要的颜色,只要它是黑色的。”
- 当通用汽车开始提供更多颜色、更舒适的座椅时,福特嘲笑这些是”肤浅的”——并用绝对权力扼杀了公司内部所有试图改进的声音。
B. 组织的僵化:”我比高管更懂如何管理”
一个”相信自己是神”的创始人,无法容忍任何质疑。
- 驱逐天才:威廉·诺德森 (William Knudsen) 因建议改进 T 型车而被羞辱,最终加入通用汽车,成为 GM 总裁,带领 GM 彻底击败了福特。
- 压制亲人:他的儿子埃德塞尔·福特力主开发更现代的车型,但亨利一次又一次公开羞辱他,否决提案,剥夺权力。
C. 文化的僵化:”我比员工更懂他们该如何生活”
“5 美元日薪”并非无条件。福特为此成立了庞大的社会学部门(Sociological Department),调查员会闯入工人家中检查私生活——是否喝酒、是否赌博、家庭是否整洁。后期更雇佣打手组建内部秘密警察,公司内部充满恐怖和猜疑。
三、终极警示:神话的破灭
1927 年,福特被迫承认 T 型车彻底失败,被迫关闭工厂长达 6 个月转向生产 Model A。这 6 个月的停产真空中,通用汽车和克莱斯勒疯狂抢占市场。福特从此再也没有夺回过市场第一。
结论:对创始人和投资者的提醒
福特的悲剧在于他混淆了”自我”与”公司”。这是所有成功创始人和投资者的终极提醒:
- 对于创始人:警惕”相信自己的神话”。过去的成功只是因为你”恰好做对了某件事”,而不是因为你是”全知全能的神”。最危险的时刻,就是你被称为”教父”或”先知”的时刻。
- 对于投资者:最大的风险之一是”创始人僵化”。当创始人开始沉迷于谈论自己的”哲学”和”过去的辉煌”,而不是恐惧地关注”今天的竞争对手”和”明天的客户需求”时,这就是明确的卖出信号。
你最大的优势(打破常规),最终会变成你最大的负债(维护常规)。
最大化人生总效用,而非账面价值
有两个按钮:① 100% 概率得到 100 万;② 50% 概率得到 1 个亿。你选哪个?
这是我早年写的《概率权》开篇。罗振宇看到并加以推荐,让”孤独大脑”出圈,极大改变了我的退休生活。
几种解答:
- 根据期望值理论,按钮②价值 5000 万;
- 很多人仍愿选确定的 100 万,因为他们无法忍受 50% 概率的什么都拿不到;
- 开放地想:假如你拥有选择②的权利,可将这 5000 万的选择权以 2000 万卖给一个有承受力的人;
- 继续优化:你可以只用 100 万(低首付)卖掉这个权利,但要求购买者中得 1 个亿时和你分成。
从期望值角度看,选 100 万是”不理性的”——我在文中称这是为了确定性甩卖自己的概率权。
但今天,我打算”自我推翻”一下。
选 100 万,真的很”短视”吗?
假如你无法将概率权以高于 100 万的价格卖给别人,你还会选按钮②吗?
要回答这个问题,我们需要从期望值,跃迁到一个更温暖的人性尺度——”效用”。
“期望值”假设每一块钱的价值都等同。但 18 世纪的”圣彼得堡悖论”早已揭示其谬误。丹尼尔·伯努利据此提出效用理论:金钱的价值在于它能带给人的主观幸福感,而这种幸福感遵循”边际效用递减”法则。
从 0 到 100 万,对一个普通人而言,可能意味着从负债到自立,从焦虑到安稳,是从生存状态到生活状态的”相变”,其带来的效用是巨大的。而从 100 万到 1 个亿,生活无疑会更奢华,但幸福感的提升远不如前者那般天翻地覆——这多出来的 9900 万,只是锦上添花。
为了一个效用增量有限的机会,去冒 50% 的风险,失去那个能让人生”重启”的基石,这不划算。
最关键的前提是:你要知道,自己想过一种什么样的人生。
构建并忠于自己的”人生效用函数”。对你而言,什么最重要?多少才算”足够”?否则,人很容易去追逐一些外界看来”更正确”却不符合自己内心效用的目标,反而带来消耗和迷失。
理性的重新定义:它不是最大化账面价值,而是最大化人生总效用。