TED「爱情数学」中提到的「最优停止论」的37%是如何计算的?-Jay哥讲数学
想象一下,你是一名28岁的男青年,名牌大学毕业,工作了几年,事业小有所成,收入稳定,父母也开始催你成家立业.你过去谈过三段恋爱,虽然现在单身,但身边不乏主动向你示好的女生.
然而你却一直犹豫.因为在你心里,这些女生都不如你的"白月光"——那是你大一时谈的初恋,也是你至今认为遇到过的最完美的女孩.你在想:如果将来要结婚,伴侣至少不能比"白月光"差吧?所以你不断拖延,刻意和身边对你有好感的女生保持距离,一直在等你的天选之女.
镜头一转.现在你是一位两个孩子的妈妈,自从有了二胎,你觉得原来这个家有些小了,于是你和丈夫一直合计着换个更大的房子.刚好有个朋友告诉你,他家附近有一片新房不错,于是你就和老公就去看了一下,觉得挺满意,本来已经准备签合同了.
但是这时候你表哥跑过来劝你再等等,现在房价正处于高点,仓促出手不划算,而且他知道城西有一片新盘也非常不错,应该去看看再说.临走前他语重心长地说:“买房可是人生大事,怎么能只看了几套就决定?多看看,多比较,将来才不会后悔.”
像这类问题,如果你出手太早,似乎就有点草率,你很可能错过未来更好的.可如果出手太晚,又会发现理想的对象已经成为别人的配偶,好房子早就被别人买走了,你会后悔当初没有果断出手.
所以出手太早和太晚都不是一个好主意,那到底有没有一个"最佳出手时机"呢?数学家说你们都别争了,我的数学计算表明最佳时机是—— !也就是说你应该在前
的时间只观察但不选择,等过了
,一旦你遇到和前
中最好的一样好或者更好的,就要果断出手.
这就是著名的 法则,采用这个法则,可以保证你以最大概率收获最好的结果.这个法则流传很广,但很多人只记住了
这个数字,却忽略了它的适用前提和真正含义.
还是以买房为例, 法则要想成立,我们必须先把现实问题做一些简化和假设.大致需要满足以下四个条件:
- 你会随机地遇到一批房源,但你只打算买其中一套.
- 遇到一个房子,如果你选择买下,这个房子就是你的.
- 如果你选择不买,很快别人就会把它买走——你没有回头再选的机会.
- 你给自己设定了一个总期限,比如说:三个月内必须买到房.或者最多看20套房就决定.
这些条件跟现实中买房的具体情况不完全一样,但只有在这样的抽象和简化下,数学家才能计算.
下面我们就来欣赏一下数学家的解法.首先我必须申明,这个问题一点也不简单.它最早来源于经典的"秘书问题" (Secretary Problem)——最优停止问题(Optimal Stopping Problem)中最著名的一类难题,直到上世纪60年代才被数学家解决.因此后面我会使用相当多的数学,如果你对数学不感兴趣,或者还没学过本科水平的概率论,可以跳过推导过程,直接听最后的结论和启发.
而如果你愿意多花一些时间把中间的数学过程啃下来,你将收获一整套用数学分析现实决策的方法.比如在这个最优停止问题中,最后得到的答案究竟是 ,还是
或者
,这并不重要,重要的是得到
的方法.你掌握了方法,就可以触类旁通分析和解决一大类问题,这就是外行和内行的本质区别.
我们先来看什么是秘书问题.想象你是公司CEO,现在要招一名秘书,共有 位候选人依次来面试.对每一位候选人,你只有录用和拒绝两个选项:如果你录用了某位候选人,那么后面的人就不再面试;如果拒绝了某位候选人,也不能反悔,秘书只能在之后的候选人中产生.现在你希望以最大概率选到这
位候选人中最优秀的那位,那么最佳策略是什么?
上面这个问题的问法还是比较模糊,想让数学发挥威力,你首先要把生活中的模糊问题,转化为在数学意义上精确的表述.
在这个秘书问题中,我们假设这 位候选人的排名是一个全序,也就是说任何两名候选人之间都能比较出谁更强,不存在并列.我们用他们的出场顺序给人编号
,并用一个排列
来代表"编号和真实排名"之间的一一对应关系:
这里, 表示第
个出场的人在整体中的名次,比如
代表第
个出场的是所有人中的第一名.由于候选人的出场顺序是随机的,换句话说,我们事先不知道他们的真实排名会以什么顺序出现,所以自然假设这
种可能的排列
是等概率的.
在这个问题中,"策略"指的是:在面试到第几位候选人时停下来,录用当前这位.我们把终止面试的时刻记为 .很重要的一点是:当你做出是否录用第
位候选人的决定时,你只能基于之前和当前见到的人来判断,不能用"还没出场的人"的信息.
我们记 是前k位候选者相对排名的信息,为了方便,我们规定
,那么,
是一个只依赖于
的随机变量,在数学上称为一个停时 (stopping time).我们的策略空间,就是所有可能的停时集合
.
直觉上我们就能想到,太早或太晚停下都不是好主意:如果你总是录用第一个人,或者总是等到最后一个人,这两种极端策略下,选中最优秀者的概率都只有 .一个"看起来合理"的策略是:先等一等,观察前几个人的水平,再开始认真做决定——而且要充分利用手头的信息,也就是之前见过的人和当前面试者之间的相对排名.
我们定义随机变量 ,
如果第 位候选者是第一名时取值为 ,否则取值为 。
于是,对于某个策略 ,我们选到最优秀者的概率就是:
\begin{equation*}
P(\text{使用策略 }\tau\text{ 选到最优秀者}) = E(X_\tau).
\end{equation*}
我们的目标就是找到这样一个策略 \tau^\* ,使得
\begin{equation*}
\tau^* = \mathrm{argmax}{E(X_\tau)}.
\end{equation*}
也就是让 达到最大。
要找到这样的最佳策略,我们引入一个叫"收益函数"的概念.定义第 步的收益函数
为:
其中 表示在已经知道前
位候选人相对排名信息的前提下,如果你此刻立刻停止面试,录用当前这位,你选中最优秀者的概率.而
则表示如果你决定继续面试(也就是再等等),将来最终选到最优秀者的概率.注意,当你面试到最后一位候选人时,已经没有等待的选项,只能录用他,所以有
.这个随机过程
在数学上被称为Snell包络(Snell envelope).
最优停时定理:是一个最佳策略.
简单理解这个定理就是:一旦出现某一时刻 ,此刻立刻录用当前候选人所带来的期望收益,已经不低于"再等等看"的期望收益,那么时刻
就是我们最理想的停下时间点.
证明: 严格的数学证明需要用到鞅论,这里只是给一个直观"证明".
从 的定义可以看出
只用到前
位候选人的信息,因此它确实是一个合法的停时,也就是一个允许的策略.对于任意一个其它策略
,如果
,意味着在
这个时刻,我们还处在"继续面试更好或至少不差"的阶段,即
所以继续等待不会比当场录用更差,因此这种"过早停下"的策略 不可能优于
.如果
,那么采用策略
时经过
时刻,在
时刻我们有
因此在 时刻选择停下的收益不会比继续等到
时刻更差,故"拖得更晚"的策略
也不可能优于策略
.综上,
是一个最佳策略.
接下来我们需要具体算出 和
.
引理1:.
证明: 如果第 位候选者不是前
位中最优秀的,那么他当然也不是所有候选人中最优秀的,此时如果你停止面试录用他,必然选不到第一名,所以
如果第i位候选者是前 位中最优秀的,由于
种排名等概率,因此
于是由条件概率公式
推论1:存在最佳策略,它满足在第
位停下时,这位候选人是至今面试过的人中最优秀的.
证明: 反证法,如果第 位候选人不是前
位中最优秀的,那么由前一引理
因此必有
即继续面试的结果至少不会更差,因此任何一个策略都可以"改进"为面试到当前最优秀者才结束.
引理2:对任意,
,也就是说在第
步,如果我们选择继续面试,将来选到最优者的概率,与前
**位候选人的具体相对排名无关,只和 "还剩下多少人"有关.并且 **
满足如下递推关系式:
证明: 采用向前归纳法,当 时,我们有
右侧表示在知道前 位候选者的相对排名后,最后一位候选人是最优秀者的概率.对前
位候选人的每一种具体相对排名
,其出现的概率为
在这种排序下,第 位是最优秀者,其概率为
因此
从而 ,与前
位的具体排名毫无关系.
如果结论对 成立,那么当
时,我们有
由于第 位候选人是否是最优秀的与前
位候选人的相对排名无关(仿照
时的推导),因此
是常数.
最后,我们来导出 的递推表达式,根据(2)我们有
由(1)可知
而 随着
严格单调递增,所以一定存在唯一的正整数
(只与
有关)满足
因此根据最优停时定理,秘书问题的最佳策略如下:
把整个过程分成观察、决定两个阶段.具体做法是这样的,拒绝前 位候选人,从第
位候选人开始,只要遇到比前
位候选人都更优秀的候选人,就立刻录用他.
现在我们来确定 的值.记随机变量
是最优候选人的出场次序,由于
种排名是等概率的,因此
.利用全概率公式,有
而
于是
构造辅助函数 ,利用微积分知识可知
在
处取得最大值.因此当
足够大以后,最佳策略是拒绝前
个候选人,然后等待之后出现的比之前都优秀的第一个候选人.
因为 ,这就是著名的
法则的由来,采取这个策略选到最优候选人的概率能够达到
这个模型给我的第一个震撼是如此简单的策略——“先观察,再选择”,居然就是最佳策略.也就是说在秘书问题中,任何再复杂的策略,都无法把成功率提升到超过这条简单法则的程度,甚至往往还不如它.
这背后隐含着一种"简单优于复杂 "的哲学.我们在上一讲中提到过,与其在每个案例上详细权衡几十个因素、制定错综复杂的指标和规则,不如选择少数几个关键指标,配上一套清晰、易执行、简单稳定的流程,实战表现往往更好.
博弈论里也有个经典的多人博弈策略,叫做"一报还一报" (tit for tat):你这次跟我合作,我下次也继续合作;你这次背叛,我下次就惩罚性地背叛一次.计算机模拟结果显示,这样朴素的策略在长周期竞争中经常表现得比复杂策略更好
为什么简单规则能在复杂世界中获胜?我目前也不敢说有一个统一完备的数学解释,但可以直观地猜测:我们面对的是一个极其复杂、充满噪声的世界,而我们所掌握的信息永远极其有限.复杂策略看上去更精细,但也更容易被噪声和不确定性所干扰,微弱的理论优势在现实中很容易被误差淹没;而简单策略容错率更高,反而在长期表现上更稳定.正所谓"大道至简",在这里似乎有了数学的注脚.
第二个让我震撼的,是这个结论本身的"反直觉":即使候选人的人数 再怎么增大,在采用最佳策略的前提下,你最终选到最优秀者的概率始终稳定在
左右.直觉上,这个概率应该随着
增大而不断下降,最后趋近于
才对.
这也是一个困扰很多概率论学生的问题,其实我们可以考虑一个更简单的策略,也就是前 的候选人只观察不录用,过了
我们再选其中比之前都要好的.这时候只要最优者出现在后
,次优者出现在前
,那么我们一定能选到最优者.而最优者落在后半段、次优者落在前半段,这两个事件相互独立且概率都是
,因此同时发生的概率为
.换句话说,哪怕采取如此简单的策略,我们选到最优者的概率也能高于
.
当然,我必须要强调, 法则并不能保证你在现实生活中每一次都能选到"最心仪的那一个".也许你后来发现高中时的女同桌才是最合适的结婚对象,但这并不意味着这个策略错了.这个策略,说的是在面对一个不确定的世界,你根本不知道命运会怎么样的情况下.如果重复很多次,或者找很多人来试验,你会发现这个策略比别的策略都好——更比没有策略要好.
就像我们在讨论"科学决策"时说过,要把"决策过程"和"决策结果"分开看.一个策略带来的某个具体结果,也应该和策略本身区分开来.人生的很多重要选择——择偶、择业、买房、投资,甚至是否跳槽、何时创业——本质上都更像"系统性游戏",而不是"一局定输赢".大多数时候,单次成败并没有我们想象得那么重要.真正关键的是:你有没有在用一套,能让你在长期以更大概率获胜的策略与系统.
如果你能有一点数学精神,就会发现生活中其实充满可以优化的变量和空间.这些细小而持续的优化,在时间的复利下,就会成为你与他人拉开差距的底气和筹码.
评论区
吴钩霜雪明: 我现在终于也可以做到“注意到37%约等于1/e了”,下拉一看果然[机智] 👍🏽162 💭河北 🕐2025-12-03 09:43:01
│ └── frank macial: 注意力锻炼成功 👍🏽25 💭上海 🕐2025-12-03 12:12:45
│ └── 拉乌: 注意力惊人 👍🏽16 💭上海 🕐2025-12-03 13:37:49
│ └── 轻舞肥羊: 易知 👍🏽1 💭辽宁 🕐2025-12-03 14:45:57
│ └── frank macial: 注意力锻炼成功 👍🏽25 💭上海 🕐2025-12-03 12:12:45
│ └── 拉乌: 注意力惊人 👍🏽16 💭上海 🕐2025-12-03 13:37:49
│ └── 轻舞肥羊: 易知 👍🏽1 💭辽宁 🕐2025-12-03 14:45:57
星辰大海: 让我感到神奇的地方是,从引入数学概念和公式推导开始,一步一步,到最后神奇般地出现了ln和自然底数e,自然底数和圆周率真的是我们宇宙中广泛存在的啊 👍🏽81 💭韩国 🕐2025-12-03 09:50:56
│ └── 陶然: 好神奇[思考] 👍🏽2 💭中国香港 🕐2025-12-03 13:28:08
│ └── 玄天: e和pi本质上是一种周期性和变化率的体现。(e^x求导仍为本身) 👍🏽32 💭陕西 🕐2025-12-03 23:00:25
│ └── 陶然: 好神奇[思考] 👍🏽2 💭中国香港 🕐2025-12-03 13:28:08
│ └── 玄天: e和pi本质上是一种周期性和变化率的体现。(e^x求导仍为本身) 👍🏽32 💭陕西 🕐2025-12-03 23:00:25
越子隐: 实质上人的注意力也是充满噪声的,所以人也只会倾向于记住更为简单的东西[思考]那么看完整篇文章也只会记得37% 👍🏽34 💭江西 🕐2025-12-03 15:55:18
│ └── 小尹的生活: 大脑自行做了滤波处理 👍🏽1 💭浙江 🕐2025-12-04 16:24:45
│ └── 小尹的生活: 大脑自行做了滤波处理 👍🏽1 💭浙江 🕐2025-12-04 16:24:45
momo: 看到这个问题我以为我在上果壳 👍🏽29 💭北京 🕐2025-12-02 15:14:05
疯狂的大青蛙: 虽然我很喜欢数学建模,但是不得不说很多东西目前还是没法简单地用数学计算的,尤其是这种感情问题。A女生性格温柔,B女生大方不矫情,C女生面容身材好,你说谁的数值高呢。所以我认为,这里的37%也好,50%也好,可以当参考,但不要太拘泥。 👍🏽22 💭北京 🕐2025-12-03 10:12:38
│ └── ppoj: 每个人都有一套自己的评分系统。有的人是颜控,颜值的权重就会高;有的人想白手起家,需要伴侣镇守后方,温柔顾家的权重高;有的人想吃软饭,有钱多金的权重高;有的人想安稳过日子,门当户对权重高。 👍🏽20 💭广东 🕐2025-12-03 19:35:57
│ │ └── 宇落: 我老婆过于优秀,以至于我能拿下她完全靠她是个颜控[发呆] 👍🏽2 💭上海 🕐2025-12-04 11:22:09
│ │ └── 宇落: 我老婆过于优秀,以至于我能拿下她完全靠她是个颜控[发呆] 👍🏽2 💭上海 🕐2025-12-04 11:22:09
│ └── 谢少: 选胸大的。 👍🏽2 💭广东 🕐2025-12-04 14:46:30
│ └── ppoj: 每个人都有一套自己的评分系统。有的人是颜控,颜值的权重就会高;有的人想白手起家,需要伴侣镇守后方,温柔顾家的权重高;有的人想吃软饭,有钱多金的权重高;有的人想安稳过日子,门当户对权重高。 👍🏽20 💭广东 🕐2025-12-03 19:35:57
│ │ └── 宇落: 我老婆过于优秀,以至于我能拿下她完全靠她是个颜控[发呆] 👍🏽2 💭上海 🕐2025-12-04 11:22:09
│ │ └── 宇落: 我老婆过于优秀,以至于我能拿下她完全靠她是个颜控[发呆] 👍🏽2 💭上海 🕐2025-12-04 11:22:09
│ └── 谢少: 选胸大的。 👍🏽2 💭广东 🕐2025-12-04 14:46:30
小白: 可是大部分的情况下都不知道现在的进度是多少 👍🏽12 💭上海 🕐2025-12-03 10:42:51
│ └── 不高兴也没头脑: 看上去,要先设定一个目标值,比如我最多找10个对象这种 👍🏽15 💭广东 🕐2025-12-03 11:07:55
│ └── 魏连殳: 开头说了啊,你要设置一个期限。比如找10个女朋友,观察三四个,以后就可以做出决策了 👍🏽2 💭陕西 🕐2025-12-04 14:23:59
│ └── 不高兴也没头脑: 看上去,要先设定一个目标值,比如我最多找10个对象这种 👍🏽15 💭广东 🕐2025-12-03 11:07:55
│ └── 魏连殳: 开头说了啊,你要设置一个期限。比如找10个女朋友,观察三四个,以后就可以做出决策了 👍🏽2 💭陕西 🕐2025-12-04 14:23:59
上邪: 没坚持下来[大哭] 👍🏽4 💭陕西 🕐2025-12-03 06:23:22
老实中介: 这个只拿到第一名概率最高的策略,还是一个排名尽量高的策略 👍🏽3 💭浙江 🕐2025-12-03 10:18:33
│ └── 当夏: 是以第一的策略,如果想要排名尽量高 就应该自己有个基准线,合适就直接接受 在打算入取后,不进行对比 👍🏽3 💭山东 🕐2025-12-03 13:37:29
│ └── 当夏: 是以第一的策略,如果想要排名尽量高 就应该自己有个基准线,合适就直接接受 在打算入取后,不进行对比 👍🏽3 💭山东 🕐2025-12-03 13:37:29
玛卡巴卡: 啥意思啊 我又看不到进度条 我怎么知道什么时候是37%? 👍🏽3 💭美国 🕐2025-12-04 08:33:05
│ └── 噢嗣嗣: 比如你准备25岁结婚,去掉前15岁不太懂事。那就到你19岁的时候看看,遇到的最好姑娘就去死命追吧。[感谢] 👍🏽5 💭上海 🕐2025-12-04 13:21:25
│ └── corax: 那就要自己估计和设限了。比方说,决定18岁上了大学开始谈,一段用于观察和体验的感情耗时给个半年,目标是26岁基本定下人生大事。做好无缝衔接的准备,总共可以估算人数为16人。那么,前期观察人数就可定为6人左右。当然这是理想模型。带入实际肯定是要做调整的。这种思路的学习才是重要的。学会人生的规划[感谢] 👍🏽0 💭四川 🕐2025-12-04 17:35:56
│ │ └── 玛卡巴卡: 也就是说我总共打算试16个人 实际上第七个就该停手?那不相当于我只打算试七个了吗 那七个的37% 就是第三个? 👍🏽0 💭美国 🕐2025-12-05 02:09:43
│ │ │ └── corax: 不。按照文中的最优理论模型,策略是前六个都谈,谈完就分。之后遇到的每一个只要比最初遇到的六个都更好,就确定未来的人生和他/她度过,同时停止继续恋爱序列。这样找到在这16人中最好的伴侣的可能性最高。策略就是将这六个人作为观察组,积累恋爱经验。不管多好都分。而对后面的十个人进行挑选。文中的理想策略有几个前提条件。比如队列是单向的,只会和一个人谈一次,谈过要么分要么一直走下去。实际上有可能和前任复合。 👍🏽2 💭四川 🕐2025-12-05 11:50:29
│ │ │ └── corax: 不。按照文中的最优理论模型,策略是前六个都谈,谈完就分。之后遇到的每一个只要比最初遇到的六个都更好,就确定未来的人生和他/她度过,同时停止继续恋爱序列。这样找到在这16人中最好的伴侣的可能性最高。策略就是将这六个人作为观察组,积累恋爱经验。不管多好都分。而对后面的十个人进行挑选。文中的理想策略有几个前提条件。比如队列是单向的,只会和一个人谈一次,谈过要么分要么一直走下去。实际上有可能和前任复合。 👍🏽2 💭四川 🕐2025-12-05 11:50:29
│ │ └── 玛卡巴卡: 也就是说我总共打算试16个人 实际上第七个就该停手?那不相当于我只打算试七个了吗 那七个的37% 就是第三个? 👍🏽0 💭美国 🕐2025-12-05 02:09:43
│ │ └── corax: 不。按照文中的最优理论模型,策略是前六个都谈,谈完就分。之后遇到的每一个只要比最初遇到的六个都更好,就确定未来的人生和他/她度过,同时停止继续恋爱序列。这样找到在这16人中最好的伴侣的可能性最高。策略就是将这六个人作为观察组,积累恋爱经验。不管多好都分。而对后面的十个人进行挑选。文中的理想策略有几个前提条件。比如队列是单向的,只会和一个人谈一次,谈过要么分要么一直走下去。实际上有可能和前任复合。 👍🏽2 💭四川 🕐2025-12-05 11:50:29
│ │ └── corax: 不。按照文中的最优理论模型,策略是前六个都谈,谈完就分。之后遇到的每一个只要比最初遇到的六个都更好,就确定未来的人生和他/她度过,同时停止继续恋爱序列。这样找到在这16人中最好的伴侣的可能性最高。策略就是将这六个人作为观察组,积累恋爱经验。不管多好都分。而对后面的十个人进行挑选。文中的理想策略有几个前提条件。比如队列是单向的,只会和一个人谈一次,谈过要么分要么一直走下去。实际上有可能和前任复合。 👍🏽2 💭四川 🕐2025-12-05 11:50:29
│ └── 噢嗣嗣: 比如你准备25岁结婚,去掉前15岁不太懂事。那就到你19岁的时候看看,遇到的最好姑娘就去死命追吧。[感谢] 👍🏽5 💭上海 🕐2025-12-04 13:21:25
│ └── corax: 那就要自己估计和设限了。比方说,决定18岁上了大学开始谈,一段用于观察和体验的感情耗时给个半年,目标是26岁基本定下人生大事。做好无缝衔接的准备,总共可以估算人数为16人。那么,前期观察人数就可定为6人左右。当然这是理想模型。带入实际肯定是要做调整的。这种思路的学习才是重要的。学会人生的规划[感谢] 👍🏽0 💭四川 🕐2025-12-04 17:35:56
│ └── 玛卡巴卡: 也就是说我总共打算试16个人 实际上第七个就该停手?那不相当于我只打算试七个了吗 那七个的37% 就是第三个? 👍🏽0 💭美国 🕐2025-12-05 02:09:43
│ │ └── corax: 不。按照文中的最优理论模型,策略是前六个都谈,谈完就分。之后遇到的每一个只要比最初遇到的六个都更好,就确定未来的人生和他/她度过,同时停止继续恋爱序列。这样找到在这16人中最好的伴侣的可能性最高。策略就是将这六个人作为观察组,积累恋爱经验。不管多好都分。而对后面的十个人进行挑选。文中的理想策略有几个前提条件。比如队列是单向的,只会和一个人谈一次,谈过要么分要么一直走下去。实际上有可能和前任复合。 👍🏽2 💭四川 🕐2025-12-05 11:50:29
│ │ └── corax: 不。按照文中的最优理论模型,策略是前六个都谈,谈完就分。之后遇到的每一个只要比最初遇到的六个都更好,就确定未来的人生和他/她度过,同时停止继续恋爱序列。这样找到在这16人中最好的伴侣的可能性最高。策略就是将这六个人作为观察组,积累恋爱经验。不管多好都分。而对后面的十个人进行挑选。文中的理想策略有几个前提条件。比如队列是单向的,只会和一个人谈一次,谈过要么分要么一直走下去。实际上有可能和前任复合。 👍🏽2 💭四川 🕐2025-12-05 11:50:29
│ └── 玛卡巴卡: 也就是说我总共打算试16个人 实际上第七个就该停手?那不相当于我只打算试七个了吗 那七个的37% 就是第三个? 👍🏽0 💭美国 🕐2025-12-05 02:09:43
│ └── corax: 不。按照文中的最优理论模型,策略是前六个都谈,谈完就分。之后遇到的每一个只要比最初遇到的六个都更好,就确定未来的人生和他/她度过,同时停止继续恋爱序列。这样找到在这16人中最好的伴侣的可能性最高。策略就是将这六个人作为观察组,积累恋爱经验。不管多好都分。而对后面的十个人进行挑选。文中的理想策略有几个前提条件。比如队列是单向的,只会和一个人谈一次,谈过要么分要么一直走下去。实际上有可能和前任复合。 👍🏽2 💭四川 🕐2025-12-05 11:50:29
│ └── corax: 不。按照文中的最优理论模型,策略是前六个都谈,谈完就分。之后遇到的每一个只要比最初遇到的六个都更好,就确定未来的人生和他/她度过,同时停止继续恋爱序列。这样找到在这16人中最好的伴侣的可能性最高。策略就是将这六个人作为观察组,积累恋爱经验。不管多好都分。而对后面的十个人进行挑选。文中的理想策略有几个前提条件。比如队列是单向的,只会和一个人谈一次,谈过要么分要么一直走下去。实际上有可能和前任复合。 👍🏽2 💭四川 🕐2025-12-05 11:50:29
keySMILE: 年龄会影响你遇到的人的平均优秀度,这是一个极其重要的变量,我不知道这个公式是否考虑进去了。 👍🏽3 💭北京 🕐2025-12-03 18:22:55
犹大大大大: 这个就叫专业 👍🏽2 💭北京 🕐2025-12-03 09:20:38
Lidocaine: 遗风[大笑] 👍🏽2 💭上海 🕐2025-12-03 12:03:42
Snylo: v序列直接求通项到临界点也能算出n/e 👍🏽1 💭湖北 🕐2025-12-03 16:53:01
│ └── Jay哥讲数学: 对,但是这个方法过于代数,所以我采用了更“概率”的做法 👍🏽1 💭北京 🕐2025-12-03 16:58:08
│ └── Jay哥讲数学: 对,但是这个方法过于代数,所以我采用了更“概率”的做法 👍🏽1 💭北京 🕐2025-12-03 16:58:08
叶知秋: 看不懂推导过程。。。 [发呆][发呆][发呆] 👍🏽1 💭上海 🕐2025-12-03 17:31:30
拜火者: 啥?太长不看,房子和女人都是负资产。[惊喜] 👍🏽2 💭广东 🕐2025-12-03 17:06:07
│ └── 读书人: 神人[惊喜] 👍🏽1 💭广东 🕐2025-12-03 19:02:38
│ └── 读书人: 神人[惊喜] 👍🏽1 💭广东 🕐2025-12-03 19:02:38
网友岛顺蛙: 一看就觉得是某个数列会收敛到1/e 👍🏽0 💭安徽 🕐2025-12-05 21:52:50
菠菜精灵耳: 看着看着突然晕过去了[脑爆] 👍🏽0 💭浙江 🕐2025-12-04 11:29:53
方杰: 那么如果不巧最优选择出现在前37%,那就只能等到最后一个选择了,有没有办法在过程中纠正错误获得比较好的选择呢 👍🏽0 💭北京 🕐2025-12-05 10:31:06
│ └── Jay哥讲数学: 有一个推广就是引入“回心转意”的可能,也就是回头去找已经面试过的人会有一定概率接受,但是这样的话观察期也会拉长,最终肯定是要在看过足够多选项和错过最好选项之间取得平衡。 👍🏽0 💭北京 🕐2025-12-05 10:50:00
│ │ └── 某科学的Kevin chan: 原问题说的是最大化选到最优人选的概率,但现实中可能更多时候人们希望的是选到一个足够优秀的人选(不一定要是最优的),换句话说是“选择的排名期望尽可能靠前”。在最优选择出现在前37%的情况下这个策略会导致只能选择最后一个人选,其排名可能十分靠后,直觉上这很可能不是一个能满足新的目标的策略。直觉上一种应对新目标的策略可能是放宽条件,例如“超过前37%中能力排行前1%的即可录用”,那么对于新问题的最优策略是否是这一种呢? 👍🏽0 💭广东 🕐2025-12-05 13:09:38
│ │ │ └── Jay哥讲数学: 这时候策略会变,比如我们的目标是选到n名候选人中的前m名,那么最优策略是“先苛刻,后宽松”,刚开始t1时刻前是观察期,谁都不选,然后t1到t2只有遇到是比之前所有人都优秀才录取,t2到t3是遇到已经面试过的人中前两名才录取,依次类推到tm。更一般的,考虑单调递减的效用函数U,U(i)表示录取第i 名带来的效用,目标是期望效用最大化,此时的策略也是“先苛刻,后宽松”。我下周会讨论这种推广的秘书问题,周一在B站和知乎同步更新。 👍🏽0 💭北京 🕐2025-12-05 13:33:05
│ │ │ └── Jay哥讲数学: 这时候策略会变,比如我们的目标是选到n名候选人中的前m名,那么最优策略是“先苛刻,后宽松”,刚开始t1时刻前是观察期,谁都不选,然后t1到t2只有遇到是比之前所有人都优秀才录取,t2到t3是遇到已经面试过的人中前两名才录取,依次类推到tm。更一般的,考虑单调递减的效用函数U,U(i)表示录取第i 名带来的效用,目标是期望效用最大化,此时的策略也是“先苛刻,后宽松”。我下周会讨论这种推广的秘书问题,周一在B站和知乎同步更新。 👍🏽0 💭北京 🕐2025-12-05 13:33:05
│ │ └── 某科学的Kevin chan: 原问题说的是最大化选到最优人选的概率,但现实中可能更多时候人们希望的是选到一个足够优秀的人选(不一定要是最优的),换句话说是“选择的排名期望尽可能靠前”。在最优选择出现在前37%的情况下这个策略会导致只能选择最后一个人选,其排名可能十分靠后,直觉上这很可能不是一个能满足新的目标的策略。直觉上一种应对新目标的策略可能是放宽条件,例如“超过前37%中能力排行前1%的即可录用”,那么对于新问题的最优策略是否是这一种呢? 👍🏽0 💭广东 🕐2025-12-05 13:09:38
│ │ └── Jay哥讲数学: 这时候策略会变,比如我们的目标是选到n名候选人中的前m名,那么最优策略是“先苛刻,后宽松”,刚开始t1时刻前是观察期,谁都不选,然后t1到t2只有遇到是比之前所有人都优秀才录取,t2到t3是遇到已经面试过的人中前两名才录取,依次类推到tm。更一般的,考虑单调递减的效用函数U,U(i)表示录取第i 名带来的效用,目标是期望效用最大化,此时的策略也是“先苛刻,后宽松”。我下周会讨论这种推广的秘书问题,周一在B站和知乎同步更新。 👍🏽0 💭北京 🕐2025-12-05 13:33:05
│ │ └── Jay哥讲数学: 这时候策略会变,比如我们的目标是选到n名候选人中的前m名,那么最优策略是“先苛刻,后宽松”,刚开始t1时刻前是观察期,谁都不选,然后t1到t2只有遇到是比之前所有人都优秀才录取,t2到t3是遇到已经面试过的人中前两名才录取,依次类推到tm。更一般的,考虑单调递减的效用函数U,U(i)表示录取第i 名带来的效用,目标是期望效用最大化,此时的策略也是“先苛刻,后宽松”。我下周会讨论这种推广的秘书问题,周一在B站和知乎同步更新。 👍🏽0 💭北京 🕐2025-12-05 13:33:05
│ └── Jay哥讲数学: 有一个推广就是引入“回心转意”的可能,也就是回头去找已经面试过的人会有一定概率接受,但是这样的话观察期也会拉长,最终肯定是要在看过足够多选项和错过最好选项之间取得平衡。 👍🏽0 💭北京 🕐2025-12-05 10:50:00
│ └── 某科学的Kevin chan: 原问题说的是最大化选到最优人选的概率,但现实中可能更多时候人们希望的是选到一个足够优秀的人选(不一定要是最优的),换句话说是“选择的排名期望尽可能靠前”。在最优选择出现在前37%的情况下这个策略会导致只能选择最后一个人选,其排名可能十分靠后,直觉上这很可能不是一个能满足新的目标的策略。直觉上一种应对新目标的策略可能是放宽条件,例如“超过前37%中能力排行前1%的即可录用”,那么对于新问题的最优策略是否是这一种呢? 👍🏽0 💭广东 🕐2025-12-05 13:09:38
│ │ └── Jay哥讲数学: 这时候策略会变,比如我们的目标是选到n名候选人中的前m名,那么最优策略是“先苛刻,后宽松”,刚开始t1时刻前是观察期,谁都不选,然后t1到t2只有遇到是比之前所有人都优秀才录取,t2到t3是遇到已经面试过的人中前两名才录取,依次类推到tm。更一般的,考虑单调递减的效用函数U,U(i)表示录取第i 名带来的效用,目标是期望效用最大化,此时的策略也是“先苛刻,后宽松”。我下周会讨论这种推广的秘书问题,周一在B站和知乎同步更新。 👍🏽0 💭北京 🕐2025-12-05 13:33:05
│ │ └── Jay哥讲数学: 这时候策略会变,比如我们的目标是选到n名候选人中的前m名,那么最优策略是“先苛刻,后宽松”,刚开始t1时刻前是观察期,谁都不选,然后t1到t2只有遇到是比之前所有人都优秀才录取,t2到t3是遇到已经面试过的人中前两名才录取,依次类推到tm。更一般的,考虑单调递减的效用函数U,U(i)表示录取第i 名带来的效用,目标是期望效用最大化,此时的策略也是“先苛刻,后宽松”。我下周会讨论这种推广的秘书问题,周一在B站和知乎同步更新。 👍🏽0 💭北京 🕐2025-12-05 13:33:05
│ └── 某科学的Kevin chan: 原问题说的是最大化选到最优人选的概率,但现实中可能更多时候人们希望的是选到一个足够优秀的人选(不一定要是最优的),换句话说是“选择的排名期望尽可能靠前”。在最优选择出现在前37%的情况下这个策略会导致只能选择最后一个人选,其排名可能十分靠后,直觉上这很可能不是一个能满足新的目标的策略。直觉上一种应对新目标的策略可能是放宽条件,例如“超过前37%中能力排行前1%的即可录用”,那么对于新问题的最优策略是否是这一种呢? 👍🏽0 💭广东 🕐2025-12-05 13:09:38
│ └── Jay哥讲数学: 这时候策略会变,比如我们的目标是选到n名候选人中的前m名,那么最优策略是“先苛刻,后宽松”,刚开始t1时刻前是观察期,谁都不选,然后t1到t2只有遇到是比之前所有人都优秀才录取,t2到t3是遇到已经面试过的人中前两名才录取,依次类推到tm。更一般的,考虑单调递减的效用函数U,U(i)表示录取第i 名带来的效用,目标是期望效用最大化,此时的策略也是“先苛刻,后宽松”。我下周会讨论这种推广的秘书问题,周一在B站和知乎同步更新。 👍🏽0 💭北京 🕐2025-12-05 13:33:05
│ └── Jay哥讲数学: 这时候策略会变,比如我们的目标是选到n名候选人中的前m名,那么最优策略是“先苛刻,后宽松”,刚开始t1时刻前是观察期,谁都不选,然后t1到t2只有遇到是比之前所有人都优秀才录取,t2到t3是遇到已经面试过的人中前两名才录取,依次类推到tm。更一般的,考虑单调递减的效用函数U,U(i)表示录取第i 名带来的效用,目标是期望效用最大化,此时的策略也是“先苛刻,后宽松”。我下周会讨论这种推广的秘书问题,周一在B站和知乎同步更新。 👍🏽0 💭北京 🕐2025-12-05 13:33:05
百分之五十: 但是这里貌似存在一个问题,数学上那确实是这样,实践中我们却经常会发现在恋爱这一维度上我们的取值可能会发生根本性的改变,对应回数学理论就是这个数列的顺序在18到30岁之间有一定可能会产生多次改变,所以我的策略是先打枪再画靶,顺应本心谈上恋爱再反向构造未来的成立条件。我坚持每个人都是无穷多维的,只要角度取得好任意一个人都能是世界第一。 👍🏽0 💭北京 🕐2025-12-05 02:10:35
刘学智: OK,已点100个公主 👍🏽0 💭广东 🕐2025-12-04 09:51:47
曹操杀人救猪: 谈100个,第37个结婚 👍🏽0 💭四川 🕐2025-12-04 15:17:33
来日方长: 知乎遗风 👍🏽0 💭天津 🕐2025-12-04 16:21:27
世谦: 上班摸鱼为啥要给自己找罪受看数学题[发呆] 👍🏽0 💭天津 🕐2025-12-04 10:34:27
竹半棘: 高考模拟题 👍🏽0 💭陕西 🕐2025-12-04 09:21:09
陈678678: 我活一百岁,然后37结婚是不是也是37% 👍🏽0 💭四川 🕐2025-12-05 21:34:55
剑圣: 苏格拉底选麦子 👍🏽0 💭江苏 🕐2025-12-04 14:34:44
brymm: 自我安慰罢了 👍🏽0 💭广东 🕐2025-12-04 09:09:23
渭城朝雨浥轻尘: 但是这个秘书问题更多的是站在决策者的角度来看待问题,有没有可能把决策者和被决策者都统一起来看呢?假如在原本的题设中,再加入一条:如果被面试的人员收到拒绝后,就会去往下一家公司进行面试,那么最后每个用人单位和被面试者都选到合适的人选和岗位,这个最优概率也是37%吗? 👍🏽0 💭浙江 🕐2025-12-03 22:10:59
│ └── Jay哥讲数学: 站在应聘者的角度和站在公司的角度有本质不同,因为公司的信息是公开的,哪家公司条件好哪家公司条件差一目了然。所以应聘者的最优策略就是从最好的公司开始投简历,被拒绝了就投次优的,以此类推。而公司面试某种意义上就是开盲盒,来的人在所有人中是什么水平没法事先知道,就可以用37%法则。这个问题的一个变体就是引入信息,我们这里讨论的就是无信息情况,在全信息情况下就可以省去观察阶段,而且选到最优者的概率能提高到58%。未来有机会我也会讨论这个问题的各种变体,包括引入拒绝概率等等。 👍🏽2 💭北京 🕐2025-12-03 22:58:04
│ └── Jay哥讲数学: 站在应聘者的角度和站在公司的角度有本质不同,因为公司的信息是公开的,哪家公司条件好哪家公司条件差一目了然。所以应聘者的最优策略就是从最好的公司开始投简历,被拒绝了就投次优的,以此类推。而公司面试某种意义上就是开盲盒,来的人在所有人中是什么水平没法事先知道,就可以用37%法则。这个问题的一个变体就是引入信息,我们这里讨论的就是无信息情况,在全信息情况下就可以省去观察阶段,而且选到最优者的概率能提高到58%。未来有机会我也会讨论这个问题的各种变体,包括引入拒绝概率等等。 👍🏽2 💭北京 🕐2025-12-03 22:58:04
车江卧龙杨文韬: 牛逼,这就是我上知乎的一个重要目的,涨知识了[赞] 👍🏽0 💭湖北 🕐2025-12-04 10:37:59
优势在我: 看到一串英文的时候就睡着了[打招呼] 👍🏽0 💭浙江 🕐2025-12-03 19:18:28
狗头军师: e真是一个神奇的数字啊[捂脸] 👍🏽0 💭重庆 🕐2025-12-03 17:04:41
海边的沙漏: 对年轻男性 大部分情况下把决定交给二弟[酷] 👍🏽0 💭江苏 🕐2025-12-03 17:26:04
知乎用户: 理想情况下算几个数还是很简单的,但真实情况是无穷维的多变量实时决策,决策了也不一定立即执行。 👍🏽0 💭中国香港 🕐2025-12-03 13:37:14
捎个妹纸骑猪兜风: 你等式多你对[赞同] 👍🏽0 💭江苏 🕐2025-12-03 12:34:46
知乎用户: 哈人啊Jay哥 👍🏽0 💭江苏 🕐2025-12-03 03:27:54
吴钩霜雪明: 我现在终于也可以做到“注意到37%约等于1/e了”,下拉一看果然[机智] 👍🏽162 💭河北 🕐2025-12-03 09:43:01
│ └── frank macial: 注意力锻炼成功 👍🏽25 💭上海 🕐2025-12-03 12:12:45
│ └── 拉乌: 注意力惊人 👍🏽16 💭上海 🕐2025-12-03 13:37:49
│ └── 轻舞肥羊: 易知 👍🏽1 💭辽宁 🕐2025-12-03 14:45:57
│ └── frank macial: 注意力锻炼成功 👍🏽25 💭上海 🕐2025-12-03 12:12:45
│ └── 拉乌: 注意力惊人 👍🏽16 💭上海 🕐2025-12-03 13:37:49
│ └── 轻舞肥羊: 易知 👍🏽1 💭辽宁 🕐2025-12-03 14:45:57
星辰大海: 让我感到神奇的地方是,从引入数学概念和公式推导开始,一步一步,到最后神奇般地出现了ln和自然底数e,自然底数和圆周率真的是我们宇宙中广泛存在的啊 👍🏽81 💭韩国 🕐2025-12-03 09:50:56
│ └── 陶然: 好神奇[思考] 👍🏽2 💭中国香港 🕐2025-12-03 13:28:08
│ └── 玄天: e和pi本质上是一种周期性和变化率的体现。(e^x求导仍为本身) 👍🏽32 💭陕西 🕐2025-12-03 23:00:25
│ └── 陶然: 好神奇[思考] 👍🏽2 💭中国香港 🕐2025-12-03 13:28:08
│ └── 玄天: e和pi本质上是一种周期性和变化率的体现。(e^x求导仍为本身) 👍🏽32 💭陕西 🕐2025-12-03 23:00:25
越子隐: 实质上人的注意力也是充满噪声的,所以人也只会倾向于记住更为简单的东西[思考]那么看完整篇文章也只会记得37% 👍🏽34 💭江西 🕐2025-12-03 15:55:18
│ └── 小尹的生活: 大脑自行做了滤波处理 👍🏽1 💭浙江 🕐2025-12-04 16:24:45
│ └── 小尹的生活: 大脑自行做了滤波处理 👍🏽1 💭浙江 🕐2025-12-04 16:24:45
momo: 看到这个问题我以为我在上果壳 👍🏽29 💭北京 🕐2025-12-02 15:14:05
疯狂的大青蛙: 虽然我很喜欢数学建模,但是不得不说很多东西目前还是没法简单地用数学计算的,尤其是这种感情问题。A女生性格温柔,B女生大方不矫情,C女生面容身材好,你说谁的数值高呢。所以我认为,这里的37%也好,50%也好,可以当参考,但不要太拘泥。 👍🏽22 💭北京 🕐2025-12-03 10:12:38
│ └── ppoj: 每个人都有一套自己的评分系统。有的人是颜控,颜值的权重就会高;有的人想白手起家,需要伴侣镇守后方,温柔顾家的权重高;有的人想吃软饭,有钱多金的权重高;有的人想安稳过日子,门当户对权重高。 👍🏽20 💭广东 🕐2025-12-03 19:35:57
│ │ └── 宇落: 我老婆过于优秀,以至于我能拿下她完全靠她是个颜控[发呆] 👍🏽2 💭上海 🕐2025-12-04 11:22:09
│ │ └── 宇落: 我老婆过于优秀,以至于我能拿下她完全靠她是个颜控[发呆] 👍🏽2 💭上海 🕐2025-12-04 11:22:09
│ └── 谢少: 选胸大的。 👍🏽2 💭广东 🕐2025-12-04 14:46:30
│ └── ppoj: 每个人都有一套自己的评分系统。有的人是颜控,颜值的权重就会高;有的人想白手起家,需要伴侣镇守后方,温柔顾家的权重高;有的人想吃软饭,有钱多金的权重高;有的人想安稳过日子,门当户对权重高。 👍🏽20 💭广东 🕐2025-12-03 19:35:57
│ │ └── 宇落: 我老婆过于优秀,以至于我能拿下她完全靠她是个颜控[发呆] 👍🏽2 💭上海 🕐2025-12-04 11:22:09
│ │ └── 宇落: 我老婆过于优秀,以至于我能拿下她完全靠她是个颜控[发呆] 👍🏽2 💭上海 🕐2025-12-04 11:22:09
│ └── 谢少: 选胸大的。 👍🏽2 💭广东 🕐2025-12-04 14:46:30
小白: 可是大部分的情况下都不知道现在的进度是多少 👍🏽12 💭上海 🕐2025-12-03 10:42:51
│ └── 不高兴也没头脑: 看上去,要先设定一个目标值,比如我最多找10个对象这种 👍🏽15 💭广东 🕐2025-12-03 11:07:55
│ └── 魏连殳: 开头说了啊,你要设置一个期限。比如找10个女朋友,观察三四个,以后就可以做出决策了 👍🏽2 💭陕西 🕐2025-12-04 14:23:59
│ └── 不高兴也没头脑: 看上去,要先设定一个目标值,比如我最多找10个对象这种 👍🏽15 💭广东 🕐2025-12-03 11:07:55
│ └── 魏连殳: 开头说了啊,你要设置一个期限。比如找10个女朋友,观察三四个,以后就可以做出决策了 👍🏽2 💭陕西 🕐2025-12-04 14:23:59
上邪: 没坚持下来[大哭] 👍🏽4 💭陕西 🕐2025-12-03 06:23:22
老实中介: 这个只拿到第一名概率最高的策略,还是一个排名尽量高的策略 👍🏽3 💭浙江 🕐2025-12-03 10:18:33
│ └── 当夏: 是以第一的策略,如果想要排名尽量高 就应该自己有个基准线,合适就直接接受 在打算入取后,不进行对比 👍🏽3 💭山东 🕐2025-12-03 13:37:29
│ └── 当夏: 是以第一的策略,如果想要排名尽量高 就应该自己有个基准线,合适就直接接受 在打算入取后,不进行对比 👍🏽3 💭山东 🕐2025-12-03 13:37:29
玛卡巴卡: 啥意思啊 我又看不到进度条 我怎么知道什么时候是37%? 👍🏽3 💭美国 🕐2025-12-04 08:33:05
│ └── 噢嗣嗣: 比如你准备25岁结婚,去掉前15岁不太懂事。那就到你19岁的时候看看,遇到的最好姑娘就去死命追吧。[感谢] 👍🏽5 💭上海 🕐2025-12-04 13:21:25
│ └── corax: 那就要自己估计和设限了。比方说,决定18岁上了大学开始谈,一段用于观察和体验的感情耗时给个半年,目标是26岁基本定下人生大事。做好无缝衔接的准备,总共可以估算人数为16人。那么,前期观察人数就可定为6人左右。当然这是理想模型。带入实际肯定是要做调整的。这种思路的学习才是重要的。学会人生的规划[感谢] 👍🏽0 💭四川 🕐2025-12-04 17:35:56
│ │ └── 玛卡巴卡: 也就是说我总共打算试16个人 实际上第七个就该停手?那不相当于我只打算试七个了吗 那七个的37% 就是第三个? 👍🏽0 💭美国 🕐2025-12-05 02:09:43
│ │ │ └── corax: 不。按照文中的最优理论模型,策略是前六个都谈,谈完就分。之后遇到的每一个只要比最初遇到的六个都更好,就确定未来的人生和他/她度过,同时停止继续恋爱序列。这样找到在这16人中最好的伴侣的可能性最高。策略就是将这六个人作为观察组,积累恋爱经验。不管多好都分。而对后面的十个人进行挑选。文中的理想策略有几个前提条件。比如队列是单向的,只会和一个人谈一次,谈过要么分要么一直走下去。实际上有可能和前任复合。 👍🏽2 💭四川 🕐2025-12-05 11:50:29
│ │ │ └── corax: 不。按照文中的最优理论模型,策略是前六个都谈,谈完就分。之后遇到的每一个只要比最初遇到的六个都更好,就确定未来的人生和他/她度过,同时停止继续恋爱序列。这样找到在这16人中最好的伴侣的可能性最高。策略就是将这六个人作为观察组,积累恋爱经验。不管多好都分。而对后面的十个人进行挑选。文中的理想策略有几个前提条件。比如队列是单向的,只会和一个人谈一次,谈过要么分要么一直走下去。实际上有可能和前任复合。 👍🏽2 💭四川 🕐2025-12-05 11:50:29
│ │ └── 玛卡巴卡: 也就是说我总共打算试16个人 实际上第七个就该停手?那不相当于我只打算试七个了吗 那七个的37% 就是第三个? 👍🏽0 💭美国 🕐2025-12-05 02:09:43
│ │ └── corax: 不。按照文中的最优理论模型,策略是前六个都谈,谈完就分。之后遇到的每一个只要比最初遇到的六个都更好,就确定未来的人生和他/她度过,同时停止继续恋爱序列。这样找到在这16人中最好的伴侣的可能性最高。策略就是将这六个人作为观察组,积累恋爱经验。不管多好都分。而对后面的十个人进行挑选。文中的理想策略有几个前提条件。比如队列是单向的,只会和一个人谈一次,谈过要么分要么一直走下去。实际上有可能和前任复合。 👍🏽2 💭四川 🕐2025-12-05 11:50:29
│ │ └── corax: 不。按照文中的最优理论模型,策略是前六个都谈,谈完就分。之后遇到的每一个只要比最初遇到的六个都更好,就确定未来的人生和他/她度过,同时停止继续恋爱序列。这样找到在这16人中最好的伴侣的可能性最高。策略就是将这六个人作为观察组,积累恋爱经验。不管多好都分。而对后面的十个人进行挑选。文中的理想策略有几个前提条件。比如队列是单向的,只会和一个人谈一次,谈过要么分要么一直走下去。实际上有可能和前任复合。 👍🏽2 💭四川 🕐2025-12-05 11:50:29
│ └── 噢嗣嗣: 比如你准备25岁结婚,去掉前15岁不太懂事。那就到你19岁的时候看看,遇到的最好姑娘就去死命追吧。[感谢] 👍🏽5 💭上海 🕐2025-12-04 13:21:25
│ └── corax: 那就要自己估计和设限了。比方说,决定18岁上了大学开始谈,一段用于观察和体验的感情耗时给个半年,目标是26岁基本定下人生大事。做好无缝衔接的准备,总共可以估算人数为16人。那么,前期观察人数就可定为6人左右。当然这是理想模型。带入实际肯定是要做调整的。这种思路的学习才是重要的。学会人生的规划[感谢] 👍🏽0 💭四川 🕐2025-12-04 17:35:56
│ └── 玛卡巴卡: 也就是说我总共打算试16个人 实际上第七个就该停手?那不相当于我只打算试七个了吗 那七个的37% 就是第三个? 👍🏽0 💭美国 🕐2025-12-05 02:09:43
│ │ └── corax: 不。按照文中的最优理论模型,策略是前六个都谈,谈完就分。之后遇到的每一个只要比最初遇到的六个都更好,就确定未来的人生和他/她度过,同时停止继续恋爱序列。这样找到在这16人中最好的伴侣的可能性最高。策略就是将这六个人作为观察组,积累恋爱经验。不管多好都分。而对后面的十个人进行挑选。文中的理想策略有几个前提条件。比如队列是单向的,只会和一个人谈一次,谈过要么分要么一直走下去。实际上有可能和前任复合。 👍🏽2 💭四川 🕐2025-12-05 11:50:29
│ │ └── corax: 不。按照文中的最优理论模型,策略是前六个都谈,谈完就分。之后遇到的每一个只要比最初遇到的六个都更好,就确定未来的人生和他/她度过,同时停止继续恋爱序列。这样找到在这16人中最好的伴侣的可能性最高。策略就是将这六个人作为观察组,积累恋爱经验。不管多好都分。而对后面的十个人进行挑选。文中的理想策略有几个前提条件。比如队列是单向的,只会和一个人谈一次,谈过要么分要么一直走下去。实际上有可能和前任复合。 👍🏽2 💭四川 🕐2025-12-05 11:50:29
│ └── 玛卡巴卡: 也就是说我总共打算试16个人 实际上第七个就该停手?那不相当于我只打算试七个了吗 那七个的37% 就是第三个? 👍🏽0 💭美国 🕐2025-12-05 02:09:43
│ └── corax: 不。按照文中的最优理论模型,策略是前六个都谈,谈完就分。之后遇到的每一个只要比最初遇到的六个都更好,就确定未来的人生和他/她度过,同时停止继续恋爱序列。这样找到在这16人中最好的伴侣的可能性最高。策略就是将这六个人作为观察组,积累恋爱经验。不管多好都分。而对后面的十个人进行挑选。文中的理想策略有几个前提条件。比如队列是单向的,只会和一个人谈一次,谈过要么分要么一直走下去。实际上有可能和前任复合。 👍🏽2 💭四川 🕐2025-12-05 11:50:29
│ └── corax: 不。按照文中的最优理论模型,策略是前六个都谈,谈完就分。之后遇到的每一个只要比最初遇到的六个都更好,就确定未来的人生和他/她度过,同时停止继续恋爱序列。这样找到在这16人中最好的伴侣的可能性最高。策略就是将这六个人作为观察组,积累恋爱经验。不管多好都分。而对后面的十个人进行挑选。文中的理想策略有几个前提条件。比如队列是单向的,只会和一个人谈一次,谈过要么分要么一直走下去。实际上有可能和前任复合。 👍🏽2 💭四川 🕐2025-12-05 11:50:29
keySMILE: 年龄会影响你遇到的人的平均优秀度,这是一个极其重要的变量,我不知道这个公式是否考虑进去了。 👍🏽3 💭北京 🕐2025-12-03 18:22:55
犹大大大大: 这个就叫专业 👍🏽2 💭北京 🕐2025-12-03 09:20:38
Lidocaine: 遗风[大笑] 👍🏽2 💭上海 🕐2025-12-03 12:03:42
Snylo: v序列直接求通项到临界点也能算出n/e 👍🏽1 💭湖北 🕐2025-12-03 16:53:01
│ └── Jay哥讲数学: 对,但是这个方法过于代数,所以我采用了更“概率”的做法 👍🏽1 💭北京 🕐2025-12-03 16:58:08
│ └── Jay哥讲数学: 对,但是这个方法过于代数,所以我采用了更“概率”的做法 👍🏽1 💭北京 🕐2025-12-03 16:58:08
叶知秋: 看不懂推导过程。。。 [发呆][发呆][发呆] 👍🏽1 💭上海 🕐2025-12-03 17:31:30
拜火者: 啥?太长不看,房子和女人都是负资产。[惊喜] 👍🏽2 💭广东 🕐2025-12-03 17:06:07
│ └── 读书人: 神人[惊喜] 👍🏽1 💭广东 🕐2025-12-03 19:02:38
│ └── 读书人: 神人[惊喜] 👍🏽1 💭广东 🕐2025-12-03 19:02:38
网友岛顺蛙: 一看就觉得是某个数列会收敛到1/e 👍🏽0 💭安徽 🕐2025-12-05 21:52:50
菠菜精灵耳: 看着看着突然晕过去了[脑爆] 👍🏽0 💭浙江 🕐2025-12-04 11:29:53
方杰: 那么如果不巧最优选择出现在前37%,那就只能等到最后一个选择了,有没有办法在过程中纠正错误获得比较好的选择呢 👍🏽0 💭北京 🕐2025-12-05 10:31:06
│ └── Jay哥讲数学: 有一个推广就是引入“回心转意”的可能,也就是回头去找已经面试过的人会有一定概率接受,但是这样的话观察期也会拉长,最终肯定是要在看过足够多选项和错过最好选项之间取得平衡。 👍🏽0 💭北京 🕐2025-12-05 10:50:00
│ │ └── 某科学的Kevin chan: 原问题说的是最大化选到最优人选的概率,但现实中可能更多时候人们希望的是选到一个足够优秀的人选(不一定要是最优的),换句话说是“选择的排名期望尽可能靠前”。在最优选择出现在前37%的情况下这个策略会导致只能选择最后一个人选,其排名可能十分靠后,直觉上这很可能不是一个能满足新的目标的策略。直觉上一种应对新目标的策略可能是放宽条件,例如“超过前37%中能力排行前1%的即可录用”,那么对于新问题的最优策略是否是这一种呢? 👍🏽0 💭广东 🕐2025-12-05 13:09:38
│ │ │ └── Jay哥讲数学: 这时候策略会变,比如我们的目标是选到n名候选人中的前m名,那么最优策略是“先苛刻,后宽松”,刚开始t1时刻前是观察期,谁都不选,然后t1到t2只有遇到是比之前所有人都优秀才录取,t2到t3是遇到已经面试过的人中前两名才录取,依次类推到tm。更一般的,考虑单调递减的效用函数U,U(i)表示录取第i 名带来的效用,目标是期望效用最大化,此时的策略也是“先苛刻,后宽松”。我下周会讨论这种推广的秘书问题,周一在B站和知乎同步更新。 👍🏽0 💭北京 🕐2025-12-05 13:33:05
│ │ │ └── Jay哥讲数学: 这时候策略会变,比如我们的目标是选到n名候选人中的前m名,那么最优策略是“先苛刻,后宽松”,刚开始t1时刻前是观察期,谁都不选,然后t1到t2只有遇到是比之前所有人都优秀才录取,t2到t3是遇到已经面试过的人中前两名才录取,依次类推到tm。更一般的,考虑单调递减的效用函数U,U(i)表示录取第i 名带来的效用,目标是期望效用最大化,此时的策略也是“先苛刻,后宽松”。我下周会讨论这种推广的秘书问题,周一在B站和知乎同步更新。 👍🏽0 💭北京 🕐2025-12-05 13:33:05
│ │ └── 某科学的Kevin chan: 原问题说的是最大化选到最优人选的概率,但现实中可能更多时候人们希望的是选到一个足够优秀的人选(不一定要是最优的),换句话说是“选择的排名期望尽可能靠前”。在最优选择出现在前37%的情况下这个策略会导致只能选择最后一个人选,其排名可能十分靠后,直觉上这很可能不是一个能满足新的目标的策略。直觉上一种应对新目标的策略可能是放宽条件,例如“超过前37%中能力排行前1%的即可录用”,那么对于新问题的最优策略是否是这一种呢? 👍🏽0 💭广东 🕐2025-12-05 13:09:38
│ │ └── Jay哥讲数学: 这时候策略会变,比如我们的目标是选到n名候选人中的前m名,那么最优策略是“先苛刻,后宽松”,刚开始t1时刻前是观察期,谁都不选,然后t1到t2只有遇到是比之前所有人都优秀才录取,t2到t3是遇到已经面试过的人中前两名才录取,依次类推到tm。更一般的,考虑单调递减的效用函数U,U(i)表示录取第i 名带来的效用,目标是期望效用最大化,此时的策略也是“先苛刻,后宽松”。我下周会讨论这种推广的秘书问题,周一在B站和知乎同步更新。 👍🏽0 💭北京 🕐2025-12-05 13:33:05
│ │ └── Jay哥讲数学: 这时候策略会变,比如我们的目标是选到n名候选人中的前m名,那么最优策略是“先苛刻,后宽松”,刚开始t1时刻前是观察期,谁都不选,然后t1到t2只有遇到是比之前所有人都优秀才录取,t2到t3是遇到已经面试过的人中前两名才录取,依次类推到tm。更一般的,考虑单调递减的效用函数U,U(i)表示录取第i 名带来的效用,目标是期望效用最大化,此时的策略也是“先苛刻,后宽松”。我下周会讨论这种推广的秘书问题,周一在B站和知乎同步更新。 👍🏽0 💭北京 🕐2025-12-05 13:33:05
│ └── Jay哥讲数学: 有一个推广就是引入“回心转意”的可能,也就是回头去找已经面试过的人会有一定概率接受,但是这样的话观察期也会拉长,最终肯定是要在看过足够多选项和错过最好选项之间取得平衡。 👍🏽0 💭北京 🕐2025-12-05 10:50:00
│ └── 某科学的Kevin chan: 原问题说的是最大化选到最优人选的概率,但现实中可能更多时候人们希望的是选到一个足够优秀的人选(不一定要是最优的),换句话说是“选择的排名期望尽可能靠前”。在最优选择出现在前37%的情况下这个策略会导致只能选择最后一个人选,其排名可能十分靠后,直觉上这很可能不是一个能满足新的目标的策略。直觉上一种应对新目标的策略可能是放宽条件,例如“超过前37%中能力排行前1%的即可录用”,那么对于新问题的最优策略是否是这一种呢? 👍🏽0 💭广东 🕐2025-12-05 13:09:38
│ │ └── Jay哥讲数学: 这时候策略会变,比如我们的目标是选到n名候选人中的前m名,那么最优策略是“先苛刻,后宽松”,刚开始t1时刻前是观察期,谁都不选,然后t1到t2只有遇到是比之前所有人都优秀才录取,t2到t3是遇到已经面试过的人中前两名才录取,依次类推到tm。更一般的,考虑单调递减的效用函数U,U(i)表示录取第i 名带来的效用,目标是期望效用最大化,此时的策略也是“先苛刻,后宽松”。我下周会讨论这种推广的秘书问题,周一在B站和知乎同步更新。 👍🏽0 💭北京 🕐2025-12-05 13:33:05
│ │ └── Jay哥讲数学: 这时候策略会变,比如我们的目标是选到n名候选人中的前m名,那么最优策略是“先苛刻,后宽松”,刚开始t1时刻前是观察期,谁都不选,然后t1到t2只有遇到是比之前所有人都优秀才录取,t2到t3是遇到已经面试过的人中前两名才录取,依次类推到tm。更一般的,考虑单调递减的效用函数U,U(i)表示录取第i 名带来的效用,目标是期望效用最大化,此时的策略也是“先苛刻,后宽松”。我下周会讨论这种推广的秘书问题,周一在B站和知乎同步更新。 👍🏽0 💭北京 🕐2025-12-05 13:33:05
│ └── 某科学的Kevin chan: 原问题说的是最大化选到最优人选的概率,但现实中可能更多时候人们希望的是选到一个足够优秀的人选(不一定要是最优的),换句话说是“选择的排名期望尽可能靠前”。在最优选择出现在前37%的情况下这个策略会导致只能选择最后一个人选,其排名可能十分靠后,直觉上这很可能不是一个能满足新的目标的策略。直觉上一种应对新目标的策略可能是放宽条件,例如“超过前37%中能力排行前1%的即可录用”,那么对于新问题的最优策略是否是这一种呢? 👍🏽0 💭广东 🕐2025-12-05 13:09:38
│ └── Jay哥讲数学: 这时候策略会变,比如我们的目标是选到n名候选人中的前m名,那么最优策略是“先苛刻,后宽松”,刚开始t1时刻前是观察期,谁都不选,然后t1到t2只有遇到是比之前所有人都优秀才录取,t2到t3是遇到已经面试过的人中前两名才录取,依次类推到tm。更一般的,考虑单调递减的效用函数U,U(i)表示录取第i 名带来的效用,目标是期望效用最大化,此时的策略也是“先苛刻,后宽松”。我下周会讨论这种推广的秘书问题,周一在B站和知乎同步更新。 👍🏽0 💭北京 🕐2025-12-05 13:33:05
│ └── Jay哥讲数学: 这时候策略会变,比如我们的目标是选到n名候选人中的前m名,那么最优策略是“先苛刻,后宽松”,刚开始t1时刻前是观察期,谁都不选,然后t1到t2只有遇到是比之前所有人都优秀才录取,t2到t3是遇到已经面试过的人中前两名才录取,依次类推到tm。更一般的,考虑单调递减的效用函数U,U(i)表示录取第i 名带来的效用,目标是期望效用最大化,此时的策略也是“先苛刻,后宽松”。我下周会讨论这种推广的秘书问题,周一在B站和知乎同步更新。 👍🏽0 💭北京 🕐2025-12-05 13:33:05
百分之五十: 但是这里貌似存在一个问题,数学上那确实是这样,实践中我们却经常会发现在恋爱这一维度上我们的取值可能会发生根本性的改变,对应回数学理论就是这个数列的顺序在18到30岁之间有一定可能会产生多次改变,所以我的策略是先打枪再画靶,顺应本心谈上恋爱再反向构造未来的成立条件。我坚持每个人都是无穷多维的,只要角度取得好任意一个人都能是世界第一。 👍🏽0 💭北京 🕐2025-12-05 02:10:35
刘学智: OK,已点100个公主 👍🏽0 💭广东 🕐2025-12-04 09:51:47
曹操杀人救猪: 谈100个,第37个结婚 👍🏽0 💭四川 🕐2025-12-04 15:17:33
来日方长: 知乎遗风 👍🏽0 💭天津 🕐2025-12-04 16:21:27
世谦: 上班摸鱼为啥要给自己找罪受看数学题[发呆] 👍🏽0 💭天津 🕐2025-12-04 10:34:27
竹半棘: 高考模拟题 👍🏽0 💭陕西 🕐2025-12-04 09:21:09
陈678678: 我活一百岁,然后37结婚是不是也是37% 👍🏽0 💭四川 🕐2025-12-05 21:34:55
剑圣: 苏格拉底选麦子 👍🏽0 💭江苏 🕐2025-12-04 14:34:44
brymm: 自我安慰罢了 👍🏽0 💭广东 🕐2025-12-04 09:09:23
渭城朝雨浥轻尘: 但是这个秘书问题更多的是站在决策者的角度来看待问题,有没有可能把决策者和被决策者都统一起来看呢?假如在原本的题设中,再加入一条:如果被面试的人员收到拒绝后,就会去往下一家公司进行面试,那么最后每个用人单位和被面试者都选到合适的人选和岗位,这个最优概率也是37%吗? 👍🏽0 💭浙江 🕐2025-12-03 22:10:59
│ └── Jay哥讲数学: 站在应聘者的角度和站在公司的角度有本质不同,因为公司的信息是公开的,哪家公司条件好哪家公司条件差一目了然。所以应聘者的最优策略就是从最好的公司开始投简历,被拒绝了就投次优的,以此类推。而公司面试某种意义上就是开盲盒,来的人在所有人中是什么水平没法事先知道,就可以用37%法则。这个问题的一个变体就是引入信息,我们这里讨论的就是无信息情况,在全信息情况下就可以省去观察阶段,而且选到最优者的概率能提高到58%。未来有机会我也会讨论这个问题的各种变体,包括引入拒绝概率等等。 👍🏽2 💭北京 🕐2025-12-03 22:58:04
│ └── Jay哥讲数学: 站在应聘者的角度和站在公司的角度有本质不同,因为公司的信息是公开的,哪家公司条件好哪家公司条件差一目了然。所以应聘者的最优策略就是从最好的公司开始投简历,被拒绝了就投次优的,以此类推。而公司面试某种意义上就是开盲盒,来的人在所有人中是什么水平没法事先知道,就可以用37%法则。这个问题的一个变体就是引入信息,我们这里讨论的就是无信息情况,在全信息情况下就可以省去观察阶段,而且选到最优者的概率能提高到58%。未来有机会我也会讨论这个问题的各种变体,包括引入拒绝概率等等。 👍🏽2 💭北京 🕐2025-12-03 22:58:04