设事件A是ta喜欢我,然而是个人都知道,我和ta并没有特殊交集,所以ta现在喜欢上我的概率实在太低了,比如P(A) = 0.0000001。有什么办法提高这个概率?

贝叶斯定理

于是我设想了一个场景,假如ta遇到了什么麻烦,我帮助了ta。那么ta喜欢上我的概率肯定会大大提高,设事件B是我能帮助ta的概率。

(图片)

也就是说,本来发生事件A的概率是P(A),但现在突然发生了事件B,所以事件A的概率受到了影响,变成了P(A|B),我们就得重新找出P(A|B),这才是现在发生事件B后,发生事件A的概率。

P(A|B)可能不容易得出,例如我并不知道我和Ta一起经历一些事后,Ta喜欢上我的概率。我却知道Ta喜欢上某人是因为某件事的概率P(B|A),怎么用这个帮助我求出P(A|B)呢?

(图片)

于是我就想,比如事件B是我帮助了迷路了的ta,那么P(A|B)就是我帮助了迷路了的ta后,ta喜欢上我的概率,再乘上我能帮助迷路的ta的概率P(B),就得到“我帮助迷路的ta”和“ta喜欢上我”这两件事同时发生的概率P(A ∩ B)。即

P(A|B)P(B) = P(A ∩ B)

同样,Ta喜欢上我是因为我曾帮助了迷路了的Ta后的概率P(B|A),乘上Ta喜欢上我的概率P(A),也得到了 我帮助迷路的ta”和“ta喜欢上我”这两件事同时发生的概率P(A ∩ B)。 即:

P(A|B)P(B) = P(A ∩ B)

我看到上面两个式子右边是相同的,所以当然左边等于左边,即

P(A|B)P(B) = P(B|A)P(A)

或者变一下形:

也就是说:

  • 我没有与Ta共同经历过一些事的话,Ta喜欢上我的概率是P(A),称为先验概率,即一开始估计的概率。
  • 我现在想要得到出“共同经历了一些难忘的事情,现在Ta喜欢上我的概率”P(A|B),称为后验概率,即通过事件B的调整后的概率。我可能无法得出P(A|B)究竟是多少,但我可以估计P(A|B)最有可能是多少。
  • 怎么估计呢?根据之前的推导,我就得让P(A)乘上P(B|A)/P(B),但这个乘式究竟有什么意义呢?

最大似然估计

假设不认识Ta的末人保护了迷路的Ta,那么Ta喜欢上那个人的概率 θ (即之前所提到的P(A|B))是70%。那么分别独立地保护了10个有类似的想法的路人甲乙丙丁等,结果会是怎样的呢?

也就是说,我已经知道了某件事发生的概率,那么对于独立的实验来说,我们就需要从概率(probability)推导出结果。根据概率的知识,我们很容易得到,对于10个有类似的想法的人,其中会有7个喜欢上保护了Ta的人。

很好。但是如果Ta不愿意把自己会喜欢上保护了Ta的人的概率说出来,或者Ta自己也不知道呢?嗯,那么我们就先要做实验,从结果推导出概率,不过这个时候的概率一般被叫做 似然(likelihood)。嗯,那再把那10个群众演员拉过来。

根据对路人甲乙丙丁等10人做的实验,得到结果也是有7个喜欢上保护了Ta的人。很好, θ 是多少?开了上帝视角的你可能会说 θ 肯定是70%,这是不对的。因为我只做了一次实验,误差很大,所以没法求出 θ 的确切值。

我们虽然不能直接算出 θ ,但可以算出 θ 的概率函数P(θ)。 θ 的取值可能是20%,可能是90%,也可能是70%。但这些取值的概率可不一样,例如 θ 的取值20%的概率是0.2,取值90%的概率是0.4,取值是70%是0.7,取到70%的概率最大,我就姑且认为 θ 就是70%。

既然保护了Ta后,Ta对你的态度就是两种,喜欢上你的概率是 θ (P(A|B)),没有喜欢上你的概率就是(1- θ),于是根据实验结果,得到 θ 的函数f(x),即似然函数,f(x)的意思是要让结果x,x1,x2对应着不同的结果,可能是6个人,也可能是7个人。出现的概率最大

画出图像,容易看到, θ 取0.7时f(θ)最大,也就是 θ 最有可能是0.7。这就是最大似然估计。

最大后验概率估计

但上面的例子包含了一个前提,我只是根据经历这些事得到的结果去推测概率θ,而没有考虑到,在我送给一桶热水之前,Ta可能就对我有好感了,喜欢上我的概率是P(A)。那么在送了一桶热水后,Ta喜欢我的概率P(A|B)是多少呢?

MD,烂尾了,f(p(A|B))怎么就等于p(p(B|A))了?想不通啊

Leave a Reply