英语选词填空中的数学问题

By NriotHrreion2024-10-07#数学

引入

英语的题目里常常能见到这么一种叫做“选词填空”的题型,这种题目要求学生将给定的10个单词填入所给短文中的10个空,而且需要进行相应的词性变换。

小明是一个英语不太好的学生,每次遇到这种题,他都会将所给的10个词随便地填入10个空中。那么,这就出现了一个数学问题:

在不考虑词性变换的情况下,将10个备选词填入10个空。设答对题数为XX,求XX的分布列和数学期望。

解决问题

由于“选词填空”这种题型只提供了10个词和10个空,所以可以知道 XZ,X[0,10],X9X \in \Z, X \in [0,10], X \ne 9

那么答案就总共有 A1010=3628800A_{10}^{10}=3628800 种情况。

全部答对

我们可以先讨论最简单的情况:全部答对

由于标准答案只有一种可能,可得

P(X=10)=1A1010=136288000.0000003P(X=10)=\frac{1}{A_{10}^{10}}=\frac{1}{3628800} \approx 0.0000003

错位排列问题

为了研究 X10X \ne 10 的情况,我们需要先引入错位排列问题

假设我们有 nn 封信件,每个信件都有其对应的一个信封,如果我们在装信封的时候把每一个信件都装错,有几种可能?

这个问题的解法总共分两步:

  1. 将第 nn 封信装进其他信封,共有 n1n-1 种装法。假设我们将第 nn 封信装进了第 kk 个信封。(knk \ne n)

  2. 将第 kk 封信装进其他信封,此时有两种情况: 一、将第 kk 封信装进第 nn 个信封,那么此时可看作是对剩余的 n2n-2 封信进行错位排列; 二、将第 kk 封信装入除第 nn 个信封之外的其他信封,那么此时可看作第 kk 封信对应第 nn 个信封,对这 n1n-1 封信进行错位排列(因为前提已经说明,此时第 kk 封信不可能装入第 nn 个信封)。

设这 nn 封信件共有 DnD_n 种错位排列的放法,于是,我们可以得出下面的递推式

Dn=(n1)(Dn2+Dn1)D_n=(n-1)(D_{n-2}+D_{n-1})

通过简单列举法,我们可以得出 D2=1D_2=1D3=2D_3=2,那么,我们就可以通过递推式算出其他 DnD_n 的值了:

nnDnD_n
4499
554444
66265265
7718541854
881483314833
99133496133496

其他情况

接下来,我们就可以研究 X10X \ne 10 的其他情况了。不妨先从 X=0X=0 入手。

X=0X=0 时,这个问题就可以简化为10个单词的错位排列问题。那么根据上面所推出的递推式,我们可以得出

D10=(101)(D8+D9)=9(14833+133496)=1334961D_{10}=(10-1)(D_{8}+D_{9})=9*(14833+133496)=1334961

因此,可得

P(X=0)=D10A1010=133496136288000.3678795P(X=0)=\frac{D_{10}}{A_{10}^{10}}=\frac{1334961}{3628800} \approx 0.3678795

X=1X=1 时,可看作是对除了填对的那一空单词以外,其他单词的错位排列问题。那么我们可以得出

P(X=1)=C101D9A1010=133496036288000.3678792P(X=1)=\frac{C_{10}^{1} D_{9}}{A_{10}^{10}}=\frac{1334960}{3628800} \approx 0.3678792

以此类推

P(X=2)=C102D8A10100.1839410P(X=2)=\frac{C_{10}^{2} D_{8}}{A_{10}^{10}} \approx 0.1839410 P(X=3)=C103D7A10100.0613095P(X=3)=\frac{C_{10}^{3} D_{7}}{A_{10}^{10}} \approx 0.0613095 P(X=4)=C104D6A10100.0153356P(X=4)=\frac{C_{10}^{4} D_{6}}{A_{10}^{10}} \approx 0.0153356 P(X=5)=C105D5A10100.0030556P(X=5)=\frac{C_{10}^{5} D_{5}}{A_{10}^{10}} \approx 0.0030556 P(X=6)=C106D4A10100.0005208P(X=6)=\frac{C_{10}^{6} D_{4}}{A_{10}^{10}} \approx 0.0005208 P(X=7)=C107D3A10100.0000661P(X=7)=\frac{C_{10}^{7} D_{3}}{A_{10}^{10}} \approx 0.0000661 P(X=8)=C108D2A10100.0000124P(X=8)=\frac{C_{10}^{8} D_{2}}{A_{10}^{10}} \approx 0.0000124

计算结果

综上,可得 XX 的分布列:

XX0011223344556677881010
PP0.36787950.36787950.36787920.36787920.18394100.18394100.06130950.06130950.01533560.01533560.00305560.00305560.00052080.00052080.00006610.00006610.00001240.00001240.00000030.0000003

那么,再根据分布列,可算出 XX 的数学期望

E(X)=i=08(iP(X=i))+10P(X=10)=1E(X)=\sum_{i=0}^{8} (i*P(X=i)) + 10*P(X=10)=1

结语

看得出来,如果小明做选词填空的时候是完全随机乱填的,那么他大概率会错一大堆。