小思Catalan数 - Daybreakcx's Blog - Keep Programming! With Algorithm! With Fun!
二进制状态转移的最小覆盖问题

小思Catalan数

daybreakcx posted @ 2010年4月20日 20:37 in 算法 with tags Catalan , 6304 阅读

 什么是Catalan数

说到Catalan数,就不得不提及Catalan序列,Catalan序列是一个整数序列,其通项公式是C_n = \frac{1}{n+1}{2n\choose n} = \frac{(2n)!}{(n+1)!\,n!} \quad n\ge 0我们从中取出的C_n就叫做第n个Catalan数,前几个Catalan数是:1, 1, 2, 5, 14, 42, 132, 429, 1430, 4862, 16796, 58786, 208012, 742900, 2674440, 9694845, 35357670, …咋看之下没什么特别的,但是Catalan数却是许多计数问题的最终形式。

Catalan数的一些性质

Catalan数的基本公式就是上个部分所列出的那样,但是却有一些变形和具体的性质:

1、C_n = {2n\choose n} - {2n\choose n+1} \quad n\ge 0

这是根据原来的式子推导出来的,大概过程是这样的:C_n = \frac{1}{n+1}{2n\choose n} = {2n\choose n} -  \frac{n}{n+1}{2n\choose n} = {2n\choose n} -  {2n\choose n + 1}

2、C_0 = 1 \quad , \quad C_{n+1}=\frac{2(2n+1)}{n+2}C_n

这个递推式很容易可以从原来的式子中获得

3、\begin{displaymath}C_0 = 1 \quad , \quad C_{n+1}=\sum_{i=0}^{n}C_i\,C_{n-i}\quad n\ge 0\end{displaymath}

4、\begin{displaymath}C_n= \frac 1{n+1} \sum_{i=0}^n {n \choose i}^2\end{displaymath}

5、\begin{displaymath}C_n \sim \frac{4^n}{n^{\frac{3}{2}}\sqrt{\pi}}\end{displaymath}

这个是Catalan数的增长趋势。

Catalan数在组合计算中的应用

在《组合数学》(机械工业出版社)一书中,介绍Catalan数是由其一个应用推导出的公式,其具体的描述如下:

n个+1和n个-1构成2n项a_1,a_2,...,a_n,其部分和满足a_1 + a_2 + ... + a_k \ge 0 \quad , \quad 0 \le k \le 2n的序列个数等于第n个Catalan数C_n

其证明也不难,我们假设不满足条件的序列个数为U_n,那么就有C_n + U_n = {2n \choose n}。剩下的工作就是求U_n了,我们假设有一个最小的k令a_1 + a_2 + ... + a_k < 0。由于这里k是最小的,所以必有a_1 + a_2 + ... + a_{k - 1} = 0 \quad , \quad a_k = -1,并且k是一个奇数。此时我们将前k项中的+1变为-1,将-1变为+1,那么就得到一个有(n+1)个+1和(n-1)个-1的序列了,这样的序列个数就是我们要求的U_n,数值大小为 U_n = {2n\choose n + 1}。那么我们就得到了C_n = {2n\choose n} - U_n = {2n\choose n} - {2n\choose n + 1}}},就是我们前面的公式。

在具体的组合数问题中,很多都可以转换为Catalan数进行最后的计算,如下:

1、如上文所说,对于任意的k,前k个元素中-1的个数小等于+1的个数的序列计数,我们可以不停地变换形式,比如将-1看成右括号,+1看成左括号,就变成了合法括号表达式的个数。比如2个左括号和2个右括号组成的合法表达式有C_2 = 2种,是()()和(())。

2、既然如上一点都把括号加上去了,那么顺便就再次转换,n+1个数连乘,乘法顺序有C_n种,比如我们三个数连乘a*b*c,那么等于在式子上加括号,有2种乘法顺序,分别是(ab)c和a(bc)。貌似对应关系比较模糊,我们取n为3来看看,n为3的时候就是4个数相乘了,那么我们设为abcd,最初的标号定在a上,我们对于n为3得到合法的括号序列有5个,分别是:((())),()(()),()()(),(())()和(()()),那么我们将一个左括号看成是当前操作数指针往右移动一个位置,一个右括号看成是当前操作数和左边最近的一块操作数相乘起来,那么对应的五个表达式就是:a(b(cd)),(ab)(cd),((ab)c)d,(a(bc))d和a((bc)d),他们之间是一一对应关系。

3、n个节点的二叉树的所有可能形态数为C_n,这一点很容易证明,我们考虑随便取一个节点作为根,那么他左边和右边的儿子节点个数就确定了,假定根节点标号为x,那么左子树的标号就从1到x-1,共x-1个,右子树的标号就从x+1到n,共n-x个,那么我们的x从1取到n,就获得了所有的情况数\begin{displaymath}C_n = \sum_{i = 0}^{n - 1}C_i\,C_{n - i - 1}\end{displaymath}。这个式子就是我们性质3的式子。

4、n个非叶节点的满二叉树的形态数(对称后得到的二叉树除非自己本身对称,否则算是不同),这里取Wikipedia上的一张图片说明问题:

这里要求满二叉树,实际上就是在上一点的每个子节点的空儿子上都加上叶子,就形成了我们的图了,那么我们要求的结果就是Catalan数。

5、对于一个n*n的正方形网格,每次我们能向右或者向上移动一格,那么从左下角到右上角的所有在副对角线右下方的路径总数为C_n。同样引用Wikipedia上的一张图片来表示:

我们将一条水平边记为+1,垂直边记为-1,那么就组成了一个n个+1和n个-1的序列,我们所要保证的就是前k步中水平边的个数不小于垂直边的个数,换句话说前k个元素的和非负,就是我们关于Catalan数的定义。

6、凸n+2边形进行三角形分割(只连接顶点对形成n个三角形)数:

7、n个数入栈后的出栈的排列总数是C_n。例如1,2,3入栈的出栈排序有123,132,213,231和321五种

8、对于集合\{1,2,...,2n\}的不交叉划分的数目为C_n,这里解释一下不交叉划分,我们对于集合{a,b}和{c,d},假设他们组成了两个区间[a,b]和[c,d],我们假设两个区间不重合,那么以下四种情况当做是不交叉的:a<c<d<b,a<b<c<d,c<a<b<d与c<d<a<b,就是说两个区间可以包含或者相离,那么此时我们称集合{a,b}和{c,d}是不交叉的。对于集合\{1,2,...,2n\},将里面元素两两分为一子集,共n个,若任意两个子集都是不交叉的,那么我们称此时的这个划分为一个不交叉划分。此时不交叉的划分数就是我们的C_n了,证明也很容易,我们将每个子集中较小的数用左括号代替,较大的用右括号代替,那么带入原来的1至2n的序列中就形成了合法括号问题,就是我们第二点的结论。例如我们的集合{1,2,3,4,5,6}的不交叉划分有五个:{{1,2},{3,4},{5,6}},{{1,2},{3,6},{4,5}},{{1,4},{2,3},{5,6}},{{1,6},{2,3},{4,5}}和{{1,6},{2,5},{3,4}}。

9、n层的阶梯切割为n个矩形的切法数也是C_n。如下图所示:

 这个证明是怎么进行的呢?我们先绘制如下的一张图片,即n为5的时候的阶梯:

我们注意到每个切割出来的矩形都必需包括一块标示为*的小正方形,那么我们此时枚举每个*与#标示的两角作为矩形,剩下的两个小阶梯就是我们的两个更小的子问题了,于是我们的C_5 = C_0 * C_4 + C_1 * C_3 + C_2 * C_2 + C_1 * C_3 + C_0 * C_4注意到这里的式子就是我们前面的性质3,因此这就是我们所求的结果了。

10、在一个2*n的格子中填入1到2n这些数值使得每个格子内的数值都比其右边和上边的所有数值都小的情况数也是C_n

11、平面上连接可以形成凸包的2n个点分成2个一组连成n条线段,两两线段之间不相交的情况总数是C_n,这里实际上和第7点本质上是一样的,这里就不解释了。

Catalan数问题的一个变形:

n+m个人排队买票,并且满足n \ge m,票价为50元,其中n个人各手持一张50元钞票,m个人各手持一张100元钞票,除此之外大家身上没有任何其他的钱币,并且初始时候售票窗口没有钱,问有多少种排队的情况数能够让大家都买到票。

这个题目是Catalan数的变形,不考虑人与人的差异,如果m=n的话那么就是我们初始的Catalan数问题,也就是将手持50元的人看成是+1,手持100元的人看成是-1,任前k个数值的和都非负的序列数。

这个题目区别就在于n>m的情况,此时我们仍然可以用原先的证明方法考虑,假设我们要的情况数是D_{n+m},无法让每个人都买到的情况数是U_{n + m},那么就有D_{n + m} + U_{n +m} = {n + m \choose n},此时我们求U_{n + m},我们假设最早买不到票的人编号是k,他手持的是100元并且售票处没有钱,那么将前k个人的钱从50元变成100元,从100元变成50元,这时候就有n+1个人手持50元,m-1个手持100元的,所以就得到U_{n + m} = {n + m \choose n + 1},于是我们的结果就因此得到了,表达式是D_{n + m} = {n + m \choose n} - {n + m \choose n + 1}

关于Catalan数的变形还有很多,本身组合数学就是一门十分有趣的学科,通过不停地分析,求解我们能够不断增加自己思维的严谨性和全面性。Catalan数中涉及到了关于组合数的求解问题,这个问题实际上可以详细地展开,内容十分丰富,涉及面也很广,留在下一次继续说明。


登录 *


loading captcha image...
(输入验证码)
or Ctrl+Enter