LWLAymh的备忘录

混乱节拍拼凑出血肉喧嚷

汉诺塔问题

三个柱子,\(n\)个面积互不相等的有孔圆盘一开始按照面积从上往下以此增大的顺序套在其中一个柱子上.

现在每次可以将某根柱子顶端的圆盘移动到另一根柱子顶端,要求这根柱子原本没有圆盘或者柱子顶端圆盘面积大于该圆盘.

求最小移动次数,使得所有圆盘移动到另一根柱子上.

不妨令\(T_n\)表示答案,显然\(T_0 = 0 , T_1 = 1\).

而我们一定可以找到一种方案,使得前\(n - 1\)个圆盘先移动到其中一根柱子上,然后将最下面的圆盘移动到目标柱子,最后再把\(n - 1\)个圆盘移动到目标柱子.由于这是一个可行解而不一定是最优解,我们有:\(T_n \leq 2 T_{ n - 1 } + 1\).

而如果我们要移动最大的圆盘,一定要保证前n-1个圆盘已经移走到一根柱子上.因此一定有:\(2 T_{ n - 1 } + 1 \leq T_n\).于是有\(T_n = 2 T_{ n - 1 } + 1\).

Example1(《具体数学》1.2)

汉诺塔问题,所有圆盘一开始均在最左边的塔A上,要将他们全都移动到最右边的塔C上,不允许在二塔之间直接移动,求最小操作次数.

Solution 1

考虑设\(T_n\)为n个圆盘时的最小操作次数.假设已知\(T_{ n - 1 }\),我们考虑如何移动.

首先因为不能直接在AC之间移动,因此一定是先要把最大的圆盘移动到中间塔上,这一步要求先把所有圆盘移动到C上,然后需要再把这些圆盘移动回A上,因此,显然有:\(T_{ n } = 3 T_{ n - 1 } + 2 , T_0 = 0\).

考虑如何求该式子的封闭形式,令\(W_n = T_n + 1\),显然有\(W_n = 3 W_{ n - 1 } , W_0 = 1\),显然\(W_n = 3^n\),有\(T_n = 3^n - 1\).

注意到\(T_n\)刚好是三根柱子上所有合法排列的数量,并且这个过程中不可能出现某两个时刻的情况是相同的,因此1.3也可以证明.

Example2(《具体数学》1.4)

汉诺塔问题,问是否存在一种符合规则的初始摆放方式,使得将其全部移动到其中一根柱子所用次数小于等于\(2^n - 1\).

Solution 2

不存在.

证明方式类似原初问题的证明,考虑最大的那个圆盘是否到达终点.如果到达则可以去掉它,用数学归纳证明不存在;如果还未到达,同样用数学归纳得到不等式.

Example3(《具体数学》1.10)

汉诺塔问题,但是移动圆盘时只能从A移动到B,从B移动到C,从C移动到A.一开始所有圆盘都在A,求将它们全部移动到B的最小操作次数,以及将他们从B移动回A的最小操作次数.

Solution 3

\(Q_n\)为将n个圆盘从A移动到B的最小操作次数,令\(R_n\)为将n个圆盘从B移动回A的最小操作次数.

先考虑边界情况,\(Q_0 = 0 , R_0 = 0\).

我们考虑,由于柱子间在移动过程中是无区别的,因此\(Q_n\)的实质是将n个圆盘移动到它的下一个柱子的最小操作次数,\(R_n\)的实质是将n个圆盘移动到它的上一个柱子的最小操作次数.

在将最大的圆盘移动到下一根柱子前,一定要先把上面的圆盘全部移动到上一根柱子上,最后再移动回来.

显然有\(Q_n = 2 R_{ n - 1 } + 1 , 1 \leq n\).

在将最大的圆盘移动到上一根柱子前,一定要先把他移动到下一根柱子上,这个步骤要求我们把其他的圆盘移动到上一根柱子上.在这之后,我们又要把所有圆盘放到上一根柱子上来让最大圆盘到目标柱子,最后再移动回来.

\(R_n = R_{ n - 1 } + 1 + Q_{ n - 1 } + 1 + R_{ n - 1 } = Q_n + Q_{ n - 1 } + 1 , 1 \leq n\).

Example4(《具体数学》1.11)

汉诺塔问题,但是每种大小的圆盘有两个,且其中一个可以摆放在另一个的上面.

a.如果相同圆盘无区别,求最小操作次数.

b.如果相同圆盘有区别,且最后需要还原原本二者的上下顺序,求最小操作次数.

Solution 4

a.仍然令\(T_n\)为n对圆盘的最小操作次数,显然\(T_n = 2 T_{ n - 1 } + 2 , T_0 = 0\),可解得\(T_n = 2^{ n + 1 } - 2\).

b.令\(Q_n\)为n对圆盘的最小操作次数,观察a问题,我们可以发现a问题转移之后,只有最下面的两个圆盘会交换顺序.而如果我们在b问题中只关注最下层两个圆盘的顺序,我们发现\(Q_n = T_{ n - 1 } + 1 + T_{ n - 1 } + 1 + T_{ n - 1 } + 1 + T_{ n - 1 } = 4 T_{ n - 1 } + 3 = 2^{ n + 2 } - 5\).

我们进行了四次a操作,那么次下面两个圆盘自然就顺序与原本相同了,因此这里的\(Q_n\)就是答案.

Example5(《具体数学》1.12)

类似Problem11,但第\(i\)大的圆盘有\(k_i\)个.

Solution 5

无区别,只是\(T_n = 2 T_{ n - 1 } + k_n , T_0 = 0\).

如果求封闭形式的话,显然有\(T_n = \sum_{ i = 1 }^n 2^{ n - i } k_i\).

递归式的封闭形式

在上述问题中,我们已经有了以下式子:

\(T_n = 2 T_{ n - 1 } + 1 , n > 0 , T_0 = 0\).

如果\(n\)很大,那么一步一步去计算是很复杂的,现在我们想知道一种更为快速的求出\(T_n\)的方法.

换句话说,我们想要把\(T_n\)表示为只与n有关的式子,我们称其为该递归式的封闭形式.

寻找循环节

Example(《具体数学》1.8)

解递归式:\(Q_n = \begin{cases}\alpha & n = 0 \\ \beta & n = 1 \\ \frac{ ( 1 + Q_{ n - 1 } ) }{ Q_{ n - 2 } } & n > 1\end{cases}\),保证\(\forall n , Q_n > 0\).

Solution

注意到\(Q_2 = \frac{ \beta + 1 }{ \alpha } , Q_3 = \frac{ \beta + \alpha + 1 }{ \beta \alpha } , Q_4 = \frac{ 1 + \alpha }{ \beta } , Q_5 = \alpha , Q_6 = \beta\).

显然该递归式存在长度为\(5\)的循环节.

数学归纳法

观察T序列的前几项,可以发现似乎有\(T_n = 2^n - 1\).

现在我们来证明它:

1.该公式对于\(n = 0\)成立,显然可验证.

2.若该公式对\(n = k\)时成立,那该公式必然对\(n = k + 1\)成立.

因为有\(T_{ k + 1 } = 2 T_k + 1 = 2 \times 2^k + 2 - 1 = 2^{ k + 1 } - 1\).

以上过程被称为数学归纳法.

Example(《具体数学》1.9)

求证:\(\prod_{ i = 1 }^n x_i \leq ( \frac{ \sum_{ i = 1 }^n x_i }{ n } )^n , \forall i \in N_+ , 1 \leq i \leq n , 0 \leq x_i\).

Solution

使用反向归纳法.

1.\(n = 2\)时,即基本不等式,显然成立.

2.若该式子对\(n = k\)时成立,则该式子对n=2k时也成立.

不妨令\(A_1 = \sqrt[k]{ \prod_{ i = 1 }^k x_i } , B_1 = \sqrt[k]{ \prod_{ i = k + 1 }^{ 2 k } x_i } , A_2 = ( \frac{ \sum_{ i = 1 }^k x_i }{ k } ) , B_2 = ( \frac{ \sum_{ i = k + 1 }^{ 2 k } x_i }{ k } )\),显然有\(A_1 \leq A_2 , B_1 \leq B_2\).

同时有\(( \frac{ A_2 + B_2 }{ 2 } ) \geq \sqrt{ A_2 B_2 } \geq \sqrt{ A_1 B_1 }\).

3.若该式子对\(n = k\)时成立,则该式子对\(n = k - 1\)的时候也成立.

\(x_k = \frac{ \sum_{ i = 1 }^{ k - 1 } x_i }{ k - 1 }\),有\(x_k \prod_{ i = 1 }^{ k - 1 } x_i \leq ( x_k )^k\).

则显然\(n = k - 1\)时也成立.

由1和2,我们知道了对于n是二的整数次幂的情况,该公式成立,由3,我们又可以知道该公式对于任意一个存在比他大的二的整数次幂的数成立,因此该公式成立.

换元

考虑令\(U_n = T_n + 1\),显然有:\(T_n + 1 = 2 T_{ n - 1 } + 2\).即\(U_n = 2 U_{ n - 1 }\),显然\(U_n = 2^n\),则\(T_n = 2^n - 1\).

这个做法可以做掉所有形如\(a_{ n + 1 } = pa_n + q\)的递归式.我们有:

\[ a_{ n + 1 } + \frac{ q }{ p - 1 } = p ( a_n + \frac{ q }{ p - 1 } ) \]

换元做掉这个式子.

转化和式

考虑递归式\(a_n T_n = b_n T_{ n - 1 } + c_n\).如果我们能找到一个不为0的求和因子\(s_n\)并满足\(s_n b_n = s_{ n - 1 } a_{ n - 1 }\).那么我们两面同时乘以\(s_n\),显然有:\(s_n a_n T_n = s_{ n - 1 } a_{ n - 1 } T_{ n - 1 } + c_n s_n\).

\(S_n = s_n a_n T_n\).显然有\(S_n = s_0 a_0 T_0 + \sum_{ i = 1 }^n s_i c_i\),则\(T_n = \frac{ S_n }{ s_n a_n }\).

而我们也会发现\(s_n = \frac{ \prod_{ i = 1 }^{ n - 1 } a_i }{ \prod_{ i = 1 }^n b_i }\).

Example1(快速排序时间复杂度)

结论:排序\(n\)个数时,其期望复杂度满足:

\[ C_n = \begin{cases} 0 & n = 0 , 1 \\ n + 1 + \frac{ 2 }{ n } \sum_{ i = 0 }^{ n - 1 } C_k & n > 1 \end{cases} \]

不妨考虑两边同时乘以\(n\),有 \(nC_n = n^2 + n + 2 \sum_{ i = 0 }^{ n - 1 } C_i , n > 1\) .

显然也有\(( n - 1 ) C_{ n - 1 } = ( n - 1 )^2 + n - 1 + 2 \sum_{ i = 0 }^{ n - 2 } C_i , n > 2\).

二式相消,有\(nC_n - ( n - 1 ) C_{ n - 1 } = 2 n + 2 C_{ n - 1 } , n > 2\).

而同时有\(C_2 = 3\).即:\(nC_n = ( n + 1 ) C_{ n - 1 } + 2 n , n > 2\),可以使用转化和式的方法,两边乘以\(\frac{ 1 }{ n ( n + 1 ) }\)解决.

Example2

已知\(a_1 = 1\),\(a_n = \sqrt{ S_n } + \sqrt{ S_{ n - 1 } }\),求\(a_n\).

注意到\(a_n = S_n - S_{ n - 1 }\),则有\(\sqrt{ S_n } - \sqrt{ S_{ n - 1 } } = 1\),于是\(\sqrt{ S_n } = n\),\(S_n = n^2\),\(a_n = 2 n - 1\).

成套方法

如果我们有

& n=1\

2f(n 2)+& n=2k,k\

2f(2)+&n=2k+1,k

\end{cases}

其中\(n = 2^m + l\)\(2^m \leq n < 2^{ m + 1 }\).

该如何求出\(f ( n )\)的封闭形式呢?

由于所有的未知数都是以加法运算连接,显然有\(f ( n ) = A ( n ) \alpha + B ( n ) \beta + C ( n ) \gamma\),而有\(A 、 B 、 C\)互不影响且\(\alpha \beta \gamma\)\(ABC\)无关.

那无论\(\beta\)\(\gamma\)的取值如何,\(A ( n )\)都不会受到影响,我们考虑\(\beta = \gamma = 0\)的特殊情况,此时显然有\(A ( n ) = 2^m\).

接下来,我们考虑取\(\alpha \beta \gamma\)的特殊值,去得到ABC之间的关系.

例如,当\(f ( n ) = 1\)时,由递推式可知\(\alpha = 1 , \beta = \gamma = - 1\),那么有\(A ( n ) - B ( n ) - C ( n ) = f ( n ) = 1\).

同理,\(f ( n ) = n\)时,可知\(\alpha = 1 , \beta = 0 , \gamma = 1\),此时有\(A ( n ) + C ( n ) = f ( n ) = n\).

显然可以通过解方程求得\(B ( n )\)\(C ( n )\).

这个方法显然是通用方法,式子仅仅是例子,事实上,只要我们能证明\(ABC\)互不影响且\(\alpha \beta \gamma\)\(ABC\)无关,我们就可以使用这个方法.

这个东西的原理是什么呢?显然是因为其中存在一个线性无关性对吧.

线性递推

一个常系数的\(k\)阶线性递推关系形如:

\[ \begin{aligned} a_n & = P_n + \sum_{ i = 1 }^k c_i a_{ n - i } , n \geq k \\ a_0 & = C_0 , a_1 = C_1 , . . . , a_{ k - 1 } = C_{ k - 1 } \end{aligned} \]

\(P = 0\)时,称作齐次线性递推.

特征方程

我们称方程\(r^k = \sum_{ i = 1 }^k c_i r^{ k - i }\)是该递推关系的特征方程,方程的解叫做该递推关系的特征根.

二阶线性齐次递推

若其特征方程有两个不同的根\(r_1\)\(r_2\),那么存在两个常数\(\alpha_1\)\(\alpha_2\),满足\(a_n = \alpha_1 r_1^n + \alpha_2 r_2^n\).

若其特征方程有两个相同的根\(r\),那么存在两个常数\(\alpha_1\)\(\alpha_2\),满足\(a_n = \alpha_1 r^n + \alpha_2 nr^n\).

先考虑前者的证明,首先考虑对于\(n = 0\)或者\(n = 1\)的情况,我们考虑求出一组\(\alpha_1\)\(\alpha_2\)来满足:

\[ \begin{aligned} C_0 & = \alpha_1 + \alpha_2 \\ C_1 & = \alpha_1 r_1 + \alpha_2 r_2 \end{aligned} \]

\(r_1 \ne r_2\),可以解得:

\[ \begin{aligned} \alpha_1 & = \cfrac{ C_1 - C_0 r_2 }{ r_1 - r_2 } \\ \alpha_2 & = C_0 - \alpha_1 \end{aligned} \]

接下来考虑数学归纳:

\[ \begin{aligned} a_n & = c_1 a_{ n - 1 } + c_2 a_{ n - 2 } \\ & = c_1 ( \alpha_1 r_1^{ n - 1 } + \alpha_2 r_2^{ n - 1 } ) + c_2 ( \alpha_1 r_1^{ n - 2 } + \alpha_2 r_2^{ n - 2 } ) \\ & = \alpha_1 ( c_1 r_1^{ n - 1 } + c_2 r_1^{ n - 2 } ) + \alpha_2 ( c_1 r_2^{ n - 1 } + c_2 r_2^{ n - 2 } ) \\ & = \alpha_1 r_1^n + \alpha_2 r_2^n \end{aligned} \]

接下来考虑后者,首先我们有\(\Delta = c_1^2 + 4 c_2 = 0\),考虑初始条件:

$$ \[\begin{aligned} C_0 & = \alpha_1 \\ C_1 & = \alpha_1 r + \alpha_2 r \\ \end{aligned}\]

$$

接下来我们考虑数学归纳:

\[ \begin{aligned} a_n & = c_1 a_{ n - 1 } + c_2 a_{ n - 2 } \\ & = c_1 ( \alpha_1 r^{ n - 1 } + \alpha_2 nr^{ n - 1 } - \alpha_2 r^{ n - 1 } ) + c_2 ( \alpha_1 r^{ n - 2 } + \alpha_2 nr^{ n - 2 } - 2 \alpha_2 r^{ n - 2 } ) \\ & = a_n - c_1 \alpha_2 r^{ n - 1 } - 2 c_2 \alpha_2 r^{ n - 2 } \end{aligned} \]

我们接下来只需证明\(c_1 r + 2 c_2 = 0\)即可.根据方程,不难发现\(r = \cfrac{ c_1 }{ 2 }\),根据\(\Delta = 0\),自然得证.

更一般的情况

直接在复数域上定义\(f_k ( x ) = \{ n^k x^n \}_{ n = 0 }^\infty\),此时我们规定\(0^0 = 1\).特别地,当\(x = 0\)的时候,定义\(f_k ( x )\)的第\(k\)项是\(1\),其余项是\(0\).在此基础上定义线性映射\(T : ( a_n )_{ n = 0 }^\infty \mapsto ( a_{ n + 1 } )_{ n = 0 }^\infty\),立刻见到:\(( T - x )^{ k + 1 } f_k ( x ) = 0 , ( T - x )^k f_k ( x ) \ne 0\).原因只需简单数学归纳.而此还可以引出\(f_0 ( x ) , f_1 ( x ) , \cdots\)线性无关.

在此基础上观察线性递推\(a_{ n + d } = c_{ d - 1 } a_{ n + d - 1 } + \cdots + c_0 a_n\),不妨取\(G ( x ) = x^d - c_{ d - 1 } x^{ d - 1 } - \cdots - c_0\),立刻应当见到如果\(a\)\(G\)的根并且重数为\(e ( a )\),那么\(f_{ 0 } ( x ) , \cdots , f_{ e ( a ) - 1 } ( a )\)都在\(\ker f ( T )\)中.这恰好是该线性递推空间的维数个.我们需要说明它们线性无关,不妨反证,假设出现了形如\(\sum_j w_i f_i ( y ) = \sum_j w_j f_j ( x )\)的情况,此时对右边直接操作若干次\(( T - x )\)就可以把右边全部消成\(0\),在对着左边消几次就可以使得左边只留下最高次项,这个时候发现最高次项是消不掉的,原因是将每一个位置看作关于\(n\)的多项式右边的\(( T - x )\)是不会改变左边这边的每一个位置多项式的\(\deg\),这当然意味着不可能消干净.

再再进一步

我们都知道矩阵加速:也就是\(\vec{ x }_{ k + 1 } = A \vec{ x }\),\(\vec{ x }_{ n } = A^n \vec{ x }_0\).而我们又知道CH定理:\(p ( A ) = 0\),我们用多项式取膜,有\(A^n = p ( A ) F ( A ) + G ( A ) = G ( A )\),这就是解.

约瑟夫问题

考虑n个人围成一圈,从第一个人开始,每隔一个人就杀掉一个人.如10个人围成一圈时,杀人的顺序是\(2 , 4 , 6 , 8 , 10 , 3 , 7 , 1 , 9\).问最后幸存下来的人编号.

首先一定有J(1)=1.考虑第一遍杀掉n号或者n-1号之后,对整个圆圈进行重新编号.

那么当人数是偶数时,我们有\(J ( 2 n ) = 2 J ( n ) - 1\);当人数是奇数时,我们杀掉一号,然后有\(J ( 2 n + 1 ) = 2 J ( n ) + 1\).

整理得到:

\[ J ( n ) = \begin{cases} 1 & n = 1 \\ 2 J ( \frac{ n }{ 2 } ) - 1 & n = 2 k , k \in \mathbb{ N_+ } \\ 2 J ( \frac{ n - 1 }{ 2 } ) + 1 & n = 2 k + 1 , k \in \mathbb{ N_+ } \end{cases} \]

仍然可以使用数学归纳,如果令\(n = 2^m + l 且 2^m \leq n < 2^{ m + 1 }\).

\(J ( n ) = 2 l + 1\).

要是注意力没有那么集中怎么办呢?考虑到这个东西显然和取膜有着不可分割的关系,我们不妨从\(0\)开始编号:

\[ J ( n ) = \begin{cases} 0 & n = 1 \\ 2 J ( \frac{ n }{ 2 } ) & n = 2 k , k \in \mathbb{ N_+ } \\ 2 J ( \frac{ n - 1 }{ 2 } ) + 2 & n = 2 k + 1 , k \in \mathbb{ N_+ } \end{cases} \]

这下相信\(J ( n )\)是多少就很显然了,将\(n\)写成二进制的形式,这个就相当于把首位\(1\)抹去然后在末尾加个\(0\).

Example(《具体数学》1.15)

求约瑟夫问题中最后一名被杀死的人的编号.

Solution

显然有:

\[ J ( n ) = \begin{cases} 2 & n = 2 \\ 1 & n = 3 \\ 2 J ( \frac{ n }{ 2 } ) - 1 & n = 2 k + 2 , k \in \mathbb{ N_+ } \\ 2 J ( \frac{ n - 1 }{ 2 } ) + 1 & n = 2 k + 3 , k \in \mathbb{ N_+ } \end{cases} \]

\(0\)开始编号,自然有:

\[ J ( n ) = \begin{cases} 1 & n = 2 \\ 0 & n = 3 \\ 2 J ( \frac{ n }{ 2 } ) & n = 2 k + 2 , k \in \mathbb{ N_+ } \\ 2 J ( \frac{ n - 1 }{ 2 } ) + 2 & n = 2 k + 3 , k \in \mathbb{ N_+ } \end{cases} \]

显然\(J ( n )\)也可以用二进制表达其形式.

和式

和式的基本运算

分配律:

\[ \sum_{ i \in S } ca_i = c \sum_{ i \in S } a_i \]

一般分配律:

\[ \sum_{ i } \sum_{ j } a_{ i } b_j = ( \sum_{ i } a_i ) ( \sum_j b_j ) \]

结合律:

\[ \sum_{ i \in S } ( a_i + b_i ) = \sum_{ i \in S } a_i + \sum_{ i \in S } b_i \]

交换律:

\[ \sum_{ i \in S } a_i = \sum_{ p ( i ) \in S } a_{ p ( i ) } \]

交换求和顺序:

\[ \begin{aligned} \sum_{ i } \sum_{ j } a_{ i , j } [ P ( i , j ) ] & = \sum_{ j } \sum_{ i } a_{ i , j } [ P ( i , j ) ] \\ \sum_{ i = 1 }^n \sum_{ j = i }^n a_{ i , j } & = \sum_{ j = 1 }^n \sum_{ i = 1 }^j a_{ i , j } \end{aligned} \]

和式的封闭形式

交换顺序法

Example1(等差数列求和)

我们有:

\[ \begin{aligned} S_n & = \sum_{ i = 0 }^n ( ai + b ) = \sum_{ i = 0 }^n ( a ( n - i ) + b ) \\ 2 S_n & = \sum_{ i = 0 }^n ( an + 2 b ) = an ( n + 1 ) + 2 b ( n + 1 ) \\ S_n & = ( n + 1 ) ( \frac{ an }{ 2 } + b ) \end{aligned} \]

Example2(切比雪夫单调不等式)

\(S = \sum_{ 1 \leq i < j \leq n } ( a_j - a_i ) ( b_j - b_i ) = \sum_{ 1 \leq j < i \leq n } ( a_j - a_i ) ( b_j - b_i )\).

考虑恒等式\([ 1 \leq j < i \leq n ] + [ 1 \leq i < j \leq n ] = [ 1 \leq j , i \leq n ] - [ 1 \leq i = j \leq n ]\).

那么我们有:

\[ \begin{aligned} 2 S & = \sum_{ 1 \leq i , j \leq n } ( a_j - a_i ) ( b_j - b_i ) - \sum_{ 1 \leq i = j \leq n } ( a_j - a_i ) ( b_j - b_i ) \\ & = \sum_{ 1 \leq i , j \leq n } ( a_j - a_i ) ( b_j - b_i ) \\ & = 2 n \sum_{ i = 1 }^n a_i b_i - 2 ( \sum_{ i = 1 }^n a_i ) ( \sum_{ j = 1 }^n b_j ) \\ ( \sum_{ i = 1 }^n a_i ) ( \sum_{ j = 1 }^n b_j ) & = n \sum_{ i = 1 }^n a_i b_i - \sum_{ 1 \leq i < j \leq n } ( a_j - a_i ) ( b_j - b_i ) \end{aligned} \]

显然有以下式子:

(_{i=1}na_i)({j=1}^nb_j)n{i=1}na_ib_i,i<j,a_ia_j且b_ib_j\

上式被称为切比雪夫单调不等式.

值得一提的是,切比雪夫单调不等式其实是排序不等式的一个特化版本.

Example3(拉格朗日恒等式)

证明:

$$ \[\begin{aligned} \sum_{ 1 \leq j < k \leq n } ( a_j b_k - a_k b_j )^2 & = ( \sum_{ i = 1 }^n a_i^2 ) ( \sum_{ i = 1 }^n b_i^2 ) - ( \sum_{ i = 1 }^n a_i b_i )^2 \\ \end{aligned}\]

$$

有:

\[ \begin{aligned} S_n & = \sum_{ 1 \leq j < k \leq n } ( a_j b_k - a_k b_j )^2 \\ 2 S_n & = \sum_{ j = 1 }^n \sum_{ k = 1 }^n ( a_j b_k - a_k b_j )^2 \\ & = \sum_{ j = 1 }^n \sum_{ k = 1 }^n ( a_j^2 b_k^2 - 2 a_j a_k b_j b_k + a_k^2 b_j^2 ) \\ & = 2 ( \sum_{ i = 1 }^n a_i^2 ) ( \sum_{ i = 1 }^n b_i^2 ) - 2 ( \sum_{ i = 1 }^n a_i b_i )^2 \end{aligned} \]

扰动法

Example1(等比数列求和)

\[ \begin{aligned} S_n & = \sum_{ i = 0 }^n ax^i \\ & = a + \sum_{ i = 1 }^n ax^i \\ & = a + x \sum_{ i = 0 }^{ n - 1 } ax^i \\ & = a + xS_{ n - 1 } \end{aligned} \]

\(S_{ n - 1 } + ax^n = S_n = a + xS_{ n - 1 }\),有\(S_n + ax^{ n + 1 } = a + xS_n , S_n = a \frac{ x^{ n + 1 } - 1 }{ x - 1 }\),其中\(x \ne 1\).

Example2(平方和公式)

如果直接对该公式使用扰动法:

\[ \begin{aligned} S_n & = \sum_{ i = 0 }^n i^2 = \sum_{ i = 0 }^{ n - 1 } i^2 + n^2 \\ & = \sum_{ i = 1 }^n ( i - 1 )^2 + n^2 \\ & = S_n - 2 \sum_{ i = 1 }^n i + n + n^2 \end{aligned} \]

我们无法得到\(S_n\)的封闭形式,但我们发现我们得到了\(\sum_{ i = 1 }^n i\)的封闭形式.

那以此类推,我们设\(W_n = \sum_{ i = 0 } i^3\).

\[ \begin{aligned} W_n & = \sum_{ i = 0 }^{ n - 1 } i^3 + n^3 \\ & = \sum_{ i = 1 }^n ( i - 1 )^3 + n^3 \\ & = \sum_{ i = 1 }^n i^3 - 3 \sum_{ i = 1 }^n i^2 + 3 \sum_{ i = 1 }^n i - n + n^3 \\ & = W_n - 3 S_n + 3 \frac{ n + n^2 }{ 2 } - n + n^3 \\ S_n & = \frac{ n + n^2 }{ 2 } - \frac{ n - n^3 }{ 3 } \\ & = \frac{ n + 3 n^2 + 2 n^3 }{ 6 } \\ & = \frac{ n ( 1 + 3 n + 2 n^2 ) }{ 6 } \\ & = \frac{ n ( 2 n + 1 ) ( n + 1 ) }{ 6 } \end{aligned} \]

Example3(《具体数学》2.20)

\(H_n = \sum_{ k = 1 }^n \frac{ 1 }{ k }\),求\(\sum_{ i = 0 }^n H_i\).

Solution3

不妨考虑\(\sum_{ i = 0 }^n iH_{ i }\)的值.

$$ \[\begin{aligned} \sum_{ i = 0 }^n iH_{ i } & = \sum_{ i = 1 }^n [ ( i - 1 + 1 ) H_{ i - 1 } + 1 ] \\ & = n + \sum_{ i = 0 }^{ n - 1 } H_i + \sum_{ i = 0 }^{ n } iH_i - nH_n \\ \sum_{ i = 0 }^{ n - 1 } H_i & = n ( H_n - 1 ) \\ \sum_{ i = 0 }^n H_i & = ( n + 1 ) ( H_{ n + 1 } - 1 ) \\ \end{aligned}\]

$$

Example4(《具体数学》2.21)

\(S_n = \sum_{ i = 0 }^n ( - 1 )^{ n - i } , T_n = \sum_{ i = 0 }^n ( - 1 )^{ n - i } i , U_n = \sum_{ i = 0 }^n ( - 1 )^{ n - i } i^2\).

Solution 4

\[ \begin{aligned} S_n & = \sum_{ i = 1 }^{ n } ( - 1 )^{ n - i } + ( - 1 )^n \\ - S_{ n - 1 } + 1 & = ( - 1 )^n + \sum_{ i = 0 }^{ n - 1 } ( - 1 )^{ n - 1 - i } \\ - S_{ n - 1 } + 1 & = ( - 1 )^n + S_{ n - 1 } \\ S_{ n - 1 } & = \frac{ 1 - ( - 1 )^n }{ 2 } \\ S_n & = \frac{ 1 + ( - 1 )^n }{ 2 } \end{aligned} \]

\[ \begin{aligned} T_{ n } & = \sum_{ i = 1 }^n ( - 1 )^{ n - i } i \\ - T_{ n - 1 } + n & = \sum_{ i = 1 }^n ( - 1 )^{ n - i } ( i - 1 ) + \sum_{ i = 1 }^n ( - 1 )^{ n - i } \\ - T_{ n - 1 } + n & = \sum_{ i = 0 }^{ n - 1 } ( - 1 )^{ n - i - 1 } i + \sum_{ i = 0 }^n ( - 1 )^{ n - i } - ( - 1 )^n \\ - T_{ n - 1 } + n & = T_{ n - 1 } + S_n - ( - 1 )^n \\ n - \frac{ 1 - ( - 1 )^n }{ 2 } & = 2 T_{ n - 1 } \\ T_n & = \frac{ 1 }{ 2 } ( n + 1 + \frac{ - 1 - ( - 1 )^n }{ 2 } ) = \frac{ 1 }{ 2 } ( n + \frac{ 1 - ( - 1 )^n }{ 2 } ) \end{aligned} \]

\[ \begin{aligned} U_n & = \sum_{ i = 1 }^n ( - 1 )^{ n - i } i^2 \\ - U_{ n - 1 } + n^2 & = \sum_{ i = 1 }^n ( - 1 )^{ n - i } ( i - 1 + 1 )^2 \\ - U_{ n - 1 } + n^2 & = \sum_{ i = 1 }^n ( - 1 )^{ n - i } ( i - 1 )^2 + 2 \sum_{ i = 1 }^n ( - 1 )^{ n - i } ( i - 1 ) + \sum_{ i = 1 }^n ( - 1 )^{ n - i } \\ - U_{ n - 1 } + n^2 & = \sum_{ i = 0 }^{ n - 1 } ( - 1 )^{ n - i - 1 } i^2 + 2 \sum_{ i = 0 }^{ n - 1 } ( - 1 )^{ n - i - 1 } i + \sum_{ i = 0 }^{ n - 1 } ( - 1 )^{ n - i - 1 } \\ - U_{ n - 1 } + n^2 & = U_{ n - 1 } + 2 T_{ n - 1 } + S_{ n - 1 } \\ 2 U_{ n - 1 } & = n^2 - 2 T_{ n - 1 } - S_{ n - 1 } \\ 2 U_{ n - 1 } & = n^2 - ( n - \frac{ 1 - ( - 1 )^n }{ 2 } ) - \frac{ 1 - ( - 1 )^n }{ 2 } \\ 2 U_{ n - 1 } & = n^2 - n \\ U_n & = \frac{ n ( n + 1 ) }{ 2 } \end{aligned} \]

转化为递归式

考虑和式\(S_n = \sum_{ i = 0 }^n f ( i ) = S_{ n - 1 } + f ( n ) \\\),显然是递归式形式.

因此递归式所可以使用的方法同样可以在和式中使用.

Example1(《具体数学》2.13)

\(\sum_{ i = 0 }^n ( - 1 )^i i^2 \\\).

Solution1

\(S ( n ) = \sum_{ i = 0 }^n ( - 1 )^i i^2 = S ( n - 1 ) + ( - 1 )^n n^2\),考虑使用成套方法.

不妨令\(S ( n ) = S ( n - 1 ) + ( - 1 )^n ( \alpha + \beta n + \gamma n^2 ) = \alpha A ( n ) + \beta B ( n ) + \gamma C ( n )\).

\(S ( n ) = ( - 1 )^n n , 可 以 解 得 \alpha = - 1 , \beta = 2 , \gamma = 0\),有\(( - 1 )^n n = - A ( n ) + 2 B ( n )\).

\(S ( n ) = ( - 1 )^n n^2 , 可 以 解 得 \alpha = 1 , \beta = - 2 , \gamma = 2\),有\(( - 1 )^n n^2 = A ( n ) - 2 B ( n ) + 2 C ( n )\).

显然可解得\(2 C ( n ) = ( - 1 )^n n^2 + ( - 1 )^n n , C ( n ) = ( - 1 )^n \frac{ n ( n + 1 ) }{ 2 }\).

而原式中,\(S ( n ) = C ( n ) = ( - 1 )^n \frac{ n ( n + 1 ) }{ 2 }\).

Example2(《具体数学》2.19)

\(2 T_n = nT_{ n - 1 } + 3 n ! , T_0 = 5\),求\(T_n\).

Solution 2

\(s_n = \frac{ 2^{ n - 1 } }{ n ! }\),两边同时乘以\(s_n\),有\(\frac{ 2^n }{ n ! } T_n = \frac{ 2^{ n - 1 } }{ ( n - 1 ) ! } T_{ n - 1 } + 3 \times 2^{ n - 1 } \\\).

\(S_n = \frac{ 2^n }{ n ! } T_n\),有:

\[ \begin{aligned} S_n & = S_{ n - 1 } + 3 \times 2^{ n - 1 } \\ & = 5 + 3 \sum_{ i = 0 }^{ n - 1 } 2^i \\ & = 5 + 3 \times 2^{ n + 1 } - 3 \\ & = 3 \times 2^{ n } + 2 \\ T_n & = 3 n ! + \frac{ n ! }{ 2^{ n - 1 } } \end{aligned} \]

转化为积分形式

Example1(平方和公式)

考虑先求出一个近似解,然后再求误差.

考虑函数\(f ( x ) = x^2\),显然\(\int_0^n x^2 dx = \frac{ n^3 }{ 3 } \sim S_n \\\).

接下来,我们考虑求得二者之间的误差,设\(E_n = S_n - \frac{ n^3 }{ 3 } \\\),对其使用扰动法:

\[ \begin{aligned} E_n & = S_n - \frac{ n^3 }{ 3 } \\ & = S_{ n - 1 } + n^2 - \frac{ ( n - 1 + 1 )^3 }{ 3 } \\ & = S_{ n - 1 } + n^2 - \frac{ ( n - 1 )^3 }{ 3 } - ( n - 1 )^2 - ( n - 1 ) - \frac{ 1 }{ 3 } \\ & = E_{ n - 1 } + n^2 - n^2 + 2 n - 1 - n + 1 - \frac{ 1 }{ 3 } \\ & = E_{ n - 1 } + n - \frac{ 1 }{ 3 } \end{aligned} \]

这样就得到了递归式,可以求得封闭形式.

还有一种方法是:

\[ \begin{aligned} E_n & = S_n - \int_0^n x^2 dx \\ & = \sum_{ k = 1 }^n ( k^2 - \int_{ k - 1 }^k x^2 dx ) \\ & = \sum_{ k = 1 }^n ( k^2 - \frac{ k^3 - ( k - 1 )^3 }{ 3 } ) \\ & = \sum_{ k = 1 }^n ( k - \frac{ 1 }{ 3 } ) \end{aligned} \]

这是一个简单的和式.而\(S_n = E_n + \frac{ n^3 }{ 3 } \\\),显然也可以求得.

Example2(某浙江高考题)

已知\(a_1 = 1 , a_{ n + 1 } - a_n = - \frac{ 1 }{ 3 } a_n^2\),估计\(a_n\)的值.

考虑构造一个函数\(f ( n )\)使得\(f ( n ) \approx a_n\),那我们就可以将\(a_{ n + 1 } - a_n \approx f_n\).

这个第一眼看上去就很有道理,而事实上也确实很有道理,原因是根据拉格朗日中值定理,\(\exists x_0 \in [ n , n + 1 ] , f ' ( x_0 ) = f ( n + 1 ) - f ( n )\),而对于增长率变化不大的函数,直接认为\(f ' ( x_0 ) = f ' ( n )\)是有理可循的!

然后,原式子就变成了一个微分方程了,带入\(f ( 1 ) = 1\)解得\(f ( n ) = \frac{ 3 }{ n + 2 }\).这个精度已经足够选出来原本的放缩题的答案了.

\(a_n = \frac{ 3 }{ n + 2 } - b_n\),带入化简,得到\(\{ b_n \}\)的递推式:

\[ \begin{aligned} \frac{ 3 }{ n + 3 } - b_{ n + 1 } & = ( \frac{ 3 }{ n + 2 } - b_n ) ( 1 - \frac{ 1 }{ n + 2 } + \frac{ b_n }{ 3 } ) \\ b_{ n + 1 } - \frac{ 3 }{ n + 3 } & = ( b_n - \frac{ 3 }{ n + 2 } ) ( \frac{ n + 1 }{ n + 2 } + \frac{ b_n }{ 3 } ) \\ b_1 & = 0 , b_{ n + 1 } = \frac{ b_n^2 }{ 3 } + \frac{ n }{ n + 2 } b_n + \frac{ 3 }{ ( n + 2 )^2 ( n + 3 ) } \end{aligned} \]

算到这里,我们可以很轻易使用数学归纳法算出\(b_n \leq \frac{ 1 }{ 4 n }\),这个精度已经挺不错的了,但是也让人觉得很不满意,因为这个误差项怎么和估计项是同阶的啊.

然后我开始估计了一下这个\(b_n\)的阶,因为我其实没学过什么高超的高数技巧,所以我使用了OI的一些技巧来估计,不妨假设\(b_n^2 < < b_n\):

那么这个\(b_n\)\(O ( \frac{ \ln n }{ n^2 } )\)级别的.

如何理解这个级别?考虑别乱动\(b_n\)的系数,我们有:

\[ \begin{aligned} b_{ n + 1 } & = \frac{ n }{ n + 2 } b_n + \frac{ 1 }{ n ( n + 1 ) ( n + 2 ) } \\ ( n + 1 ) ( n + 2 ) b_{ n + 1 } & = n ( n + 1 ) b_n + \frac{ 1 }{ n } \\ g ( n ) & = n ( n + 1 ) b_n , g ' ( n ) = \frac{ 1 }{ n } , g ( n ) = \ln n \\ b_n & = \frac{ \ln n }{ n^2 } \end{aligned} \]

这警戒我们以后乱估计的时候千万别把\(O ( n^{ \epsilon } )\)\(O ( 1 )\)搞混了,警钟长鸣.

这个时候大概估计一下会发现\(b_n \leq \frac{ 3 \ln n }{ n ( n + 1 ) }\).

展开和收缩

Example1(平方和公式)

我们有:

\[ \begin{aligned} S_n & = \sum_{ k = 1 }^n k^2 \\ & = \sum_{ k = 1 }^n \sum_{ i = 1 }^k k \\ & = \sum_{ i = 1 }^n \sum_{ k = i }^n k \\ & = \sum_{ i = 1 }^n \frac{ 1 }{ 2 } ( i + n ) ( n - i + 1 ) \\ & = \sum_{ i = 1 }^n \frac{ 1 }{ 2 } ( in - i^2 + i + n^2 - ni + n ) \\ & = \frac{ 1 }{ 2 } ( \sum_{ i = 1 }^n i - \sum_{ i = 1 }^n i^2 + n^3 + n^2 ) \\ & = \frac{ 1 }{ 4 } n ( n + 1 ) - \frac{ 1 }{ 2 } S_n + \frac{ n^3 + n^2 }{ 2 } \end{aligned} \]

整理得到\(S_n\).

Example2(《具体数学》2.14)

\(\sum_{ i = 1 }^n i 2^i \\\).

Solution 2

\[ \begin{aligned} \sum_{ i = 1 }^n i 2^i & = \sum_{ i = 1 }^n \sum_{ j = 1 }^i 2^i \\ & = \sum_{ j = 1 }^n \sum_{ i = j }^n 2^i \\ & = \sum_{ j = 1 }^n ( 2^{ n + 1 } - 2^j ) \\ & = n 2^{ n + 1 } - ( 2^{ n + 1 } - 2 ) \\ & = ( n - 1 ) 2^{ n + 1 } + 2 \end{aligned} \]

Example3(《具体数学》2.15)

\(\sum_{ i = 1 }^n i^3 \\\).

Solution 3

\[ \begin{aligned} S ( n ) & = \sum_{ i = 1 }^n i^3 \\ & = \sum_{ i = 1 }^n \sum_{ j = 1 }^i i^2 \\ & = \sum_{ j = 1 }^n \sum_{ i = j }^n i^2 \\ & = \sum_{ j = 1 }^n ( \frac{ n ( n + 1 ) ( 2 n + 1 ) }{ 6 } - \frac{ ( j - 1 ) j ( 2 j - 1 ) }{ 6 } ) \\ & = \frac{ n^2 ( n + 1 ) ( 2 n + 1 ) }{ 6 } - \frac{ 1 }{ 3 } S ( n ) + \frac{ n ( n + 1 ) ( 2 n + 1 ) }{ 12 } - \frac{ n ( n + 1 ) }{ 12 } \\ S ( n ) & = \frac{ n^2 ( n + 1 )^2 }{ 4 } \end{aligned} \]

ExampleEX

\(\sum_{ i = 1 }^n iq^i ( q \ne 1 )\).

SolutionEX
$$ \[\begin{aligned} \sum_{ i = 1 }^n iq^i & = \sum_{ j = 1 }^n \sum_{ i = j }^n q^i \\ & = \sum_{ j = 1 }^n \frac{ q^j - q^{ n + 1 } }{ 1 - q } \\ & = \frac{ 1 }{ q - 1 } \sum_{ j = 1 }^n ( q^{ n + 1 } - q^j ) \\ & = \frac{ 1 }{ q - 1 } ( nq^{ n + 1 } - \frac{ q^{ n + 1 } - q }{ q - 1 } ) \\ \end{aligned}\]

$$

ExampleEX2

\(\sum_{ i = 1 }^n ( ai + b ) q^{ i - 1 } ( q \ne 1 )\).

SolutionEX2

\(A = \frac{ a }{ q - 1 } , B = \frac{ b - A }{ q - 1 }\),答案为\(( An + B ) q^n - B\).

有限微积分

移位算子

定义移位算子\(E\),使得\(Ef ( x ) = f ( x + 1 )\).

差分算子

定义差分算子\(\Delta f ( x ) = f ( x + 1 ) - f ( x )\),类似于无限微积分中的D算子.

另外,不难发现有\(\Delta = E - 1\).

逆差分算子

定义逆差分算子\(\Sigma\),可以得到有限微积分的基本定理:

$$ \[\begin{aligned} g ( x ) & = \Delta f ( x ) \Leftrightarrow \sum g ( x ) \delta x = f ( x ) + C \\ \end{aligned}\]

$$

这里的\(\Sigma\)又被称为不定和式,是差分等于\(g\)的一个函数类.

值得一提的是,这里的\(C\)与无限微积分中的\(C\)有一定区别,这里的\(C\)可以是满足\(p ( x ) = p ( x + 1 )\)的任意一个函数而不非得是常数函数.

定和式

如果\(g ( x ) = \Delta f ( x )\),那么有\(\sum \nolimits_{ a }^b g ( x ) \delta x = f ( x ) |^{ b }_a = f ( b ) - f ( a ) \\\).

值得一提的是,如果\(a \leq b\),显然有\(\sum \nolimits_{ a }^b g ( x ) \delta x = \sum_{ x = a }^{ b - 1 } g ( x ) \\\).

但如果\(a > b\),那么\(\sum \nolimits_{ a }^b g ( x ) \delta x = - \sum \nolimits_b^a g ( x ) \delta x \\\).

事实上,我们一定有:\(\sum \nolimits_a^b g ( x ) \delta x + \sum \nolimits_b^c g ( x ) \delta x = \sum \nolimits_a^c g ( x ) \delta x \\\).

一些基本的公式

类比无限微积分中的\(D ( x^m ) = mx^{ m - 1 }\),有:

$$ \[\begin{aligned} \Delta ( x^{ \underline{ m } } ) & = mx^{ \underline{ m - 1 } } \\ \sum mx^{ \underline{ m - 1 } } \delta x & = x^{ \underline{ m } } + C , m \ne 0 \\ \\ \end{aligned}\]

$$

类比无限微积分中的\(D ( \ln x ) = \frac{ 1 }{ x }\),有:

$$ \[\begin{aligned} \Delta ( H ( x ) ) & = x^{ \underline{ - 1 } } = \frac{ 1 }{ x + 1 } \\ \sum x^{ \underline{ - 1 } } \delta x & = H ( x ) + C \\ \\ \end{aligned}\]

$$

类比无限微积分中的\(D ( e^x ) = e^x\),有:

$$ \[\begin{aligned} \Delta ( 2^x ) & = 2^x , \sum 2^x \delta x = 2^x + C \\ \Delta ( c^x ) & = ( c - 1 ) c^x , \sum c^x \delta x = \frac{ c^x }{ c - 1 } + C , c \ne 1 \\ \Delta ( c^{ \underline{ x } } ) & = \frac{ c^{ \underline{ x + 2 } } }{ c - x } , \sum \frac{ c^{ \underline{ x + 2 } } }{ c - x } \delta x = c^{ \underline{ x } } + C , c - x \ne 0 \\ \end{aligned}\]

$$

根据组合数公式,有:

\[ \begin{aligned} \Delta ( \binom{ x }{ k } ) & = \binom{ x }{ k - 1 } \\ \sum \binom{ x }{ k - 1 } \delta x & = \binom{ x }{ k } + C \end{aligned} \]

Example(平方和公式)

我们有:\(k^2 = k^{ \underline{ 2 } } + k^{ \underline{ 1 } } \\\).

那么:

\[ \begin{aligned} S_{ n - 1 } & = \sum_{ i = 0 }^{ n - 1 } i^2 \\ & = \sum_{ i = 0 }^{ n - 1 } ( i^{ \underline{ 2 } } + i^{ \underline{ 1 } } ) \\ & = \sum \nolimits_{ 0 }^n x^{ \underline{ 2 } } \delta x + \sum \nolimits_{ 0 }^n x^{ \underline{ 1 } } \delta x \\ & = \frac{ n^\underline{ 3 } }{ 3 } + \frac{ n^{ \underline{ 2 } } }{ 2 } \end{aligned} \]

整理即可得到封闭形式.

值得一提的是:

与前面的方法不同,这里没有使用三次的二项式公式,而是使用了二次的斯特林公式负责将一般幂转化为下降幂.

高阶差分

考虑一阶差分是\(\Delta f ( x ) = f ( x + 1 ) - f ( x )\),那么二阶差分就是\(\Delta^2 f ( x ) = f ( x + 2 ) - 2 f ( x + 1 ) + f ( x )\).

类似地,我们可以通过归纳法证明\(\Delta^n f ( x ) = \sum_{ k } \binom{ n }{ k } ( - 1 )^{ n - k } f ( x + k ) \\\).

事实上有一种更简单的证明方法,由于\(\Delta = E - 1\),于是\(\Delta^n = ( E - 1 )^n = \sum_{ k } \binom{ n }{ k } ( - 1 )^{ n - k } E^k \\\),由于\(E^k f ( x ) = f ( x + k )\),即可证明原式.

另外,不难发现如果\(f ( x )\)是一个关于\(x\)\(d\)次多项式,那么\(\Delta f ( x )\)是一个\(d - 1\)次多项式.同理,\(\Delta^d f ( x )\)会是一个常数而\(\Delta^{ d + 1 } f ( x )\)会是\(0\),这个发现引出了牛顿级数.

Example([yLOI2020]灼)

首先不难发现对于一个位置,有意义的只有相邻的两个虫洞,设这两个位置分别为\(x_1 , x_2\).

不难写出期望转移式子:\(f_i = \cfrac{ 1 }{ 2 } ( f_{ i - 1 } + f_{ i + 1 } ) + 1\),并且\(f_{ x_1 } = f_{ x_2 } = 0\).

接下来如何做呢?

我们先对第一个式子进行变形:

\[ \begin{aligned} f_i & = \cfrac{ 1 }{ 2 } ( f_{ i - 1 } + f_{ i + 1 } ) + 1 \\ 2 f_i & = f_{ i - 1 } + f_{ i + 1 } + 2 \\ f_i - f_{ i - 1 } & = f_{ i + 1 } - f_i + 2 \\ \Delta f_{ i - 1 } & = \Delta f_{ i } + 2 \\ \Delta f_i - \Delta f_{ i - 1 } & = - 2 \\ \Delta^2 f_{ i - 1 } & = - 2 \end{aligned} \]

\(f\)的二阶差分是常数,也就是说\(f\)是二次多项式,不难求得其二次项系数为\(- 1\)又知道两个零点,显然可以得到\(f\)的表达式.

牛顿级数

\(f ( x ) = \sum_{ 0 \leq i \leq d } a_i x^i \\\).而由于有斯特林数可以进行幂和下降幂的转换,则我们可以将其改写为\(f ( x ) = \sum_{ 0 \leq i \leq d } b_i x^{ \underline{ i } } \\\).

我们设\(c_i = i ! b_i\),于是有:\(f ( x ) = \sum_{ 0 \leq i \leq d } c_i \binom{ x }{ i } \\\).

也就是说,任何多项式都可以表示为二项式系数的倍数之和,我们称这样的展开式为\(f ( x )\)的牛顿级数.

于是不难发现有:\(\Delta^n f ( x ) = \sum_{ 0 \leq i \leq d } c_i \binom{ x }{ i - n } \\\).如果我们令\(x = 0\),则有:\(\Delta^n f ( 0 ) = \begin{cases}c_n & n \leq d \\ 0 & n > d\end{cases}\).那么牛顿级数的另一种表示即:\(f ( x ) = \sum_{ 0 \leq i \leq d } \Delta^i f ( 0 ) \binom{ x }{ d } \\\).

另外,如果我们展开一下\(c_n = \Delta^n f ( 0 )\),我们可以得到公式:

\(\sum_{ k } \binom{ n }{ k } ( - 1 )^k ( \sum_{ 0 \leq i \leq n } c_i \binom{ k }{ i } ) = ( - 1 )^n c_n , n \in \mathbb{ N } \\\).

如果我们将多项式还原,由于\(a_n = b_n\),有:

\(\sum_{ k } \binom{ n }{ k } ( - 1 )^k ( \sum_{ 0 \leq i \leq n } a_i k^i ) = ( - 1 )^n n ! a_n , n \in \mathbb{ N } \\\).

另外,如果\(x \in \mathbb{ N }\),那么我们有:\(f ( x ) = \sum_{ 0 \leq k } \Delta^k f ( 0 ) \binom{ x }{ 0 }\),根据多项式推理法,这个公式对\(\forall x \in \mathbb{ Z }\)都成立.

于是我们可以类似泰勒级数写出无限牛顿级数:

\[ g ( a + x ) = \sum_{ 0 \leq k } \cfrac{ \Delta^k g ( a ) }{ k ! } x^{ \underline{ k } } \]

Example

\(\sum_{ k } \binom{ n }{ k } \binom{ r - sk }{ n } ( - 1 )^k , n \in \mathbb{ N } \\\).

如果我们令\(f ( k ) = \binom{ r - sk }{ n } = \sum_{ 0 \leq i \leq n } a_i k^i \\\),不难发现\(a_n = \cfrac{ ( - 1 )^n s^n }{ n ! }\),于是显然原式\(= s^n\).

分部求和法则(Abel求和法)
$$ \[\begin{aligned} \Delta ( uv ) & = u ( x + 1 ) v ( x + 1 ) - u ( x ) v ( x ) \\ & = u ( x + 1 ) v ( x + 1 ) - u ( x ) v ( x + 1 ) + u ( x ) v ( x + 1 ) - u ( x ) v ( x ) \\ & = v ( x + 1 ) \Delta u + u ( x ) \Delta v = Ev \Delta u + u \Delta v \\ \end{aligned}\]

$$

两边取不定和,即可得到分部求和法则:

\(\sum u \Delta v = uv - \sum Ev \Delta u \\\).

分部求和用一般和式表达如下,下式又被称为Abel求和法:

\[ \begin{aligned} \sum_{ i = l }^{ r - 1 } ( a_{ i + 1 } - a_i ) b_i & = a_r b_r - a_l b_l - \sum_{ i = l }^{ r - 1 } a_{ i + 1 } ( b_{ i + 1 } - b_i ) \\ \sum_{ i = l }^{ r - 1 } ( \Delta a_i ) b_i & = a_r b_r - a_l b_l - \sum_{ i = l }^{ r - 1 } a_{ i + 1 } ( \Delta b_i ) \end{aligned} \]

对于\(l = 0 , r = n , a_0 = b_0 = 0\)的特殊情况,应当有:

\[ \begin{aligned} \sum_{ i = 0 }^{ n - 1 } ( \Delta a_i ) b_i & = a_n b_n - \sum_{ i = 0 }^{ n - 1 } a_{ i + 1 } ( \Delta b_i ) \\ \sum_{ i = 1 }^n a_i ( b_{ i + 1 } - b_i ) & = a_n b_n - \sum_{ i = 0 }^{ n - 1 } ( \Delta a_i ) b_i \end{aligned} \]

取两组数列\(\alpha , \beta\),并令\(\sum_{ i = 1 }^n \beta_i = B_i\),立刻有:

\[ \sum_{ i = 1 }^n \alpha_i \beta_i = \alpha_n B_n - \sum_{ i = 1 }^{ n - 1 } ( \alpha_{ i + 1 } - \alpha_i ) B_i \]

Example1

\(\sum_{ k = 0 }^n k 2^k \\\).

根据分部求和法则,我们有:

\(\sum x 2^x \delta x = x 2^x - \sum 2^{ x + 1 } \delta x = x 2^x - 2^{ x + 1 } + C \\\).

改为定和式形式,显然有:

\(\sum_{ k = 0 }^n k 2^k = \sum \nolimits_0^{ n + 1 } x 2^x \delta x = ( n + 1 ) 2^{ n + 1 } - 2^{ n + 2 } + 2 = ( n - 1 ) 2^{ n + 1 } + 2 \\\).

Example2

\(\sum_{ k = 0 }^{ n - 1 } kH_k \\\).

\(u ( x ) = H_x , v ( x ) = \frac{ 1 }{ 2 } x^{ \underline{ 2 } } \\\).

带入分部求和法则,显然有:

\(\sum xH_x \delta x = \frac{ x^\underline{ 2 } }{ 2 } H_x - \frac{ x^\underline{ 2 } }{ 4 } + C \\\).

带入即可求出原式\(= \frac{ n^\underline{ 2 } }{ 2 } ( H_n - \frac{ 1 }{ 2 } ) \\\).

Example3(《具体数学》2.23)

\(\sum_{ i = 1 }^n \frac{ 2 i + 1 }{ i ( i + 1 ) } \\\).

Solution 3

\(u = ( 2 n + 1 ) , v = - \frac{ 1 }{ i }\),则\(\Delta u = 2 , \Delta v = \frac{ 1 }{ i ( i + 1 ) }\).

根据分部求和法则,有:

\[ \begin{aligned} \sum_{ i = 1 }^n \frac{ 2 i + 1 }{ i ( i + 1 ) } & = ( 2 n + 3 ) \times ( - \frac{ 1 }{ n + 1 } ) + 3 - \sum_{ i = 1 }^n ( - \frac{ 2 }{ i + 1 } ) \\ & = - \frac{ 2 n + 3 }{ n + 1 } + 2 H_n + \frac{ n + 3 }{ n + 1 } = 2 H_n - \frac{ n }{ n + 1 } \end{aligned} \]

Problem 4(《具体数学》2.24)

\(\sum_{ i = 0 }^{ n - 1 } \frac{ H_k }{ ( k + 1 ) ( k + 2 ) } \\\).

Solution 4

\(u = H_n , v = - \frac{ 1 }{ n + 1 } , \Delta u = \frac{ 1 }{ n + 1 } , \Delta v = \frac{ 1 }{ ( n + 1 ) ( n + 2 ) } \\\).

根据分部求和法则,有:

\[ \begin{aligned} \sum_{ i = 0 }^{ n - 1 } \frac{ H_k }{ ( k + 1 ) ( k + 2 ) } & = - \frac{ H_n }{ n + 1 } - \sum_{ i = 0 }^{ n - 1 } ( - \frac{ 1 }{ ( i + 2 ) ( i + 1 ) } ) \\ & = - \frac{ H_n }{ n + 1 } + \sum_{ i = 0 }^{ n - 1 } ( \frac{ 1 }{ i + 1 } - \frac{ 1 }{ i + 2 } ) \\ & = - \frac{ H_n }{ n + 1 } + H_n - ( H_n - 1 + \frac{ 1 }{ n + 1 } ) \\ & = 1 - \frac{ H_n + 1 }{ n + 1 } \end{aligned} \]

贪心

排除不优策略

Example1(CF1612E)

先把期望写开,我们发现如果选择了\(t\)个消息\(a_1 , a_2 , . . . , a_t\),那么答案就是\(\sum [ \exists j , m_i = a_j ] \cfrac{ \min ( t , k_i ) }{ t }\).显然如果\(t\)固定,那么每个\(a_j\)的贡献是独立的.于是只需要枚举\(t\)然后取贡献最大的.

但是,如果\(t > \max \{ k_i \}\),这个时候\(t - 1\)的答案是\(t - 1\)个数之和除以\(t - 1\),\(t\)的答案是这\(t - 1\)个数之和加上另一个更小的数除以\(t\),而前者肯定比后者大,于是不用再进一步枚举.

于是复杂度\(O ( n \max \{ k_i \} )\).

Example2(CF1592F1)

首先,二操作和三操作一定没有用,因为它们都可以用两次一操作代替.

再注意到四操作是可能有用的,因为我们拿一操作模拟四操作需要四金币的代价,而用一个四操作只需要三个金币.但是,由于拿一操作模拟四操作的时候,需要全局做一遍一操作,所以如果有两个四操作,模拟的时候两遍全局操作就可以抵消.因此,我们模拟两次四操作只需要六个金币的代价.换句话说,我们如果要用到四操作,只会使用一次或零次.

首先区间异或可以差分(\(b_{ i , j } = a_{ i , j } \oplus a_{ i + 1 , j } \oplus a_{ i , j + 1 } \oplus a_{ i + 1 , j + 1 }\))后转化为四个点的异或操作,而由于一操作操作了左上角的矩阵,所以它实际上是对三个在原矩阵外的点和一个在矩阵内的点操作.我们注意到如果矩阵内已经全都是\(0\)了,那么矩阵外不可能是\(1\),也就是原矩阵也全都是\(0\)了.

枚举一下最后的操作是啥即可,另外注意到这一步操作必须把四个点全部变成\(0\)才有用,不然还需要拿一操作去补,就不如直接用一操作.

Example3(CF1592F2)

首先注意到,如果我们对\(( x , y )\)使用操作四,那我们不可能再对一个\(( x , i )\)使用操作四,不然我们就可以用四次操作一代替这两次操作四.

再通过上面的分析,注意到只有\(b_{ x , y } , b_{ n , y } , b_{ x , m }\)都是\(1\)的时候才会使用四操作,不然,如果我们使用四操作,必然会再需要一个一操作来补,这样就是至少三个金币的代价.而由于这四个点中最多只有三个\(1\),所以一定不如直接用一操作来的划算.不然,如果三个都是\(1\),那么用了就一定不亏,因为无论如何也需要三次一操作,而就算我们用完后\(b_{ n , m }\)变成\(1\)了,再不行也可以使用一次\(1\)操作来补全.

因此我们现在想要选尽可能多的三操作,满足两两操作不在同一行或同一列,这显然是一个二分图匹配问题.换句话说,如果\(b_{ x , y } , b_{ n , y } , b_{ x , m }\)都是\(1\),我们就把\(x\)\(y\)连一条边,然后做二分图匹配,显然是最优的.

Example4(CF1666E)

先想一下别的东西怎么求.

如果我们要求最大值最小或者最小值最大怎么办?我们可以二分后贪心,而显然它们的差就是一个答案的下界,问题在于这个下界是否可以取到.

我们冷静一下,发现在可能的方案中,第\(i\)条线段的右端点的位置一定是一段连续的区间.

\(f_i\)表示第\(i\)个分界点可能的最小值,\(g_i\)表示第\(i\)个分界点可能的最大值.假设我们目前二分的最大值要小于等于\(mx\),最小值要大于等于\(mn\),那么我们有转移:

$$ \[\begin{aligned} f_{ i + 1 } & = \max \{ a_{ i + 1 } , f_i + mn \} \\ g_{ i + 1 } & = \min \{ a_{ i + 2 } , g_i + mx \} \\ \end{aligned}\]

$$

注意到\(f\)\(g\)的转移是无关的,而显然对于第\(i\)个分界点,它可以取\([ f_i , g_i ]\)中一个数,一定存在一个取法使得答案能取到下界.

为啥呢?只需让\(ans_{ i }\)表示第\(i\)条分界线是啥,那么我们\(ans_i\)是可以取\([ ans_{ i + 1 } - mx , ans_{ i + 1 } - mn ]\)中的任何一个数字的,我们将其和上面求出的\([ f_i , g_i ]\)求一下交集.如果交集为空,说明要么\(ans_{ i + 1 } - mn < f_i , f_{ i + 1 } < ans_{ i + 1 } < f_i + mn\),这是不可能的.另一种情况同理不可能,这就保证了一定可以取到答案.一定能使极差\(\leq mx - mn\).

Example5(2022zrtg十连测day7 Palindrome)

首先注意到同种字符的相对顺序不可能改变.于是最后的回文串是哪个字符对应哪个字符就可以确定.

这样我们的问题转化为现在有若干个点对\(( l , r )\),我们想给每一个点对赋值:\(a_l = i , a_r = n - i + 1\)(注意如果\(n\)是奇数,那么中心点应该是\(a_{ mid } = \frac{ n + 1 }{ 2 }\)),然后使整个序列逆序对数尽可能小.

接下来讨论一下两个点对\(( l_1 , r_1 )\),\(( l_2 , r_2 )\)之间的三种可能的关系:不交,包含,相交且不包含.会发现若\(l\)小则让\(a_l\)尽可能小就是最优的.

Example6(23省选10连测 day9 C)

强强题.

首先发现这个\(\pm 1\)操作很奇怪.我们不妨这么考虑:设最后的答案序列为\(b\),那么答案其实就是\(\sum | b_i - a_i |\).这实际上是什么呢?实际上是数轴上\(a_i\)\(b_i\)之间的距离.既然这样,那么我们同时反转\(a\)\(b\),这等价于翻转数轴,答案应该是不变的.这说明什么呢?如果我挑一个\(a\),将它和\(x\)同时反转,那么答案不变.这么做后我们可以直接清空所有\(a\)的最高位,只剩下\(x\)可能有最高位.

\(x\)的最高位一定会让若干\(a\)往上变成它.注意到最多只会有一个\(a\)会向上满足\(x\)的最高位.证明的话同样考虑取反,如果有两个\(a\)满足\(a_i \oplus b_i\)\(a_j \oplus b_j\)这一位是\(1\),我们仍然考虑数轴,有\(| not ( b_i ) - a_i | \leq | a_i - b_i |\),这由\(a_i \oplus b_i\)最高位是\(1\)导出.因此两个都取反一定不劣.

再考虑,我们会让哪个\(a\)上去满足呢?自然的想法是取代价最小的那个,因为就算它不是,这里自然地有一个待悔贪心:其它的\(a\)可以再变成它.

于是就做完了.

Example7(异或粽子)
Example8()

带悔贪心

Example1

给定一个数组,给出若干次操作\([ l , r , k ]\)表示可以将\(a [ l \cdots r ]\)减一进行至多\(k\)次,要求操作过程中数组时刻非负,求最大能做出的操作次数.

这题的做法是,我们每次遇到一个左端点,就将所有以它为左端点的区间全部操作,并把这些区间按照右端点为关键字扔进堆里.每次遇到一个地方的值变成了负的,就从堆中找右端点最大的区间杀掉.容易发现这样是正确的.

为啥能想到带悔贪心呢?主要是因为我们发现不同的区间会彼此影响,而且有一个限制性的长期条件.因此先不管这个条件,最后再通过调整堆将这个条件调整至合法.

Example2

给定一个序列,每次可以选择相邻的两个数,使其中一个\(- 1\),另一个\(- 2\),求使得整个序列都小于等于\(0\)的最小操作次数.

我们明确一下带悔贪心的基本条件:

  1. 首先,贪心是需要保证局部最优性的,并且需要保证不考虑全局的前提下,求局部最优解就是全局最优解的一部分.按我的理解,贪心是和dp一样需要有无后效性的,你前面的决策做了就是做了,带悔贪心只能改变后面的决策的形态,而不能改变前面的决策.

  2. 不同的操作之间会彼此影响,并且我们在不看全局的状态的前提下,无法第一时间确定当前对后面最优影响的操作是啥.通常情况下,感觉带悔贪心的每个操作会影响的操作是有限的.

  3. 感觉能做带悔贪心的好像很多都可以设计一个复杂度更高的dp.不过这个似乎很合理,因为(2)告诉我们它能影响的操作大概率是不多的.

我们看这个题,第一点基本随便编个贪心都可以满足:就是先不断做\(( - 2 , - 1 )\),最后不够了再加个\(( - 1 , - 2 )\)补一下.而第二点呢?显然每个地方的操作只会影响前后两个位置接下来的操作(当然,被影响到的位置有可能继续影响别人).

那么为什么能想到带悔贪心呢?其实只要发现有的时候\(( - 1 , - 2 ) + ( - 1 , - 2 )\)\(( - 2 , - 1 )\)更优秀就自然能引到带悔贪心了.

好,现在我们仍然是做那个看上去就不太对的贪心:先不断做\(( - 2 , - 1 )\),最后不够了再加个\(( - 1 , - 2 )\)补一下.我们通过样例以及其它栗子发现:有的时候\(( - 1 , - 2 ) + ( - 1 , - 2 )\)\(( - 2 , - 1 )\)更优秀,这启发我们:能不能在做后面位置的时候将前面的\(( - 2 , - 1 )\)变成\(( - 1 , - 2 ) + ( - 1 , - 2 )\)呢?注意这里我们不能直接换:带悔贪心要求我们不能改变前面操作的状态.因此我们引入一个操作:如果当前前面存在一个\(( - 2 , - 1 )\)操作,那么我可以在这个位置进行一个\(( 0 , - 3 )\)操作.显然\(( 0 , - 3 ) + ( - 2 , - 1 ) = ( - 1 , - 2 ) + ( - 1 , - 2 )\).我们完成了反悔的操作!

但是,我们直接认为\(( - 1 , - 2 )\)不可能反悔的原因是:它是一个补位操作,一个位置只有可能进行一次,这玩意不可能能反悔.可现在不一样了,我们的操作序列中有了两个\(( - 1 , - 2 ) + ( - 1 , - 2 )\),怎么办呢?你当然可以对着这个操作再观察怎么反悔,但事实上有更高效的思路:我们直接考虑\(( - 3 , 0 )\)怎么反悔.这个看上去很疑惑:我们为了使\(( - 2 , - 1 )\)变成\(( - 1 , - 2 ) + ( - 1 , - 2 )\)而引入了一个新操作,这个新操作在原序列中是不存在的:它甚至有个很奇怪的限制条件:必须在前面存在\(( - 2 , - 1 )\)的时候才可以发动.那为什么我们可以直接考虑它如何反悔呢?

先看第一个问题:\(( - 3 , 0 )\)这个技能的发动是有前提条件的:前面必须有\(( - 2 , - 1 )\)才可以.但你注意我们是在贪心啊,我们很清楚每个地方用了几个\(( - 2 , - 1 )\),也很清楚每个地方用了几个\(( - 3 , 0 )\).

再看第二个问题:这个新操作为何能反悔呢?其实第一个问题解决这个问题也就解决了,由于贪心,我们知道了巨大多的信息,这个信息量是dp不能比的.因此这个条件如果dp的话看上去需要多记一维,但是贪心完全不用.

我们可以根据类似上面的操作迅速编出它怎么反悔:\(( - 3 , 0 ) \rightarrow ( - 1 , - 2 ) + ( - 2 , - 1 ) = ( - 3 , 0 ) + ( 0 , - 3 )\),或者\(( - 3 , 0 ) \rightarrow ( - 1 , - 2 ) + ( - 1 , - 2 ) + ( - 1 , - 2 ) = ( - 3 , 0 ) + ( 0 , - 3 ) + ( 0 , - 3 )\).

最后遇到一个点,能用\(( 0 , - 3 )\)就用\(( 0 , - 3 )\),不够用的再补齐.这个原因也很简单:如果我们在这里不用\(( - 3 , 0 )\)而用其它的代替的话,你会发现无论如何都等价于\(( - 3 , 0 )\)然后后面再反悔.

再总结一下这个题中包含的带悔贪心:

这个带悔贪心包含若干个操作,这些操作之间可以互相转化,使得在前面进行的一个操作可以和在后面进行的一个操作一起,等价于前面进行了另一个操作.如同最经典的带悔贪心的模型,我们每次进行一个操作后,都会加入若干个可以进行的操作(在这个题中,一开始就在每个位置加入了无穷多的\(( - 2 , - 1 )\)\(( - 1 , - 2 )\)的操作)(写一下代码就会发现,我们其实记录下了每个位置插入了多少个可行的\(( - 3 , 0 )\)操作).这些操作构成一个封闭的东西,使得反悔任意一个操作的反悔操作本身都可以使用若干操作表示出来.

寻找下界并证明

Example1([EER1]代价)

给你一个长度为\(n\)的序列\(a\),保证\(a_1 = a_n = 1\).每次你可以选择一个\(i ( 1 < i < n )\)\(a_i\)删去并付出\(a_{ i - 1 } a_i a_{ i + 1 }\)的代价.删去\(a_i\)后序列两端会接起来,求删成两个\(1\)的最小代价.

首先注意到,如果有一个\(1 < i < n\)满足\(a_i = 1\),那这个点最后删显然更优秀:如果我们把它删了,不仅肯定比最后删它劣(最后删它只需要\(1\)的代价),还有可能使原本能和它相邻的点这次和一个更大的数相邻了,显然不优秀.因此整个序列被若干个\(1\)所划分.接下来我们只考虑中间所有数\(\geq 2\)的情况.

再思考一个事实:当\(a , b \geq 2\)时,一定有\(ab \geq a + b\).而考虑每两个相邻的点一定会被乘起来扔进答案,也就是说答案下界一定是\(\sum_{ i = 2 }^{ n - 2 } a_i a_{ i + 1 } + \min_{ i = 2 }^{ n - 1 }{ a_i }\).注意到这个下界是可以构造出来的:找到每一段最小的点然后从左/右挨个删点即可.

Example2(loj3318)

首先考虑:给出一个排列,从原排列换到它的最小步数一定是它的逆序对数.因为我们可以每次找到应当被放到边界的点,然后不断把它换过去.

考虑现在构造\(a\)数组,每次对于还没选的最大值,显然要扔到尽可能靠后的位置,然后不断递归处理.

Example3

给定一张图,每个点上有一个权值\(a_i\),我们每次可以删掉一个点以及其所有连边,代价是所有相邻的点的权值和.求删光图的最小代价.

首先注意到答案一共要更新边数次,不妨考虑边.

一条边可能对答案有两种贡献,也就是与它相邻的两个点的点权.它会对答案贡献后删的那个点的点权.显然所有边取最小值时是一个下界.这个下界是可以构造出来的:我们按照点权从大往小删即可.

Example4([UOJ280]题目难度排序)

先考虑\(a_i\)互不相同,那可以每次选一个最大的数,满足它加进去后整个集合的中位数\(\leq\)还没选的数的最小的数.注意到这里一定能构造出合法解,且如果选了另一个数一定更劣.

那如果可能存在\(a_i\)相同呢,我们先按照大小排序,然后选出一对小于等于所有数的中位数的\(( a_i , a_{ i + 1 } )\),然后这么选:\(a_i , a_{ i + 1 } , a_n , a_{ i - 1 } , a_{ n - 1 } , a_{ i - 2 } . . .\),一直到左边全部被填完,然后按照互不相同的方法填.

首先这么做一定是合法解,因为中位数会在\(a_i\)上震荡.其次这么做为什么是最优解呢?我们考虑一开始如果选了另一对大于中位数的相等的数,那一定不合法,因为最后会剩一些小数,会把这些东西震荡到一个更小的中位数.而如果一开始选了一个单点,接下来一定要不断选更大的点,这样比它小的数就没法加进去了.而等左边全部被填完后,由于这个时候中位数已经没有办法保持不变了,所以必定接下来要增大,而中位数不断增大只能按照互不相同的方法填.

Example5([CF1098D]Eels)

首先,我们猜测:我们一开始先让最小的两个互相吃,可能是最优秀的.接下来我们尝试证明这个猜测.

首先,对于一个不危险的操作来说,假设这次操作的两个数是\(a\)\(b\),其中\(2 a < b\).我们尝试判断一下这个操作满足什么条件.这个时候,注意到如果\(b\)之前吃过别的鱼,假设是\(c\)\(d\)(不妨假设\(d \geq c\)),有\(b = c + d\),由鸽笼原理,发现\(d > a\).这意味着:如果\(a\)都没被操作掉,那么\(d\)必不可能被操作掉,这也就是说\(b\)不可能出现.因此\(b\)在这次操作前一定没有吃过别的鱼.那互相残杀的鱼的重量就都一定小于\(b\),且\(a\)就是所有一开始小于\(b\)的鱼的和.

我们按照鱼的重量从小到大排序,你会发现一次不危险操作涉及到的鱼一定是一条满足自己大于比自己小的所有鱼的重量和的两倍的鱼,我们称其为大鱼,也就是\(w_i > 2 \sum_{ j = 1 }^{ i - 1 } w_j\),我们对此计数就可以完成一次操作.

那么问题又来了,这个东西一定是最小的吗?

我们考虑一个事实:我们要最小化不危险操作的数量,但很明显的一点是:每只大鱼都必须经过一次不危险操作才能变成一只更大的鱼,当然,如果它选择自杀,那么吃掉它的那只鱼会继承它的地位,在不死的情况下仍然要进行至少一次不危险操作才能变成更大的鱼,因此这显然是一个下界.而又可以构造出答案.

那么如何多组询问呢?首先发现大鱼不会很多,最多\(\log w\)个,我们考虑一下这个两倍的用处,我们按照值域\([ 1 , 1 ] , [ 2 , 2 ] , [ 3 , 4 ] , [ 5 , 8 ] , . . . , [ 2^{ k - 1 } + 1 , 2^k ]\)将鱼分成若干组,不难发现大鱼只有可能是每个区间中最小的数字,因为不然,那么这个区间中最小的数字乘以二一定比它自己大.这个东西就很好维护了.

Example6(称球游戏)

给定\(n\)个球(其中有一个次品球,重量和其它球不一样)和一架天平,求最少通过多少次操作才能找到这个球.

我们通过这个游戏来引入信息论和判定树作为一个构造下界的工具.

首先引入一套语言体系来简化文字:

  1. \(S\)表示标准球.

  2. \(< A , B >\)表示称量集合\(A\)和集合\(B\),\(< A , B > = 0\)表示平衡,\(< A , B > = A\)表示\(A\)较重,\(< A , B > = B\)表示\(B\)较重.

信息论

如果一个随机变量\(x\)\(n\)种取值,出现概率分别为\(p_1 , p_2 , \cdots , p_n\),则其熵为\(H ( x ) = f ( p_1 , p_2 , \cdots , p_n ) = \sum{ C p_i \ln \frac{ 1 }{ p_i } }\),\(C\)为正整数,通常取\(1\).(事实上这里的定义与真正的信息论的定义有一定的差别,不过原理是类似的,这里简化了一些.)

定理1:在得到关于随机变量\(x\)的一个熵为\(h\)的信息后,\(x\)的熵会减少\(h\).

定理2:当一个随机变量的各种取值概率相等时,它的熵最大.

用信息论估计一下称球游戏的上界,如果我们已知次品轻重,由于一共有\(n\)个球,每个球等概率成为次品,因此总熵是\(\ln n\),每称一次能得到的信息有三种:平衡,左边重,右边重,因此称一次能得到的熵是\(\ln 3\),也就是说我们至少要猜\(\frac{ \ln n }{ \ln 3 } = \log_3 n\)次.如果我们不知道次品的轻重,那么至少要猜\(\frac{ \ln 2 n }{ \ln 3 } = \log_3 2 n\)次.

这就是称球游戏的信息论下界,接下来我们要做的无非就是证明这个下界能否取得到.

判定树

我们考虑将称量的决策树建立出来,每个叶子节点表示我们得到的答案,每个非叶子节点代表一次称量,每个非叶子节点有三个儿子,分别表示如果称量的结果是左偏/右偏/平衡时,接下来的策略.显然判定树的深度就是最坏情况下称量的次数.

\(n\)个叶子的树的最小深度是\(\lceil \log_3 n \rceil\),这得出和信息论一样的下界估计(信息论的结论好像就是拿哈夫曼树证明的,不太懂).

子问题1(已知次品重量)

不妨假设\(f ( n )\)表示有\(n\)个球的最少次数,注意到\(f ( 3 ) = 1\).

根据信息论,\(f ( n ) \geq \lceil \log_3 n \rceil\),下面证明等号成立:

首先考虑证明\(f ( 3^m ) = m\),\(m = 1\)时已经得证.\(m > 1\)时,考虑将所有球分成等数量的三份,称量其中两份.由于已知次品重量,这一次就可以找到次品在哪一份中,因此\(f ( 3^m ) \leq f ( 3^{ m - 1 } ) + 1\).综合信息论下界\(f ( 3^m ) \geq m\),我们不难得出以上结论.至于\(n \ne 3^m\)的情况,我们类似这个过程按照\(n \bmod 3\)的值讨论一下即可,于是有\(f ( n ) \leq f ( \lceil \frac{ n }{ 3 } \rceil ) + 1\).

子问题2(不知次品轻重,已有一个标准球,需知道次品轻重)

根据信息论下界,\(f ( n ) \geq \lceil \log_3 2 n \rceil\).

比起上面的问题,这个问题在于:如果我们称量不平衡,是不知道次品球在两堆中的哪一堆的.但我们思考到:虽然我们不知道在哪一堆,但我们得到了一个额外的信息:如果它在哪一堆,它的重量我们也就知道了.

下面证明引理:

引理

有两堆球,第一堆有\(n\)个球,第二堆有\(m\)个,已知其中有一个次品,并且次品如果在第一堆中只可能是重球,在第二堆中只可能是轻球.设此时的称量次数是\(g ( n , m )\),则\(g ( n , m ) = \lceil \log_3 ( n + m ) \rceil\).

先证明信息论下界,不难发现仍然是\(g ( n , m ) = \lceil \log_3 ( n + m ) \rceil\).

首先不难发现,\(g ( 1 , 0 ) = g ( 0 , 1 ) = 0 , g ( 1 , 1 ) = g ( 2 , 0 ) = g ( 0 , 2 ) = 1\).

仍然使用数学归纳,假设\(n + m < k ( k \geq 3 )\)的时候成立,我们接下来证明\(n + m = k\)的时候仍然成立.

情况1

\(n = 3 p , m = 3 q\),我们将\(n\)分成等数量的三堆:\(A_1 , B_1 , C_1\),将\(m\)分成等质量的三堆\(A_2 , B_2 , C_2\).

接下来称量\(\langle A_1 + A_2 , B_1 + B_2 \rangle\).

  1. 如果\(\langle A_1 + A_2 , B_1 + B_2 \rangle = 0\),那么答案在\(C_1 \cup C_2\)中,此时有\(g ( n , m ) = g ( \frac{ n }{ 3 } , \frac{ m }{ 3 } ) + 1\).

  2. 如果\(\langle A_1 + A_2 , B_1 + B_2 \rangle = A_1 + A_2\),由于若次品在\(A_2\)中,那么它不可能是重球,因此次品不可能在\(A_2\)中,同理不可能在\(B_1\)中,只可能在\(A_1 \cup B_2\)中,此时有\(g ( n , m ) = g ( \frac{ n }{ 3 } , \frac{ m }{ 3 } ) + 1\).

  3. \(\langle A_1 + A_2 , B_1 + B_2 \rangle = B_1 + B_2\),同理.

此时数学归纳成立.

情况2

\(n = 3 p + 1 , m = 3 q + 2\).此时我们将第一堆分成\(A_1 ( p ) , B_1 ( p ) , C_1 ( p + 1 )\),将第二堆分成\(A_2 ( q + 1 ) , B_2 ( q + 1 ) , C_2 ( q )\),然后\(\langle A_1 + A_2 , B_1 + B_2 \rangle\),接下来和情况1一样,于是有\(g ( n , m ) = \max \{ g ( p , q + 1 ) , g ( p + 1 , q ) \} = \lceil \log_3 \frac{ n + m }{ 3 } \rceil + 1\).

同理,当\(n , m \bmod 3\)的值是其它组合的时候,也都可以类似操作.引理得证.

由此引理得证.

回到原问题,进行数学归纳,我们继续来讨论\(n \bmod 3\)的值.

情况1

\(n = 3 p\)时,直接分成\(A ( p ) , B ( p ) , C ( p )\),然后\(\langle A , B \rangle\).如果平衡则接下来需要\(f ( p ) = \lceil \log_3 2 p \rceil\)次,不然根据引理,需要\(\lceil \log_3 ( p + p ) \rceil\)次,因此\(f ( n ) = \lceil \log_3 2 p \rceil + 1 = \lceil \log_3 6 p \rceil = \lceil \log_3 2 n \rceil\).

情况2

\(n = 3 p + 1\)时,一种自然的想法是分成\(A ( p + 1 ) , B ( p ) , C ( p )\),但是这种想法是错误的!我们考虑判定树,这种情况下,所有的叶子被分成了\(2 p + 2 , 2 p , 2 p\),这显然是不优秀的.正确的做法是分成\(A = \{ S , 1 , \cdots p \} , B = \{ p + 1 , \cdots 2 p + 1 \} , C = \{ 2 p + 2 , \cdots 3 p + 1 \}\).由于存在标准球,此时如果\(\langle A , B \rangle = A \ or \ B\),那么转化成\(g ( p , p + 1 ) = \lceil \log_3 ( 2 p + 1 ) \rceil\),不然转化成\(f ( p ) = \lceil \log_3 2 p \rceil\).

剩下的情况也都类似,该问题解决.

子问题3(不知次品轻重,无标准球,需知道次品轻重)

考虑在第一次称量后,无论结果如何都会得到一个标准球,因此后面的问题都等价于子问题2,只需考虑第一次操作.再思考一下不难发现,在子问题2中,只有\(n \bmod 3 = 1\)的时候才会需要用到标准球,因此只有这里需要多一步.拟合一下函数,可以得到该问题\(f ( n ) = \lceil \log_3 ( 2 n + 2 ) \rceil\).

子问题4(不知次品轻重,已有一个标准球,无需知道次品轻重)

这个问题复杂一些,而且难以估计下界.但我们可以用一下最优化dp来估计下界.

首先假设有无穷个标准球,我们每次将\(a\)个球放左边,\(b\)个球放右边,\(a \leq b\),在左边补上\(b - a\)个标准球.

  1. 如果天平不平衡,转化为引理问题(因为此时找到次品是谁必然知道它的轻重),因此需要\(\lceil \log_3 ( a + b ) \rceil + 1\)步.

  2. 如果天平平衡,需要\(f ( n - a - b ) + 1\)步.

我们有\(f ( n ) = \min_{ a , b } \{ \max \{ f ( n - a - b ) , \lceil \log_3 ( a + b ) \rceil \} \} + 1\).

注意到接下来的步数只与\(a + b\)有关,取\(b - a \leq 1\),于是一个标准球已经够用了.

构造方程后手算几项,注意到\(f ( n ) = \lceil \log_3 ( 2 n - 1 ) \rceil\).

接下来归纳法就简单了,只需要对于\(n \bmod 3\)的余数讨论一下,然后再讨论一下\(a\)的取值即可.

Example7(Ucup 3rd Stage 8 H)

每次可以询问一个区间,交互库返回这个区间中的次大元素所在位置,求\(n\)所在位置.要求询问次数\(\leq \lceil 1 . 5 \log_2 n \rceil\),询问区间总长度\(\leq 3 n\).

一个自然的想法是先问一下全局次大值,然后二分,但这样询问区间总长度就会爆掉.

因此考虑设\(T ( n )\)表示长度为\(n\)的,已知次大值(并且次大值)的最小次数.我们考虑每次判断一下最大值在哪边,因此把这个区间拆成两半,然后询问一下次大值所在的那一半,这样就可以判断最大值在不在那一半.

那么我们当然有方程\(T ( n ) = \min_{ m < n } \{ \max \{ T ( m ) + 1 , T ( n - m ) + 2 \} \}\).

当然有\(m_n \leq m_{ n + 1 }\),于是直接dp即可.

Exchange Arguments

模型1

给定\(n\)个元素\(x_1 , . . . , x_n\),以及一个定义域为这些元素的序列,定义域为有序集合的函数\(F\).求出对于所有的\(n\)阶排列\(p\),表达式\(F ( \{ x_{ p_1 } , x_{ p_2 } , . . . , x_{ p_n } \} )\)最小值.

事实上会发现一些NPC问题也可以直接转化为这个模型,但是并无贪心解.我们接下来考虑这个模型内哪些问题是有贪心解的.

Example1(国王游戏)

给定\(n\)个二元正整数对\(( a_i , b_i )\),将它们按照任意顺序排成一列.定义排成一列的代价为每个二元组的\(a\)乘上序列中这个二元组之后的所有二元组的\(b\)之和的总和,求最小代价.\(n , a_i , b_i \leq 10^6\).

转化为上面的形式,也即:\(F ( \{ ( a_1 , b_1 ) , . . . , ( a_n , b_n ) \} ) = \sum_{ 1 \leq i < j \leq k } a_i b_j\).

考虑调整法,令排列\(( q_1 , . . . , q_n ) = ( p_1 , . . . , p_{ i - 1 } , p_{ i + 1 } , p_i , p_{ i + 2 } , . . . , p_n )\).则:

\[ F ( \{ ( a_{ p_1 } , b_{ p_1 } ) , . . . , ( a_{ p_n } , b_{ p_n } ) \} ) - F ( \{ ( a_{ q_1 } , b_{ q_1 } ) , . . . , ( a_{ q_n } , b_{ q_n } ) \} ) = a_{ p_i } b_{ p_{ i + 1 } } - a_{ p_{ i + 1 } } b_{ p_i } \]

因而如果\(a_{ p_i } b_{ p_{ i + 1 } } - a_{ p_{ i + 1 } } b_{ p_i } > 0\),则\(F ( \{ ( a_{ p_1 } , b_{ p_1 } ) , . . . , ( a_{ p_n } , b_{ p_n } ) \} ) > F ( \{ ( a_{ q_1 } , b_{ q_1 } ) , . . . , ( a_{ q_n } , b_{ q_n } ) \} )\),也就是说\(( p_1 , . . . , p_n )\)不是最优解.因此只有满足\(\forall 1 \leq i < n\),\(\cfrac{ a_{ p_i } }{ b_{ p_i } } \leq \cfrac{ a_{ p_{ i + 1 } } }{ b_{ p_{ i + 1 } } }\)可能是最优解.

如果一个\(p\)满足这样的性质,则所有\(\cfrac{ a }{ b }\)相等的数在排列中一定是连续的一段.而根据式子,这样的排列交换\(\cfrac{ a }{ b }\)相等的两个位置,是不会使答案改变的.因此直接按照\(\cfrac{ a }{ b }\)排序即可.

我以前所使用的调整法大概是先构造一个贪心策略,然后证明这个策略改变后一定不优秀或更劣.但是这样对于多峰函数会卡在一个局部最优解上而找不到全局最优解.但是,如果我们说不满足这个条件的一定不是最优解(可以使用调整得到更优解),我们再证明满足这个条件(即调整过程DAG的终止点)的都是最优解,继续做下去,就是很严谨的.

换句话说,我们要用调整法,就一定要证明调整过程中的DAG的零出度点是最优解.

模型通解

设给出的元素的集合为\(S\),定义\(S\)上的一种二元比较关系\(\leq\),将所有元素按照比较关系排序.在上一个问题中,不难发现以下性质:

  1. 强完全性:\(\forall a , b \in S\),\(a \leq b \lor b \leq a = 1\).

  2. 传递性:\(\forall a , b , c \in S\),\(a \leq b , b \leq c \Rightarrow a \leq c\).

  3. \(\forall a , b \in S\),如果\(a \leq b\),则对于任意一个包含\(\{ a , b \}\)作为子段的元素序列\(\{ s_1 , . . . , s_{ k - 1 } , a , b , s_{ k + 2 } , . . . , s_n \}\)\(\{ s_1 , . . . , s_{ k - 1 } , b , a , s_{ k + 2 } , . . . , s_n \}\)都有:\(F ( \{ s_1 , . . . , s_{ k - 1 } , a , b , s_{ k + 2 } , . . . , s_n \} ) \leq F ( \{ s_1 , . . . , s_{ k - 1 } , b , a , s_{ k + 2 } , . . . , s_n \} )\).

问题满足以上性质,那么我们按照这种二元比较关系对元素排序后的答案一定是最优的.原因在于,首先这种操作构成DAG,而定义\(\leq\)后自然也就定义了\(=\),所以DAG的零出度点自然是最优解点.

分析题目时,应该先分析第三条性质得到\(\leq\)的定义,然后判断是否符合前两条性质.

Example2

给定\(n\)个包含小写字符的字符串\(s_1 , . . . , s_n\),找到一个\(n\)阶排列\(p\),将\(s_{ p_1 } , s_{ p_2 } , . . . , s_{ p_n }\)顺序拼接得到\(S\),使\(S\)的字典序最小.

\(s \leq t\)当且仅当\(s + t\)的字典序\(\leq\)t+s

此时我们注意到:\(s + t\)的字典序小于等于\(t + s\)的字典序当且仅当\(s^{ \infty } \leq t^{ \infty }\).原因是:不妨设\(s\)的长度\(\leq t\)的长度.若\(s\)不是\(t\)的前缀,那显然只需比较\(t\)的前缀和\(s\)的字典序即可,此时上面两个条件等价;若\(s\)\(t\)的前缀,则我们需要比较\(t\)的前缀和\(t\)的后缀,注意到\(t\)的前缀还是\(s\),于是需要比较\(s\)\(t\)的后缀.类似可得.

于是这题可以使用后缀数组求任意两个字符串的后缀的最长公共前缀实现.

Example3

\(n\)个箱子,第\(i\)个箱子有重量\(w_i\)和承载量\(v_i\),\(( w_i , v_i > 0 )\),将它们堆成一列使得每一个箱子上面的箱子总重量都不大于它的承载量.

考虑最大化\(\min_{ i = 1 }^n \{ v_i - \sum_{ j = 1 }^{ i - 1 } w_j \}\),并判断是否\(\geq 0\).

我们令\(b_i = - ( v_i + w_i ) , a_i = - v_i\),则我们要最大化\(\min \{ \sum_{ j = 1 }^{ i - 1 } b_i - \sum_{ j = 1 }^i a_i \}\).

我们接下来将证明所有形如这样的题的通法.

首先,定义\(x \leq y\)当且仅当\(F ( \{ x , y \} ) \leq F ( \{ y , x \} )\),那么对于两个元素\(( a_1 , b_1 ) , ( a_2 , b_2 )\),显然\(( a_1 , b_1 ) \leq ( a_2 , b_2 )\)当且仅当\(\min \{ - a_1 , b_1 - a_1 - a_2 \} \geq \min \{ - a_2 , b_2 - a_1 - a_2 \}\).接下来我们证明这样的定义是满足性质的.

对于性质(3),显然成立,因为交换两个相邻位置不会对前面或后面产生影响,而前后对于这两个位置的影响也都可以抵消.

性质(1)显然成立.

再分析一下这个式子,这相当于不等式左边的两个元素都大于等于右边的最小值.我们讨论一下两种情况:

  1. 都大于等于第一个元素,则相当于\(a_1 \leq a_2 \land b_1 - a_1 \geq 0\).

  2. 都大于等于第二个元素,则相当于\(b_1 \geq b_2 \land b_2 - a_2 \leq 0\).

可能这里后面和\(0\)比较没有移项来得简洁.但是,相减的两项是同一个元素的两项,我们显然把它俩放在一类是更优秀的.

注意到需要对\(b - a\)的符号进行讨论:

  1. \(sgn ( b_1 - a_1 ) > sgn ( b_2 - a_2 )\),则不等式成立.

  2. \(sgn ( b_1 - a_1 ) = sgn ( b_2 - a_2 ) = 1\),则不等式成立当且仅当\(a_1 \leq a_2\).

  3. \(sgn ( b_1 - a_1 ) = sgn ( b_2 - a_2 ) = 0\),则不等式成立.

  4. \(sgn ( b_1 - a_1 ) = sgn ( b_2 - a_2 ) = - 1\),则不等式成立当且仅当\(b_1 \geq b_2\).

这四条中(2)和(4)的证明是显然的,(3)则是因为此时\(b_1 = a_1\),\(b_2 = a_2\),两条件必有一真.(1)则是因为此时满足\(b_1 - a_1 > b_2 - a_2 \land sgn ( b_1 - a_1 ) \geq 0 \land sgn ( b_2 - a_2 ) \leq 0\).也就有\(a_2 - a_1 > b_2 - b_1 \land b_1 \geq a_1 \land b_2 \leq a_2\).怎么着都能成立.

由此发现,对于\(sgn ( b - a )\)相同的类,内部排序是一定满足传递性的.

但是不同类之间并没有满足传递性,因此我们把排序条件修正为:

\[ \begin{aligned} ( a_1 , b_1 ) & \leq ( a_2 , b_2 ) \\ \Updownarrow \\ ( sgn ( b_1 - a_1 ) & > sgn ( b_2 - a_2 ) ) \\ \lor ( sgn ( b_1 - a_1 ) & = sgn ( b_2 - a_2 ) \land F ( \{ 1 , 2 \} ) \leq F ( \{ 2 , 1 \} ) \end{aligned} \]

模型2

给定\(n\)个元素\(x_1 , . . . , x_n\),以及一个定义域为这些元素的序列,值域为有序集合的函数\(F\).求出对于给定整数\(k\),所有的\(n\)阶排列\(p\)的长度为\(k\)的子序列,表达式\(F ( \{ x_{ p_1 } , x_{ p_2 } , . . . , x_{ p_k } \} )\)最小值.

如果\(k = n\),则就是模型1.不然,我们考虑先选出一个大小为\(k\)的子集,然后使用模型1.不难发现,我们最后取出的\(\{ x_{ p_1 } , x_{ p_2 } , . . . , x_{ p_k } \}\)一定是\(n = k\)时最优解的一个子序列.这在一些情况下可以降低问题的难度.

Example

\(n\)个物品,第\(i\)个物品有非负费用\(c_i\)和价值\(v_i\),两个人进行如下博弈:

  1. 第一个人要么选择一个物品,付出\(c_i\)的代价;要么选择结束游戏.

  2. 第二个人可以选择删除这个物品,这会使博弈回到第一步,且第一个人付出的代价不会消失(这个操作最多可以进行\(k\)次);也可以选择不操作,此时第一个人获得\(v_i\)的收益,博弈结束.

  3. 第一个人的总收益为收益减去付出的所有代价,第一个人希望最大化收益,第二个人希望最小化收益.\(( n \leq 1 . 5 \times 10^5 , k \leq 9 )\)

注意到第一个人要么一开始就结束游戏,要么连续选择\(k + 1\)个,然后收益为\(\min_{ i = 1 }^{ k - 1 } \{ v_{ x_i } - \sum_{ j = 1 }^i c_{ x_j } \}\)(如果第一个人把一个收益很大的放在最后选,那第二个人可以直接结束游戏防止他选到).注意到这和模型1的Example3是类似的,于是我们可以先排序,然后dp出子序列,复杂度\(O ( n \log n + nk )\).

构造

增量构造

Example1

平面上有\(n\)条直线,将整个平面划分成若干部分.求证:这些部分可以黑白染色使得两个边相邻的部分颜色不相同,并给出构造方案.

考虑数学归纳,现在已经有\(n\)条直线的答案,求\(n + 1\)条直线的答案.我们将直线加到这个平面上,并将在这条直线其中一边的部分颜色全部取反.

Example2

给定若干个角度\(a_1 , \cdots , a_n \in \{ 90 \degree , 270 \degree \}\),要求构造一个\(n\)边形(边必须平行于坐标轴),使得其内角依次是\(a_1 , \cdots , a_n\).

首先有解条件显然是判定它们的和是否是\(180 \degree ( n - 2 )\).

注意到相邻的\(90 \degree\)\(270 \degree\)无非是在原序列上修修改改,这个可以一起合并起来.不断合并就做完了.

Example3(CF1770H)

呃,简单来说就是把边界往里缩,每次找左上和右上的四个点做匹配,然后剩下的缩进去.

原题解的那个图特别清晰.

Example4(ABC232H)

放在这个模块下就好想了,剥一行一列就行.最后可能会剩个边界情况,简单讨论.

找中间状态

常见于操作可逆,想要让\(S \rightarrow T\).这个时候可以找一个中间状态\(A\),让\(S \rightarrow A , T \rightarrow A\).

Example1

坐标系上每个整点有个灯,初始只有\(( X , 0 )\)亮着,每次把\(( x , y )\),\(( x , y + 1 )\),\(( x + 1 , y )\)状态反转,给出终止状态,求初始亮的点的坐标,保证有解且唯一解.

\(n \leq 10^5\),坐标的绝对值均\(\leq 10^{ 17 }\).

首先我们发现,如果我们上面有若干个亮点,我们一定能把他们全杀了,变到下面,但下面的亮点没办法处理.怎么办呢?

一个想法是,我们将所有的亮点全都推到一条直线\(y = - inf\),然后比对.我们注意到\(( X , 0 )\)向下推的过程类似一个组合数递推的过程,由经典公式\(\binom{ S }{ T } \equiv [ T \subseteq S ] \bmod 2\)可知,我们取\(inf = 2^{ 63 } - 1\)即可.然后最后在这条线上一定是有一个区间是\(1\),我们需要找到区间左端点,我们选择在直线上随便找到一个\(1\),由于\(inf\)很大,大于\(10^{ 17 }\),因此这一步是好找的.然后最后二分+算贡献就可以找到左端点.

这个题有个改版,\(n \leq 10^4\),但是初始点可能是\(( X , Y )\).

这个题怎么做呢?类似上面的,我们考虑找到两个点\(( j , - inf )\)\(( k , - inf )\)是亮的,并且他们分别是最靠左的和最靠右的,然后我们就能反解出\(X\)\(Y\).而上述条件满足当且仅当\([ j - X \subseteq Y + inf ]\).

如果我们随便找一个点\(( p , - inf )\)满足条件,那我们接下来只需要枚举\(w\),判断\(( p - 2^w , - inf )\)是否是亮的,这样就能找到最靠左的,同理可以找到最靠右的.

那么怎么找到这个点呢?我们二分,每次判断一个区间\([ l , r ]\)中是否有亮的.这个是难以判断的,但是好判断的是,这个区间中亮的灯的数量是奇数还是偶数.因此我们拿这个判断就行,有奇数就去奇数,两个都是偶数随便去一个.

二维计算几何

参考:https://www.luogu.com.cn/blog/command-block/ji-suan-ji-he-suan-fa-hui-zong.

这一部分比较常用,知识点也比较简单,会主要聚焦于写法.

基本函数

eps

1
const double eps=1e-10

浮点数计算存在误差,因此大部分时候不能直接进行大小是否相等的判断,我们需要通过规定精度来减少这种误差.

sign

1
2
3
4
5
inline int sign(double x){
if(x<eps&&-x<eps)return 0;
if(x>eps)return 1;
return -1;
}

用于判断一个浮点数是正数还是负数.

myabs

1
2
3
4
inline double myabs(double x){
if(sign(x)==-1)return -x;
return x;
}

用来求绝对值.

mysqr

1
2
3
inline double mysqr(double x){
return x*x;
}

用来求平方.

Point/Vector

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
struct Point{
double x,y;
Point(double X,double Y){
x=X;y=Y;
}
inline double len(){//判断到原点的距离
return std::sqrt(x*x+y*y);
}
inline int que(){//判断点的象限
if(sign(x)== 1&&sign(y)== 1)return 1;
if(sign(x)==-1&&sign(y)== 1)return 2;
if(sign(x)==-1&&sign(y)==-1)return 3;
return 4;
}
};
inline Point operator +(const Point &A,const Point &B){
return Point(A.x+B.x,A.y+B.y);
}
inline Point operator -(const Point &A,const Point &B){
return Point(A.x-B.x,A.y-B.y);
}
inline Point operator *(const double &c,const Point &A){
return Point(c*A.x,c*A.y);
}
inline Point operator *(const Point &A,const double &c){
return Point(c*A.x,c*A.y);
}
inline Point operator /(const Point &A,const double &c){
return Point(A.x/c,A.y/c);
}
inline double dist(const Point &A,const Point &B){
return std::sqrt(mysqr(A.x-B.x)+mysqr(A.y-B.y));
}

存储基本的点的信息.也可以看作一个二维向量.

向量内积

1
2
3
inline double operator *(const Point &A,const Point &B){
return A.x*B.x+A.y*B.y;
}

也就是\(\vec{ a } \cdot \vec{ b } = | \vec{ a } | | \vec{ b } | \cos \theta = x_a x_b + y_a y_b\).也就等于\(\vec{ a }\)\(b\)上的投影与\(\vec{ b }\)的模长的乘积.

内积可以用来判断夹角:

  1. 如果\(\vec{ a } \cdot \vec{ b } = 0\),则说明\(\vec{ a } \bot \vec{ b }\).

  2. 如果\(\vec{ a } \cdot \vec{ b } > 0\),则说明\(\vec{ a }\)\(\vec{ b }\)正方向的夹角小于\(90 \degree\).

  3. 如果\(\vec{ a } \cdot \vec{ b } < 0\),则说明\(\vec{ a }\)\(\vec{ b }\)正方向的夹角大于\(90 \degree\).

两个向量同时旋转相同角度,其内积结果不变.

向量叉积

1
2
3
double operator ^(const Point &A,const Point &B){
return A.x*B.y-B.x*A.y;
}

也就是\(\vec{ a } \times \vec{ b } = x_a y_b - y_a x_b\).也就等于\(\vec{ a } , \vec{ b }\)两个向量张成的平行四边形(有向)的面积.

叉积可以用来判断方向:

  1. 如果\(\vec{ a } \times \vec{ b } = 0\),说明二者共线.

  2. 如果\(\vec{ a } \times \vec{ b } < 0\),说明从\(\vec{ a }\)\(\vec{ b }\)的方向是顺时针.

  3. 如果\(\vec{ a } \times \vec{ b } > 0\),说明从\(\vec{ a }\)\(\vec{ b }\)的方向是逆时针.

向量旋转

1
2
3
4
5
//插入Point内部
inline Point rotate(double theta){
double st=std::sin(theta),double ct=std::cos(theta);
return Point(x*ct-A.y*st,A.x*st+A.y*ct);
}

也就是将这个竖向量乘左乘旋转矩阵\(\begin{bmatrix}\cos \theta & - \sin \theta \\ \sin \theta & \cos \theta\end{bmatrix}\).

Line

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
struct Line{
Point a,b;
double len(){
return dist(a,b);//计算线段长度,直线和射线基本没用
}
};
bool onl0(const Point &A,const Line &L){
return sign((A-L.a)^(A-L.b))==0;
}//判断点是否在直线上
bool onl2(const Point &A,const Line &L){
return (sign((A-L.a)^(A-L.b))==0)&&
(sign(A.x-std::min(L.a.x,L.b.x))>=0)&&
(sign(A.x-std::max(L.a.x,L.b.x))>=0)&&
(sign(A.y-std::min(L.a.y,L.b.y))>=0)&&
(sign(A.y-std::max(L.a.y,L.b.y))<=0);

}//判断点是否在线段上

用来维护直线/射线/线段的基本信息.

判断线段相交

1
2
3
4
5
6
7
8
9
bool isinter(const Line &L1,const Line &L2){
if(std::max(L1.a.x,L1.b.x)<std::min(L2.a.x,L2.b.x))return 0;
if(std::max(L2.a.x,L2.b.x)<std::min(L1.a.x,L1.b.x))return 0;
if(std::max(L1.a.y,L1.b.y)<std::min(L2.a.y,L2.b.y))return 0;
if(std::max(L2.a.y,L2.b.y)<std::min(L1.a.y,L1.b.y))return 0;
if(((L1.a-L2.b)^(L2.a-L2.b))*((L1.b-L2.b)^(L2.a-L2.b))<0)return 0;
if(((L2.a-L1.b)^(L1.a-L1.b))*((L2.b-L1.b)^(L1.a-L1.b))<0)return 0;
return 1;
}

前四行被称为快速排斥实验,后两行被称为跨立实验,也就是相交的两线段,对于其中一个线段而言,它的两个端点必然在另一个线段的两侧.但我们注意到共线线段也会通过跨立实验,因此拿快速排斥实验来判掉这种情况.

注意,线段交点不同于直线交点,两条共线的交点是有可能在端点上的.这个需要特判一下.

当然一般判断线段是否相交可以直接求直线交点,然后判断在不在线段上.

求直线交点

1
2
3
4
5
Point inter(const Line &L1,const Line &L2){
double ls=(L1.b-L1.a)^(L2.a-L1.a);
double rs=(L1.b-L1.a)^(L2.b-L1.a);
return L2.a+(L2.b-L2.a)*ls/(ls-rs);
}

原理在于,画一下\(x_{ L_1 } , x_{ L_2 } , y_{ L_1 } , y_{ L_2 }\)围成的四边形,计算面积后用等高不等底计算.注意\(ls\)\(rs\)所代表的面积一正一负(不一定谁是正),因此需要减一下.

点到线的最短距离

1
2
3
4
5
6
7
8
inline double disl0(const Point &A,const Line &L){
return myabs(((L.a-A)^(L.b-A))/dis(L.a,L.b));
}
inline double disl2(const Point &A,const Line &L){
if(sign((A-L.a)*(L.b-L.a))<0)return dist(A,L.a);
if(sign((A-L.b)*(L.a-L.b))<0)return dist(A,L.b);
return disl0(A,L);
}

直线好做,直接算垂线段长度,用面积除以底长.

线段用点积判一下夹角即可.

凸多边形面积

利用叉乘,任取平面上一点\(O\),则\(S = \frac{ 1 }{ 2 } \sum_{ i = 1 }^n \overrightarrow{ OP_i } \times \overrightarrow{ OP_{ i + 1 } }\).证明的话考虑分\(O\)在内部和\(O\)在外部两种情况分类讨论.注意此时的\(P\)必须逆时针排列.

另外有皮克定理:在一个平面直角坐标系内,以整点为顶点的简单多边形(任两边不交叉),它内部整点数为\(a\),它的边上(包括顶点)的整点数为\(b\),则它的面积\(S = a + \frac{ b }{ 2 } - 1\).

基本算法

排序算法

极角排序

定义原点\(O\)并建立坐标系,所有点按照和\(O\)所连直线与\(x\)轴正方向的夹角排序.

极角排序通常使用叉乘来实现,因为叉乘可以快速计算两个向量的方向.但是注意到需要先判断象限,再判断叉乘.

1
2
3
4
5
6
7
8
bool cmp(Point A,Point B){//判断A能否在B前面
A=A-O,B=B-O;//O=(0,0)的时候可以省略
if(A.qua()!=B.qua()){
return A.qua()<B.qua();
}
if(sign(A^B)==0)return A.x<B.x;
return sign(B^A)==1;
}
水平序排序
1
2
3
4
bool cmp(Point A,Point B){
if(sign(A.x-B.x)==0)return sign(A.y-B.y)==-1;
return sign(A.x-B.x)==-1;
}

也就是\(x\)相同比\(y\),否则比\(x\).

二维凸包

定义

包住平面上某个点集的周长最小的简单多边形,一定是凸多边形.

实现

用水平序排序,然后从左往右扫一遍得到上凸壳,从右往左扫一遍得到下凸壳.

用一下以下函数:

1
2
3
4
5
6
inline bool anticlock(const Point &A,const Point &B,const Point &C){
return sign((A-B)^(B-C))==-1;
}
inline bool isline(const Point &A,const Point &B,const Point &C){
return sign((A-B)^(B-C))==0;
}

前者判断是否\(ABC\)三点是一个上凸的(注意\(ABC\)三点横坐标应该不降).后者判断三点共线.

旋转卡壳

定义

定义凸包上的对踵点对,也就是拿两条平行直线卡着凸包转,这两条直线会卡住凸包的两个点,这些点对组成的集合就是对踵点对集合.

实现

逆时针枚举边,然后看对面有什么被卡住了.由于凸包的凸性,在边逆时针转的时候,另一边的对踵点也会逆时针转.只要找到距离这条边所在直线最远的点即可.但这样的点可能有俩.可以简单特判,也可以加上微小随机扰动量使得这种情况可以忽略.

闵可夫斯基和

一般只讨论凸包的闵可夫斯基和.

定义

两个区域\(A , B\)的闵可夫斯基和定义为\(\{ a + b \mid a \in A , b \in B \}\).

实现

事实上,新的区域所形成的凸包,一定是原本\(A , B\)的凸包的边按照某种顺序连接起来得到的结果.

我们考虑旋转一下\(A , B\),使得\(B\)有一条边成为最右边的直上直下的一条边,然后考虑答案区域的最右边的边,这条边一定是\(B\)这个边加上\(A\)的最右边的点.这样这条边必定还在最终的凸包上.就算\(A\)最右边的是一条边,你也会发现最终的凸包最右边也一定是由\(A\)的这条边和\(B\)的这条边拼起来的.

显然,逆时针转一遍整个凸壳,将每条边改为向量(按照逆时针转的方向)然后极角排序,最后顺次链接就是答案.

半平面交

定义

定义半平面为满足\(ax + by + c > 0\)\(ax + by + c \geq 0\)的点对\(( x , y )\)组成的集合,感性理解就是一条直线的一侧.

实现

首先直线不好描述左右侧,我们把直线改成向量,这样方便描述左右侧.并不妨假设所有的向量所表示的半平面在向量的左侧.如果两条向量方向相同,则取更靠左的那一条,也就是所在直线截距更大的那个,另一个直接删了就是了.当然你不想删可以把那个废物放前面,这样根据下面的操作过程中它会被弹掉.

我们这么实现:按照上面的顺序一个一个插入,维护一个单调队列.如果前两条向量的交点不在当前这条向量的控制范围,不难发现上一条向量是废物,弹掉它.这样做到最后,队首和队尾可能都有一些废物向量,把它们判掉弹掉即可.

三维计算几何

这一部分知识点比较困难,而几乎用不到,因此只讲简单知识点,就当是高中立体几何知识补档!

基本概念

直线

使用直线的方向向量\(\vec{ s } = ( n , m , p )\)和直线上一点\(M_0 = ( x_0 , y_0 , z_0 )\).那么方程显然为:

\[ \frac{ x - x_0 }{ n } = \frac{ y - y_0 }{ m } = \frac{ z - z_0 }{ p } \]

如果换元,我们还有参数方程:

\[ \begin{cases} x = x_0 + nt \\ y = y_0 + mt \\ z = z_0 + pt \end{cases} \]

平面

使用平面上的一点\(P_0 ( x_0 , y_0 , z_0 )\)和该平面的法向量\(\vec{ n }\)来表示一个平面,不妨设\(\vec{ n } = ( A , B , C )\),则该平面的方程显然为:

\[ A ( x - x_0 ) + B ( y - y_0 ) + C ( z - z_0 ) = 0 \]

如果我们令\(D = - ( Ax_0 + By_0 + Cz_)\),那么平面方程为:

\[ Ax + By + Cz + D = 0 \]

夹角

两直线夹角.

直接求方向向量的夹角,然后取正值.

对于方向向量分别是\(\vec{ s_1 } = ( n_1 , m_1 , p_1 ) , \vec{ s_2 } = ( n_2 , m_2 , p_2 )\),也就有\(\varphi = \arccos ( \frac{ | \vec{ s }_1 \cdot \vec{ s }_2 | }{ | \vec{ s }_1 | | \vec{ s }_2 | } ) \\\).

直线与平面的夹角

同样使用向量,不妨设方向向量\(\vec{ s } = ( n , m , p )\),法向量\(\vec{ f } = ( a , b , c )\),那么\(\varphi = \arcsin ( \frac{ | \vec{ s } \cdot \vec{ f } | }{ | \vec{ s } | | \vec{ f } | } )\).

另外,由上面这个式子,不难得到一些特殊情况下的判定标准:

  1. 若直线与平面平行,则\(am + bn + cp = 0\).

  2. 若直线与平面垂直,则\(\frac{ a }{ m } = \frac{ b }{ n } = \frac{ c }{ p }\).注意这里分母可能除以\(0\),我们实际上应该是三个形如\(a = mt\)的参数方程,这里简化了.

交点

联立方程硬解.

基本定理

参考:https://zhuanlan.zhihu.com/p/401766934

三余弦定理(最小角定理)

这个定理说明直线与平面的夹角,是所有包含直线的平面与这个平面形成的夹角中最小的那一个.并且偏移量决定了差距.

三正弦定理(最大角定理)

这个定理说明二面角是另一个平面上的直线与平面的夹角中最大的那个,并且偏移量决定了差距.

二项式系数

上升幂和下降幂

定义下降幂\(x^{ \underline{ k } } = \prod_{ i = 0 }^{ k - 1 } ( x - i ) = \frac{ x ! }{ ( x - k ) ! }\).

定义上升幂\(x^{ \overline{ k } } \prod_{ i = 0 }^{ k - 1 } ( x + i ) = \frac{ ( x + k - 1 ) ! }{ ( x - 1 ) ! }\).

上升幂和下降幂的定义是可以引申到复数域的.

例如我们有加倍公式:\(r^{ \underline{ k } } ( r - 0 . 5 )^{ \underline{ k } } = \cfrac{ ( 2 r )^{ \underline{ 2 k } } }{ 2^{ 2 k } } , k \in \mathbb{ N }\).

他们之间存在转换:\(x^{ \underline{ n } } = ( - 1 )^n ( - x )^{ \overline{ n } }\).

同时存在大小关系:\(x^{ \underline{ n } } \leq x^n \leq x^{ \overline{ n } }\),其中\(0 \leq n < x\).

二项式系数的定义

考虑令\(\binom{ n }{ m }\)表示从一个大小为\(n\)的子集中选出大小为\(m\)的子集的方案数.第一次有\(n\)个选择,第二次有\(n - 1\)个选择……第m次有\(n - m + 1\)个选择.而由于可能可以选择重复的,但一个排列被重复选择的次数显然是\(m !\),因此显然有\(\binom{ n }{ m } = \cfrac{ n^{ \underline{ m } } }{ m ! }\).

如果我们把它的定义拓展到复数域,我们有:

\(\binom{ r }{ k } = \begin{cases}\cfrac{ r^{ \underline{ k } } }{ k ! } & k \geq 0 \\ 0 & k < 0\end{cases} , r \in \mathbb{ C } , k \in \mathbb{ Z }\).

值得一提的是,如果我们这么定义,本质上其实是把\(\binom{ r }{ k }\)看作了一个关于\(r\)\(k\)次多项式.

另外根据定义,\(r \in \mathbb{ Z } \land r < k\)时,该公式给出\(0\).

值得一提的是,为了使二项式系数在面对\(0\)的时候更加简洁,通常直接定义\(0 ! = 1 , 0^0 = 1\).

另外不难发现\(\binom{ 2 n }{ n }\)是所有\(\binom{ 2 n }{ k }\)中最大的.事实上我们有Wallis公式:\(\lim_{ n \rightarrow \infty } \frac{ ( \frac{ 2^{ 2 n } }{ \binom{ 2 n }{ n } } )^2 }{ 2 n + 1 } = \frac{ \pi }{ 2 }\).

基本的二项式恒等式

  1. 阶乘展开式:\(\binom{ n }{ k } = \cfrac{ n ! }{ k ! ( n - k ) ! } , n , k \in \mathbb{ N } , n \geq k \\\).

证明根据定义是显然的.

  1. 对称恒等式:\(\binom{ n }{ k } = \binom{ n }{ n - k } , n \in \mathbb{ N } , k \in \mathbb{ Z } \\\).

根据\(( 1 )\),\(0 \leq k \leq n\)时是显然的.而其他情况两边都会给出\(0\),因此也是成立的.

  1. 吸收恒等式:\(\binom{ r }{ k } = \cfrac{ r }{ k } \binom{ r - 1 }{ k - 1 } , k \in \mathbb{ Z } \land k \ne 0 \\\).

证明根据定义是显然的.

  1. 吸收恒等式的变式:\(k \binom{ r }{ k } = r \binom{ r - 1 }{ k - 1 } , k \in \mathbb{ Z } \\\).

根据\(( 3 )\),只需要验证\(k = 0\)的情况即可,也是显然的.

  1. 相伴恒等式:\(( r - k ) \binom{ r }{ k } = r \binom{ r - 1 }{ k } , k \in \mathbb{ Z } \\\).

证明如下:

\[ \begin{aligned} ( r - k ) \binom{ r }{ k } & = ( r - k ) \binom{ r }{ r - k } \\ & = r \binom{ r - 1 }{ r - k - 1 } \\ & = r \binom{ r - 1 }{ k } \end{aligned} \]

问题在于:我们在上述描述中并未提到\(r\)的范围,但是推导过程要求\(r \in \mathbb{ N }\).不过,我们已经说明了二项式系数是关于\(r\)\(k\)次多项式,因此只需要有\(k + 1\)\(r\)满足这个公式即可.而根据推导过程显然有无限个\(r\)满足,因此这个公式对\(r \in \mathbb{ C }\)也是成立的.

不过事实上,直接用吸收恒等式就可以证明:

\[ \begin{aligned} k \binom{ r }{ k } & = r \binom{ r - 1 }{ k - 1 } \\ ( r - k ) \binom{ r }{ r - k } & = r \binom{ r - 1 }{ r - k - 1 } \\ ( r - k ) \binom{ r }{ k } & = r \binom{ r - 1 }{ k } \end{aligned} \]

  1. 加法公式:\(\binom{ r }{ k } = \binom{ r - 1 }{ k } + \binom{ r - 1 }{ k - 1 } , k \in \mathbb{ Z } \\\).

证明可以使用定义,也可以先用\(r \in \mathbb{ N }\)的情况给出组合意义,再使用多项式推理法证明.

  1. \(\binom{ r }{ m } \binom{ m }{ k } = \binom{ r }{ k } \binom{ r - k }{ m - k } , n , k \in \mathbb{ Z } \\\).

证明可以使用组合意义和多项式推理法.

  1. 平行求和法:\(\sum_{ k \leq n } \binom{ r + k }{ k } = \binom{ r + n + 1 }{ n } , n \in \mathbb{ N } \\\).

我们不妨考虑不断使用加法公式:

\(\binom{ r + n + 1 }{ n } = \binom{ r + n }{ n } + \binom{ r + n }{ n - 1 } = \binom{ r + n }{ n } + \binom{ r + n - 1 }{ n - 1 } + \binom{ r + n - 1 }{ n - 2 } = . . . \\\),最终下标会减成负数,这样后面的项就全都是\(0\)了.

也可以考虑组合意义:如果\(r \in \mathbb{ N }\),那么我们考虑从右到左第一个没有被选上的数,假设它是\(r + k + 1\),那么在它右边的数全部选择了,一共是\(n - k\)个数,而还需要在左边的\(r + k\)中选择\(k\)个数.

  1. 上指标求和法:\(\sum_{ 0 \leq k \leq n } \binom{ k }{ m } = \binom{ n + 1 }{ m + 1 } , n , m \in \mathbb{ N } \\\).

可以组合意义解释:我们不妨假设选的最大数是\(k + 1\),接下来就还需要在\([ 1 , k ]\)中选择\(m\)个.

如果我们将这个公式两边同时乘以\(m !\),我们可以得到公式:\(\sum_{ 0 \leq k \leq n } k^{ \underline{ m } } = \cfrac{ ( n + 1 )^{ \underline{ m + 1 } } }{ m + 1 } , n , m \in \mathbb{ N } \\\),这也就是有限微积分的公式中的一个.

  1. 二项式定理:\(( x + y )^r = \sum_{ k } \binom{ r }{ k } x^k y^{ r - k } , r \in \mathbb{ N } \\\).

可以使用组合意义证明.

二项式定理有一些有用的特殊情况:

$$ \[\begin{aligned} \sum_{ 0 \leq k \leq n } \binom{ n }{ k } & = 2^n , n \in \mathbb{ N } \\ \end{aligned}\]

$$

在二项式定理中令\(x = y = 1\)即可证明.

$$ \[\begin{aligned} \sum_{ 0 \leq k \leq n } ( - 1 )^k \binom{ n }{ k } & = 0^n = [ n = 0 ] , n \in \mathbb{ N } \\ \end{aligned}\]

$$

在二项式定理中令\(x = - 1 , y = 1\)即可证明,值得一提的是,当\(n = 0\)的时候这个式子给出\(1\),并在其他情况下给出\(0\),这个式子是二项式反演的基础.

  1. 三项式定理:\(( x + y + z )^n = \sum_{ 0 \leq a , b , c \leq n } [ a + b + c = n ] \cfrac{ n ! }{ a ! b ! c ! } x^a y^b z^c , n \in \mathbb{ N } \\\).

证明与二项式定理类似.值得一提的是,\(\cfrac{ n ! }{ a ! b ! c ! } = \binom{ n }{ b + c } \binom{ b + c }{ c }\).

  1. 多项式定理:\(( \sum_{ i = 1 }^m x_i )^n = \sum_{ \forall i \in [ 1 , m ] , 0 \leq a_i \leq n } [ \sum_{ i = 1 }^m a_i = n ] \cfrac{ n ! }{ \prod_{ i = 1 }^m a_i ! } \prod_{ i = 1 }^m x_i^{ a_i } , n \in \mathbb{ N } \\\).

证明与二项式定理类似.

  1. 范德蒙德卷积:\(\sum_{ k } \binom{ r }{ m + k } \binom{ s }{ n - k } = \binom{ r + s }{ n + m } , n , m \in \mathbb{ Z } \\\).

证明可以使用组合意义和多项式推理法.

另外,这个式子可以直接使用生成函数证明.

  1. 范德蒙德卷积的变式:\(\sum_{ k } \binom{ l }{ m + k } \binom{ s }{ n + k } = \binom{ l + s }{ l - m + n } , l \in \mathbb{ N } , n , m \in \mathbb{ Z } \\\).

\(\binom{ l }{ m + k } = \binom{ l }{ l - m - k }\),然后运用范德蒙德卷积即可得到答案.

  1. 上指标反转公式:\(\binom{ r }{ k } = ( - 1 )^k \binom{ k - r - 1 }{ k } \\\).

根据定义显然.

扩展的二项式恒等式(整数范围内)

  1. \(\sum_{ k \leq m } \binom{ r }{ k } ( - 1 )^k = ( - 1 )^m \binom{ r - 1 }{ m } , m \in \mathbb{ Z } \\\).

证明如下:

\[ \begin{aligned} \sum_{ k \leq m } \binom{ r }{ k } ( - 1 )^k & = \sum_{ k \leq m } \binom{ k - r - 1 }{ k } \\ & = \binom{ - r + m }{ m } = ( - 1 )^m \binom{ r - 1 }{ m } \end{aligned} \]

  1. \(\sum_{ - q \leq k \leq l } \binom{ l - k }{ m } \binom{ q + k }{ n } = \binom{ l + q + 1 }{ m + n + 1 } , n , m \in \mathbb{ N } , l + q \geq 0 \\\).

可以组合意义与多项式推理法证明.

  1. \(\sum_{ k } \binom{ a + b }{ a + k } \binom{ a + b }{ b + k } ( - 1 )^k = \binom{ a + b }{ a } , a , b \in \mathbb{ N } \\\).

可以数学归纳证明.

  1. \(\sum_{ k = 0 }^m \cfrac{ \binom{ m }{ k } }{ \binom{ n }{ k } } = \cfrac{ n + 1 }{ n + 1 - m } , n , m \in \mathbb{ N } , n \geq m \\\).

我们有\(\binom{ n }{ m } \binom{ m }{ k } = \binom{ n }{ k } \binom{ n - k }{ m - k } \\\),两边同时除以\(\binom{ n }{ m } \binom{ n - k }{ m - k } \\\),于是我们得到了\(\cfrac{ \binom{ m }{ k } }{ \binom{ n }{ k } } = \cfrac{ \binom{ n - k }{ m - k } }{ \binom{ n }{ m } } \\\).

有:

\[ \begin{aligned} \sum_{ k = 0 }^m \cfrac{ \binom{ m }{ k } }{ \binom{ n }{ k } } & = \sum_{ k = 0 }^m \cfrac{ \binom{ n - k }{ m - k } }{ \binom{ n }{ m } } \\ & = \cfrac{ 1 }{ \binom{ n }{ m } } \sum_{ k = 0 }^m \binom{ n - k }{ m - k } \\ & = \cfrac{ 1 }{ \binom{ n }{ m } } \sum_{ k = 0 }^m \binom{ n - m + k }{ k } \\ & = \cfrac{ \binom{ n + 1 }{ m } }{ \binom{ n }{ m } } \\ & = \cfrac{ n + 1 }{ n + 1 - m } \end{aligned} \]

  1. \(( - 1 )^m \binom{ - n - 1 }{ m } = ( - 1 )^n \binom{ - m - 1 }{ n } , n , m \in \mathbb{ N } \\\).

根据上指标反转公式,这个公式两边都等于\(\binom{ n + m }{ m } \\\).

  1. \(\sum_{ k \leq m } \binom{ r }{ k } ( \cfrac{ r }{ 2 } - k ) = \cfrac{ m + 1 }{ 2 } \binom{ r }{ m + 1 } , m \in \mathbb{ Z } \\\).

可以使用归纳法证明这个公式.

  1. \(\sum_{ k \leq m } \binom{ m + r }{ k } x^k y^{ m - k } = \sum_{ k \leq m } \binom{ - r }{ k } ( - x )^k ( x + y )^{ m - k } , m \in \mathbb{ Z } \\\).

不妨令左边的值为\(S_m\),我们有:

\[ \begin{aligned} S_m & = \sum_{ k \leq m } \binom{ m + r }{ k } x^k y^{ m - k } = \sum_{ k \leq m } \binom{ m + r - 1 }{ k } x^k y^{ m - k } + \sum_{ k \leq m } \binom{ m + r - 1 }{ k - 1 } x^k y^{ m - k } \\ & = y \sum_{ k < m } \binom{ m - 1 + r }{ k } x^k y^{ m - 1 - k } + \binom{ m + r - 1 }{ m } x^m + x \sum_{ k \leq m } \binom{ m + r - 1 }{ k - 1 } x^{ k - 1 } y^{ m - k } \\ & = ( x + y ) S_{ m - 1 } + \binom{ m + r - 1 }{ m } x^m \\ & = ( x + y ) S_{ m - 1 } + \binom{ r }{ m } ( - x )^m \end{aligned} \]

左右两边满足相同递归式,通过数学归纳法不难证明二者相等.

  1. \(\sum_{ k \leq m } \binom{ m + k }{ k } 2^{ - k } = 2^m , m \in \mathbb{ N } \\\).

考虑\(( 7 )\),将\(x = y = 1 , r = m + 1\)带入,得到:

\[ \begin{aligned} \sum_{ k \leq m } \binom{ 2 m + 1 }{ k } & = \sum_{ k \leq m } \binom{ m + k }{ k } 2^{ m - k } \\ 2^{ 2 m } & = \sum_{ k \leq m } \binom{ m + k }{ k } 2^{ m - k } \\ 2^m & = \sum_{ k \leq m } \binom{ m + k }{ k } 2^{ - k } \end{aligned} \]

  1. \(\sum_{ k } \binom{ l }{ m + k } \binom{ s + k }{ n } ( - 1 )^k = ( - 1 )^{ l + m } \binom{ s - m }{ n - l } , l \in \mathbb{ N } , n , m \in \mathbb{ Z } \\\).

可以数学归纳证明.

  1. \(\sum_{ k \leq l } \binom{ l - k }{ m } \binom{ s }{ k - n } ( - 1 )^k = ( - 1 )^{ l + m } \binom{ s - m - 1 }{ l - n - m } , l , n , m \in \mathbb{ N } \\\).

可以数学归纳证明.

拓展的二项式恒等式(实数范围内)

  1. \(\binom{ r }{ k } \binom{ r - \cfrac{ 1 }{ 2 } }{ k } = \cfrac{ \binom{ 2 r }{ 2 k } \binom{ 2 k }{ k } }{ 2^{ 2 k } } , k \in \mathbb{ Z } \\\).

将加倍公式两边同时除以\(k !^2\)即可得到这个公式.

  1. \(\binom{ n - \cfrac{ 1 }{ 2 } }{ n } = \cfrac{ \binom{ 2 n }{ n } }{ 2^{ 2 n } } , n \in \mathbb{ Z } \\\).

\(( 1 )\)中令\(r = k = n\)即可得到这个公式.

  1. \(\binom{ - \cfrac{ 1 }{ 2 } }{ n } = ( \cfrac{ - 1 }{ 4 } )^n \binom{ 2 n }{ n } , n \in \mathbb{ Z } \\\).

\(( 2 )\)的变形.

  1. \(\sum_{ k } \binom{ n }{ 2 k } \binom{ 2 k }{ k } 2^{ - 2 k } = \binom{ n - \cfrac{ 1 }{ 2 } }{ \lfloor \cfrac{ n }{ 2 } \rfloor } , n \in \mathbb{ N } \\\)

首先根据\(( 1 )\),左边\(= \sum_{ k } \binom{ \cfrac{ n }{ 2 } }{ k } \binom{ \cfrac{ n - 1 }{ 2 } }{ k } \\\),而考虑到\(\cfrac{ n }{ 2 }\)\(\cfrac{ n - 1 }{ 2 }\)必有一个是自然数,因此可以直接用范德蒙德卷积的变形.

  1. \(\sum_{ k } \binom{ - \cfrac{ 1 }{ 2 } }{ k } \binom{ - \cfrac{ 1 }{ 2 } }{ n - k } = ( - 1 )^n , n \in \mathbb{ N } \\\).

直接使用范德蒙德卷积即可证明.

  1. \(\sum_{ k } \binom{ 2 k }{ k } \binom{ 2 n - 2 k }{ n - k } = 4^n , n \in \mathbb{ N } \\\).

\(( 5 )\)\(( 3 )\)不难推出.

  1. \(\sum_{ k } \binom{ n }{ k } \cfrac{ ( - 1 )^k }{ x + k } = x^{ - 1 } \binom{ x + n }{ n }^{ - 1 } , x \notin \{ 0 , - 1 , . . . , - n \} \\\).

\(f ( x ) = ( x - 1 )^{ \underline{ - 1 } }\),直接做高阶差分即可得到这个式子.

  1. \(\sum_{ k = 0 }^n \binom{ r }{ k } \binom{ r }{ n - k } ( - 1 )^k = [ n \ is \ \mathrm{ even } ] ( - 1 )^{ \cfrac{ n }{ 2 } } \binom{ r }{ \cfrac{ n }{ 2 } } \\\).

首先不难发现,\(( 1 - z )^r = \sum_{ k \geq 0 } ( - 1 )^k \binom{ r }{ k } \\\).

考虑\(( 1 - z )^r ( 1 + z )^r = ( 1 - z^2 )^r\).

我们有\([ z^n ] ( 1 - z )^r ( 1 + z )^r = [ z^n ] ( 1 - z^2 )^r\),不难发现即上式.

卡特兰数

卡特兰数\(f_n\)表示:长度为\(2 n\)的合法括号序列个数.

卡特兰数的前几项为\(1 , 1 , 2 , 5 , 14 , 42 , 132 \cdots\).

接下来,我们通过这个定义来证明以下其他定义方式.

递归定义:\(f_n = \sum_{ i = 0 }^{ n - 1 } f_i f_{ n - 1 - i }\).

不妨考虑枚举一个括号序列的第一个断点,则该括号序列应形如\(( A ) B\).

考虑将其删成\(A\)\(B\),则\(A\)一定合法,因为若\(A\)不合法,那么这里一定不是第一个断点.

通项公式:\(f_n = \frac{ 1 }{ n + 1 } C_{ 2 n }^n = C_{ 2 n }^n - C_{ 2 n }^{ n - 1 }\).

考虑平面直角坐标系,我们将’(‘认为是向右上走一单位长度,将’)’认为是向右下走一单位长度.

那么卡特兰数就相当于从\(( 0 , 0 )\)走到\(( 2 n , 0 )\)不经过第四象限的方案数.

考虑反射容斥,如果只是走到\(( 2 n , 0 )\)的方案数是\(C_{ 2 n }^n\).

而如果到达第四象限,说明在这条这线上存在一个点\(( x , - 1 )\).

考虑将\(x\)以后的折线以直线\(y = - 1\)为对称轴反转,那么终点到了\(( 2 n , - 2 )\).

不难发现,任意从\(( 0 , 0 )\)走到\(( 2 n , - 2 )\)的方案一定唯一对应了一种从\(( 0 , 0 )\)走到\(( 2 n , 0 )\)的不合法方案.因为从\(( 0 , 0 )\)走到\(( 2 n , - 2 )\)一定会经过直线\(y = - 1\),将后半部分对称后就是其对应方案.而从\(( 0 , 0 )\)走到\(( 2 n , - 2 )\)的方案数为\(C_{ 2 n }^{ n - 1 }\).

因而\(f_n = C_{ 2 n }^n - C_{ 2 n }^{ n - 1 } \\\).

\(C_{ 2 n }^n - C_{ 2 n }^{ n - 1 } = \frac{ ( 2 n ) ! }{ n ! n ! } - \frac{ ( 2 n ) ! }{ ( n - 1 ) ! ( n + 1 ) ! } = \frac{ ( 2 n ) ! }{ n ! ( n + 1 ) ! } = \frac{ C_{ 2 n }^n }{ n + 1 } \\\).

递推定义:\(f_n = \frac{ 4 n - 2 }{ n + 1 } f_{ n - 1 } \\\).

使用一下上一步的通项公式:

f_n=\

f_{n-1}=

\end{cases}\

不难发现\(f_n = \frac{ ( 2 n - 1 ) ( 2 n ) }{ n ( n + 1 ) } f_{ n - 1 } \\\).整理,得到\(f_n = \frac{ 4 n - 2 }{ n + 1 } f_{ n - 1 } \\\).

换个记号,设\(C_n\)为卡特兰数的第\(n\)项,卡特兰数有一个著名的结论是\(k\)次卷积:

\[ C^{ ( k ) }_n = \sum_{ \sum_{ j = 1 }^k a_j = n } \prod C_{ a_i } = \frac{ k }{ n + k } \binom{ 2 n + k - 1 }{ n } \]

我们可以这么理解它:它指的是一个长度为\(n + k - 1\)的括号序列,前\(k - 1\)个必须是左括号的方案数.为啥呢?因为这样这个括号序列必须写成\(( ( ( A ) B ) C ) D\)之类的形式,等价于卷积.

那么证明就很简单了,类似反射容斥,有:

\[ \begin{aligned} C^{ ( k ) }_n & = \binom{ 2 n + k - 1 }{ n } - \binom{ 2 n + k - 1 }{ n - 1 } \\ & = \frac{ k }{ n + k } \binom{ 2 n + k - 1 }{ n } \end{aligned} \]

Example([HNOI2009]有趣的数列)

首先,如果没有第三条限制,那显然奇数位置和偶数位置互不影响,直接随便选,答案就是\(\binom{ 2 n }{ n }\).

而有了限制呢,我们还是想随便选然后顺序排起来,但是这次不能排列的时候使奇数位置大于偶数位置,可以发现这就是括号序列需要满足的条件,于是答案就是卡特兰数.

至于处理,这题因为模数不是质数,需要做质因数分解来维护除法.

Example2([23省选10连测day7]b)

给定\(x , n\),对\(y \in [ 1 , n ]\),固定\(p_x = y\)做笛卡尔树的形态计数.\(n \leq 5 \times 10^5\).

由于是对树的形态计数,其实根本就不在乎每个点具体的取值,只要这个取值有解就行.事实上,容易发现\(a_x = y\)只要满足:

  1. \(x\)节点的祖先数量不超过\(y - 1\)个(深度小于等于\(y\)).

  2. \(x\)节点的子树大小不超过\(n - y + 1\).

发现合法不太好记,经典补集转化,然后两个不合法情况无关,分别算.

我们考虑直接算出\(f_p\)表示\(x\)的深度为\(p\)的答案,\(g_p\)表示\(x\)的子树大小为\(p\)的答案,然后就可以完成这个题.

这两部分怎么算呢?

先看深度:\(x\)的祖先有两种:一种在序列中在\(x\)的左边,一种在\(x\)的右边.我们设前者为\(0 = l_0 < l_1 < l_2 < \cdots l_p < l_{ p + 1 } = x\),设后者为\(n + 1 = r_0 > r_1 > r_2 > \cdots > r_{ q } > r_{ q + 1 } = x\).这么分类有什么用呢?我们考虑\(( l_{ i - 1 } , l_{ i } )\)这一段数能放在哪里,它只能是\(l_{ i }\)的左儿子,独立于整棵树,因此这一段的答案就是\(C_{ l_i - l_{ i - 1 } - 1 }\).

记:

$$ \[\begin{aligned} L_p & = \sum_{ l } \prod_{ i = 1 }^{ p + 1 } C_{ l_i - l_{ i - 1 } - 1 } \\ R_q & = \sum_{ r } \prod_{ i = 1 }^{ q + 1 } C_{ r_{ i - 1 } - r_i - 1 } \\ \end{aligned}\]

$$

注意到这等价于卡特兰数的\(k\)次卷积,有:

$$ \[\begin{aligned} L_p & = C_{ x - p - 1 }^{ ( p + 1 ) } \\ R_q & = C^{ ( q + 1 ) }_{ n - x - q } \\ \end{aligned}\]

$$

此时的答案自然是\(f_{ p + q + 1 } = L_p R_q \binom{ p + q }{ q }\),做卷积.

儿子怎么算呢?二叉搜索树有一个经典性质:确定根后每个点插在哪里是固定的.也就是说我们把\(x\)的子树从原树中删去,然后插入\(x\)一定会插回原位置,这是一个双射.而子树内随便做,设左子树大小为\(p\),右子树大小为\(q\),我们有\(g_{ p + q + 1 } = C_p C_q C_{ n - ( p + q + 1 ) } = C_{ n - 1 }^{ ( 3 ) }\),同样是简单的卷积.

二项式系数的处理

通过恒等式变形求解

Example1

\(\sum_{ k = 0 }^n k \binom{ m - k - 1 }{ m - n - 1 } , n , m \in \mathbb{ N } \land m > n \\\).

这个式子乘了个系数\(k\)导致很难处理,一个自然的想法是使用吸收恒等式将\(k\)消去,然后对后面的式子使用上指标求和.

于是:

\[ \begin{aligned} \sum_{ k = 0 }^n k \binom{ m - k - 1 }{ m - n - 1 } & = \sum_{ k = 0 }^n m \binom{ m - k - 1 }{ m - n - 1 } - \sum_{ k = 0 }^n ( m - k ) \binom{ m - k - 1 }{ m - n - 1 } \\ & = m \sum_{ k = 0 }^{ m - 1 } \binom{ m - k - 1 }{ m - n - 1 } - ( m - n ) \sum_{ k = 0 }^m \binom{ m - k }{ m - n } \end{aligned} \]

不妨令\(S_m = \sum_{ k = 0 }^m \binom{ m - k }{ m - n } \\\),不难发现我们有:

\[ S_m = \sum_{ k = 0 }^m \binom{ k }{ m - n } = \binom{ m + 1 }{ m - n + 1 } \]

于是原式\(= mS_{ m - 1 } - ( m - n ) S_m = \cfrac{ n }{ m - n + 1 } \binom{ m }{ m - n } \\\).

不过事实上,我们有另一种方式来处理这个等式,我们直接将\(k = \binom{ k }{ 1 }\)带入:

\[ \begin{aligned} \sum_{ k = 0 }^n k \binom{ m - k - 1 }{ m - n - 1 } & = \sum_{ k = 0 }^n \binom{ k }{ 1 } \binom{ m - k - 1 }{ m - n - 1 } \\ & = \binom{ m }{ m - n + 1 } \\ & = \cfrac{ n }{ m - n + 1 } \binom{ m }{ m - n } \end{aligned} \]

Example2

\(\sum_{ k } k \binom{ n }{ k } \binom{ s }{ k } , n \in \mathbb{ N } \\\).

第一反应仍然是使用吸收恒等式,但是注意到\(n\)\(s\)的范围不一样,由于吸收恒等式的范围很松,因此应选择一个范围更松的数吸收,这样才能保证另一个数范围的特殊性,于是有:

\[ \begin{aligned} \sum_{ k } k \binom{ n }{ k } \binom{ s }{ k } & = s \sum_{ k } \binom{ n }{ k } \binom{ s - 1 }{ k - 1 } \\ & = s \binom{ n + s - 1 }{ n - 1 } \end{aligned} \]

Example3

\(\sum_{ 0 \leq k } \binom{ n + k }{ 2 k } \binom{ 2 k }{ k } \cfrac{ ( - 1 )^k }{ k + 1 } , n \in \mathbb{ N } \\\).

我们有:

\[ \begin{aligned} \sum_{ 0 \leq k } \binom{ n + k }{ 2 k } \binom{ 2 k }{ k } \cfrac{ ( - 1 )^k }{ k + 1 } & = \sum_{ 0 \leq k } \binom{ n + k }{ k } \binom{ n }{ k } \cfrac{ ( - 1 )^k }{ k + 1 } , n \in \mathbb{ N } \\ & = \cfrac{ 1 }{ n + 1 } \sum_{ 0 \leq k } \binom{ n + k }{ k } \binom{ n + 1 }{ k + 1 }{ ( - 1 )^k } \\ & = \cfrac{ 1 }{ n + 1 } \sum_{ 0 \leq k } \binom{ - n - 1 }{ k } \binom{ n + 1 }{ k + 1 } \\ & = \cfrac{ 1 }{ n + 1 } \binom{ 0 }{ n } \\ & = [ n = 0 ] \end{aligned} \]

Example4

\(\sum_{ k \geq 0 } \binom{ n + k }{ m + 2 k } \binom{ 2 k }{ k } \cfrac{ ( - 1 )^k }{ k + 1 } , n , m \in \mathbb{ N_+ } \\\).

考虑恒等式扩展的二项式恒等式(整数范围内)的\(( 1 )\),我们有:

\[ \begin{aligned} \sum_{ k \geq 0 } \binom{ n + k }{ m + 2 k } \binom{ 2 k }{ k } \cfrac{ ( - 1 )^k }{ k + 1 } & = \sum_{ k \geq 0 } \sum_{ 0 \leq j \leq n + k - 1 } \binom{ n + k - 1 - j }{ 2 k } \binom{ j }{ m - 1 } \binom{ 2 k }{ k } \cfrac{ ( - 1 )^k }{ k + 1 } \\ & = \sum_{ 0 \leq j \leq n - 1 } \binom{ j }{ m - 1 } \sum_{ j + 1 - n \leq k , 0 \leq k } \binom{ n + k - 1 - j }{ 2 k } \binom{ 2 k }{ k } \cfrac{ ( - 1 )^k }{ k + 1 } \end{aligned} \]

注意到如果\(j + 1 - n \geq 0\),则\(\binom{ n + k - 1 - j }{ 2 k } \\\)应为\(0\).所以有:

\[ \begin{aligned} & \sum_{ 0 \leq j \leq n - 1 } \binom{ j }{ m - 1 } \sum_{ j + 1 - n \leq k , 0 \leq k } \binom{ n + k - 1 - j }{ 2 k } \binom{ 2 k }{ k } \cfrac{ ( - 1 )^k }{ k + 1 } \\ = & \sum_{ 0 \leq j < n } \binom{ j }{ m - 1 } [ n - 1 - j = 0 ] = \binom{ n - 1 }{ m - 1 } \end{aligned} \]

Example5

\(\sum_{ k = 0 }^n ( C_n^k )^2\).

\[ \sum_{ k = 0 }^n ( C_n^k )^2 = \sum_{ k = 0 }^n C_{ n }^k \times C_{ n }^{ n - k } = C_n^{ 2 n } \]

转化为递归式/和式求解

Example1

\(Q_n = \sum_{ k \leq 2^n } \binom{ 2^n - k }{ k } ( - 1 )^k , n \in \mathbb{ N } \\\).

如果要转化为递归式的话,我们所掌握的只有加法恒等式,但加法恒等式只给出了杨辉三角中相邻两行的关系.但由于\(Q_n\)的式子中实际上只与\(2^n\)有关,我们不妨令\(R_n = \sum_{ k \leq n } \binom{ n - k }{ k } ( - 1 )^k \\\),显然有\(Q_n = R_{ 2^n }\).

而我们有:

\[ \begin{aligned} R_n & = \sum_{ k \leq n } \binom{ n - 1 - k }{ k } ( - 1 )^k + \sum_{ k \leq n } \binom{ n - 1 - k }{ k - 1 } ( - 1 )^k \\ & = \sum_{ k \leq n } \binom{ n - 1 - k }{ k } ( - 1 )^k + \sum_{ k \leq n - 1 } \binom{ n - k - 2 }{ k } ( - 1 )^{ k + 1 } \\ & = \sum_{ k \leq n - 1 } \binom{ n - 1 - k }{ k } ( - 1 )^k + \binom{ - 1 }{ n } ( - 1 )^n - ( \sum_{ k \leq n - 2 } \binom{ n - 2 - k }{ k } ( - 1 )^k + \binom{ - 1 }{ n - 1 } ( - 1 )^{ n - 1 } ) \\ & = \sum_{ k \leq n - 1 } \binom{ n - 1 - k }{ k } ( - 1 )^k - \sum_{ k \leq n - 1 } \binom{ n - 2 - k }{ k } ( - 1 )^k \\ & = R_{ n - 1 } - R_{ n - 2 } \\ & = R_{ n - 2 } - R_{ n - 3 } - R_{ n - 2 } \\ & = - R_{ n - 3 } \\ & = R_{ n - 6 } \end{aligned} \]

也即\(R_n\)具有周期性,不难计算前几项答案,最后有\(Q_n \begin{cases}1 & n = 0 \\ 0 & n \ is \ \mathrm{ odd } \\ - 1 & n > 0 \land n \ is \ \mathrm{ even }\end{cases}\).

Example2

\(( \sum^{ + \infty }_{ i = 0 } C^{ ik + r }_{ nk } ) \mod p\).

考虑设\(f ( n , r ) = \sum^{ + \infty }_{ i = 0 } C^{ ik + r }_{ nk } \\\),则有:

$$ \[\begin{aligned} f ( n , r ) & = \sum^{ + \infty }_{ i = 0 } C^{ ik + r }_{ nk } \\ & = \sum_{ i = 0 }^{ + \infty } \sum_{ j = 0 }^k C_{ nk - k }^{ ik + r - j } \times C_k^j \\ & = \sum^k_{ j = 0 } C_k^j \sum_{ i = 0 }^{ + \infty } C_{ nk - k }^{ ik + r - j } \\ & = \sum_{ j = 0 }^k C_k^j f ( n - 1 , r - j ) \\ \end{aligned}\]

$$

整理上式,得到:\(f ( n , r ) = \sum_{ j = 0 }^k C_k^j f ( n - 1 , r - j ) \\\).

于是我们得到了关于\(f\)的转移方程,可以矩阵加速.

利用微积分求解

Example

\(\sum_{ k = 1 }^n k^2 C_n^k\).

$$ \[\begin{aligned} ( ( 1 + x )^n ) & = ( \sum_{ k = 0 }^n C_n^k x^{ k } ) \\ ( ( 1 + x )^n ) ' & = ( \sum_{ k = 0 }^n C_n^k x^{ k } ) ' \\ n ( 1 + x )^{ n - 1 } & = \sum_{ k = 0 }^n kC_n^k x^{ k - 1 } \\ nx ( 1 + x )^{ n - 1 } & = \sum_{ k = 0 }^n kC_n^k x^{ k } \\ ( nx ( 1 + x )^{ n - 1 } ) ' & = ( \sum_{ k = 0 }^n kC_n^k x^{ k } ) ' \\ n ( ( 1 + x )^{ n - 1 } + ( n - 1 ) x ( 1 + x )^{ n - 2 } ) & = \sum_{ k = 0 }^n k^2 C_n^k x^{ k - 1 } \\ \end{aligned}\]

$$

\(x = 1\),则原式\(= n ( n + 1 ) 2^{ n - 2 }\).

转化为二维平面

Example1

多次询问给定\(k , r\),\(\sum k \leq 2 n , r < 2 n - k\),求\(\sum_{ i = 0 }^{ r } \frac{ 1 }{ 2^i } \binom{ i }{ n - k }\),.

我们把模型抽象成:在二维平面上,从\(( 0 , 0 )\)随机游走到\(( n - k + 1 , r - n + k )\)正下方(包含这个点)的概率,容易发现此时向右走了\(n - k\)步,总共走了\(\leq r\)步,然后再向右走一步保证第一次走到了\(( n - k + 1 , r - n + k )\)下方.

因为是概率,所以当我们已经确定这个事会发生的时候可以多走几步,不难发现这里的概率等价于走到\(x + y = r + 1\)这条直线时横坐标\(\geq n - k + 1\)的概率.枚举一下总共向上走了几步,就得到\(\frac{ 1 }{ 2^{ r } } \sum_{ j = 0 }^{ r - n + k } \binom{ r + 1 }{ j }\),注意这里是\(\frac{ 1 }{ 2^r }\),因为从一开始钦定了一步,因此映射过来需要多乘个\(\frac{ 1 }{ 2 }\),反映射就要乘个\(2\).但是这个式子还是做不了,因为\(r\)并不满足\(\sum r \leq 2 n\).我们需要另辟蹊径.

做一下补集转化转化成走到上方的概率,这个概率就等价于\(1 - \frac{ 1 }{ 2^{ r } } \sum_{ i = 0 }^{ n - k } \binom{ r + 1 }{ i }\).我们考虑暴力预处理出\(f_r = \sum_{ i = 0 }^{ n } \binom{ r }{ i }\),每次删掉一个后缀的组合数就行.现在的问题在于\(f\)怎么做.

直接拆组合数,我们有:

\[ \begin{aligned} f_r & = \sum_{ i = 0 }^n \binom{ r }{ i } \\ & = \sum_{ i = 0 }^n \binom{ r - 1 }{ i - 1 } + \sum_{ i = 0 }^n \binom{ r - 1 }{ i } \\ & = 2 \sum_{ i = 0 }^n \binom{ r - 1 }{ i } - \binom{ r - 1 }{ n } \\ & = 2 f_{ r - 1 } - \binom{ r - 1 }{ n } \end{aligned} \]

Lucas定理

\(p\)是质数,则\(C_n^m \mod p = C_{ n \mod p }^{ m \mod p } \times C_{ \lfloor \frac{ n }{ p } \rfloor }^{ \lfloor \frac{ m }{ p } \rfloor } \mod p \\\).

或者说,将\(n\)\(m\)\(p\)进制下分解,再逐位求组合数并相乘.

证明:

首先,若\(i \ne 0\)\(i \ne p\),\(C_{ p }^i \equiv \frac{ p }{ i } C_{ p - 1 }^{ i - 1 } \equiv 0 ( \mod p ) \\\).

而根据二项式定理,\(( 1 + x )^p \equiv \sum_{ i = 0 }^p C_{ p }^i x^i = 1 + x^p ( \mod p ) \\\).

\(n = k_1 p + b_1\),\(m = k_2 p + b_2\),则\(( 1 + x )^n = ( 1 + x )^{ k_1 p } ( 1 + x )^{ b_1 } \\\).

\(( 1 + x )^{ k_1 p } \equiv ( 1 + x^p )^{ k_1 } ( \mod p ) \\\),有\(( 1 + x )^n \equiv ( 1 + x^p )^{ k_1 } ( 1 + x )^{ b_1 } \\\).

根据二项式定理,\(C_n^m \bmod p\)\(x^m\)项的系数.

我们可以得出,\(C_n^m x^m \equiv C_{ k_1 }^{ k_2 } x^{ k_2 p } C_{ b 1 }^{ b_2 } x^{ b_2 } \pmod{ p } \\\),那么有\(C_a^b \equiv C_{ k_1 }^{ k_2 } C_{ b_1 }^{ b_2 } \pmod{ p } \\\).

另外,Lucas定理有一个很重要的推论是:

\[ \binom{ n }{ m } \equiv [ m \subseteq n ] \pmod{ 2 } \]

Example1([CF1770F]Koxia and Sequence)

首先观察样例并思考,可以发现当\(n\)为偶数时,显然翻转整个序列就可以一一对应(除非翻转后与本身相同,但这种情况下异或值也是\(0\)),所以异或值为\(0\).不然,我们可以翻转\(a [ 2 . . . n ]\),得出答案应该是所有\(a_1\)的异或和.

问题在于接下来怎么做,我们考虑把按位或的那个东西容斥掉.现在问题转化为:对于所有\(y ' \subseteq y\),求出满足\(a_i \subseteq y ' , \sum a_i = x\)时,\(a_1\)异或和.接下来怎么做呢?我们考虑拆位,若\(2^k \subseteq y '\),假设\(a_1\)的第\(k\)位是\(1\),然后讨论此时它对答案是否会产生贡献.

我们不难发现,第\(k\)位贡献是:

\[ [ 2^k \subseteq y ' ] \bigoplus_{ \sum a = x } [ 2^k \subseteq a_1 ] \prod_{ i = 1 }^n [ a_i \subseteq y ' ] \]

这个东西看上去没办法做,但我们突然想到个事:Lucas定理的推论:\([ x \subseteq y ] \equiv \binom{ y }{ x } \pmod{ 2 }\).

所以原式化简为:

$$ \[\begin{aligned} & \binom{ y ' }{ 2^k } \sum_{ \sum a = x } \binom{ a_1 }{ 2^k } \prod_{ i = 1 }^n \binom{ y ' }{ a_i } \pmod{ 2 } \\ = & \binom{ y ' }{ 2^k } \sum_{ a_1 } \binom{ y ' - 2^k }{ a_1 - 2^k } \sum_{ \sum a = x - a_1 } \prod_{ i = 2 }^n \binom{ y ' }{ a_i } \pmod{ 2 } \\ \end{aligned}\]

$$

然后呢?不难发现后面那一串是范德蒙德卷积的形式,就可以写成:

\[ \begin{aligned} & \binom{ y ' }{ 2^k } \sum_{ a_1 } \binom{ y ' - 2^k }{ a_1 - 2^k } \binom{ ( n - 1 ) y ' }{ x - a_1 } \pmod{ 2 } \\ = & \binom{ y ' }{ 2^k } \binom{ ny ' - 2^k }{ x - 2^k } \pmod{ 2 } \\ = & [ 2^k \subseteq y ' ] [ ( x - 2^k ) \subseteq ( ny ' - 2^k ) ] \end{aligned} \]

扩展Lucas定理

\(p = \prod p_i^{ e_i }\),那我们只要对于每个\(i\)求出\(C_n^m \mod p_i^{ e_i }\),然后使用中国剩余定理合并即可.

那现在问题转化为要求\(C_n^m \mod p^k\),其中\(p \in \mathrm{ prime }\).

原式\(= \frac{ n ! }{ m ! ( n - m ) ! } \mod p^k = \frac{ \frac{ n ! }{ p^x } }{ \frac{ m ! }{ p^y } \frac{ ( n - m ) ! }{ p^z } } p^{ x - y - z } \mod p^k \\\).

现在问题转化为求\(\frac{ n ! }{ p^x } \mod p^k 以 及 p^x \\\).

注意到:

\[ \begin{aligned} n ! & = \prod_{ i = 1 } i \\ & = ( \prod_{ i = wp , w \in \mathbb{ Z } } i ) ( \prod_{ i \ne wp , w \in \mathbb{ Z } } i ) \\ & = p^{ \lfloor n p \rfloor } ( \lfloor n p \rfloor ! ) ( \prod_{ i \ne wp , w \in \mathbb{ Z } } i ) \\ & \equiv p^{ \lfloor \frac{ n }{ p } \rfloor } ( \lfloor \frac{ n }{ p } \rfloor ! ) ( \prod_{ i = 1 , i \ne wp , w \in \mathbb{ Z } }^{ p^k } i )^{ \lfloor \frac{ n }{ p^k } \rfloor } ( \prod^{ n \ \bmod{ p^k } }_{ i = p^k \lfloor \frac{ n }{ p^k } \rfloor , i \ne wp , w \in \mathbb{ Z } } i ) ( \mod p^k ) \end{aligned} \]

递归求解即可.

ps:

这样摆式子可能非常难以理解,我们考虑将\([ 1 , n ]\)的所有数全部排成一个宽为\(p^k\)的矩阵.

那右边第一项就是把那些\(p\)的倍数的列拿出来,第二项是那些填满的行,第三项是最后没填满的一行.

斯特林数

第一类斯特林数

\(n \brack k \\\):长度为\(n\)的排列划分成\(k\)个轮换的方案数.

考虑现在已经将\(n - 1\)个数分成了若干轮换,现在新加入第\(n\)个数.这个数要么和其他的数一起组成轮换,要么自己形成自环.

而由于它可以插入前面轮换的任意位置,显然\(\left [ \begin{array}{ c } n \\ k\end{array} \right ] = ( n - 1 ) \left [ \begin{array}{ c } n - 1 \\ k\end{array} \right ] + \left [ \begin{array}{ c } n - 1 \\ k - 1\end{array} \right ] \\\).

特别地,我们定义\(\left [ \begin{array}{ c } 0 \\ k\end{array} \right ] = [ k = 0 ] \\\).

由于所有的排列都由若干置换组成,因此我们有:\(\sum_{ k = 0 }^n \left [ \begin{array}{ c } n \\ k\end{array} \right ] = n !\).

第二类斯特林数

\(\left \{ \begin{array}{ c } n \\ k\end{array} \right \}\):将\(n\)个本质不同的物品划分成k个非空集合的方案数.

考虑现在已经放好\(n - 1\)个物品,正要放入第\(n\)个物品.那么这个物品要么单独放在一起,要么和其他物品放在一起.显然\(\left \{ \begin{array}{ c } n \\ k\end{array} \right \} = k \left \{ \begin{array}{ c } n - 1 \\ k\end{array} \right \} + \left \{ \begin{array}{ c } n - 1 \\ k - 1\end{array} \right \} \\\).

特别地,我们定义\(\left \{ \begin{array}{ c } 0 \\ k\end{array} \right \} = [ k = 0 ] \\\).

斯特林数的扩展

如果我们让斯特林数的定义式扩展到整数域,我们可以发现一个性质:\({ n \brack m } ={ - m \brace - n } \\\).

基本斯特林恒等式

  1. \(x^n = \sum_{ k = 0 }^n \left \{ \begin{array}{ c } n \\ k\end{array} \right \} x^{ \underline{ k } } = \sum_{ k = 0 }^n \left \{ \begin{array}{ c } n \\ k\end{array} \right \} ( - 1 )^{ n - k } x^{ \overline{ k } } \\\).

证明:先考虑前半段,不妨使用数学归纳.若\(x^{ n - 1 } = \sum_{ k = 0 }^{ n - 1 } \left \{ \begin{array}{ c } n - 1 \\ k\end{array} \right \} x^{ \underline{ k } } \\\),我们要证

\

$$ \[\begin{aligned} x \sum_{ k = 0 }^{ n - 1 } \left \{ \begin{array} { c } n - 1 \\ k \end{array} \right \} x^{ \underline{ k } } & = \sum_{ k = 0 }^{ n } \left \{ \begin{array} { c } n \\ k \end{array} \right \} x^{ \underline{ k } } \\ \end{aligned}\]

$$

考虑\(( x - k ) x^{ \underline{ k } } = x^{ \underline{ k + 1 } }\),所以\(x \cdot x^{ \underline{ k } } = x^{ \underline{ k + 1 } } + kx^{ \underline{ k } } \\\).那么左边即:

$$ \[\begin{aligned} & \sum_{ k = 0 }^{ n - 1 } \left \{ \begin{array} { c } n - 1 \\ k \end{array} \right \} x^{ \underline{ k + 1 } } + \sum_{ k = 0 }^{ n - 1 } \left \{ \begin{array} { c } n - 1 \\ k \end{array} \right \} kx^{ \underline{ k } } \\ = & \sum_{ k = 1 }^{ n } \left \{ \begin{array} { c } n - 1 \\ k - 1 \end{array} \right \} x^{ \underline{ k } } + \sum_{ k = 1 }^{ n } \left \{ \begin{array} { c } n - 1 \\ k \end{array} \right \} kx^{ \underline{ k } } \\ = & \sum_{ k = 0 }^n \left \{ \begin{array} { c } n \\ k \end{array} \right \} x^{ \underline{ k } } \\ \\ \end{aligned}\]

$$

至于后半段,由于\(x^{ \underline{ n } } = ( - 1 )^n ( - x )^{ \overline{ n } } \\\),所以\(x^n = \sum_{ k = 0 }^n \left \{ \begin{array}{ c } n \\ k\end{array} \right \} ( - 1 )^k ( - x )^{ \overline{ k } } \\\).

不妨用\(x\)来代替\(- x\),我们有:

\[ \begin{aligned} ( - x )^n & = \sum_{ k = 0 }^n \left \{ \begin{array} { c } n \\ k \end{array} \right \} ( - 1 )^k ( x )^{ \overline{ k } } \\ x^n & = \sum_{ k = 0 }^n \left \{ \begin{array} { c } n \\ k \end{array} \right \} ( - 1 )^{ n - k } x^{ \overline{ k } } \end{aligned} \]

  1. \(x^{ \overline{ n } } = \sum_{ k = 0 }^n \left [ \begin{array}{ c } n \\ k\end{array} \right ] x^k \\\).

  2. \(x^{ \underline{ n } } = \sum_{ k = 0 }^n \left [ \begin{array}{ c } n \\ k\end{array} \right ] ( - 1 )^{ n - k } x^k \\\).

证明:

先考虑前者,由于\(( x + n - 1 ) x^k = x^{ k + 1 } + ( n - 1 ) x^k \\\),所以类似于(1)前半段的推导即可得到,后者同样可以使用下降幂和上升幂的转化来得到.

  1. 反转公式:\(\sum_{ k = 0 }^n \left [ \begin{array}{ c } n \\ k\end{array} \right ] \left \{ \begin{array}{ c } k \\ m\end{array} \right \} ( - 1 )^{ n - k } = \sum_{ k = 0 }^n \left \{ \begin{array}{ c } n \\ k\end{array} \right \} \left [ \begin{array}{ c } k \\ m\end{array} \right ] ( - 1 )^{ n - k } = [ m = n ] \\\).

证明:

考虑先证明后半部分,将(3)带入(1),得到\(x^n = \sum_{ k = 0 }^n \left \{ \begin{array}{ c } n \\ k\end{array} \right \} x^{ \underline{ k } } = \sum_{ k = 0 }^n \sum_{ m = 0 }^k \left \{ \begin{array}{ c } n \\ k\end{array} \right \} \left [ \begin{array}{ c } k \\ m\end{array} \right ] ( - 1 )^{ n - k } x^m \\\).

由于这对任意\(x\)都成立,因此右边除了\(x^n\)以外的项系数均为\(0\),而\(x^n\)的系数为\(1\).前半部分是同理的.这个公式是斯特林反演的基础.

  1. \(\left \{ \begin{array}{ c } n + 1 \\ m + 1\end{array} \right \} = \sum_{ k = m }^n \left ( \begin{array}{ c } n \\ k\end{array} \right ) \left \{ \begin{array}{ c } k \\ m\end{array} \right \} \\\).

  2. \(\left [ \begin{array}{ c } n + 1 \\ m + 1\end{array} \right ] = \sum_{ k = m }^n \left ( \begin{array}{ c } n \\ k\end{array} \right ) \left [ \begin{array}{ c } k \\ m\end{array} \right ] \\\).

证明:对于前者,考虑组合意义,将\(n + 1\)个分为\(m + 1\)组,也就是先找一部分分成\(m\)组,再把剩下的分到一组.对于后者,也可以同样考虑组合意义.

补充斯特林恒等式

  1. \(\left \{ \begin{array}{ c } n \\ m\end{array} \right \} = \sum_{ k = m }^n \left ( \begin{array}{ c } n \\ k\end{array} \right ) \left \{ \begin{array}{ c } k + 1 \\ m + 1\end{array} \right \} ( - 1 )^{ n - k } \\\).

  2. \(\left [ \begin{array}{ c } n \\ m\end{array} \right ] = \sum_{ k = m }^n \left ( \begin{array}{ c } n \\ k\end{array} \right ) \left [ \begin{array}{ c } k + 1 \\ m + 1\end{array} \right ] ( - 1 )^{ n - k } \\\).

证明:由(5)(6),根据二项式反演可知.

  1. \(m ! \left \{ \begin{array}{ c } n \\ m\end{array} \right \} = \sum_{ k = 0 }^m C_m^k k^n ( - 1 )^{ m - k } \\\).

证明:首先有\(m^n = \sum_{ k = 0 }^m m^{ \underline{ k } } \left \{ \begin{array}{ c } m \\ k\end{array} \right \} = \sum_{ k = 0 }^m k ! C_m^k \left \{ \begin{array}{ c } m \\ k\end{array} \right \} \\\),对这个式子进行二项式反演即可.

  1. \(\left \{ \begin{array}{ c } n + 1 \\ m + 1\end{array} \right \} = \sum_{ k = 0 }^n \left \{ \begin{array}{ c } k \\ m\end{array} \right \} ( m + 1 )^{ n - k } \\\).

证明:

考虑组合意义,相当于先把前\(k\)个分为\(m\)组,把第\(k + 1\)个数放到第\(m + 1\)组.然后剩下\(( n + 1 ) - ( k + 1 ) = n - k\)个随便放.相当于我们按照每组所放的数的最小值区分每组.由于这么做,第\(m + 1\)组(最小值最大的那组)在\(k\)不同的时候最小值是不同的,因此一定不重不漏.

  1. \(\left [ \begin{array}{ c } n + 1 \\ m + 1\end{array} \right ] = \sum_{ k = 0 }^n \left [ \begin{array}{ c } k \\ m\end{array} \right ] C_{ n }^k ( n - k ) ! = n ! \sum_{ k = 0 }^n \frac{ \left [ \begin{array}{ c } k \\ m\end{array} \right ] }{ k ! } \\\).

证明:

先考虑前半部分,首先如果\(n > 0\),我们有\(\left [ \begin{array}{ c } n \\ 1\end{array} \right ] = ( n - 1 ) ! \\\).这个式子很显然,我们现在有一个长度为\(n - 1\)的环,想要往里插入第\(n\)个数有\(n - 1\)种选择,所以我们有:\(\left [ \begin{array}{ c } n \\ 1\end{array} \right ] = \left [ \begin{array}{ c } n - 1 \\ 1\end{array} \right ] ( n - 1 ) \\\),数学归纳一下即可.

那么前半部分的组合意义就是:考虑将\(n + 1\)个数划分成\(m + 1\)个环,我们先将其中\(k\)个数划分成\(m\)个环,剩下\(n + 1 - k\)个数划分成另一个环.但是这样算显然会算重,所以我们只需要勒令第\(n + 1\)个数在最后一个环里即可.该证明就显然了.

而由于\(C_n^k ( n - k ) ! = C_n^{ n - k } ( n - k ) ! = n^{ \underline{ n - k } } = \frac{ n ! }{ k ! } \\\).因此后半部分也得证.

  1. \(\left \{ \begin{array}{ c } n + m + 1 \\ m\end{array} \right \} = \sum_{ k = 0 }^m k \left \{ \begin{array}{ c } n + k \\ k\end{array} \right \} \\\).

  2. \(\left [ \begin{array}{ c } n + m + 1 \\ m\end{array} \right ] \sum_{ k = 0 }^m ( n + k ) \left [ \begin{array}{ c } n + k \\ k\end{array} \right ] \\\).

证明:

先考虑前者,我们将\(n + k\)个位置分到\(k\)个集合之后.还剩下\(( n + m + 1 ) - ( n + k ) = ( m - k + 1 )\)个数,剩下\(( m - k )\)个集合.

拿出来\(( n + k + 1 )\)这个数,剩下的数刚好够每个集合放一个.最后枚举一下把\(( n + k + 1 )\)放在哪里即可.由于每个划分一定存在一段(可能是\(0\))单独自己集合的后缀.所以这个递推成立.后者也可以同样证明.

  1. \(C_n^m ( n - 1 )^{ \underline{ n - m } } = \sum_{ k = m }^n \left [ \begin{array}{ c } n \\ k\end{array} \right ] \left \{ \begin{array}{ c } k \\ m\end{array} \right \} \\\).

证明:

考虑\(( n - 1 )^{ \underline{ n - m } } = \frac{ ( n - 1 ) ! }{ ( m - 1 ) ! } \\\),不妨设\(f ( n , m ) = \sum_{ k = m }^n \left [ \begin{array}{ c } n \\ k\end{array} \right ] \left \{ \begin{array}{ c } k \\ m\end{array} \right \} \\\),相当于将\(n\)个数分成非空\(m\)组,然后组内的数要形成若干轮换的方案数.那么知道\(f ( n , m ) = f ( n - 1 , m - 1 ) + ( n - 1 + m ) f ( n - 1 , m ) \\\).

\(g ( n , m ) = C_n^m \frac{ ( n - 1 ) ! }{ ( m - 1 ) ! } = \frac{ n ! ( n - 1 ) ! }{ m ! ( n - m ) ! ( m - 1 ) ! } \\\),那么知道:

$$ \[\begin{aligned} g ( n - 1 , m - 1 ) & = \frac{ ( n - 1 ) ! ( n - 2 ) ! }{ ( m - 1 ) ! ( n - m ) ! ( m - 2 ) ! } \\ g ( n - 1 , m ) & = \frac{ ( n - 1 ) ! ( n - 2 ) ! }{ m ! ( n - 1 - m ) ! ( m - 2 ) ! } \\ \end{aligned}\]

$$

显然\(g ( n , m ) = g ( n - 1 , m - 1 ) + ( n - 1 + m ) g ( n - 1 , m ) \\\),数学归纳即可.

  1. \(C_n^m = \frac{ n ! }{ m ! ( n - m ) ! } = \sum_{ k = m }^n \left \{ \begin{array}{ c } n + 1 \\ k + 1\end{array} \right \} \left [ \begin{array}{ c } k \\ m\end{array} \right ] ( - 1 )^{ m - k } \\\).

  2. \(n^{ \underline{ n - m } } = \frac{ n ! }{ m ! } = \sum_{ k = m }^n \left [ \begin{array}{ c } n + 1 \\ k + 1\end{array} \right ] \left \{ \begin{array}{ c } k \\ m\end{array} \right \} ( - 1 )^{ m - k } , 其 中 m \leq n \\\).

证明:考虑(5)(6),对其做一遍斯特林反演即可.

  1. \(\left \{ \begin{array}{ c } n \\ l + m\end{array} \right \} C_{ l + m }^l = \sum_{ k = l }^n \left \{ \begin{array}{ c } k \\ l\end{array} \right \} \left \{ \begin{array}{ c } n - k \\ m\end{array} \right \} C_n^k \\\).

  2. \(\left [ \begin{array}{ c } n \\ l + m\end{array} \right ] C_{ l + m }^l = \sum_{ k = l }^n \left [ \begin{array}{ c } k \\ l\end{array} \right ] \left [ \begin{array}{ c } n - k \\ m\end{array} \right ] C_n^k \\\).

证明:先考虑前者,左边即先将\(n\)个数分为\(l + m\)个集合,然后再挑出\(l\)个集合.那不妨枚举这\(l\)个集合中是哪些数,然后再进行分配.后者同理.

欧拉数

\(\left \langle \begin{array}\\ n \\ k\end{array} \right \rangle\)表示\(\{ 1 , 2 , . . . , n \}\)的排列\(a\)中满足这条性质的排列个数:存在且只存在\(k\)个升高,换句话说,存在且只存在\(k\)\(i\),满足\(1 \leq i < n\),\(a_i < a_{ i + 1 }\).不难发现\(\left \langle \begin{array}\\ n \\ k\end{array} \right \rangle = \left \langle \begin{array}\\ n \\ n - k - 1\end{array} \right \rangle\).

考虑在一个\(\{ 1 , 2 , . . . , n - 1 \}\)的排列中插入\(n\),设插入的位置是原本\(a_i\)的后面,那么要么原本\(a_i < a_{ i + 1 }\),要么反之.前者不会改变排列的升高的数量,后者则会增加\(1\).另外还有一种情况是插入到了序列最前面.于是我们自然得到:\(\left \langle \begin{array}\\ n \\ k\end{array} \right \rangle = ( k + 1 ) \left \langle \begin{array}\\ n - 1 \\ k\end{array} \right \rangle + ( n - k ) \left \langle \begin{array}\\ n - 1 \\ k - 1\end{array} \right \rangle\).

特别地,我们令\(\left \langle \begin{array}\\ 0 \\ k\end{array} \right \rangle = [ k = 0 ]\),若\(k < 0\),则\(\left \langle \begin{array}\\ n \\ k\end{array} \right \rangle = 0\).

欧拉数与二项式系数

我们有Worpitzky恒等式:

\[ x^n = \sum_{ k \geq 0 } \binom{ x + k }{ n } \left \langle \begin{array} \\ n \\ k \end{array} \right \rangle , n \in \mathbb{ N } \]

还有另一个恒等式:

\[ \left \langle \begin{array} \\ n \\ m \end{array} \right \rangle = \sum_{ k = 0 }^m \binom{ n + 1 }{ k } ( m + 1 - k )^n ( - 1 )^k \]

剩下的不会了.

伯努利数

定义\(B_j\)为第\(j\)个伯努利数,且满足\(\sum_{ j = 0 }^m \binom{ m + 1 }{ j } B_j = [ m = 0 ] , m \geq 0 \\\).

定义\(S_m ( n ) = \sum_{ i = 0 }^{ n - 1 } i^m\).

伯努利数满足公式:\(S_m ( n ) = \cfrac{ 1 }{ m + 1 } \sum_{ k = 0 }^m \binom{ m + 1 }{ k } B_k n^{ m + 1 - k } \\\).

证明如下:

\(S_{ m + 1 } ( n )\)使用扰动法,我们有:

$$ \[\begin{aligned} S_{ m + 1 } ( n ) + n^{ m + 1 } & = \sum_{ k = 0 }^{ n - 1 } ( k + 1 )^{ m + 1 } \\ & = \sum_{ k = 0 }^{ n - 1 } \sum_{ j = 0 }^{ m + 1 } \binom{ m + 1 }{ j } k^j \\ & = \sum_{ j = 0 }^{ m + 1 } \binom{ m + 1 }{ j } S_j ( n ) \\ & = \sum_{ j = 0 }^{ m } \binom{ m + 1 }{ j } S_j ( n ) + S_{ m + 1 } ( n ) \\ n^{ m + 1 } & = \sum_{ j = 0 }^m \binom{ m + 1 }{ j } S_j ( n ) \\ \end{aligned}\]

$$

接下来使用数学归纳,假设\(0 \leq j < m\)时该公式成立,并假设有\(S_m ( n ) = \cfrac{ 1 }{ m + 1 } \sum_{ k = 0 }^m \binom{ m + 1 }{ k } B_k n^{ m + 1 - k } + \Delta \\\),我们只需要证明\(\Delta = 0\).

\[ \begin{aligned} n^{ m + 1 } & = \sum_{ j = 0 }^m \binom{ m + 1 }{ j } \cfrac{ 1 }{ j + 1 } \sum_{ k = 0 }^j \binom{ j + 1 }{ k } B_k n^{ j + 1 - k } + ( m + 1 ) \Delta \\ & = \sum_{ 0 \leq k \leq j \leq m } \binom{ j + 1 }{ k } \binom{ m + 1 }{ j } \cfrac{ 1 }{ j + 1 } B_k n^{ j + 1 - k } + ( m + 1 ) \Delta \\ & = \sum_{ 0 \leq k \leq j \leq m } \binom{ j + 1 }{ j - k } \binom{ m + 1 }{ j } \cfrac{ 1 }{ j + 1 } B_{ j - k } n^{ k + 1 } + ( m + 1 ) \Delta \\ & = \sum_{ 0 \leq k \leq j \leq m } \binom{ j + 1 }{ k + 1 } \binom{ m + 1 }{ j } \cfrac{ 1 }{ j + 1 } B_{ j - k } n^{ k + 1 } + ( m + 1 ) \Delta \\ & = \sum_{ 0 \leq k \leq m } \cfrac{ n^{ k + 1 } }{ k + 1 } \sum_{ j = k }^m B_{ j - k } \binom{ m + 1 }{ j } \binom{ j }{ k } + ( m + 1 ) \Delta \\ & = \sum_{ 0 \leq k \leq m } \cfrac{ n^{ k + 1 } }{ k + 1 } \binom{ m + 1 }{ k } \sum_{ j = k }^m B_{ j - k } \binom{ m + 1 - k }{ j - k } + ( m + 1 ) \Delta \\ & = \sum_{ k = 0 }^m \cfrac{ n^{ k + 1 } }{ k + 1 } \binom{ m + 1 }{ k } \sum_{ j = 0 }^{ m - k } B_{ j } \binom{ m + 1 - k }{ j } + ( m + 1 ) \Delta \\ & = \sum_{ k = 0 }^m \cfrac{ n^{ k + 1 } }{ k + 1 } \binom{ m + 1 }{ k } [ m - k = 0 ] + ( m + 1 ) \Delta \\ & = n^{ m + 1 } + ( m + 1 ) \Delta \end{aligned} \]

显然\(\Delta = 0\),上式成立.

斐波那契数

定义斐波那契数\(F_n = \begin{cases}0 & n = 0 \\ 1 & n = 1 \\ F_{ n - 1 } + F_{ n - 2 } & n > 1\end{cases}\).

斐波那契数的扩展定义

首先根据数学归纳,不难证明卡西尼恒等式:

\[ F_{ n + 1 } F_{ n - 1 } - F_n^2 = ( - 1 )^n , n > 0 \]

事实上,如果我们将斐波那契数的递推式改写作:\(F_n = F_{ n + 2 } - F_{ n + 1 }\),我们可以在\(n \in \mathbb{ Z }\)的时候定义斐波那契数,同样也是满足上面的恒等式的,而且我们可以发现:

\[ F_{ - n } = ( - 1 )^{ n - 1 } F_n , n \in \mathbb{ Z } \]

斐波那契数与数论

如果我们考虑不断使用斐波那契递推式展开,不难发现:

\[ \begin{aligned} F_{ n + k } & = F_k F_{ n + 1 } + F_{ k - 1 } F_n \\ F_{ n + m + 1 } & = F_{ n + 1 } F_{ m + 1 } + F_n F_m \end{aligned} \]

另外,如果我们在上面这个式子中取\(k = wn , w \in \mathbb{ N }\)并使用归纳法,我们又可以得到一个性质:\(F_{ kn }\)\(F_n\)的倍数,\(k \in \mathbb{ Z }\).

再观察这个式子,使用归纳法可以证明\(\gcd ( F_{ n } , F_{ n - 1 } ) = 1\),进一步有:\(\gcd ( F_{ n + m } , F_m ) = \gcd ( F_n , F_m )\).

如果我们推广这个结论,就可以得到一个重要的性质:

\[ \gcd ( F_m , F_n ) = F_{ \gcd ( n , m ) } \]

如果我们再一次推广这个结论,可以得到马蒂亚舍维奇引理:

\[ F_n^2 | F_m \Leftrightarrow nF_n | m , n > 2 \]

这个引理的证明如下:

由于\(F_{ n + 1 } \equiv F_{ n - 1 } \pmod{ F_n }\).于是我们有:\(F_{ 2 n } = F_n F_{ n + 1 } + F_{ n - 1 } F_n\),也就是\(F_{ 2 n } \equiv 2 F_n F_{ n + 1 } \pmod{ F_n^2 }\).

另外我们有:\(F_{ 2 n + 1 } \equiv F_{ n + 1 }^2 \pmod{ F_n^2 }\).

同理,使用归纳法可以证明:\(F_{ kn } \equiv kF_n F_{ n + 1 }^{ k - 1 } \pmod{ F_n^2 } , F_{ kn + 1 } \equiv F_{ n + 1 }^k \pmod{ F_n^2 }\).

\(F_{ n + 1 } \bot F_n\),于是\(F_{ kn } \equiv 0 \pmod{ F_n^2 } \Leftrightarrow k \equiv 0 \pmod{ F_n } , n > 2\).

斐波那契数系

我们如果定义\(j \gg k \Leftrightarrow j \geq k + 2\),那么有齐肯多夫定理:

每个正整数都有唯一的表示方式满足:\(n = \sum_{ i = 1 }^r F_{ k_i } , \forall 1 \leq i < r , k_i \gg k_{ i + 1 } \gg 0\).

首先证明存在性:我们考虑数学归纳,对于一个数n,如果\(\exists k\)满足\(F_k = n\),则显然成立,不然,应\(\exists k\)满足\(F_k < n < F_{ k + 1 }\),而\(n - F_k\)的表示已经存在了.另外,由于\(n - F_k < F_{ k + 1 } - F_k = F_{ k - 1 }\),因此必定不可能出现选了\(F_k\)又选了\(F_{ k - 1 }\)的情况,存在性得证.

至于唯一性,如果我们不选择\(F_k\)而是选择\(F_{ k - 1 }\),那么显然接下来无论怎么选,它们的加和都不可能大于等于\(F_k\),因此一定是唯一的.

这样的话,我们可以将一个自然数\(n\)以斐波那契数的形式表示出来.

斐波那契数的封闭形式

使用生成函数,令\(F ( z ) = \sum_{ k \geq 0 } F_k z^k\).那么不难发现\(F ( z ) - zF ( z ) - z^2 F ( z ) = z\),也就是\(F ( z ) = \cfrac{ z }{ 1 - z - z^2 }\).

考虑这个形式一定可以分解为\(F ( z ) = \cfrac{ a }{ 1 - \alpha z } + \cfrac{ b }{ 1 - \beta z }\)的形式,而这两种形式对应的生成函数都很显然.

进行因式分解,如果令\(\phi = \cfrac{ 1 + \sqrt{ 5 } }{ 2 } , \hat \phi = \cfrac{ 1 - \sqrt{ 5 } }{ 2 }\),那么可以得到\(F_n = \cfrac{ 1 }{ \sqrt{ 5 } } ( \phi^n - \hat \phi^n )\).

另外,由于\(\hat \phi^n\)的影响很小,于是又有\(F_n = \lfloor \cfrac{ \phi^n }{ \sqrt{ 5 } } + 0 . 5 \rfloor\).

连项式

连项式多项式\(K_n ( x_1 , x_2 , . . . , x_n )\)定义为:\(K_n ( x_1 , x_2 , . . . , x_n ) = \begin{cases}1 & n = 0 \\ x_1 & n = 1 \\ x_n K_{ n - 1 } ( x_1 , x_2 , . . . x_{ n - 1 } ) + K_{ n - 2 } ( x_1 , x_2 , . . . , x_{ n - 2 } ) & n \geq 2\end{cases}\).

通过定义不难发现:\(K_n ( 1 , 1 , . . . , 1 ) = F_{ n + 1 }\).

继续观察式子,会发现它递归的过程相当于枚举是否消掉相邻的一对数\(( x_{ n - 1 } , x_n )\).我们考虑用这样一种形式的字符串来表示最后某一项的情况:‘.’为还没有消除掉的项,长度为\(1\);’-‘为已经消除了的两项,长度为\(2\).那么\(K_n ( x_1 , x_2 , . . . , x_n )\)就可以表示为一个长度为\(n\)的字符串,其中若有\(k\)个’-‘,有\(n - 2 k\)个’.’,则有\(\binom{ n - k }{ k }\)种不同的排列方式.

于是我们有:

$$ \[\begin{aligned} K_n ( z , z , . . . , z ) & = \sum_{ k = 0 }^n \binom{ n - k }{ k } z^{ n - 2 k } \\ \end{aligned}\]

$$

另外,这也导出:\(F_{ n + 1 } = \sum_{ k = 0 }^n \binom{ n - k }{ k } \\\).

考虑上面的构造过程,不难发现\(K_n ( x_1 , x_2 , . . . , x_n ) = K_n ( x_n , x_{ n - 1 } , . . . , x_1 )\).

于是递归式可以写成:\(K_n ( x_1 , x_2 , . . . , x_n ) = x_1 K_{ n - 1 } ( x_2 , x_3 , . . . x_{ n } ) + K_{ n - 2 } ( x_3 , x_4 , . . . , x_{ n } )\).

进一步地,不断展开后得到:

\[ \begin{aligned} K_{ m + n } ( x_1 , . . . , x_m , x_{ m + 1 } , . . . , x_{ n + m } ) & = \\ K_m ( x_1 , . . . , x_m ) K_n ( x_{ m + 1 } , . . . , x_{ n + m } ) + K_{ m - 1 } ( x_1 , . . . , x_{ m - 1 } ) K_{ n - 1 } ( x_{ m + 2 } , . . . , x_{ n + m } ) \end{aligned} \]

另外,根据连项式的定义,不难导出\(K_n ( x_1 , . . . , x_n + y ) = K_n ( x_1 , . . . , x_n ) + K_{ n - 1 } ( x_1 , . . . , x_{ n - 1 } ) y\).

由这个公式可以推出:\(\cfrac{ K_{ n + 1 } ( a_0 , . . . , a_n ) }{ K_n ( a_1 , . . . , a_n ) } = \cfrac{ K_n ( a_0 , . . . , a_{ n - 1 } + \cfrac{ 1 }{ a_n } ) }{ K_{ n - 1 } ( a_1 , . . . , a_{ n - 1 } + \cfrac{ 1 }{ a_n } ) }\).

不断做这个迭代,于是我们可以得到连项式与连分数之间的关系:

\[ \cfrac{ K_{ n + 1 } ( a_0 , . . . , a_n ) }{ K_n ( a_1 , . . . , a_n ) } = a_0 + \cfrac{ 1 }{ a_1 + \cfrac{ 1 }{ a_2 + \cfrac{ 1 }{ a_3 + . . . } } } \]

另外,这个与数论中的Stern-Brocot树有很大关系,暂略.

前言

这个博客是北京大学课程《音乐与数学》的相关笔记.然而我懒得画五线谱以及插入钢琴图片,所以这里我们只空谈理论.

本人在大学前并未学过相关乐理,所以下面的个人理解当然可能会出错.

泛音列

拍音理论

假设两个正弦单音的频率分别是\(\omega , \omega + \delta\),那么它们叠加后是:

\[ \begin{aligned} & \sin ( 2 \pi ( \omega + \delta ) t ) + \sin ( 2 \pi \omega t ) \\ = & 2 \sin \left ( 2 \pi ( \omega + \frac{ \delta }{ 2 } ) t \right ) \cos ( \pi \delta t ) \end{aligned} \]

注意到这个声音受到\(\cos ( \pi \delta t )\)的控制.因此会以\(\frac{ \delta }{ 2 }\)的频率振动,由于\(\delta\)应该远小于\(\omega\),这里就会产生\(\delta = | \omega_1 - \omega_2 |\)个拍音.

Mersenne定律

考虑弦乐的情况,将一根弦理想化后,可以只关注它的三个参数:

  1. 弦长\(L\).

  2. 张力\(T\).

  3. 线密度\(\rho\).

对于弦的振动解微分方程,这里我不是很想解了啊!所以我们直接放结论,对于弦上一个点\(u ( x , t )\),首先是一维振动方程:

\[ \frac{ \partial^2 u }{ \partial x^2 } = \frac{ \rho }{ T } \frac{ \partial^2 u }{ \partial t^2 } \]

最终得到的会是一个无穷级数,这个无穷级数的每一项都形如:

\[ u_n ( x , t ) = c_n \sin ( \omega_n t + \theta_n ) \sin ( \frac{ n \pi }{ L } x ) \]

其中第\(n\)项的频率满足:

\[ f_n = \frac{ n }{ 2 L } \sqrt{ \frac{ T }{ \rho } } \]

其中我们将\(f_1\)称为基频,相应的声音称为基音,而将剩下的频率对应的声音统称为泛音,其中\(f_n , n \geq 2\)对应的是第\(n - 1\)泛音.

特别地,如果我们干脆记\(f = f_1\),上述结果告诉我们弦的振动产生的一列频率是:

\[ f , 2 f , 3 f , \cdots \]

这个序列通常被称为泛音列.

特别地,上述的频率其实是固定了点来讨论的,实际上的泛音要更为复杂,会在一根弦上的不同位置处产生不同的加权.实际上对于不同的\(n\),它们的泛音列长这个样子:

其中标注的点(波节)在振动中均是固定不变的.

这其实是某些弦乐演奏中一些按弦技巧的基础.例如这里,如果我用手轻触中间点,我就可以消灭掉所有的\(f_{ 2 k + 1 }\),泛音列中只剩下\(2 f , 4 f , \cdots\).我们后面会再提这个事,这意味着我弹出的音高了八度.那如果我按\(\frac{ 1 }{ 3 }\)处呢?那泛音列中就会只剩下\(3 f , 6 f , 9 f , \cdots\),也就是先高一个纯八度,再高一个纯五度.

还有拨弦,如果我在中间拨弦会发生什么呢?由于我的拨动使得整个弦应该以中间为对称形成一个偶函数,中间的点一定在波动,因此泛音列中剩下的就会是\(f , 3 f , 5 f , \cdots\).

管乐器

管乐器中振动的变为空气柱,不过吧空气柱这个东西振动的时候会略微超出管口,因此会有管口矫正这个事存在.

再就是,管乐器其实分为两种:开管(两面开口)和闭管(单面开口).而且不像琴弦的两端是固定的.一个自然的想法是,根据上面我们放的那张图,开口的那个位置一定要振动,而闭口的那个位置一定被卡住不动.这意味着开管和闭管的泛音列天然不同.具体来说:

开管的泛音列:

\[ f , 2 f , 3 f , 4 f , \cdots \]

闭管的泛音列:

\[ f , 3 f , 5 f , 7 f \]

另外,相同长度的管,开管的基音比闭管高了一个八度.

管乐器有一种演奏方式是超吹.简单来说,当你用力吹的时候,直觉上随着你用力越大,你吹出来的音的频率应该是连续的.但实际上听感更接近于离散的.这是因为从一开始整个泛音列就都是存在的,只是当气流加快的时候,后面的音在某种程度上被”加强”了,所以对于开管来说,你会先听到一个高八度的音,再听到一个高五度的音.

泛音列重合理论

既然如此,我们可以见到,当两个音的基频的比较为简单的时候,它们产生的泛音列重合程度就会较高.例如:

\[ \begin{gathered} f , 2 f , 3 f , 4 f , \cdots \\ 2 f , 4 f , 6 f , 8 f , \cdots \end{gathered} \]

或是:

\[ \begin{gathered} f , 2 f , 3 f , 4 f , \cdots \\ \frac{ 3 }{ 2 } f , 3 f , \frac{ 9 }{ 2 } f , 6 f , \cdots \end{gathered} \]

这从相当的程度解释了为什么理想的音程全都是简单整数比.

律制

要讲律制,首先要知道从经验上来讲,人耳对于音乐的听觉其实并非线性.换言之,当你听两个音的时候,你关注的可不是它们之间的频率差值,而可能更关注它们之间的频率比值.类似地,其实人听声压的时候靠的也是比值,例如分贝的定义是\(L_p = 20 \log_{ 10 } ( \frac{ p }{ p_0 } )\),其中\(p_0 = 20 \mu Pa\).

音程

我们称两个音级之间的距离为音程,其中高的音称为冠音,而低的音被称为根音,一个音程应该由两个参数决定:度数半音数,简单来说,度数是跨越的音名数量,而半音数是跨越的半音数量.表格长这样:

度数 | 半音数 | 名称 |
—- | —— | —— |
一 | 0 | 纯一度 |
二 | 1 | 小二度 |
二 | 2 | 大二度 |
三 | 3 | 小三度 |
三 | 4 | 大三度 |
四 | 5 | 纯四度 |
四 | 6 | 增四度 |
五 | 6 | 减五度 |
五 | 7 | 纯五度 |
六 | 8 | 小六度 |
六 | 9 | 大六度 |
七 | 10 | 小七度 |
七 | 11 | 大七度 |
八 | 12 | 纯八度 |

从这套理论出发,毕达哥拉斯说我们找一下最简整数比:注意到:

音程 | 频率比 |
—— | —— |
纯八度 | \(2 : 1\) |
纯五度 | \(3 : 2\) |
纯四度 | \(4 : 3\) |
大三度 | \(5 : 4\) |
小三度 | \(6 : 5\) |

看上去太漂亮了对吧!但是就是这个规定出了大锅.

五度相生律

中国的三分损益法和毕达哥拉斯的五度相生法其实是类似的东西,我们这里只考虑五度相生律.

毕达哥拉斯学派说,我们这么干,规定\(C\)的频率(当时其实不存在频率的概念,但我们这里就为了方便这么说了)为\(1\),然后每次向上升一个纯五度,如果超出去了呢,那就降一个八度降回来.回忆到纯五度是七个半音,这相当于求\(\{ 7 k \} \pmod{ 12 }\)这个数列对吧,简单数论知识告诉我们它必然能遍历\(12\)种情况,具体而言:

$$ \[\begin{aligned} C \to & & G \to & & D \to & & A \to & & E \to & & B \to \\ 1 \to & & \frac{ 3 }{ 2 } \to & & \frac{ 3^2 }{ 2^3 } \to & & \frac{ 3^3 }{ 2^4 } \to & & \frac{ 3^4 }{ 2^6 } \to & & \frac{ 3^5 }{ 2^7 } \to \\ \\ \\ \# F \to & & \# C \to & & \# G \to & & \# D \to & & \# A \to & & \# E \\ \frac{ 3^6 }{ 2^9 } \to & & \frac{ 3^7 }{ 2^{ 11 } } \to & & \frac{ 3^8 }{ 2^{ 12 } } \to & & \frac{ 3^9 }{ 2^{ 14 } } \to & & \frac{ 3^{ 10 } }{ 2^{ 15 } } \to & & \frac{ 3^{ 11 } }{ 2^{ 17 } } \\ \end{aligned}\]

$$

我们是拿纯八度和纯五度生成的所有的音,因此纯五度肯定是准的,那么与之对应的纯四度肯定是准的.但是看三度音程就会发现问题,例如大三度\(CE\)的比是\(\frac{ 81 }{ 64 } > \frac{ 80 }{ 64 } = \frac{ 5 }{ 4 }\).

更难过的是就算我们按照纯八度和纯五度生成的,这个纯八度也有点难绷.具体而言这里的\(\# E \ne F\),你对着这个\(\# E\)往上再升一个音得到的理应是\(C ' = \frac{ 3^{ 12 } }{ 2^{ 18 } } > 2\),具体来说\(\frac{ 3^{ 12 } }{ 2^{ 19 } } \approx 1 . 013643\),这就出事了,这个东西转一圈并没有转到理想的纯八度音阶上,这个问题在中国古代的三分损益上也体现了,那里的名字叫旋宫不归,这里的话则是将这个略大于\(1\)的数叫做毕达哥拉斯音差.

仔细分析一下就会发现这个问题几乎是不可避免的,因为你上升\(12\)个纯五度,再下降\(7\)个纯八度理应回到原点,可是:

\[ ( \frac{ 3 }{ 2 } )^{ 12 } \times ( \frac{ 1 }{ 2 } )^7 > 1 \]

这下这下了.

纯律

其实我们刚才就能见到真正完美符合简单整数比的律根本调不出来.但是能不能让一些常用的音程(比如纯八度,纯五度,纯四度,大三度)尽可能准呢.这就是纯律在干的事.

还是规定\(C\)的频率为\(1\).接下来用正三和弦(一个大三度和一个小三度)\(I : C - E - G\),\(IV : F - A - C '\),\(V : G - B - D '\)的比例是\(4 : 5 : 6\)确定剩下的:

\[ \begin{aligned} C & & D & & E & & F & & G & & A & & B & & C ' & & D ' \\ 1 & & \frac{ 9 }{ 8 } & & \frac{ 5 }{ 4 } & & \frac{ 4 }{ 3 } & & \frac{ 3 }{ 2 } & & \frac{ 5 }{ 3 } & & \frac{ 15 }{ 8 } & & 2 & & \frac{ 9 }{ 4 } \end{aligned} \]

所以现在大三度和小三度都准了.但问题又来了:

  1. 五度音程\(D - A\)不协和,比例为\(\frac{ 80 }{ 54 } < \frac{ 81 }{ 54 } = \frac{ 3 }{ 2 }\).这直接导致了转调会出错.

  2. 有两种不同的大二度:音程\(C - D , F - G , A - B\)的比例是\(\frac{ 9 }{ 8 }\)而音程\(D - E , G - A\)的比例为\(\frac{ 10 }{ 9 }\).

  3. 谐调音差:从\(C\)出发升高四个纯五度,降低两个八度和一个大三度后,得到的是:\(( \frac{ 3 }{ 2 } )^4 \times ( \frac{ 1 }{ 2 } )^2 \times \frac{ 4 }{ 5 } = \frac{ 81 }{ 80 } = 1 . 0125 > 1\).

十二平均律

既然我们一开始就说了律是根据比值来定的,为什么不直接简单一点,干脆用\(\sqrt[12]{ 2 }\)来平均律制呢?于是将近五百年前就有了朱载堉这位手开十二次根号的神人.这也是所有律法中几乎最简单的一种了,以至于我到这里发现没啥可写的了.

但它的问题也是最一眼能看出来的,那就是除了纯八度,全都不准.

先在这里定义音分的概念,设两个声音的频率分别是\(f_1 , f_2\),则它们的音分数定义为\(1200 \log_2 ( \frac{ f_2 }{ f_1 } )\),容易见到十二平均律拿到的一个半音恰好是\(100\)音分.

用音分可以迅速确定一下,发现十二平均律这玩意准的离谱,虽然哪里都差一点,但哪里差的都不多.

调式

大小调

自然大调

就是我们最常用的\(CDEFGABC '\),用大二度和小二度组织调式.具体而言,以一个大二度分开了两组四声音阶(均为大大小),按顺序分别为:

  1. 主音

  2. 上主音

  3. 中音

  4. 下属音

  5. 属音

  6. 下中音

  7. 导音

用五度相生,下属音\(\rightarrow\)主音\(\rightarrow\)属音.

自然小调

以一个大二度分开了两组四声音阶(分别为大小大和小大大)

\(ABCDEFG\)用的调子,然而这里的问题是\(G\)作为导音却和\(A '\)差了个全音,导得不好.

和声小调

以一个大二度分开了两组四声音阶(分别为大小大和小增小)

将自然小调的导音升高一个半音.用\(A , B , C , D , E , F , (^\# G )\).

但是这样出了个增二度.

旋律小调

以一个大二度分开了两组四声音阶(分别为大小大和大大小)

把下中音也升上去,这样差的就小,用\(A , B , C , D , E , (^\# F ) , (^\# G )\).

可以见到小调改音的主要目的是为了调导音的作用,这种作用只有在上行音阶的时候才是需要人为更改的,因此下行音阶不改音,与自然小调的下行音阶保持一致.

升降号调

以五度相生:

\[ C \to G \to D \to A \to E \to B \to (^\# F ) \to (^\# C ) \]

依次考虑它们为主调的自然大调音阶.

大调音阶的前后是对称的全全半+全+全全半结构,跳一个五度刚好能从前半部分跳到后半部分,因此从\(C\)开始每次往后跳一次都要在一个音阶上增一个升号.从\(C\)大调提升到\(G\)大调的时候就是将\(C\)的下属音(也就是\(F\))升音.

对称地,反方向的五度相生:

\[ C \to F \to (^b B ) \to (^b E ) \to (^b A ) \to (^b D ) \to (^b G ) \to (^b C ) \]

那这个应该降什么呢?比如从\(C\)大调提升到\(F\)大调的时候就是将\(F\)的下属音\(B\)降一个音对吧.

所以最后的结果就是:

一个自然大调将主音向前挪小三度就得到了一个自然小调,它们称为一对关系大小调.

具有相同主音的大小调被称为平行大小调.其实也就是名字精确到大小写是一样的.

一个大调的下属音大调和属音大调以及对应的关系小调称为其近关系调.

和弦

三和弦

按照三度音程叠起来的三个音所构成的和弦被称为三和弦.其中最下面的音被称为根音,最上面的音被称为冠音或者五音,中间的被称为三音.

由于三度音程分大小,所以就有了四种不同的三和弦.

  1. 大三和弦:下面一个大三度,上面一个小三度,刚好形成\(4 : 5 : 6\)的频率关系.

  2. 小三和弦:下面一个小三度,上面一个大三度.

  3. 减三和弦:两个小三度.

  4. 增三和弦:两个大三度.

七和弦

按照三度音程叠四个音构成的和弦被称为七和弦.除去其中由三个大三度构成的(这样使得最上方的七音和最底下的根音形成了八度)以外,其余七种七和弦依照三和弦名称+七度音阶名称的原则命名,如下:

  1. 减减七和弦(减七和弦):小小小.

  2. 减小七和弦(半减七和弦):小小大.

  3. 小小七和弦(小七和弦):小大小.

  4. 小大七和弦:小大大.

  5. 大小七和弦(属七和弦):大小小.

  6. 大大七和弦(大七和弦):大小大.

  7. 增大七和弦:大大小.

很遗憾的是七和弦全部包含至少一个不协和音程,所以它们全都是不协和和弦.

和弦转位

以根音为低音的和弦为原位和弦,以三五七音为低音的则称为转位和弦.

对于三和弦来说:

  1. 以三音作为低音的称为第一转位,也称作六和弦.

  2. 以五音作为低音的称为第二转位,也称作四六和弦.

对于七和弦来说:

  1. 以三音作为低音的称为第一转位,也称作五六和弦.

  2. 以五音作为低音的称为第二转位,也称作三四和弦.

  3. 以七音作为低音的称为第三转位,也称作二和弦.

和弦的调性

在调式的主音,下属音,属音上的和弦分别被称为主和弦(I),下属和弦(IV),属和弦(V),它们被统称为正和弦,在C大调中体现为\(C - E - G\),\(F - A - C '\),\(G - B - D '\).其中主和弦一般比较稳定,属和弦则比较飘渺,下属和弦往往则起到过度作用.

一定范围内的和弦连接被称为和声进行,下面是三种基本形式:

  1. 正格进行:\(I \to V \to I\).

  2. 变格进行:\(I \to IV \to I\).

  3. 复式进行:\(I \to IV \to V \to I\).

对于大调来说,其不同的三和弦之间有更加复杂的关系.经验给出以下图表:

\[ \xymatrix{ & & & & I \\ & & IV \ar[r] \ar[d] \ar[dr] \ar[rru] & vii \degree \ar[ru] & \\ iii \ar[r] & vi \ar[r] \ar[ru] & ii \ar[r] \ar[ru] & V \ar[ruu] & } \]

其中\(I\)较为特殊,可以走向全部的和弦,这里略去不画.

新黎曼理论

引入以下三种对三和弦的变换(均会使得大和弦变小和弦,小和弦变大和弦):

  1. 平行变换\(P\):保持纯五度音阶不变,将三音切换.

  2. 关系变换\(R\):保持大三度音阶不变,补上剩下的一个(等价于大小调转换).

  3. 导音变换\(L\):保持小三度音阶不变,补上剩下的一个.

容易见到\(R \circ ( L \circ R )^3 = P\).

随机化算法

基本分析

Union Bound

即:\(Pr [ \bigcup_i X_i ] \leq \sum Pr [ X_i ]\),取等当且仅当所有\(X_i\)互斥.

Markov 不等式

\(X \geq 0\),则\(Pr [ X \geq t \mathbb{ E } [ X ] ] \leq \frac{ 1 }{ t }\).

Example(Max-Cut算法)

一个无向无权图,将点集划分成两个部分,使得跨越这两部分的边尽可能多.

直接随机划分,容易见到每条边有\(\frac{ 1 }{ 2 }\)的概率是割边,因此期望自然是\(\frac{ 1 }{ 2 } | E | \geq \frac{ 1 }{ 2 } | \text{ max - cut } |\).

由此立即见到,\(Pr [ | ans | \leq ( \frac{ 1 }{ 2 } - \epsilon ) | E | ] = Pr [ | E | - | ans | \geq ( \frac{ 1 }{ 2 } + \epsilon ) | E | ] \leq \frac{ 1 }{ 1 + 2 \epsilon }\).

由于每次独立操作,因此如果有\(P\)的概率失败,那么运行\(T\)次后至少成功一次的概率应当为\(1 - P^T\).从而\(T = O ( \log_P{ \delta } ) = O ( \cfrac{ \ln \frac{ 1 }{ \delta } }{ \ln ( 1 +{ 2 \epsilon } ) } ) \approx O ( \cfrac{ \ln \frac{ 1 }{ \delta } }{ \epsilon } )\)即可拿到\(\delta\)失败概率.

Chernoff Bound

\(X_1 , \cdots , X_n \in [ 0 , 1 ]\)是独立,同期望(期望为\(\mu \geq t\))的随机变量,令\(X = \frac{ \sum_k X_k }{ n }\),对于任何失败概率\(\delta \in ( 0 , 1 )\),应当有:

\[ Pr \left [ | X - \mu | \geq \sqrt{ \cfrac{ \log ( 1 / \delta ) }{ nt } } \mu \right ] \leq \delta \]

Example(Median Trick)

现在有一个黑盒能够以\(p > \frac{ 1 }{ 2 }\)的概率正确回答Yes或者No,问重复\(T\)选多少次能拿到\(1 - \delta\)的成功概率.

考虑重复\(T\)次后应当有期望\(pT\)个正确答案,因此直接取中位数.称此算法为Median Trick.

Chernoff Bound 告诉我们\(T = O ( \log \frac{ 1 }{ \delta } )\)足够.

Hoeffding 不等式

设独立随机变量\(x_1 , \cdots , x_m \in [ s , t ]\),令\(X = \sum_i x_i\),则:

\[ Pr [ X - E [ X ] \geq z ] \leq 2 \exp \left ( - \cfrac{ 2 z^2 }{ m ( t - s )^2 } \right ) \]

编程中的随机性

一般采用伪随机,也即是给定初值\(X_0\),通过某个确定性的函数来生成\(X_{ n + 1 } = f ( X_n )\)这样的.

数值概率算法

即通过随机选取元素从而求得在数值上的近似解.较之于传统算法,其运行速度更快,而且随着运行时间的增加,近似解的精度也会提高.在不可能或不必要求出问题的精确解时,可以使用其得到相当满意的近似解,如随机撒点法(近似求难以计算的图形面积).

Monte Carlo算法

总是能在确定的运行时间内出解,但是得到的解有一定概率是错的.通常出错的概率比较小,因此可以通过反复运行算法来得到可以接受的正确率.

求解最优化问题的Monte Carlo算法

事实上,大部分最优化问题都可以转化为判定性问题:也就是判定一个解是否是最优解,因此我们接下来基本都是讨论的求解判定性问题的Monte Carlo算法.

求解判定性问题的Monte Carlo算法
  1. 假倾向的Monte Carlo算法:当这类算法的返回值为假的时候,结果一定正确,但返回值为真的时候则有一定概率错误.

  2. 真倾向的Monte Carlo算法:当这类算法的返回值为真的时候,结果一定正确,但返回值为假的时候则有一定概率错误.

  3. 产生双侧错误的Monte Carlo算法:无论返回值为什么都有概率出错.基本不会使用.

以下讨论的Monte Carlo算法均为产生单侧错误的Monte Carlo算法.

正确率与复杂度

显然,如果我们有一个单词正确率为\(p\),时间复杂度为\(O ( f ( n ) )\)的算法,我们运行其\(k\)次,则正确率为\(1 - ( 1 - p )^k\),时间复杂度为\(O ( kf ( n ) )\).

算法设计思路1

我们来总结一下通常的Monte Carlo算法的设计思路:

设计一个能解决问题的确定性算法
  1. 这个算法需要枚举一些元素.

  2. 设这个算法的复杂度为\(O ( f ( n ) g ( n ) )\),其中\(f ( n )\)为枚举部分的复杂度,\(g ( n )\)为单词枚举中计算所需的复杂度.大部分情况下应保证\(g ( n )\)不会很大.

向算法引入随机化优化复杂度
  1. 随机化寻找元素来降低复杂度.

  2. 计算随机化情况下的正确率以及复杂度.

算法设计思路2
设计一个能解决问题的确定性算法
  1. 这个算法需要用到一个或多个传入的元素.

  2. 这个元素的值不应该依赖于输入数据.

  3. 我们可以通过check这个元素来得到与答案有关的信息.

向算法引入随机化优化复杂度
  1. 随机这个元素.

  2. 计算随机化情况下的正确率以及复杂度

Example
Example 1(Millar-Rabin算法)

Example2(CodeChef MSTONE)

平面上有\(n\)个互不重合的点,已知存在不超过\(7\)条直线可以覆盖全部的点,问在平面上作一条直线,最多能覆盖多少个点.\(n \leq 10000\).

考虑一个朴素的暴力:枚举两个点,确定一条直线,然后判断多少个点在这条直线上.但是这样复杂度是\(O ( n^3 )\)的.

考虑加入随机化.我们不妨每次随机两个点,注意到存在七条直线覆盖全部的点,那覆盖点最多的直线覆盖的点数一定不少于\(\lceil \frac{ n }{ 7 } \rceil\)个点.换句话说,我们随机一个点,这个点在这条直线上的概率是\(\frac{ 1 }{ 7 }\),因此随机两个点确定这条直线的概率为\(\frac{ 1 }{ 49 }\).随机\(1000\)次,错误概率为\(1 - ( \frac{ 48 }{ 49 } )^{ 1000 }\),是很小的.

Example3(CF364D Ghd)

给定一个长度为\(n\)的序列,要求找出一个长度大于等于\(\frac{ n }{ 2 }\)的子序列,使这个子序列中所有数的\(\gcd\)最大,求最大的\(\gcd\).\(n \leq 10^6\),\(a_i \leq 10^{ 12 }\).

注意到我们随机一个数,这个数在最终答案中的概率是\(\frac{ 1 }{ 2 }\).我们不妨直接随机这个数,然后枚举它的因子,判断每个因子在序列中的出现次数即可.但是这样单次复杂度\(O ( n \sqrt{ a } )\),好像不太能过.

冷静一下,我们不妨将这\(\sqrt{ a }\)个质因子全都存下来,然后将\(n\)个数也全都存下来,做狄利克雷后缀和即可.不过直接做可能还需要离散化/map,我们考虑先把所有数与我们随机到的那个数取一个\(\gcd\),这样所有数就都是这个数的因子,可以使用大小因子分别编号来实现.

Example4([POI2014]Couriers)

给定长度为\(n\)的序列\(a\),有\(m\)次询问,每次给定一个区间\([ l , r ]\),问\(a [ l , r ]\)中是否存在出现次数严格大于其它所有数出现次数之和的数,如果存在请输出.\(( n , m \leq 500000 , 1 \leq a_i \leq n )\).

先存下来每个位置的数是第几次出现,我们就可以利用二分快速找到一个区间内某个数出现次数.接下来只需要随机化找这个区间内某个数并判断是否满足条件即可.

Example5([NOI2013] 向量内积)

先考虑\(k = 2\)的情况:

首先,我们自然可以枚举一个向量\(A\)并判断它与其它向量的内积,这样复杂度为\(O ( n^2 d )\).

冷静一下,这个过程其实就是一个矩阵乘法的过程:我们设\(A = \begin{bmatrix}\vec{ a_1 } , \vec{ a_2 } , . . . , \vec{ a_n }\end{bmatrix}\),那我们要验证的无非是\(B = AA^T\)中是否存在一个不在主对角线上的元素\(B_{ i , j }\)\(\mod 2\)意义下为\(0\).

这咋做啊?我们冷静一下,构造一个矩阵\(C\),其中\(C\)的主对角线元素与\(B\)相同,而其他元素全是\(1\).接下来我们要做的无非是找到\(B\)\(C\)不同的地方.

这咋办呢?我们考虑这么一点:如果\(B = C\),那么对于任意一个\(X_{ m \times n }\)都应该满足\(XB = XC\),取\(m = 1\),我们的问题就转化为:是否能找到一个\(X\),使得\(XB \ne XC\)?这显然可以随机化.计算前者的复杂度为\(O ( nd )\),后者由于\(C\)很特殊,可以在\(O ( n )\)的时间内求出.这样我们就保证了算法复杂度上的合理性.

接下来,我们要证明其正确率上的合理性.这个算法显然是单侧错误的Monte Carlo算法.问题在于正确率:

\(D = B - C\),若返回相等但实际上不相等,则\(D\)中至少存在一个不为\(0\)的数字,假设\(D_{ i , j } \ne 0\).我们令\(E = X \times D\),那么只有当\(E\)是零向量时才会错误.而\(E_j = \sum_{ k } X_k D_{ k , j }\),不难解得:\(E_i = - \frac{ 1 }{ D_{ i , j } } \sum_{ k \ne i } X_k D_{ k , j }\),也就是说如果\(X\)的其它位置都确定了,那么\(E\)只有一种取值会返回错误.由于\(k\)一共就俩取值,所以正确率至少\(\frac{ 1 }{ 2 }\).

至于找到答案:我们找到一个不为\(0\)\(E_i\),那么一定存在一组解包含了第\(i\)个向量,只需枚举另一个向量检验就行,复杂度\(O ( nd )\).

\(k = 3\)的话,我们注意到\(\mod 3\)意义下,\(1\)\(2\)的平方都是\(1\).考虑\(\sum_{ j } B_{ i , j }^2 X_j = \sum_{ j } B_{ i , j } X_j B_{ h , i }^T\),大概做做.

Las Vegas算法(Sherwood算法)

总是能返回正确的结果,但是其运行时间不确定.对于一些平均时间复杂度优秀,但是最坏情况下复杂度较高的确定性算法,通过引入随机函数,尝试减小最坏情况的可能性,以在期望意义下达到优秀的时间复杂度.

算法设计思路
设计一个能解决问题的确定性算法
  1. 这个算法需要枚举全排列.

  2. 通常,问题问的是要么只是可行解而不是最优解,要么最优方案特别多,总之要保证有用的排列个数不会太少

向算法引入随机化优化复杂度
  1. 随机化寻找排列来降低复杂度.

  2. 通常证明复杂度和正确率巨大麻烦,这里建议直接实践证明.

Example
快速排序算法

我们试图计算它的期望时间复杂度:

不妨设\(T ( n )\)表示对长度为\(n\)的序列运行快速排序算法所需的期望时间,我们有:

\[ \begin{aligned} T ( 0 ) & = 0 \\ T ( n ) & = n + \frac{ 1 }{ n } \sum_{ i = 0 }^{ n - 1 } ( T_i + T_{ n - i - 1 } ) \end{aligned} \]

做放缩(可能有些地方需要\(+ 1\)或者\(- 1\)或者加取整,但是问题不大,反正是期望):

\[ \begin{aligned} T ( n ) & = n + \frac{ 1 }{ n } \sum_{ i = 0 }^{ n - 1 } ( T_i + T_{ n - i - 1 } ) \\ & = n + \frac{ 2 }{ n } \sum_{ i = \frac{ n }{ 2 } }^{ n - 1 } ( T_i + T_{ n - i - 1 } ) \\ & = n + \frac{ 2 }{ n } \sum_{ i = \frac{ n }{ 2 } }^{ \frac{ 3 n }{ 4 } } ( T ( i ) + T ( n - i - 1 ) ) + \frac{ 2 }{ n } \sum_{ i = \frac{ 3 n }{ 4 } }^{ n } ( T ( i ) + T ( n - i - 1 ) ) \end{aligned} \]

由于\(T ( n ) \geq n\),所以对于\(\frac{ n }{ 2 } \leq i \leq j\),我们显然有:\(T ( i ) + T ( n - i ) \leq T ( j ) + T ( n - j )\).

因此:

\[ \begin{aligned} T ( n ) & \leq n + \frac{ 2 }{ n } \sum_{ i = \frac{ n }{ 2 } }^{ \frac{ 3 n }{ 4 } } ( T ( \frac{ 3 n }{ 4 } ) + T ( \frac{ n }{ 4 } ) ) + \frac{ 2 }{ n } \sum_{ i = \frac{ 3 n }{ 4 } }^{ n } ( T ( n - 1 ) + T ( 0 ) ) \\ & \leq n + \frac{ 1 }{ 2 } ( T ( \frac{ 3 n }{ 4 } ) + T ( \frac{ n }{ 4 } ) + T ( n - 1 ) ) \end{aligned} \]

我们要证明\(\exists c\),\(T ( n ) \leq cn \log n\),考虑使用数学归纳法,则:

\[ \begin{aligned} T ( n ) & \leq n + \frac{ 1 }{ 2 } ( \frac{ 3 cn }{ 4 } \log ( \frac{ 3 n }{ 4 } ) + \frac{ cn }{ 4 } \log ( \frac{ n }{ 4 } ) + c ( n - 1 ) \log ( n - 1 ) ) \\ & \leq n + c ( \frac{ 3 n }{ 8 } \log n - \frac{ 3 n }{ 8 } \log \frac{ 4 }{ 3 } + \frac{ n }{ 8 } \log n - \frac{ n }{ 4 } + \frac{ n }{ 2 } \log n ) \\ & = cn \log n + n ( 1 - \frac{ 3 c }{ 8 } \log ( \frac{ 4 }{ 3 } ) - \frac{ c }{ 4 } ) \end{aligned} \]

于是显然存在,假设成立.

一类由Monte Carlo算法改造而成的算法

对于一类一定有解的构造性问题,假设我们有一个正确率为\(p\),时间复杂度为\(O ( f ( n ) )\)的产生单侧错误的Monte Carlo算法,我们时图将其改造为Las Vegas算法,我们现在想知道它的期望复杂度.

设其期望运行\(k\)次,则:

\[ \begin{aligned} k & = \sum_{ i = 1 }^{ \infty } p ( 1 - p )^{ i - 1 } i \\ ( 1 - p ) k & = \sum_{ i = 1 }^{ \infty } p ( 1 - p )^i i \\ pk & = \sum_{ i = 2 }^{ \infty } p ( 1 - p )^{ i - 1 } = p \sum_{ i = 0 }^{ \infty } ( 1 - p )^i \\ k & = \frac{ 1 }{ p } \end{aligned} \]

则期望复杂度为\(O ( \frac{ f ( n ) }{ p } )\).

Example3(CF329C Graph Reconstruction)
Example4([Petrozavodsk Summer-2015. Moscow IPT Contest B]Game With A Fairy)

首先注意到一个问题:操作能得到的信息太少了,应该是没有什么确定性算法.因此考虑随机化,那就肯定要先将整个序列random_shuffle一下.

然后呢?我们考虑之后随机选取新序列的一个前缀询问,只要有大致的正确性/复杂性估计应该就是很正确的.

这里有一种方式:考虑这个前缀中第一个有宝藏的位置\(x_1\)和第二个位置\(x_2\),显然只要问到\([ x_1 , x_2 )\)是正确的.

考虑因为是随机,所以\(x_1 \times 2 \leq x_2\)的概率应当是不低的(事实上约为\(\frac{ 1 }{ 2 }\)),而此时的\([ x_1 , x_2 )\)中必有一个位置是二的整数幂,因此我们查询一个等比数列:\(1 , 2 , 4 , . . .\).每次random_shuffle后就查一次,就可以得到一个正确性较高的Las Vegas算法.

爬山与模拟退火

爬山

也就是随机一个起始的解,然后走向与其相邻的较大的解.

但是这样会卡在一个局部最优解上而得不到全局最优解.

于是我们就有了模拟退火算法.

模拟退火

简而言之,模拟退火就是以一定的概率跳到随机的不优秀的点,这样就避免卡在了局部最优解上.不妨设我们想找到最大解,如果要最小解那就稍微改改.

下面给出这个概率的公式:

\[ P = \begin{cases} 1 & E_{ t + 1 } > E_t \\ e^{ \frac{ E_{ t + 1 } - E_t }{ T } } & E_{ t + 1 } \leq E_t \end{cases} \]

具体流程是,先设定一个初始温度\(T_0\),降温速度\(k \in ( 0 , 1 )\),以及终止温度\(T_k\),每次操作后让\(T = kT\),直到其小于终止温度.

数据随机下的性质

  1. 随机树树高为\(\sqrt{ n }\).

  2. 点的度数期望为\(\log n\).

  1. 数字的期望因数个数为\(\log V\).

序列

  1. 随机序列的LIS长度期望为\(O ( \sqrt{ n } )\).

离散概率

基本定义

概率空间\(\Omega\):在一个给定问题中可能发生的所有情况.

事件:\(\Omega\)的一个子集.

基本事件\(\omega\):\(\Omega\)中的单个元素,也可以看作集合大小为\(1\)的事件.

概率:若\(\omega \in \Omega\),我们称它发生的概率为\(\Pr ( \omega )\),有\(\Pr ( \omega ) \geq 0\)\(\sum_{ \omega \in \Omega } \Pr ( \omega ) = 1\).

随机变量:在概率空间的基本事件上定义的函数.

联合分布:如果两个随机变量\(X\)\(Y\)定义在同一个概率空间\(\Omega\)上,对于每一个在\(X\)取值范围内的\(x\)以及在\(Y\)取值范围内的\(y\),我们称\(\Pr ( X = x \land Y = y )\)为它们的联合分布.

独立:如果对于每一个在\(X\)取值范围内的\(x\)以及在\(Y\)取值范围内的\(y\),\(\Pr ( X = x \land Y = y ) = \Pr ( X = x ) \times \Pr ( Y = y )\),我们称\(X\)\(Y\)是独立的.

期望(均值)\(E X\):我们设概率空间上的随机变量\(X\)的期望\(EX = \sum_{ x \in X ( \Omega ) } x \times \Pr ( X = x ) = \sum_{ w \in \Omega } X ( \omega ) \Pr ( \omega )\).

中位数:我们设概率空间上的随机变量\(X\)的中位数为满足\(\Pr ( X \leq x ) \geq 0 . 5 \land \Pr ( X \geq x ) \geq 0 . 5\)\(x \in X ( \Omega )\)所组成的集合.

众数:我们设概率空间上的随机变量\(X\)的众数为满足\(\Pr ( X = x ) \geq \Pr ( X = x ' ) , \forall x ' \in X ( \Omega )\)\(x \in X ( \Omega )\)所组成的集合.

方差\(VX\):我们设概率空间上的随机变量\(X\)的方差\(VX = E ( ( X - EX )^2 )\).

标准差\(\sigma\):我们设概率空间上的随机变量\(X\)的标准差\(\sigma = \sqrt{ VX }\).

期望的简单运算

如果\(X , Y\)是定义在同一个概率空间上的两个随机变量,那么:

  1. \(E ( X + Y ) = EX + EY\).

  2. \(E ( \alpha X ) = \alpha EX\).

  3. 如果\(X\)\(Y\)互相独立,那么\(E ( XY ) = ( EX ) ( EY )\).

上述法则都可以通过期望的定义简单证明.

此外(3)的逆命题不成立.考虑取\(X\)分别以\(\frac{1}{2}\)的概率选取\(-1\)\(1\),取\(Y=X^2\),则\(E(X)=E(XY)=0\).

方差的简单运算

我们考虑方差的定义式:

\[ \begin{aligned} E ( ( X - EX )^2 ) & = E ( X^2 - 2 X ( EX ) + ( EX )^2 ) \\ & = E ( X^2 ) - 2 ( EX ) ( EX ) + ( EX )^2 \\ & = E ( X^2 ) - ( EX )^2 \end{aligned} \]

也即:方差等于随机变量平方的均值减均值的平方.

\(X\)\(Y\)为独立的随机变量时,我们有:

\[ \begin{aligned} V ( X + Y ) & = E ( ( X + Y )^2 ) - ( EX + EY )^2 \\ & = E ( ( X + Y )^2 ) - ( EX )^2 - 2 ( EX ) ( EY ) - ( EY )^2 \end{aligned} \]

而又有:

\[ \begin{aligned} E ( ( X + Y )^2 ) & = E ( X^2 + 2 XY + Y^2 ) \\ & = E ( X^2 ) + 2 ( EX ) ( EY ) + E ( Y^2 ) \end{aligned} \]

则:

\[ \begin{aligned} V ( X + Y ) & = E ( X^2 ) + 2 ( EX ) ( EY ) + E ( Y^2 ) - ( EX )^2 - 2 ( EX ) ( EY ) - ( EY )^2 \\ & = VX + VY \end{aligned} \]

即:独立随机变量之和的方差等于它们的方差之和.此外显然也有\(\mathrm{Var}(X-Y)=\mathrm{Var}(X)+\mathrm{Var}(Y)\).

事实上,容易见到可以定义协方差\(\mathrm{Cov}(X,Y)=E(XY)-E(X)E(Y)\).容易见到以下性质:

  1. \(\mathrm{Cov}(X,X)=\mathrm{Var}(X)\).
  2. \(\mathrm{Cov}(X,Y)=\mathrm{Cov}(Y,X)\).
  3. \(\mathrm{Cov}(aX,bY)=ab\mathrm{Cov}(X,Y)\).
  4. \(\mathrm{Cov}(X_1+X_2,Y)=\mathrm{Cov}(X_1,Y)+\mathrm{Cov}(X_2,Y)\).
  5. \(X,Y\)相互独立,则\(\mathrm{Cov}(X,Y)=0\).然而逆命题不成立.
  6. \(\mathrm{Var}(\sum_{i}X_i)=\sum_{i}\sum_j\mathrm{Cov}(X_i,X_j)\).
  7. \(\mathrm{Var}(X+Y)=\mathrm{Var}(X)+\mathrm{Var}(Y)+2\mathrm{Cov}(X,Y)\).

随机抽样调查

如果我们随机取得了\(n\)个值\(X_1 , X_2 , . . . , X_n\),那么我们可以通过这些值来估计概率空间的期望和方差.

\(\hat EX = \cfrac{ \sum_{ i = 1 }^n X_i }{ n }\).

\(\hat VX = \cfrac{ \sum_{ i = 1 }^n X_i^2 }{ n - 1 } - \cfrac{ ( \sum_{ i = 1 }^n X_i )^2 }{ n ( n - 1 ) }\).

这里的\(\hat VX\)似乎与定义不是那么相符.但是它拥有更好的性质:\(E ( \hat VX ) = VX\).

证明如下:

\[ \begin{aligned} E ( \hat VX ) & = \cfrac{ 1 }{ n - 1 } E ( \sum_{ i = 1 }^n X_i^2 - \cfrac{ 1 }{ n } \sum_{ j = 1 }^n \sum_{ k = 1 }^n X_j X_k ) \\ & = \cfrac{ 1 }{ n - 1 } ( \sum_{ i = 1 }^n E ( X_i^2 ) - \cfrac{ 1 }{ n } \sum_{ i = 1 }^n \sum_{ j = 1 }^n E ( X_i X_j ) ) \\ & = \cfrac{ 1 }{ n - 1 } ( \sum_{ i = 1 }^n E ( X^2 ) - \cfrac{ 1 }{ n } \sum_{ i = 1 }^n \sum_{ j = 1 }^n ( ( EX )^2 [ j \ne k ] + E ( X^2 ) [ j = k ] ) ) \\ & = \cfrac{ 1 }{ n - 1 } ( nE ( X^2 ) - \cfrac{ 1 }{ n } ( nE ( X^2 ) + n ( n - 1 ) ( EX )^2 ) ) \\ & = E ( X^2 ) - ( EX )^2 \\ & = VX \end{aligned} \]

条件概率

已知事件B发生时事件A发生的概率为\(P ( A | B ) = \frac{ P ( AB ) }{ P ( B ) } \\\).

贝叶斯公式

贝叶斯公式:如果有\(\{ B_i \}\)是样本空间的一个划分,即\(\forall i , j\),有\(B_i \cap B_j = \emptyset\),并且有\(\bigcup_{ i = 1 }^n B_i = \Omega\).则有\(P ( B_i | A ) = \frac{ P ( AB_i ) }{ P ( A ) } = \frac{ P ( AB_i ) }{ P ( A ) \sum P ( B_j ) } = \frac{ P ( A B_i ) }{ \sum_{ j = 1 }^n P ( A B_j ) } = \frac{ P ( A | B_i ) P ( B_i ) }{ \sum_{ j = 1 }^n P ( A | B_j ) P ( B_j ) } \\\).

简化形式:\(P ( B | A ) = \frac{ P ( A | B ) P ( B ) }{ P ( A ) } \\\).

另外,我们考虑设\(O ( B ) = \cfrac{ P ( B ) }{ P ( \lnot B ) }\),称\(\cfrac{ P ( B | E ) }{ P ( \lnot B | E ) }\)为贝叶斯算子,则同理可得:

\[ O ( B | E ) = O ( B ) \cfrac{ P ( B | E ) }{ P ( \lnot B | E ) } \]

这个公式更加精准地分开了先验概率和后验概率,也表现了贝叶斯算子对先验概率的改变.

概率生成函数

如果\(X\)是定义在概率空间\(\Omega\)上的随机变量,那么它的概率生成函数为\(G_X ( z ) = \sum_{ k \geq 0 } \Pr ( X = k ) z^k = E ( z^X )\).

不难发现\(G_X ( z )\)需要满足的条件:所有系数都非负并且\(G_X ( 1 ) = 1\).

我们发现,当我们定义了概率生成函数后,期望和方差都可以使用它来表示:

\[ \begin{aligned} EX & = G_X ' ( 1 ) \\ E ( X^2 ) & = G ' '_X ( 1 ) + G_X ' ( 1 ) \\ VX & = G_X ' ' ( 1 ) + G_X ' ( 1 ) - ( G_X ' ( 1 ) )^2 \end{aligned} \]

通常,我们也可以将方差和均值的定义扩展到任意函数上,于是我们定义:

\[ \begin{aligned} Mean ( G ) & = G ' ( 1 ) \\ Var ( G ) & = G ' ' ( 1 ) + G ' ( 1 ) - ( G ' ( 1 ) )^2 \end{aligned} \]

不过,求导的过程可能会有些麻烦,但我们可以直接使用泰勒定理:

\[ G ( 1 + t ) = \sum_{ i \geq 0 } \cfrac{ G^{ ( i ) } ( 1 ) }{ i ! } t^i \]

另外,我们不难发现:\(G_{ X + Y } ( z ) = G_X ( z ) G_Y ( z )\).

根据前面的推导,我们有:

\[ \begin{aligned} Mean ( G_{ X + Y } ) & = Mean ( G_X ) + Mean ( G_Y ) \\ Var ( G_{ X + Y } ) & = Var ( G_X ) + Var ( G_Y ) \end{aligned} \]

换句话说,若\(G_X ( 1 ) = 1 , G_Y ( 1 ) = 1\),那么这个式子与直接对\(G_{ X + Y }\)使用求导的那个公式是等价的.注意,这里并没有要求这些生成函数的系数是非负的.

于是我们有了另一个法则:

\[ \begin{aligned} Mean ( G_X ) & = Mean ( G_{ X + Y } ) - Mean ( G_Y ) \\ Var ( G_X ) & = Var ( G_{ X + Y } ) - Var ( G_Y ) \end{aligned} \]

Example1

一枚硬币正面向上的概率为\(p\),反面向上的概率为\(q\),设硬币正面向上为H,反面向上为T,不断抛掷硬币直到抛掷出连续的THTTH为止,求期望次数.

考虑设\(N\)为所有不包含THTTH的硬币序列的生成函数,\(S\)为所有只有结尾为THTTH的硬币序列的生成函数,令\(H = pz , T = qz\),\(1\)为空集,我们显然有:

\[ \begin{aligned} 1 + N \times ( H + T ) & = N + S \\ N \times THTTH & = S + S \times TTH \end{aligned} \]

解方程即可.

另外不难发现,这种方法取决于字符串的所有border,显然是通用方法.

我们考虑扩展这个方法,设\(A\)是我们要找到的字符串,\(m\)是它的长度,令\(A^{ ( k ) }\)表示\(A\)字符串的前\(k\)个字符所组成的字符串,\(A_{ ( k ) }\)表示\(A\)字符串的后\(k\)个字符所组成的字符串.这样的形式与\(k\)阶导的形式可能会起冲突,但至少在接下来我们的式子中不会出现导数(好吧其实是因为《具体数学》上就这么写的我也懒得改了).

我们的方程将会变为:

\[ \begin{aligned} 1 + N ( H + T ) & = N + S \\ N \times A & = S ( \sum_{ k = 0 }^{ m - 1 } A^{ ( k ) } [ A^{ ( m - k ) } = A_{ ( m - k ) } ] ) \end{aligned} \]

如果我们设\(\tilde{ A }\)为将字符串\(A\)中的H替换成\(\cfrac{ 1 }{ p } z\),T替换成\(\cfrac{ 1 }{ q } z\)之后的值,那么显然有:

\[ \begin{aligned} N \times A & = A \times S \times ( \sum_{ k = 1 }^{ m } \tilde{ A }_{ ( k ) } [ A^{ ( k ) } = A_{ ( k ) } ] ) \\ N & = S \times ( \sum_{ k = 1 }^{ m } \tilde{ A }_{ ( k ) } [ A^{ ( k ) } = A_{ ( k ) } ] ) \\ \cfrac{ S - 1 }{ H + T - 1 } & = S \times ( \sum_{ k = 1 }^{ m } \tilde{ A }_{ ( k ) } [ A^{ ( k ) } = A_{ ( k ) } ] ) \\ S \times ( 1 + ( 1 - H - T ) \times ( \sum_{ k = 1 }^{ m } \tilde{ A }_{ ( k ) } [ A^{ ( k ) } & = A_{ ( k ) } ] ) ) = 1 \end{aligned} \]

这显然是一个卷积的形式.

\(w = \sum_{ k = 1 }^{ m } \tilde{ A }_{ ( k ) } [ A^{ ( k ) } = A_{ ( k ) } ]\).

\(H ( z ) = 1\),\(F ( z ) = ( 1 + ( 1 - z ) \times w )\),\(G ( z ) = S\).

那么我们显然可以直接求\(G ( z )\)的期望和方差,事实上:

\[ \begin{aligned} EX & = \sum_{ k = 1 }^{ m } \tilde{ A }_{ ( k ) } [ A^{ ( k ) } = A_{ ( k ) } ] \\ VX & = ( EX )^2 - \sum_{ k = 1 }^m ( 2 k - 1 ) \tilde{ A }_{ ( k ) } [ A^{ ( k ) } = A_{ ( k ) } ] \end{aligned} \]

如果硬币是均匀的(\(p = q = \cfrac{ 1 }{ 2 }\))我们引入另一个符号:我们设\(A : A = \sum_{ k = 1 }^m 2^{ k } [ A^{ ( k ) } = A_{ ( k ) } ]\).那么显然期望需要的抛硬币次数就是\(( A : A )\).

Example2(Penney游戏)

一枚均匀硬币,设硬币正面向上为H,反面向上为T.不断扔硬币直到扔出连续的HHT或HTT为止,求最后以HHT结尾的概率.

我们设\(S_A\)为所有以HHT结尾的硬币序列的生成函数,设\(S_B\)为所有以HTT结尾的硬币序列的生成函数.\(N\)为其它的硬币序列的生成函数,令\(H = T = 0 . 5 z\).

我们显然有:

\[ \begin{aligned} 1 + N ( H + T ) & = N + S_A + S_B \\ N \times HHT & = S_A \\ N \times HTT & = S_A \times T + S_B \end{aligned} \]

解方程并带入\(z = 1\),可以有得知以HHT结尾的概率为\(\cfrac{ 2 }{ 3 }\).

事实上,我们使用类似Example1的方法,设这两个硬币序列分别为\(A\)\(B\),那么可以求出:

\[ \cfrac{ S_A }{ S_B } = \cfrac{ B : B - B : A }{ A : A - A : B } \]

Example3([SDOI2017] 硬币游戏)

是Example2的超级加强版.

把上面的东西给形式化一下,不妨设\(g_i\)表示进行了\(i\)步还未结束的概率,\(f_{ k , i }\)为进行了\(i\)步恰好第\(k\)个人胜利的概率,\(F , G\)是它们的生成函数,我们自然有:

  1. \(1 + xG ( x ) = \sum_k F_k ( x ) + G ( x )\).

  2. \(( \frac{ 1 }{ 2 } x )^L G ( x ) = \sum_{ j = 1 }^n F_j ( x ) \sum_{ i = 0 }^{ L - 1 } ( \frac{ 1 }{ 2 } x )^i [ A_k^{ ( L - i ) } ={ A_j }_{ ( L - i ) } ]\).

第一个式子的用处在于带入\(x = 1\),发现\(\sum_{ k } F_k ( 1 ) = 1\).

把(2)化简一下,有:

\[ \begin{aligned} x^L G ( x ) & = \sum_{ j = 1 }^n F_j ( x ) \sum_{ i = 0 }^{ L - 1 } ( \frac{ 1 }{ 2 } x )^{ i - L } [ A_k^{ ( L - i ) } ={ A_j }_{ ( L - i ) } ] \\ x^L G ( x ) & = \sum_{ j = 1 }^n F_j ( x ) \sum_{ i = 1 }^{ L } ( \frac{ 1 }{ 2 } x )^{ - i } [ A_k^{ ( i ) } ={ A_j }_{ ( i ) } ] \end{aligned} \]

带入\(x = 1\),有:

\[ G ( 1 ) = \sum_{ j = 1 }^n F_j ( 1 ) \sum_{ i = 1 }^{ L } 2^i [ A_k^{ ( i ) } ={ A_j }_{ ( i ) } ] \]

不难发现对于不同的\(k\),(2)的右边不同,而左边一定相同,这样就给出了\(n\)个等式,算上(1)一共有\(n + 1\)个等式,可以算出\(G ( 1 ) , F_{ 1 \cdots n } ( 1 )\)\(n + 1\)个未知数.

二项式分布

现在有一个大小为\(n + 1\)的概率空间,其中\(\Pr ( \omega_k ) = \binom{ n }{ k } p^k q^{ n - k } \\\),我们把这样的概率序列称为二项式分布.

如果我们令\(H ( z ) = q + pz\),不难发现二项式分布的生成函数为\(H ( z )^n\).

不难发现,满足二项式分布的随机变量的均值是\(np\),方差是\(npq\).

与二项式分布相对应的还有负二项式分布,它的生成函数形如:\(G ( z )^n = ( \cfrac{ p }{ 1 - qz } )^n = \sum_{ k } \binom{ n + k - 1 }{ k } p^n q^k z^k\).

我们考虑如何求\(G ( z )\)的方差和均值,不妨设\(F ( z ) = \cfrac{ 1 - qz }{ p } = \cfrac{ 1 }{ p } - \cfrac{ q }{ p } z\),则\(G ( z )^n = F ( z )^{ - n }\).

不难发现\(F ( z )\)满足二项式分布.也就是说,以\(( n , p , q )\)为参数的负二项式分布也就是以\(( - n , - \cfrac{ q }{ p } , \cfrac{ 1 }{ p } )\)为参数的二项式分布.

模型

树上随机游走

随机游走指每次从相邻的点中随机选一个走过去, 重复这样的过程若干次.

Example1

给一棵所有边长都为\(1\)\(n\)个点的树,问所有点对\(( i , j ) ( 1 \leq i , j \leq n )\)中,从\(i\)走到\(j\)的期望距离的最大值是多少.

由于树上简单路径唯一,我们考虑设\(f_u\)表示\(u\)随机走到它父亲的期望,\(g_v\)表示\(v\)的父亲(假设是\(u\))走到\(v\)的期望.

对于\(f_u\),我们有:

\[ \begin{aligned} f_u & = \cfrac{ \sum_{ u \rightarrow v } ( f_v + f_u ) }{ \deg_u } + 1 \\ f_u & = \deg_u + \sum_{ u \rightarrow v } f_v \end{aligned} \]

对于\(g_v\),我们有:

\[ \begin{aligned} g_v & = \cfrac{ g_u + g_v + \sum_{ u \rightarrow w , w \ne v } ( g_v + f_w ) }{ \deg_u } + 1 \\ g_v & = g_u + \sum_{ u \rightarrow w , w \ne v } f_w + \deg_u \end{aligned} \]

Example2

给出一棵\(n\)个节点的树,每个点有可能是黑白两种颜色的一种.

现在从\(1\)号点开始随机游走(即走这个点的每条出边的概率是相同的),每到一个点,如果这个点是黑点,或者这是白点并且这个点第一次经过,那么答案\(+ 1\).当走到度数为\(1\)的节点时游走停止.

注意到黑白点对答案的贡献是互相独立的,所以分开讨论:

如果只有黑点,那么显然答案就是路径的期望长度,我们设\(f_u\)表示以\(u\)为起点的路径的期望长度,不难注意到\(f_{ leaf } = 1\)\(f_u = 1 + \cfrac{ 1 }{ \deg_u } \sum_{ u \rightarrow v \lor v \rightarrow u } f_v\).这个dp转移显然是有后效性的,可以使用高斯消元做,但有一个经典做法:我们求得\(f_u = k_u f_{ fa } + b_u\),然后就可以采取带入化简的方法做了.

如果只有白点,考虑每个点只会贡献一次,所以我们要求出的就是每个点被走到的概率.注意到一个点被走到一定是从它父亲走来的,于是我们需要求出\(g_v\)表示从\(v\)的父亲(假设是\(u\))走到\(v\)的概率,再令\(f_u\)表示从\(u\)走到父亲的概率,类似Example1,我们有:

\[ \begin{aligned} f_u & = \cfrac{ 1 }{ \deg_u } ( 1 + \sum_{ u \rightarrow v } f_v f_u ) \\ g_v & = \cfrac{ 1 }{ \deg_u } ( 1 + g_v g_u + \sum_{ u \rightarrow w , w \ne v } f_w g_v ) \end{aligned} \]

最后把两部分答案合起来就好.

计数与期望的转换

Example(CodeChef Secplayer)

冷静一下,如果我们直接计数的话会发现巨大难做,因为项太多了,直接乘起来也太麻烦了.

这启发我们:当我们注意到一个计数题的各种情况相乘很麻烦的时候,我们不妨只考虑一种情况并计算期望,然后拿期望和总数反推计数.注意到权值最小的人最危险,他不能和其他任何一个人匹配到,不然就死了.那不难求得此时他作为次大值存活的概率为\(\frac{ 1 }{ \binom{ n }{ 2 } }\).

把所有人权值从大到小排序,设\(f_i\)表示只考虑前\(i\)个人的时候的期望,不难发现:\(f_{ i } = \frac{ 1 }{ \binom{ i }{ 2 } } v_i + ( 1 - \frac{ 1 }{ \binom{ i }{ 2 } } ) f_{ i - 1 }\).

一些小技巧

Example1(CF865C)

首先写出转移式子,但是存在后效性.如果我们设\(f_{ i , j }\)表示过了\(i\)关,花费为\(j\)的期望,不难发现所有的\(f\)都需要与\(f_{ 0 , 0 }\)\(\min\),这咋办?

我们考虑二分这个\(f_{ 0 , 0 }\),做的时候直接取\(\min\),这样最后还会求出一个\(f_{ 0 , 0 }\),比较一下大小然后继续做二分.

等一下,为撒子这样是收敛的呢?

首先,根据这个题,期望肯定是存在的.

我们注意到我们一开始二分的\(f_{ 0 , 0 }\)越大,最后的答案就越大,但是增长的一定会变慢.换句话说,最后的答案关于我们二分的值的关系应该是一个上凸的函数(增长的时候会被取\(\min\)的另一项限制住,但原本应该是没被限制的),于是这个时候得到的答案如果比二分的答案更小,那我们就应该调小一点.

换句话说,当我们二分答案的时候,应该判断函数凸性.wqs二分也是这个道理:二分答案并判断答案是否满足条件.

Example2(猎人杀)

先做一步转化:如果做期望的时候,会有一些操作变得不能做,那我们改为:先随便选,如果选到不合法的操作就跳过,概率和期望都不会变.

offline

Example3(AGC019F)

人类智慧题…

首先注意到策略显然是每次选剩下最多的答案.

我们画一张\(n \times m\)的图(假设\(n \geq m\)),其中格点\(( a , b )\)表示现在还剩\(a\)个Yes,\(b\)个No.我们再把我们的策略用图上的有向边表示.我们先考虑转化为计数问题,那答案显然就是所有从\(( n , m )\)走到\(( 0 , 0 )\)的路径与我们图上有向边的交的大小总和.

然后咧?

我们注意到这张图长得太规律了,换句话说,如果我们把图的左半部分沿着直线\(y = x\)翻折(路径也跟着翻折),注意到对着这张图做仍然是一样的!

所以呢?由于从\(( n , m )\)走到\(( 0 , 0 )\)一定会经过\(n\)条有向边,所以期望贡献一定要加上一个\(n\).而如果我走到了直线\(y = x\)上,那接下来的贡献是\(\frac{ 1 }{ 2 }\).我们只需要枚举一下走到了多少次即可.

一些不等式

Union Bound

即:\(\mathbb{P} [ \bigcup_i X_i ] \leq \sum \mathbb P [ X_i ]\),取等当且仅当所有\(X_i\)互斥.

Markov 不等式

\(X \geq 0\),则\(\mathbb{P} [ X \geq t \mathbb{ E } [ X ] ] \leq \frac{ 1 }{ t }\).

显然,多的太多的话就会超过\(E\).

Chebyshev 不等式

\(\sigma(X)>0\)时,有 \[ \mathbb{P}(|X-\mathbb{E}(X)|\geq c\sdot \sigma(X))\leq \frac{1}{c^2} \] 证明的话直接考虑设\(Y=(X-\mathbb E(X))^2\),用Markov不等式得到: \[ \begin{aligned} \mathbb{P}(Y\geq c^2\mathbb E(Y))&\leq \frac{1}{c^2}\\ \mathbb{P}((X-\mathbb E(X))^2\geq c^2\sigma^2(X))&\leq \frac{1}{c^2}\\ \mathbb{P}|(X-\mathbb E(X)|\geq c\sigma(X))&\leq \frac{1}{c^2}\\ \end{aligned} \]

一些离散分布

泊松分布

取二项分布的极限情况.设此时\(n=\lambda m\),每个东西有\(\frac{1}{m}\)的概率选入,则对于一个固定的常数\(k\),当\(m\to \infty\)的时候,\(P(X=k)=\frac{1}{k!}\lambda^k e^{-\lambda}\),记作\(X\sim \pi(\lambda)\).

欸,虽然我们这里只考虑了\(k\)某种程度上远小于\(m\)的存在,但好在大的部分也不会有什么太大影响,因此: \[ \sum_k P(X=k)=1 \] 原因是\(e^{\lambda}=\sum_k \frac{\lambda^k}{k!}\).

此时来看\(\mathbb E(X)\),留神到无非是上面那个东西转移了一下子,因此\(\mathbb{E}(X)=\lambda\).

来看\(\mathbb{E}(X^2)\),自然有: \[ \begin{aligned} &\sum_k \frac{1}{k!}\lambda^k e^{-\lambda}k^2\\ =&\sum_k \frac{1}{k!}\lambda^k e^{-\lambda}k(k-1)+\sum_k \frac{1}{k!}\lambda^k e^{-\lambda}k\\ =&\lambda^2+\lambda \end{aligned} \] 所以\(\sigma^2(X)=\mathbb{E}(X^2)-(\mathbb E(X))^2=\lambda\).

几何分布

伯努利试验中首次发生结果\(A\)的次数,记作\(X\sim \text{G}(p)\).

显然\(P(X=k)=p(1-p)^{k-1}\),此外\(P(X>n)=(1-p)^n\).

\(f(p)=\sum_{k\geq 1}(1-p)^{k-1}\),则\(f(p)=\frac{1}{p}\),\(E(X)=-pf'(p)=\frac{1}{p}\),\(\sigma^2(X)=\frac{1-p}{p^2}\).

很重要的一个性质是无记忆性.即\(P(X>m+n|X>m)=P(X>n)\).

负二项分布

伯努利实验中结果\(A\)发生\(r\)次的重复次数.则\(P(X=k)=\binom{k-1}{r-1}p^r(1-p)^{k-r}\),记作\(X\sim \text{NB}(r,p)\).显然\(\text{NB}(1,p)\sim \text{G}(p)\).必然有\(E(X)=\frac{r}{p}\).

首先要验证: \[ \begin{aligned} \sum_{k\geq r}P(X=k)&=\sum_{k\geq r}\binom{k-1}{r-1}p^r(1-p)^{k-r}\\ &=\sum_{l\geq 0}\binom{l+r-1}{r-1}p^r(1-p)^l\\ &=\sum_{l\geq 0}\binom{l+r-1}{l}p^r(1-p)^l \end{aligned} \] 而: \[ \begin{aligned} p^{-r}&=(1-(1-p))^{-r}\\ &=\sum_{l\geq 0}\binom{-r}{l}(-1)^l(1-p)^{l}\\ &=\sum_{l\geq 0}\binom{l+r-1}{l}(1-p)^l \end{aligned} \]

连续随机变量

给定随机变量\(X\)和实数\(x\),定义\(F(x)=P(X\leq x)\)为随机变量\(X\)分布函数.

分布函数有如下性质:

  1. 有界性:\(0\leq F(x)\leq 1\),而且\(\lim_{x\to -\infty}F(x)=0,\lim_{x\to +\infty}F(x)=1\).
  2. 单调性:\(F(x)\)单调不减.
  3. 右连续:\(F(x_0+0)=F(x_0)\).

如果存在一个\(f(x)\),使得\(F(x)=\int_{-\infty}^x f(x)\mathrm{d}x\),则称\(X\)连续随机变量,而\(f(x)\)是其概率密度函数.它还应当满足以下性质:

  1. 非负性:\(f(x)\geq 0\).
  2. 正则性:\(\int_{-\infty}^{+\infty}f(t)\mathrm{d}t=1\).

对于连续随机变量.此时\(F\)还满足左连续\(F(x_0-0)=F(x_0)\).

由此还可以得出连续随机变量在任何一点处取值必然为零,因为\(P(a\leq X\leq a)=P(a<X<a)=0\).

由此可以定义期望:当\(\int_{-\infty}^{+\infty}f(x)|x|\mathrm{d}x<\infty\),则定义\(E(X)=\int_{-\infty}^{+\infty}xf(x)\mathrm{d}x\).注意这里要求的是绝对可积而不是可积.

现在我们来搞定:\(P(X\leq E(X))>0\).

策略是反证:如果\(P(X\leq E(X))=0\).此时任取一个\(\epsilon>0\)使得\(P(X\leq E(X)+\epsilon)\leq \frac{1}{2}\).

此时\(E(X)\geq P(X\geq E(X)+\epsilon)(E(X)+\epsilon)+P(X< E(X)+\epsilon)E(X)>E(X)\),这就矛盾了.

接下来来做Markov不等式,对于非负随机变量\(X\),若\(E(X)> 0,a>0\),则\(P(X\geq aE(X))\leq \frac{1}{a}\).原因是: \[ \begin{aligned} E(X)&=\int_{-\infty}^{+\infty}f(x)x\mathrm{d}x\\ &\geq \int_{aE(X)}^{+\infty}f(x)x\mathrm{d}x\\ &\geq \int_{aE(X)}^{+\infty}f(x)aE(X)\mathrm{d}x\\ &=aE(X)\int_{aE(X)}^{+\infty}f(x)\mathrm{d}x\\ &=aE(X)P(X\geq aE(X)) \end{aligned} \] 此时还可以定义\(\mathrm{Var}(X)=E((X-E(X))^2)=E(X^2)-E^2(X)\).

Chebyshev不等式的证明只依赖于Markov不等式,因此在这里也能用.

高斯分布

概率密度函数\(f(x)=\frac{1}{\sqrt{2\pi}}e^{-\frac{x^2}{2}}\).

除了上述已经提到的性质,它还满足:

  1. 对称性:\(f(x)=f(-x)\).
  2. \(f(x)_{\max}=f(0)\).
  3. \(\lim_{x\to -\infty}f(x)=\lim_{x\to +\infty}f(x)=0\).
  4. \(E(X)=\int_{-\infty}^{+\infty}f(x)x\mathrm{d}x=0\).
  5. \(E(X^2)=\int_{-\infty}^{+\infty}f(x)x^2\mathrm{d}x=1\).
  6. \(\mathrm{Var}(X)=1\).

其中(5)的证明见: \[ \begin{aligned} \int_{-\infty}^{+\infty}f(x)x^2\mathrm{d}x&=\int_{-\infty}^{+\infty}\frac{1}{\sqrt{2\pi}}e^{-\frac{x^2}{2}}x^2\mathrm{d}x\\ &=\int_{-\infty}^{+\infty}\frac{1}{\sqrt{2\pi}}(-x)\mathrm{d}e^{-\frac{x^2}{2}}\\ &=\frac{1}{\sqrt{2\pi}}(-x)e^{-\frac{x^2}{2}}|_{-\infty}^{+\infty}+\int_{-\infty}^{+\infty}\frac{1}{\sqrt{2\pi}}e^{-\frac{x^2}{2}}\mathrm{d}x\\ &=1 \end{aligned} \] 还可以对此进行推广,考虑\(f(x)=\frac{1}{\sqrt{2\pi}\sigma}e^{-\frac{(x-\mu)^2}{2\sigma^2}}\),记\(X\sim N(\mu,\sigma^2)\).只需取\(y=\frac{x-\mu}{\sigma}\),就可以转换回标准正态分布,并且此时\(F_Y(y)=F_X(\sigma y+\mu)\).

指数分布

对于\(\lambda>0\),定义概率密度函数\(f(x)=\begin{cases}\lambda e^{-\lambda x}&x\geq 0\\0&x<0\end{cases}\),记作\(X\sim \mathrm{EXP}(\lambda)\).其分布函数\(F(X)=\begin{cases}1-e^{-\lambda x}&X>0\\0&X\leq 0\end{cases}\).

它同样也有无记忆性.考虑\(P(X>t)=e^{-\lambda t}\),从而\(P(X>s+t|X>s)=P(X>t)\).

伽马分布

对于\(\alpha>0\),定义伽马函数\(\Gamma(\alpha)=\int_0^{+\infty}x^{\alpha-1}e^{-x}\mathrm{d}x\).我们见过很多次这个东西了,请看:

  1. \(\Gamma(1)=1\).
  2. \(\Gamma(\frac{1}{2})=\sqrt{\pi}\).
  3. \(\Gamma(\alpha+1)=\alpha\Gamma(\alpha)\).
  4. \(\Gamma(n+1)=n!\).
  5. \(\Gamma(n+\frac{1}{2})=\frac{(2n)!}{4^nn!}\sqrt \pi\).

对于\(\lambda,\alpha>0\),定义概率密度函数\(f(x)=\begin{cases}\frac{\lambda^\alpha}{\Gamma(\alpha)}x^{\alpha-1}e^{-\lambda x}&x\geq 0\\0&x<0\end{cases}\),称此时\(x\)符合伽马分布,记作\(X\sim \Gamma(\alpha,\lambda)\).

先把正则性验证了吧,令\(y=\lambda x\),则\(f(x)=\frac{\lambda}{\Gamma(\alpha)}y^{\alpha-1}e^{-y}\),则\(f(x)\mathrm{d}x=\frac{1}{\Gamma(\alpha)}y^{\alpha-1}e^{-y}\mathrm{d}y\),于是搞定了.

然后是其期望: \[ \begin{aligned} E(X)&=\int_{0}^{+\infty}xf(x)\mathrm{d}x\\&=\int_0^{+\infty}\frac{1}{\Gamma(\alpha)}y^{\alpha}e^{-y}\frac{\mathrm{d}y}{\lambda}\\ &=\frac{\Gamma(\alpha+1)}{\Gamma(\alpha)\lambda}\\ &=\frac{\alpha}{\lambda} \end{aligned} \] 类似地,\(\int_0^{+\infty}x^2f(x)\mathrm{d}x=\frac{\Gamma(\alpha+2)}{\Gamma(\alpha)\lambda^2}\),从而算出\(\mathrm{Var}(X)=\frac{\alpha}{\lambda^2}\).显然当\(X\sim \Gamma(\alpha,\lambda)\)时,\(Y=kX\sim \Gamma(\alpha,\frac{\lambda}{k})\).

\(\alpha=1\)的时候,我们得到了指数分布\(\Gamma(1,\lambda)\sim \mathrm{Exp}(\lambda)\).

另一个特例是,\(\alpha=\frac{n}{2},\lambda=\frac{1}{2}\).此时我们称其为自由度为\(n\)的卡方\(\chi^2\)分布.记作\(\chi^2(n)\),其数学期望为\(n\),方差为\(2n\).当\(n=1\)的时候,\(f(x)=\sqrt \frac{1}{2\pi x}e^{-\frac{x}{2}}\).

多维离散随机变量

重期望公式

考虑把\(E(X|Y)\)视作一个\(g(Y)\),则\(E(E(X|Y))=E(X)\).原因是\(E(E(X|Y))=\sum_j P(Y=y_j)E(X|Y=y_j)\).

多维连续随机变量

\(F(x,y)=P(X\leq x\land Y\leq y)\).应该有:

联合分布函数有如下性质:

  1. 有界性:\(0\leq F(x,y)\leq 1\),而且\(\lim_{x\to -\infty}F(x,y)=\lim_{y\to -\infty}F(x,y)=0,\lim_{x,y\to +\infty}F(x,y)=1\).
  2. 单调性:当\(x_1\leq x_2\)时,\(F(x_1,y)\leq F(x_2,y)\);当\(y_1\leq y_2\)时,\(F(x,y_1)\leq F(x,y_2)\).
  3. 右连续:\(F(x_0+0,y)=F(x_0,y)\),\(F(x,y_0+0)=F(x,y_0)\).
  4. 非负性:\(P(a<X\leq b,c<Y\leq d)=F(b,d)-F(a,d)-F(b,c)+F(a,c)\geq 0\).

\(F\)连续时,如果能找到函数\(f\geq 0\)满足\(F(x,y)=\int_{-\infty}^x\int_{-\infty}^y f(u,v)\mathrm{d}v\mathrm{d}u\),称\(f\)联合密度函数.

接下来来看条件分布函数和条件密度函数,当概率密度函数的确连续时,定义: $$ \[\begin{aligned} P(X\leq x|Y=y)&=\lim_{\Delta\to +0}P(X\leq x|y\leq Y\leq y+\Delta)\\ &=\lim_{\Delta\to +0}\cfrac{\int_{-\infty}^x\int_{y}^{y+\Delta}f(u,v)\mathrm{d}v\mathrm{d}u}{\int_{y}^{y+\Delta}f_Y(v)\mathrm{d}v}\\ &=\lim_{\Delta\to +0}\cfrac{\int_{-\infty}^x(\frac{1}{\Delta}\int_{y}^{y+\Delta}f(u,v)\mathrm{d}v)\mathrm{d}u}{\frac{1}{\Delta}\int_{y}^{y+\Delta}f_Y(v)\mathrm{d}v}\\ &=\cfrac{\int_{-\infty}^xf(u,y)\mathrm{d}u}{f_Y(y)}\\ &=\int_{-\infty}^x\cfrac{f(u,y)}{f_Y(y)}\mathrm{d}u\\ \end{aligned}\]

$$ 其中\(f_Y(y)=\int_{-\infty}^{+\infty}f(u,y)\mathrm{d}u\).

\(\forall x,y\)都有\(f(x,y)=f_X(x)f_Y(y)\),则称\(X,Y\)相互独立.

容易检验\(E(X+Y)=E(X)+E(Y)\),而且当\(X,Y\)相互独立的时候,\(E(XY)=E(X)E(Y)\),于是自然也有\(\mathrm{Var}(X\pm Y)=\mathrm{Var}(X)+\mathrm{Var}(Y)\).

二维正态分布

即: \[ f(x,y)=\frac{\exp(-\frac{1}{2(1-\rho^2)}\left(\frac{(x-\mu_1)^2}{\sigma_1^2}+\frac{(y-\mu_2)^2}{\sigma_2^2}-\frac{2\rho(x-\mu_1)(y-\mu_2)}{\sigma_1\sigma_2}\right))}{2\pi \sigma_1\sigma_2\sqrt{1-\rho^2}} \] 现在来验证正则性,取\(u=\frac{\frac{x-\mu_1}{\sigma_1}-\rho \frac{y-\mu_2}{\sigma_2}}{\sqrt{1-\rho^2}},v=\frac{y-\mu_2}{\sigma_2}\).而\(\left|\frac{\partial(u,v)}{\partial(x,y)}\right|=\sigma_1\sigma_2\sqrt{1-\rho^2}\)​.于是: \[ \begin{aligned} &\int_{-\infty}^{+\infty}\int_{-\infty}^{+\infty}f(x,y)\mathrm{d}x\mathrm{d}y\\ =&\int_{-\infty}^{+\infty}\int_{-\infty}^{+\infty}\frac{1}{2\pi}\exp\left(-\frac{1}{2}(u^2+v^2)\right)\mathrm{d}u\mathrm{d}v\\ =&1 \end{aligned} \] 此外请看: \[ \begin{aligned} f_X(x)&=\int_{-\infty}^{+\infty}f(x,y)\mathrm{d}y\\ &=\sigma_2\sqrt{1-\rho^2}\int_{-\infty}^{+\infty}f(x,y)\mathrm{d}u\\ &=\frac{1}{\sigma_1\sqrt{2\pi}}\exp\left(-\frac{(x-\mu_1)^2}{2\sigma_1^2}\right) \end{aligned} \] 于是当\(X,Y\sim N(\mu_1,\mu_2,\sigma_1^2,\sigma_2^2,\rho)\),则\(X\sim N(\mu_1,\sigma_1^2),Y\sim N(\mu_2,\sigma_2^2)\).

此外: \[ \begin{aligned} f(x|y)&=\frac{f(x,y)}{f_Y(y)}\\ &=\frac{1}{\sigma_1\sqrt{2\pi}\sqrt{1-\rho^2}}\exp\left(-\frac{1}{2(1-\rho^2)}\left(\frac{x-\mu_1}{\sigma_1}-\rho\frac{y-\mu_2}{\sigma_2}\right)^2\right) \end{aligned} \] 也就是说,当\(Y=y\)时,\(X\sim N(\mu_1+\rho\frac{\sigma_1}{\sigma_2}(y-\mu_2),\sigma_1^2(1-\rho^2))\),容易见到相互独立当且仅当\(\rho=0\).

Example1

\(n\times n\)的矩阵\(A\)中每个元素独立服从\(N(0,1)\).求\(E(\det A),E(\mathrm{trace}(A)),E(\mathrm{trace}(A^2))\).

考虑\(\det A=\sum_{\sigma}\mathrm{sgn}(\sigma)\prod A_{i,\sigma(i)}\).直接套期望就知道\(E(\det A)=0\).

显然\(E(\mathrm{trace}(A))=0\).

\(E(\mathrm{trace}(A^2))\)中,每一个\((A^2)_{i,i}=\sum_{j}E(a_{i,j}a_{j,i})=1\),于是\(E(\mathrm{trace}(A^2))=n\).

重期望公式

定义\(E(X|Y=y)=\int_{-\infty}^{+\infty}f(x|y)x\mathrm{d}x\).则\(E(E(X|Y))=E(X)\).

协方差

和离散时的基本全部一样.其实早该看出来协方差就是一种双线性形式.

Example1

证明二维正态分布的\(\mathrm{Cov}(X,Y)=\sigma_1\sigma_2\rho\).

容易见到: \[ \begin{aligned} \mathrm{Cov}(X,Y)&=\int\int f(x,y)(x-\mu_1)(y-\mu_2)\mathrm{d}x\mathrm{d}y\\ &=\int\int\frac{1}{2\pi}\exp\left(-\frac{1}{2}(u^2+v^2)\right)\sigma_1\sigma_2v(u\sqrt{1-\rho^2}+\rho v)\mathrm{d}u\mathrm{d}v \end{aligned} \] 然而: \[ \begin{aligned} \int\int\frac{1}{2\pi}\exp\left(-\frac{1}{2}(u^2+v^2)\right)uv\mathrm{d}u\mathrm{d}v&=0\\ \int\int\frac{1}{2\pi}\exp\left(-\frac{1}{2}(u^2+v^2)\right)v^2\mathrm{d}u\mathrm{d}v&=1\\ \end{aligned} \] 带入得到结果.

相关系数

可以定义相关系数\(\mathrm{Corr}(X,Y)=\frac{\mathrm{Cov}(X,Y)}{\sigma(X)\sigma(Y)}\).一个很好玩的事是两个变量的任意线性变换\(X'=aX+b\)后,仍有: \[ \begin{aligned} \mathrm{Corr}(X',Y)=\frac{a\mathrm{Cov}(X,Y)}{|a|\sigma(X)\sigma(Y)}=\mathrm{sgn}(a)\frac{\mathrm{Cov}(X,Y)}{\sigma(X)\sigma(Y)} \end{aligned} \] 一个显然结论是当标准化后即\(\tilde X=\frac{X-E(X)}{\sigma(X)}\)后相关系数不变.

此外,我们可以证明以下性质:

  1. \(|\mathrm{Corr}(X,Y)|\leq 1\).
  2. 如果\(|\mathrm{Corr}(X,Y)|=1\)等价于\(Y,X\)存在关系\(a\ne 0\)使得\(P(Y=aX+b)=1\).

(1)(2)其实就是柯西不等式对吧,因为\(\mathrm{Cov}\)其实是某种内积,所以当然有\(\frac{\mathrm{Cov}(X,Y)}{\sqrt{\mathrm{Cov}(X,X)\mathrm{Cov}(Y,Y)}}\in [-1,1]\).

协方差矩阵

设随机变量\(X=(X_1,\cdots,X_n)\),定义\(E(X)=(E(X_1),\cdots,E(X_n))\)为其数学期望向量,而\(\mathrm{Cov}(X)=E((X-E(X))(X-E(X))^t)\)\(X\)的协方差矩阵.也就是\(\mathrm{Cov}(X)_{i,j}=\mathrm{Cov}(X_i,X_j)\).容易见到其半正定,原因是\(\alpha^t\mathrm{Cov}(X)\alpha=E((\alpha^t(X-E(X)))^2)\).

Example1

求二维正态分布的协方差矩阵.

显然为: \[ B=\begin{bmatrix} \sigma_1^2&\rho\sigma_1\sigma_2\\ \rho\sigma_1\sigma_2&\sigma_2^2 \end{bmatrix} \] 此外\(\det(B)=(1-\rho^2)\sigma_1^2\sigma_2^2\).其逆矩阵\(B^{-1}=\frac{1}{1-\rho^2}\begin{bmatrix}\frac{1}{\sigma_1^2}&-\frac{\rho}{\sigma_1\sigma_2}\\-\frac{\rho}{\sigma_1\sigma_2}&\frac{1}{\sigma_2^2}\end{bmatrix}\).

此时见到: \[ \begin{aligned} f(x_1,x_2)&=\frac{\exp(-\frac{1}{2(1-\rho^2)}\left(\frac{(x_1-\mu_1)^2}{\sigma_1^2}+\frac{(x_2-\mu_2)^2}{\sigma_2^2}-\frac{2\rho(x_1-\mu_1)(x_2-\mu_2)}{\sigma_1\sigma_2}\right))}{2\pi \sigma_1\sigma_2\sqrt{1-\rho^2}}\\ &=\frac{1}{2\pi\sqrt {\det B}}\exp\left(-\frac{1}{2}(\vec x-\vec \mu)^TB^{-1}(\vec x-\vec \mu)\right) \end{aligned} \] 从而容易推广到任意多维,只需定义: \[ \begin{aligned} f(\vec x) &=\frac{1}{(2\pi)^{\frac{n}{2}}\sqrt {\det B}}\exp\left(-\frac{1}{2}(\vec x-\vec \mu)^TB^{-1}(\vec x-\vec \mu)\right) \end{aligned} \]

Example2

求证:当\(\vec X\sim N(\vec \mu,B)\),则\(\vec Y=A\vec X+\vec b\sim N(A\vec \mu+\vec b,ABA^t)\),其中\(A\)必须行满秩.

\(A\)是方阵的时候,直接可逆,于是: \[ \begin{aligned} f_Y(y)&=f_X(A^{-1}(y-b))|\frac{\partial x}{\partial y}|\\ &=f_X(A^{-1}(y-b))|\frac{\partial y}{\partial x}|^{-1}\\ &=f_X(A^{-1}(y-b))|\frac{1}{\det A}|\\ &=\frac{1}{(2\pi)^{\frac{n}{2}}\sqrt {\det ABA^{t}}}\exp\left(-\frac{1}{2}(A^{-1}(\vec y-\vec b)-\vec \mu)^TB^{-1}(A^{-1}(\vec y-\vec b)-\vec \mu)\right)\\ &=\frac{1}{(2\pi)^{\frac{n}{2}}\sqrt {\det ABA^{t}}}\exp\left(-\frac{1}{2}(\vec y-A\vec \mu-\vec b)^T(ABA^{T})^{-1}(A^{-1}(\vec y-A\vec \mu-\vec b)\right) \end{aligned} \] 此外,一般的多为高斯分布可以看作独立同分布标准正态分布线性变换后的结果,原因是当\(X\sim N(0,I),Y\sim N(\vec \mu,B)\),当然有\(Y=B^{\frac{1}{2}}X+\vec \mu\).

特别地,把一个有一定信息关系的东西\(Y\)变成\(X\)也只需要\(X=B^{-\frac{1}{2}}(X-\vec \mu )\),这个过程一般叫白化.因为信息被缩简单了.

然而,考虑如果\(X\sim N(0,I)\),如果\(Y=AX\),此时\(Y\)的结果似乎只和\(AA^t\)有关,而与\(A\)竟然无关.特别地,如果\(A\)是一个正交矩阵,则\(Y\)干脆和\(X\)服从同样的分布.

这揭示了正态分布其实更关注于模长,换言之,当\(\vec \mu=0,B=I\)的时候,\(f(\vec y)\)其实是只和\(\vec y\)的模长相关的.此时如果看它的等密度轮廓线其实是一圈又一圈的圆.而拉伸之后就成了某种一圈又一圈的椭圆(因为要拉伸呀).

卷积

\(X,Y\)相互独立,考虑\(Z=X+Y\),则\(f_Z(z)=\int_{-\infty}^{+\infty}f_X(z-y)f_Y(y)\mathrm{d}y\).

离散情况下将熵定义为\(H[X]=E(\log \frac{1}{P(X)})=\sum_{i}P_i\log \frac{1}{P_i}\).如果设\(|X|=|\{x|P(x)>0\}|\),则容易见到\(0\leq H[X]\leq \log|X|\).

接下来我们想定义条件熵,直观的理解是”去掉\(X\)的信息后\(Y\)还剩多少信息”: \[ \begin{aligned} H[Y|X]&=\sum_xH[Y|X=x]P[X=x]\\ &=\sum_x\sum_yP(Y=y|X=x)P[X=x]\lg\frac{1}{P(Y=y|X=x)}\\ &=\sum_{x,y}P(Y=y,X=x)\lg\frac{1}{P(Y=y|X=x)}\\ &=E(\lg\frac{1}{P(Y|X)}) \end{aligned} \] 首先检验\(f(x)=x\ln x\)是下凸函数,原因是\(f'(x)=1+\ln x\)\(f''(x)=\frac{1}{x}>0\).于是琴生不等式给出\(f(\frac{a+b}{2})\leq \frac{f(a)+f(b)}{2}\),或说\(E(f(X))\geq f(E(X))\).

可以见到以下性质:

  1. \(H[X,Y]=H[X]+H[Y|X]\).
  2. \(H[X|Y]\leq H[X]\).
  3. 作为(2)的推论,互信息\(I(X,Y)=H[X]+H[Y]-H[X,Y]\geq 0\).
  4. 对于一个确定性函数\(g\),\(H[X]\geq H[g(X)]\).
  5. \(I(X;YZ)=I(X;Z)+I(X;Y|Z)\).
  6. \(X,Y,Z\)满足Markov规则,或者说\(P_{X,Y,Z}=P_XP_{Y|X}P_{Z|Y}\),或说\(P_{Z|Y}=P_{Z|XY}\),则\(I(X,Y)=I(X;Z)+I(X;Y|Z)\).这自然推出\(I(X;Y)\geq I(X;Z)\),也即这个过程中信息不会增多.

(1)是上述的一个显然推论.

(2)的话考虑: \[ \begin{aligned} &H[X]-H[X|Y]\\ =&\sum_x\left(P(X=x)\lg \frac{1}{P(X=x)}-\sum_y P(X=x,Y=y)\lg \frac{1}{P(X=x|Y=y)}\right)\\ =&\sum_x\left(\sum_y P(X=x,Y=y)\lg \frac{P(X=x|Y=y)}{P(X=x)}\right)\\ =&\sum_x\sum_y P(X=x,Y=y)\lg \frac{P(X=x,Y=y)}{P(X=x)P(Y=y)}\\ \end{aligned} \] 不妨令\(a_i=P(X=x,Y=y),b_i=P(X=x)P(Y=y)\).容易见到\(a=\sum_i a_i=1,b=\sum_i b_i=1\).于是上式变为: \[ \begin{aligned} &H[X]-H[X|Y]\\ =&\sum_i a_i\lg \frac{a_i}{b_i}\\ =&-\sum_i a_i\lg \frac{b_i}{a_i}\\ \geq &-\sum_i a_i (\frac{b_i}{a_i}-1)\\ =&-\sum_i (b_i-a_i)\\ =&0 \end{aligned} \] 对于(4),轻易地: \[ \begin{aligned} H[X,g(X)]&=H[g(X)]+H[X|g(X)]\\ H[X]&=H[g(X)]+H[X|g(X)] \end{aligned} \] 然而后者非负,于是显然.

对于(5),留神到\(H[X]=I(X;Z)+H[X|Z]\),考虑: \[ \begin{aligned} I(X;YZ)&=H[X]-H[X|YZ]\\ &=I(X;Z)+H[X|Z]-H[X|YZ] \end{aligned} \] 然而\(I(X;Y\mid Z)=H[X| Z]-H[(X|Y)|Z]=H[X|Z]-H[X|YZ]\).

对于(6),考虑: \[ \begin{aligned} I(X;YZ)&=I(X;Y)+I(X;Z\mid Y)\\ I(X;YZ)&=I(X;Z)+I(X;Y\mid Z)\\ \end{aligned} \] 此外: \[ \begin{aligned} I(X;Y)+I(X;Z\mid Y)&=H[X]-H[X|Y]+H[Z|Y]-H[Z|YX]\\ &=H[X]-H[X|Y]+H[Z|Y]-H[Z|Y]\\ &=I(X;Y) \end{aligned} \] 于是\(I(X;Z\mid Y)=0\),这就证毕.

KL散度

定义\(D(P||Q)=\sum_x P(x)\lg \frac{P(x)}{Q(x)}\).其中如果\(P(x)\ne 0\)\(Q(x)=0\)的情况出现,我们就说此时其为\(+\infty\).我们想要证明:\(D(P||Q)\geq 0\).考虑: \[ \begin{aligned} D(P||Q)&=E_{x\sim Q}(\frac{P(X)}{Q(X)}\lg \frac{P(X)}{Q(X)})\\ &\geq f\left(E_{x\sim Q}(\frac{P(X)}{Q(X)})\right)\\ &=f(1)\\ &=0 \end{aligned} \] 从而这的确是某种衡量偏离程度的算子.

此外还应当定义条件KL散度.考察: $$ \[\begin{aligned} D(P_{X,Z}||Q_{X,Z})&=\sum_{(x,z)} P_{X,Z}(x,z)\log \frac{P_{X,Z}(x,z)}{Q_{X,Z}(x,z)}\\ &=\sum_{(x,z)} P_{Z|X}(z|x)P_{X}(x)\log \frac{P_{Z|X}(z|x)P_{X}(x)}{Q_{Z|X}(z|x)Q_{X}(x)}\\ &=D(P_X||Q_X)+\sum_{(x,z)} P_{Z|X}(z|x)P_{X}(x)\log \frac{P_{Z|X}(z|x)}{Q_{Z|X}(z|x)}\\ \end{aligned}\]

$$ 将后面的部分定义为\(D(P_{Y|X}||Q_{Y|X}\mid P_X)\).顺便应该有\(D(P_{X,Z}||Q_{X,Z})\geq D(P_X||Q_X)\).

此外还应当证明KL散度凸性.对于概率分布对\((P_1,Q_1),(P_2,Q_2)\),以及任意\(\theta\in [0,1]\),令\(P=\theta P_1+(1-\theta)P_2,Q=\theta Q_1+(1-\theta)Q_2\).下面我们证明下凸: \[ D(P||Q)\leq \theta D(P_1||Q_1)+(1-\theta)D(P_2||Q_2) \]

频率

尾不等式

留神到如果事件在\(n\)次中发生了\(n_a\)次,其实是不能说\(\lim_{n\to \infty}\frac{n_a}{n}=P\)的.因为后面总是会有微小的扰动.但似乎总能刻画这些微小扰动的代价.

\(f_n(A)=\frac{n_a}{n}\).如果我们能求出\(P(|f_n-p|\geq \epsilon)=P(|n_a-E(n_a)|\geq n\epsilon)\)的上界,看上去就会非常优秀.进一步地:

  1. 尾不等式:给出\(P(X\geq k)\)的上界.
  2. 集中不等式:给出\(P(|X-E(X)|\geq k)\)的上界.
Example1

对二项分布用Chebyshev不等式,轻易有: \[ P(|n_A-E(n_A)|\geq n\epsilon)\leq \frac{p(1-p)}{n\epsilon^2} \] 这个估计有点菜,右侧是\(O(\frac{1}{n})\)的,这个趋近也太慢了.

考虑一下它为什么菜,问题在于Chebyshev不等式只用到了”两两独立”这件事,但是实际上二项分布更强一点,它其实是”互相独立”的.

定义\(E(X^k)\)\(X\)\(k\)阶原点矩,而将\(E((X-E(X))^k)\)称为\(X\)\(k\)阶中心距.则期望是其一阶原点矩而方差是二阶中心矩.

对于随机变量\(X\),定义\(M_X(t)=E(e^{tX})\)\(X\)矩生成函数.考虑: \[ \begin{aligned} E(e^{Xt})&=\sum_{k=0}^ne^{kt}P(X=k)\\ &=\sum_{k=0}^nP(X=k)\left(\sum_{j=0}^{+\infty}\frac{(kt)^j}{j!}\right)\\ &=\sum_{j=0}^{\infty}\frac{t^j}{j!}\sum_{k=0}^nP(X=k)k^j\\ &=\sum_{j=0}^\infty \frac{t^j}{j!}E(X^j) \end{aligned} \]

Example2

\(X\sim B(n,p)\),求\(E((X-E(X))^4)\).

考虑其矩生成函数: \[ \begin{aligned} E(e^{Xt})&=\sum_{k=0}^ne^{kt}P(X=k)\\ &=\sum_{k=0}^ne^{kt}\binom{n}{k}p^k(1-p)^{n-k}\\ &=\sum_{k=0}^n\binom{n}{k}(pe^{t})^k(1-p)^{n-k}\\ &=(pe^t+(1-p))^n\\ &=(1+p(e^t-1))^n \end{aligned} \]\(Y=X-E(X)\),则\(E(e^{Yt})=E(e^{Xt})e^{-tpn}\),现在我们可以对其求四次导数得到: \[ E((X-E(X))^4)=np(1-p)^4+n(1-p)p^4+3n(n-1)p^2(1-p^2) \] 那这个有什么用呢?考虑对其用Markov不等式: \[ P((X-E(X))^4\geq (n\epsilon)^4)\leq \frac{O(n^2)}{(n\epsilon)^4}=O(\frac{1}{n^2\epsilon^4}) \] 这的确给出了一个更好的估计.

但是再做六阶矩好像也很痛苦,而且这只能给出一个多项式估计,但看着这个逼近速度就不太可能是多项式估计,那怎么办呢?

Chernoff Bound

考虑直接对\(e^{tX}\)用Markov不等式:

  1. \(t>0\)的时候,有\(P(X\geq k)\leq M_X(t)e^{-tk}\).
  2. \(t<0\)的时候,有\(P(X\leq k)\leq M_X(t)e^{-tk}\).

左侧没有\(t\)而右侧有,那看上去只要找到能使右侧取到最小值的\(t\)就万事大吉了.

Example1

\(X\sim \pi(\lambda)\)的时候,求\(P(X\geq x)\)的上界.其中\(x>\lambda\).

先求此时的矩生成函数: \[ \begin{aligned} E(e^{Xt})&=e^{-\lambda}\sum_{k\geq 0}\frac{\lambda^k}{k!}e^{kt}\\ &=e^{-\lambda}\sum_{k\geq 0}\frac{(\lambda e^t)^k}{k!}\\ &=e^{\lambda (e^t-1)} \end{aligned} \]\(t>0\)的时候,我们想要优化\(e^{\lambda(e^t-1)-tx}\)的最小值,直接对\(t\)求导,发现当\(t=\ln\frac{x}{\lambda}\)时最小.

此时: \[ P(X\geq x)\leq \frac{e^{-\lambda}(e\lambda)^x}{x^x} \]

Example2

\(X\sim N(\mu,\sigma^2)\),求\(P(X-E(X)\geq k\sigma)\)的上界.

还是求矩生成函数,考虑: \[ E(e^{tX})=\int_{-\infty}^{+\infty}\frac{1}{\sqrt {2\pi}\sigma}e^{-\frac{(x-\mu)^2}{2\sigma^2}+tx}=e^{\mu t+\frac{\sigma^2t^2}{2}} \] 从而: \[ P(X\geq k\sigma+\mu)\leq e^{\mu t+\frac{\sigma^2t^2}{2}}e^{-t(\mu+k\sigma)}=e^{\frac{\sigma^2t^2}{2}-k\sigma t} \]\(t=\frac{k}{\sigma}\)的时候取最小值,从而最后的界是\(e^{-\frac{k^2}{2}}\).

Example3

\(X\sim B(n,p)\),求\(P(X-E(X)\geq n\epsilon)\)的上界.

考虑\(M_X(t)=(1-p-pe^t)^n\).

然后需要一个Lemma,我们说\((1-p)e^{-tp}+pe^{t(1-p)}\leq e^{\frac{t^2}{8}}\),这个会在后面的Hoeffding引理证明.

直接带入,右侧为: \[ \begin{aligned} M_X(t)e^{-t(E(X)+n\epsilon)}&=e^{-tn\epsilon}\left((1-p)e^{-tp}+pe^{t(1-p)}\right)^n\\ &\leq e^{-tn\epsilon+\frac{nt^2}{8}} \end{aligned} \]\(t=4\epsilon\)得到\(e^{-2n\epsilon^2}\)的上界.

此外取\(t=-4\epsilon\)得到\(P(X-E(X)\leq -n\epsilon)\)的上界为\(e^{-2n\epsilon^2}\).

于是我们有\(P(|X-E(X)|\geq n\epsilon)\leq 2e^{-2n\epsilon^2}\).

Hoeffding引理

若实数随机变量\(a\leq X\leq b\),则\(M_{X-E(X)}(t)=E(e^{t(X-E(X))})\leq e^{\frac{t^2(b-a)^2}{8}}\).

Example1(Chernoff-Hoeffding不等式)

\(X=\sum_{i=1}^n X_i\),其中\(X_i\)相互独立且\(a\leq X_i\leq b\).则(\(k> 0\)):

  1. \(P(X\geq E(X)+k)\leq e^{-\frac{2k^2}{n(b-a)^2}}\).
  2. \(P(X\leq E(X)-k)\leq e^{-\frac{2k^2}{n(b-a)^2}}\).

怎么证明呢,考虑\(P(X\geq E(X)+k)\leq M_{X-E(X)}(t)e^{-tk}\).

然而: \[ \begin{aligned} M_{X-E(X)}(t)&=E(e^{t(X-E(X))})\\ &=E(\prod_i e^{t(X_i-E(X_i))})\\ &=\prod_i E(e^{t(X_i-E(X_i))})\\ &=\prod_i M_{X_i-E(X_i)}(t)\\ &\leq e^{n\frac{t^2(b-a)^2}{8}} \end{aligned} \] 接下来对后面那个东西最优化,可以发现\(t=\frac{4k}{n(b-a)^2}\)的时候足够优秀,这就证明了上面的不等式.

Sanov Bound

回忆到斯特林公式\(n!\sim \sqrt{2\pi n}(\frac{n}{e})^n\).

对于一个可能的空间\(\Omega=\{v_1,\cdots v_L\}\),现在有一个分布\(P:\Omega\to [0,1]\),记录\(p_i=P(v_i)\).

现在从\(P\)中独立取样\(x_1,\cdots,x_n\).考虑对于一个特定的可重集合\(S\),求\(Pr[\{x_1,\cdots ,x_n\}=S]\).回忆到可重集的定义为\(S:\Omega\to\mathbb{N}\),不妨干脆记录\(s_i=S(v_i)\).容易发现\(Pr[\{x_1,\cdots ,x_n\}=S]=\binom{n}{s_1,\cdots,s_L}p_1^{s_1}\cdots p_L^{s_L}\).

现在考虑一个新的分布\(Q:\Omega\to [0,1]\),其中\(q_i=\frac{s_i}{n}\),此时如果采样\(y_1,\cdots,y_n\sim Q\)的时候,先来看看\(Pr[\{y_1,\cdots,y_n\}=S]\).

容易见到\(|\Omega\to \mathbb N|\leq \frac{1}{(n+1)^{L-1}}\),从而见到以下简单估计(需要证明当前的情况的概率是所有情况中最大的): \[ \begin{gathered} \frac{1}{(n+1)^{L-1}}\leq Pr[\{y_1,\cdots,y_n\}=S]\leq 1\\ \frac{1}{(n+1)^{L-1}}\leq \binom{n}{s_1,\cdots,s_L}\leq \left((\frac{1}{q_1})^{q_1}\cdots (\frac{1}{q_L})^{q_L}\right)^n\\ \frac{\exp(nH(Q))}{(n+1)^{L-1}}\leq \binom{n}{s_1,\cdots,s_L}\leq \exp(nH(Q))\\ \end{gathered} \] 这给出了\(\binom{n}{s_1,\cdots,s_L}\)的一个上下界.

现在回看: \[ \begin{aligned} Pr[\{x_1,\cdots ,x_n\}=S]&=\binom{n}{s_1,\cdots,s_L}p_1^{s_1}\cdots p_L^{s_L}\\ &\leq \exp(nH(Q))\exp(n\sum_i q_i\log p_i)\\ &=\exp(nH(Q))\exp(-nD(Q||P)) \end{aligned} \]

大数定律

对于随机变量\(\{X_i\}\),对于任意\(\epsilon>0\),如果: \[ \lim_{n\to \infty} P(|\frac{1}{n}\sum_i^n X_i-\frac{1}{n}\sum_i^n E(X_i)|<\epsilon)=1 \] 则称它们满足大数定律.

一般而言,对于一列随机变量\(\{Y_i\}\)和一个随机变量\(Y\),如果\(\forall \epsilon>0\),\(\lim_{n\to \infty}P(|Y_n-Y|<\epsilon)=1\),则称其依概率收敛.

Markov大数定律

\(\mathrm{Var}(\sum X_i)\sim o(n^2)\),则\(\{X_n\}\)符合大数定律.

策略是考虑\(\mathrm{Var}(\frac{\sum X_i}{n})=\frac{1}{n^2}\mathrm{Var}(\sum X_i)\).用Chebyshev不等式碾一下就好了.

Khinchin大数定律(弱大数定律)

\(\{X_i\}\)独立同分布,且数学期望\(\mu=E(X_i)\)存在,则\(\{X_i\}\)满足大数定律.

数据结构理论

维度

B维正交范围

对于一个\(B\)维的点\(x\),满足\(\forall 1 \leq i \leq B , l_i \leq x_i \leq r_i\),称所有这样的点组成的集合为一个\(B\)维正交范围.

一维正交范围就是区间,二维正交范围是矩形,三维正交范围是立方体.

另外,如果\(l , r\)有若干个是自动满足的(所有点都满足),那么我们称它为无用限制,如果一个\(B\)维正交范围有\(k\)个有用限制,称它为\(k - side\)的.

例如,找到区间\([ l , r ]\)\(< x\)的元素,这个矩形是\(3 - side\)的.找到区间\([ 1 , l ]\)\(< x\)的元素,这个矩形是\(2 - side\)的.有些矩形虽然是高side的,但可能因为某些维度满足可减性,因此可能等价于一个低side的问题.

(lxl:我建议大家遇到题都要把能差分的东西差分到不能差分为止)

矩阵乘法归约

矩阵乘法

\(n \times n\)的矩阵乘法目前得到的最优秀复杂度也是\(O ( n^{ 2 . 373 } )\).

另外可以归约:\(01\)矩阵和整数矩阵在去除\(\log n\)后的复杂度相同.

Example

Example1(链颜色数问题)

考虑构造一棵树:他有\(\sqrt{ n }\)个叉,每个叉上有\(\sqrt{ n }\)个点.我们将这些叉编号为\([ 1 , \sqrt{ n } ]\).然后我们考虑询问两个叉所组成的链的答案,设\(f_{ i , j }\)表示数字\(j\)是否在\(i\)的叉上出现过,不难发现它们合并的时候要对\(f\)做或运算,\(01\)矩阵乘法相当于且运算,显然这两个运算等价,证毕.

Example2(区间逆序对)

考虑对序列和值域同时分块,考虑序列中第\(L\)到第\(R\)个块的答案,设为\(f ( L , R )\),这两块间的答案设为\(g ( L , R )\),显然\(f ( L , R ) = f ( L + 1 , R ) + f ( L , R - 1 ) - f ( L + 1 , R - 1 ) + g ( L , R )\),而由于对值域分块,\(g ( L , R ) = \sum a \times b\)的形式.根据这个形式构造即可.当然这个只是简化了好多,你会发现这个东西只能处理矩阵某一行递增的情况.lxl:真正的归约是很复杂的.

Example3

平面上有若干点,两个操作:每次将横坐标小于等于\(A\)的点加上\(v\),或者查询纵坐标小于等于\(B\)的点的点权和.

这玩意显然能加上扫描线归约区间逆序对.

数据结构

分块

Example1(luoguP8527 [Ynoi2003] 樋口円香)

首先将\(a\)分块,这样对于一次修改就分成了整块和散块.散块暴力做,整块的话显然是一个位移的形式,可以直接卷积,比较简单.

不过我们先考虑个事:这么顺溜就出来了,为啥会需要分块啊?

首先看到题面的位移的形式,自然想到卷积.但问题在于有个区间,所以需要把区间处理掉.注意到每个区间是需要记录一下不同的\(L\)的,这使得这个问题只能使用分块解决.

最后还没完,这题要平衡复杂度.

设块长为\(B\),暴力处理散块的复杂度是\(O ( Bm )\),处理整块的复杂度是\(O ( \frac{ n }{ B } ( m + n \log n ) )\).取\(B^2 = \frac{ n }{ m } ( m + n \log n ) = 500\)最优.

但事实上FFT肯定是很慢的,所以我开到了\(B = 2048\).

即使这样,笔者还是被卡常了(哭).

Example2(luogu[Ynoi2079] riapq)

首先对于这种区间内部贡献,而且每个点由前面点的贡献,先看有没有可差分性(区间逆序对也是一个套路).

注意到是有的,这样我们就把问题转化为了\([ 1 , l - 1 ]\)\([ l , r ]\)的贡献.

先序列分块.然后\([ 1 , l - 1 ]\)中的整块对\([ l , r ]\)的贡献是简单的:我们对每个整块开一个区间加单点查的树状数组,每次将\([ 1 , l - 1 ]\)中的整块的树状数组进行一个\([ l , r ]\)的区间加,查询的时候查一下每个整块对当前单点的贡献,这里需要对整块内部提前处理一下小于等于某个数的数量,自然可以做到\(O ( Bq \log n )\)的时间复杂度和\(O ( Bn )\)的空间复杂度.

问题在于\([ 1 , l - 1 ]\)中的散块咋办.首先\([ 1 , l - 1 ]\)中的散块对\([ l , r ]\)中的散块的贡献是好处理的,因为总共就\(O ( \frac{ n }{ B } )\)个数字,直接全部存下来排序做归并就可以统计,时间复杂度\(O ( Bq \log n )\).

现在的问题在于\([ 1 , l - 1 ]\)中的散块对\([ l , r ]\)中的整块如何贡献.能不能把\([ l , r ]\)的信息统计在\([ 1 , l - 1 ]\)的散块中呢?似乎不太行.因为散块的总数太多了.所以我们考虑把散块的信息记录在整块里.但是好像不太好记,因为你查询一个整块内的点的时候是需要判断记录的这些信息是否比它要小的,只有比它小的才能贡献.自然想到值域分块.不过还有一个问题,就是散块一共有\(\frac{ n }{ B }\)个,整块一共有\(B\)个,是不能一一对应着贡献的,这咋办呢?

其实挺好办的,因为散块要对一个区间有贡献,所以拿树状数组+差分统计一下就行.

最终复杂度为\(O ( n \sqrt{ n } \log n )\),需要进行一个极致卡常.

如果你写完代码测一下会发现,跑的最慢的是散块对散块的贡献,你把sort改成基数排序就行.事实上实测了一下基数排序还不如直接换成树状数组.

但即使这样,笔者现在也没过这个题(哭).

Example3([CTS2022] 普罗霍洛夫卡)

比较复杂的分块题.

放弃了,太难了.

Example4(Walking Plan HDU 6331)

类似BSGS一样分块处理即可,最后需要枚举中继点,询问部分复杂度\(O ( nq )\).

Example5(P5063 [Ynoi2014] 置身天上之森)

考虑如果\(n = 2^k\),很好做,因为每一层的点大小是相等的.我们对每一层分开处理,显然区间加操作也就等价于每一层的节点区间加上若干倍的\(a\)(开头结尾可能有两个需要特殊判断),用分块求区间rank的技巧就行.

但是\(n\)不一定是\(2^k\),也简单,每一层最多有两种不一样大小的点,这是经典结论.

Example6(第二分块:[Ynoi2018]五彩斑斓的世界)

大概是对于每个块处理出它的值域范围:一开始是\([ 1 , n ]\),然后每次操作都会将整个块分为两部分:\([ 1 , x )\)\([ x , maxn ]\),讨论一下\(maxn\)\(2 x\)的大小,就可以用\(\min ( x , maxn - x )\)的复杂度使得\(maxn\)变成\(maxn - x\),复杂度均摊掉了.

二次离线

Example1(luoguP5047 [Ynoi2019 模拟赛] Yuno loves sqrt technology II)

简单来说就是区间逆序对数.

首先想到莫队,然后配一个树状数组就可以做到\(O ( n \sqrt{ n } \log n )\).

那我们怎么改这个东西呢?

我们注意到:我们莫队在实现的无非是俩事:一个是移动左端点的时候判断左端点对右边的贡献,一个是移动右端点的时候,由于这俩是对称的,我们只讨论左端点不动移动右端点.

考虑这个过程的答案实际上是可差分的,因为\([ l , r ]\)\(r\)的贡献实际上就是\([ 1 , r ]\)\(r\)的贡献减去\([ 1 , l - 1 ]\)\(r\)的贡献,前者可以直接算,而后者呢?

我们考虑对后者再进行一次离线操作,我们把这\(O ( n \sqrt{ n } )\)次贡献查询全都记下来,然后扫描线处理一下.注意到我们只需要插入\(O ( n )\)次但是需要查询\(O ( n \sqrt{ n } )\)次,所以需要使用一下值域分块平衡一下复杂度.

做到这里其实要做完了,但还没完,这里空间复杂度达到了\(O ( n \sqrt{ n } )\),有点大.咋办呢?我们发现右端点移动的时候左端点不动,并且右端点移动的是一个区间,所以我们把所有不动的左端点上记录一下右端点移动的区间即可,由于不动的左端点只有可能是查询区间的左端点,所以这里空间复杂度降到\(O ( n )\).

注意到我们求出的是两个查询的答案的差分,最后还需要做一下前缀和求答案.

二维分块

我们现在有一个需要维护的\(n \times n\)的平面,我们现在对其进行分块:

  1. 将平面分成\(n^{ \frac{ 1 }{ 2 } }\)\(n^{ \frac{ 3 }{ 4 } } \times n^{ \frac{ 3 }{ 4 } }\)\(A\)块,以\(A\)块为单位做二维前缀和.

  2. 每个\(A\)块内部分成\(n^{ \frac{ 1 }{ 2 } }\)\(n^{ \frac{ 1 }{ 2 } } \times n^{ \frac{ 1 }{ 2 } }\)\(B\)块,在\(A\)块内部以\(B\)块为单位做二维前缀和.

  3. 将整个平面横着分别分成一个个\(n \times n^{ \frac{ 3 }{ 4 } }\)\(C\)块.(竖着也要分成一个个\(n^{ \frac{ 3 }{ 4 } } \times n\)的块,是类似的,略去)

  4. 每个\(C\)块内部分成\(\sqrt{ n }\)\(n^{ \frac{ 3 }{ 4 } } \times n^{ \frac{ 1 }{ 2 } }\)\(D\)块,在\(C\)块内部以\(D\)块为单位做二位前缀和.

注意到修改一个点的时候,需要更新三次二位前缀和,每次复杂度\(O ( \sqrt{ n } )\).同时注意到空间复杂度是\(O ( n )\)的.

查询显然是分四种情况讨论:\(A , B , D\)块都可以快速求得答案,接下来只需要做一下散块就行.

那散块怎么做呢?我们考虑一个特殊情况:修改点的纵坐标以及横坐标两两不同,或至少一个坐标只对应\(O ( 1 )\)个点.

如果查询的时候,也仍然是满足查询的一个\(l\)对应\(O ( 1 )\)\(r\),我们就可以枚举一个点被哪些查询查到了散块,显然只有可能有\(O ( \sqrt{ n } )\)个查询,记录一下即可.这样就做到了\(O ( \sqrt{ n } )\)单点改,\(O ( 1 )\)查询.

如果我们一开始不做二维前缀和,就可以实现\(O ( 1 )\)单点改,那这种情况下如何实现\(O ( \sqrt{ n } )\)求和呢?首先还是可以\(O ( \sqrt{ n } )\)求出整块的和.

横着和竖着的散块相同,只讨论横着的.由于横着的散块高度\(< n^{ \frac{ 1 }{ 2 } }\),我们就可以在每次查询的时候用\(\sqrt{ n }\)的复杂度枚举一遍横纵坐标在这个区间的点然后暴力判断即可,也可以\(O ( \sqrt{ n } )\)求散块.

Example1(luoguP7448 [Ynoi2007] rdiq)

首先注意到这个问题严格难于区间逆序对,想到二次离线莫队.

开始做二次离线,发现问题在于我们需要求出右端点移动的时候,找到新增了多少个本质不同的逆序对.设上一个和\(a_r\)颜色相同的点是\(r '\),则显然新增的逆序对只可能出现在\([ r ' , r ]\)中.

由于我们现在在保证左端点不动,于是我们考虑对于每种颜色,找到其在这个左端点后第一次出现的位置,并且只在这个位置贡献答案.这里其实已经可以扫描线了,套一下二次离线,把点扔到二位坐标系上.

现在问题在于,我们需要从\(n \rightarrow 1\)扫左端点,总共做\(O ( n )\)次单点修改,做\(O ( n \sqrt{ n } )\)次矩阵查询.

现在我们要查询的也就是左下角为\(( r ' + 1 , a_r )\),右上角是\(( r , \infty )\)的矩阵.

这个东西其实已经可以做高维前缀和了.为了使答案更显然,我们令\(rev ( x ) = n - x + 1\).然后将所有点的纵坐标\(rev\)掉,现在我们要查询的也就是左下角为\(( r ' + 1 , 1 )\),右上角是\(( r , rev ( a_r ) )\)的矩阵,这玩意可以拆前缀和拆成形如左下角是\(( 1 , 1 )\),右上角是\(( i , rev ( a_i ) )\)的矩阵.也就是说我们的\(O ( n \sqrt{ n } )\)次矩阵查询本质上只有\(O ( n )\)种.

拆到这里发现其实到这一步\(a_r\)\(a_{ r ' }\)是否相等已经不重要了,可以用一下基数排序让他俩有一定的差异.

然后上二维分块.

Example2(luoguP8530 [Ynoi2003] 博丽灵梦)

首先自然的想法是拿莫队扫掉\([ l_1 , r_1 ]\)这一维.

这样我们的问题转化为:每次插入/删除一个点,求一个类似区间颜色数的东西.

那么这个东西咋做呢?

首先我们考虑插入/删除的本质,把第二维\([ l_2 , r_2 ]\)扔到二维平面上,那本质也就是需要寻找前驱后继,然后对一个矩形做加法,查询的时候单点查询,可以配个树套树解决这个问题.

有没有什么好办法?先考虑对矩形做加法然后单点查询这个操作看上去很蛋疼.我们考虑把它转化为单点加法矩形查询.这个做法比较显然:如果没有相同的只贡献一次的限制,我们就可以直接对于每个点\(( a , a )\)上加上一个相应的\(b\),然后每次查询矩阵即可.但是有了限制怎么办呢?我们考虑在每两个相邻的点\(A ( x_1 , x_1 )\)\(B ( x_2 , x_2 )\)之间的\(( x_1 , x_2 )\)上加上一个\(- b\),不难发现这样就满足了条件.

分析一下我们现在需要做的东西:

  1. 莫队时查询一个点的前驱后继,这个操作就需要\(O ( 1 )\)完成.

  2. \(n \sqrt{ n }\)次单点修改,这个操作需要\(O ( 1 )\)完成.

  3. \(n\)次矩阵求和,这个操作需要在小于\(O ( \sqrt{ n } )\)的时间完成.

对于第一个问题,我们可能会想到用链表来解决.但问题在于链表难以支持插入操作.不过问题不大,我们有回滚莫队.这样就可以实现只删除不插入,解决了问题.

而后半部分是一个经典的二维分块.

简单来说,我们首先需要猜出时间复杂度为\(O ( n \sqrt{ n } )\),然后用到莫队,然后用二维平面表示这个问题,发现直接做不太能做,想到一步转化,转化后的问题的一半可以直接套二维分快.最后想到前半部分可以用回滚莫队+链表解决.

trie树

Example1([2019zrtg十连测day1]set)

首先反应是扔到trie上然后异或就是打个tag,但是\(+ 1\)很难处理,因为它形如在trie上找到所有长度连续为\(1\)到叶子的链并且全部翻转,不过打一下tag应该也能做.

更简单的做法是,我们考虑从小到大插入数字.这样异或几乎没有影响,但是\(+ 1\)的话就相当于反转一条从根开始均为\(1\)的链,这个东西更为好做.

线段树

普通线段树

Example1(luoguP6780 [Ynoi2009] pmrllcsrms)

感觉这题比较厉害.

先扔做法:对\(c\)分块,这样答案就是块内和块间的最大值.对于每个块都可以用线段树维护最大值,然后最后再求\(\max\).而对于块间如何做呢?

我们设\(suf_i\)为前一个块的后\(i\)个数之和,\(pre_i\)为后一个块的前\(i\)个数之和.注意到我们要求的就是\(\max \{ suf_i + pre_j | i + j \leq c \}\).这个咋做呢?

你注意到这个\(i + j \leq c\)的限制非常的奇怪,我们如果想处理两个东西,自然想让这两个东西联系越紧密越好,但是这个联系就特别奇怪.但没关系,我们注意到如果用\(j \rightarrow c - j + 1\)的话,这个限制就转化为了\(i + c - j + 1 \leq c\),也就是\(i < j\),这个限制就可以放到线段树上维护了.

仔细思考这个过程:线段树只可以维护有大于小于的限制的两个数,而不能维护和区间长度有关的条件.但如果一个限制和区间长度有关,可能可以通过翻转之类的操作取消掉区间长度.

这个问题解决了,我们再回到一开始:为啥要对\(c\)分块?

一方面,题目中的\(c\)是给定的.另一方面,我们注意到我们需要维护一个和\(c\)有关的东西,而如果没有\(c\),或者说\(c = n\)的时候,这个东西是好维护的:一般的区间最大子段和其实暗含了\(c = n\)的条件.考虑到这一点,对\(c\)分块就合情合理了.换句话说,分块其实有两种用途:一种是平衡暴力的复杂度:它可以让一些和块长有关的暴力复杂度降低.另一种用途是保证某个东西的合法性.

一个需要注意的事是,由于我们最后查询的是一个区间,所以对于块间的处理是需要处理区间的.不过我选择将\(a [ l - 1 ]\)\(a [ r + 1 ]\)都加上一个极大值.

但是啊,但是.我们发现我们一开始是需要把块间做线段树的那个\(maxn\)设成\(- \infty\)的.如果这两个东西设成等大的\(- \infty\),就会出现错误,为啥呢?

因为一开始这样会使得运算过程中有可能出现比\(- \infty\)还要小的数字,最底层的\(maxn\)有可能覆盖掉上面的.

线段树分治

大概就是用到了线段树结构进行操作,通常用来处理存在区间的问题.

之所以说它是线段树分治而不是一般的分治,是因为有的时候我们还可以利用线段树的结构.

Example1([2022qbxt国庆Day1]dottlebot)

注意到每个点其实只需要找到\([ i - r_i , i - 1 ]\)\([ i + 1 , i + r_i ]\)这两段的最大值,设为\(x\),则最后的答案就是\(\max \{ a_i + x \}\).

思考这个过程,我们将\([ i - r_i , i - 1 ]\)\([ i + 1 , i + r_i ]\)这两条线段以\(a_i\)的权值放到线段树上.具体地,我们在线段树的每个节点都开一个堆存储覆盖了这个节点区间的线段的权值.然后利用线段树求出每个区间的\(a_i\)的最大值,在节点处和堆中元素一起更新答案即可.

线段树上二分

Example1([2022qbxt国庆Day3]analysis)

考虑全局的和是\(sum\),则我们要在这些数中找到一个分界点,使得左边的和大于等于\(sum\),然后再考虑能不能将右边移动一个过去.

先把数据离散化,那么这就是一个值域线段树上二分的过程.

另外值得一提的是,考虑树状数组的形态也即线段树删去所有的右儿子,因此树状数组上也是可以二分的.

Example2

给定\(a_i , b_i\),选定至多\(k\)个位置使这里的值为\(a_i - b_i\),其它位置的值是\(a_i\),最小化最大子段和.

考虑先二分再贪心:二分一个值,然后看如果需要使得答案小于等于这个值,最少需要用多少次操作.这个咋做呢?一个想法是,我先从左到右去扫一遍,然后每次如果当前最大后缀和大于二分的\(mid\),我们就需要找一个位置使得把这个位置改掉后,最大后缀和最小.

首先来看这个为什么是正确的.考虑后面的最大后缀和是会继承前面的最大后缀和的,因此让当前局面最小一定更优秀,并且每个位置选中的代价是相等的,那自然要选择贡献最高的那个.

显然,如果选择一个改掉的话,我们需要求出\(\min_{ k = 1 }^r \{ \max ( \max_{ i = k + 1 }^n \{ sum_{ i } \} , - b_k + \max_{ i = 1 }^k \{ sum_i \} ) \}\).注意改掉一个位置后要把它的\(b\)变成\(0\).

那么什么样的\(b\)有可能是我们要选中的呢?显然可能被选中的\(b\)一定是一个单调下降的序列中的某个,因为同等大小,选后面一定更优秀.上面那个式子我们是难以快速维护的,但如果我把它改成:\(\min_{ k = 1 }^r \{ \max ( \max_{ i = k + 1 }^n \{ sum_{ i } \} , - \max_{ i = k }^n \{ b_i \} + \max_{ i = 1 }^k \{ sum_i \} ) \}\),你会发现前者是一个单调不升的序列,后者是一个单调不降的序列,现在我们想要让它们的\(\max\)尽量小,这玩意显然可以做线段树二分.

上面那个东西也就是:

$$ \[\begin{aligned} & \min_{ k = 1 }^r \{ \max ( sufmax ( sum )_{ k + 1 } , - sufmax ( b )_k + premax ( sum )_k \} \\ = & \min_{ k = 1 }^r \{ \max ( sufmax ( sum )_{ k + 1 } , - \max ( sufmax ( b )_{ k + 1 } , b_k ) + premax ( sum )_k \} \\ \end{aligned}\]

$$

这样就可以在交界点更新答案.

另外,我们实际上更新答案会用到实际上找到的最小的\(k\)后面最大的\(b\),这是为啥呢?首先这样的确是更优秀的解,而且我们发现,我们的确有可能找到更靠前的位置,如果往前的挪动不影响\(sufmax ( b )\)的话.那有没有可能跳出了这一段,来到了更靠后的地方呢?这显然也不会,因为我们只找到最后面第一个处于当前分段函数的\(b\),这个\(b\)必然存在.如果它所在的sufmax和premax不一样,那么会是一个更优秀的解,压根不可能找到前面.

线段树合并

线段树维护矩阵乘法

吉司机线段树

李超线段树

珂朵莉树

Example1(luoguP8512 [Ynoi Easy Round 2021] TEST_152)

首先有经典套路:赋值操作有用的只有最后一次.

所以考虑扫描线,扫右端点的时候直接用珂朵莉树做.这样就剩下左端点的问题,因为有珂朵莉树,所以再开以时间为下标的数据结构就能处理.

猫树

KD-Tree

处理\(K\)维正交范围(给定\(n\)个有意义的点)在线修改查询的数据结构,是一棵二叉树.单次复杂度\(O ( n^{ 1 - \frac{ 1 }{ k } } + \log n )\).(单调修改复杂度只是\(O ( \log n )\))

离线情况下通常可以用cdq分治代替.

如果要支持动态插点,可以使用复杂度不正确的替罪羊树重构+kdtree.

1D-Tree

也就是线段树.

2D-Tree

建树的时候,对于每一维轮流考虑,每次考虑将这一维上的坐标的中位数的点(基准点)找到,左右分治下去(下一层要考虑另一维)处理.查询和修改都是类似的.

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
struct KD_tree{
int son[2];
int x,y;
int siz;
int f;
int l,r,u,d;
}tr[qwq<<1|1];
int cur[qwq<<1|1];
int clen;
struct P{
int x,y;
}p[qwq<<1|1];
bool cmpx(P a,P b){
return a.x<b.x;
}
bool cmpy(P a,P b){
return a.y<b.y;
}
ll mabs(ll x){
if(x>0)return x;
return -x;
}
void pushup(int cnt){
tr[cnt].l=tr[cnt].r=tr[cnt].x;
tr[cnt].d=tr[cnt].u=tr[cnt].y;
tr[cnt].siz=1;
if(tr[cnt].son[0]){
tr[cnt].l=std::min(tr[cnt].l,tr[tr[cnt].son[0]].l);
tr[cnt].r=std::max(tr[cnt].r,tr[tr[cnt].son[0]].r);
tr[cnt].d=std::min(tr[cnt].d,tr[tr[cnt].son[0]].d);
tr[cnt].u=std::max(tr[cnt].u,tr[tr[cnt].son[0]].u);
tr[cnt].siz+=tr[tr[cnt].son[0]].siz;
}
if(tr[cnt].son[1]){
tr[cnt].l=std::min(tr[cnt].l,tr[tr[cnt].son[1]].l);
tr[cnt].r=std::max(tr[cnt].r,tr[tr[cnt].son[1]].r);
tr[cnt].d=std::min(tr[cnt].d,tr[tr[cnt].son[1]].d);
tr[cnt].u=std::max(tr[cnt].u,tr[tr[cnt].son[1]].u);
tr[cnt].siz+=tr[tr[cnt].son[1]].siz;
}
return ;
}
inline ll dispp(int pa,int pb){
return 1ll*mabs(tr[pa].x-tr[pb].x)+1ll*mabs(tr[pa].y-tr[pb].y);
}
inline ll dispm(int po,int mat){
if(!mat)return 320051113;
ll d=0;
if(tr[po].x<tr[mat].l)d+=tr[mat].l-tr[po].x;
if(tr[po].x>tr[mat].r)d+=tr[po].x-tr[mat].r;
if(tr[po].y<tr[mat].d)d+=tr[mat].d-tr[po].y;
if(tr[po].y>tr[mat].u)d+=tr[po].y-tr[mat].u;
return d;
}
bool get_var(int l,int r){
double avx=0,avy=0;
for(int i=l;i<=r;++i){
avx+=p[i].x;avy+=p[i].y;
}
avx/=(r-l+1);avy/=(r-l+1);
double varx=0,vary=0;
for(int i=l;i<=r;++i){
varx+=1ll*(avx-p[i].x)*(avx-p[i].x);
vary+=1ll*(avy-p[i].y)*(avy-p[i].y);
}
return varx<vary;
}
int build(int l,int r){
if(l>r)return 0;
int mid=(l+r)>>1;
int cnt=cur[mid];
tr[cnt].f=get_var(l,r);
if(tr[cnt].f)std::nth_element(p+l,p+mid,p+r+1,cmpy);
else std::nth_element(p+l,p+mid,p+r+1,cmpx);
tr[cnt].x=p[mid].x;tr[cnt].y=p[mid].y;tr[cnt].siz=1;
tr[cnt].son[0]=build(l,mid-1);
tr[cnt].son[1]=build(mid+1,r);
pushup(cnt);
return cnt;
}

笛卡尔树

Example1([CFgym101613]Factor-free tree)

首先有一个自然的想法是随便找一个和整个区间都互质的数,然后把序列分成左右两端向下递归.对于一棵构造出来的二叉树,它的复杂度就是\(\sum dep_u\),是可以被卡成\(O ( n^2 )\)的.

但我们考虑类似dsu on tree的做法,我们每次找到一个点,它将一个区间劈成了两部分,我们把小的那部分的贡献删去,然后做大的那部分.在递归过程中把大的那部分的贡献逐渐消磨掉.最后再做小的那部分,这样就类似于启发式合并的过程,复杂度就正确了.

Example2(23省选第一轮集训day5C)

注意到最小值的条件是容易满足的.

考虑枚举以每个点为最大值转移的区间,假设为\([ l , r ]\),这样会有:\([ l - 1 , i - 1 ] \rightarrow [ i , r ]\).注意到我们可以选择其中较短的区间来更新零一个区间或被另一个区间更新.

单调队列

Example(loj3151)

首先自然地,我们设\(f_{ i , j }\)表示前\(i\)个测试点已经分成了\(j\)段的方案数,然后做转移,复杂度\(O ( T^2 S )\).

接下来咋优化咧?决策单调性!

嘶这题好像不满足决策单调性(这个故事也告诉我们不要看到\(k\)最短路就想决策单调性).

冷静一下,首先如果我把\([ l , r ]\)分到一段里,那这一段的答案和啥有关?显然只和有多少个人在这段区间中没挂分有关.对于一个右端点\(r\),我们不妨枚举有多少个人会在它所在的子任务挂分.显然,在左端点在一个区间内的时候,这个子任务会有一定的人挂分.而且随着现在右端点的移动,这个区间的左右端点都是单调不降的.那我们对于每种人数做单调队列维护即可.

树套树

解决矩阵修改+单点查询或单点修改+矩阵查询问题.

Example1

维护一个序列支持把\(x\)位置的值改为\(y\)或查询一个区间中小于\(y\)的数个数.

用树状数组维护平衡树,每次在树状数组上对应的节点修改即可.

Example2(Luogu4054 [JSOI2009]计数问题)

乍一看是动态三维问题.

相等维度是特殊的,我们开\(100\)个二维数据结构处理值不同的情况,这样就是二维.

数据结构常见套路

分开考虑

Example1(P6105 [Ynoi2010] y-fast trie)

考虑只有两种可能:

  1. \(x + y < C\),取\(x + y\)作为答案.

  2. \(x + y \geq C\),取\(x + y - C\)作为答案.

后者只需要取出最大的两个数即可,至于前者,考虑将所有数字分成两个集合,一个集合只在\([ 0 , \lceil \frac{ C }{ 2 } \rceil )\)中,一个集合包含剩下的数字.对于第一个集合,我们只需要取出其中最大的两个数字就行.接下来的问题是怎么处理跨越两个集合的答案.考虑将每个点对应的答案配对,显然每个点能影响到的点是一段区间,删除时暴力修改.

另外,\(x + y < C\)也就是\(x < C - y\),我们把第二个集合中的元素全部变成\(C - y\)后插入,只需最小化\(C - x - y\),这个只需要维护最大的\(x\)和最小的\(C - y\)就行.

合并信息

lxl:这种问题主要需要解决三件事:标记对标记可合并,标记对值可合并,值与值可合并.

Example1([HNOI2011]括号修复 / [JSOI2011]括号序列)

注意到只要知道区间的最小前缀和以及区间的和,这个题就做完了.我们只需要维护这两件事.区间的和显然是好维护的,难以维护的是最小前缀和,我们来分开看每个操作:

替换:简单的.翻转:不太好做,尝试维护一下最小后缀和.反转:需要维护最大前缀和,进一步需要维护最大后缀和.

这样就可以更新答案了.

Example2(P4198 楼房重建)

左右维护单调栈合并,但这样复杂度肯定不对.

怎么办呢?我们可以用\(O ( \log n )\)的单次pushup操作,也就是维护一下每个节点所代表的区间的答案和最大值,不断递归右子树(或左子树)判断.

Example3(CF1017G)

\(w_i\)为从上往下延伸到\(i\)这个点后,还能多往下延伸多少,一开始\(w\)都是\(- 1\),每次操作会让\(w + = 1\).树链剖分维护子段最大非空后缀和.

去除冗余信息

Example1(luoguP6617)

自然的想法是考虑找到每个点前面第一个和它之和为\(w\)的数字,但这样就炸了,因为每修改一个点可能要影响\(O ( n )\)个点的答案.

我们注意到一个事实:我们也可以找到每个点后面第一个和它之和为\(w\)的数字,而显然只有两个数互相匹配才可行.如果\(i < j < k , ( i , j ) , ( i , k )\)分别配对,那么显然\(( i , k )\)没有用.这样每个点只有\(O ( 1 )\)个匹配了.

set维护颜色

Example1(luoguP5278 算术天才⑨与等差数列)

首先考虑\(k = 1\)怎么做,显然找一下区间最大值和区间最小值,然后就只需要判断区间内有没有重复元素,经典套路:set维护颜色,这样可以处理出每个点上一个和它相同颜色的点,拿线段树维护它的最大值.

\(k \ne 1\)怎么办呢?考虑这只是相当于要判断一下这个区间内的数字是否在\(\bmod k\)意义下全部相等,维护差分数组的区间\(\gcd\)就行.

复杂度均摊

Example1(CF702F T-Shirts)

看到这个感觉很奇怪,想想好像也没有什么快速tag算法.

我们考虑对人建平衡树,然后按照顺序买衣服,每次找到所有能买这件衣服的人,显然是平衡树的某棵子树.但是,这棵子树在买完衣服后可能就不满足顺序了,那怎么办呢?能不能暴力重构一波?

事实上是可以的,对于一件价格为\(q\)的衣服,\([ 0 , q )\)的人肯定买不了,\([ q , 2 q - 1 ]\)的人买完后,手上的钱至少减半,我们暴力处理,至于\([ 2 q , + \infty )\),显然买完后不会对其形态有什么影响,打个tag.

Example2(uoj228)

一个自然的想法是暴力开根号,它会迅速缩短两个数之间的差.但可能也不能缩到\(0\),那怎么办呢?当我们发现这个区间的最大值和最小值开根号后的差不变了,我们就把开根操作改成区间减法就行了.

loj6029是等价做法.

Example3(Luogu 4690 [Ynoi2016]镜中的昆虫)

维护每个点的颜色相同的前驱,单点修改的话就是简单树套树.

然后区间推平可以用颜色块均摊(同一个颜色块内只需要改开头元素,剩下的都是\(pre [ i ] = i - 1\)).

根号分治

Example1(luoguP7722 [Ynoi2007] tmpq)

这个题告诉我们一个故事:有的时候,有的条件可能真的没用.

直接把题目改成:每次修改\(a , b , c\)中的某个数,求.

Example2

对于一个数字\(x\),每次随机在\([ 1 , x ]\)中一个数\(y\)并令\(x \leftarrow x \bmod y\),初始值为\(n\),求期望几次能变成\(0\).

注意到如果\(y\)很小就直接做,\(y\)很大的话\(\lfloor \frac{ x }{ y } \rfloor\)很小,暴力做数论分块.

Example3

给定一棵树,每次修改树上某个点的权值,或询问某个点周围的点的权值和.

度数大的点在修改的时候改,度数小的在询问的时候做.

Example4

给定序列,每次询问给出两个数字\(x , y\),求最小的\(| i - j |\)满足\(a_i = x , a_j = y\).

对于出现次数大的,处理出它和所有数字的答案.

如果\(x , y\)出现次数都少,就在做的时候直接归并.

Example5(SHOI2006 Homework)

首先对于\(Y\)很小的情况直接预处理就行,每次插入的时候更新答案.

对于\(Y\)很大的情况,\(\frac{ n }{ Y }\)一定很小,我们不断查询大于等于\(kY\)的最小元素即可,这个可以值域分块来根号平衡做到\(O ( 1 )\)查询,\(O ( \sqrt{ n } )\)单点修改.具体地,我们对每个块处理出大于等于这个块的最小的\(X\),以及块内每个点后面最小的\(X\)(必须在块内),然后定位到\(kY\)的块.

Example6

给定\(n , m\),以及序列\(a\)和长度为\(n\)的排列\(y\),你需要回答\(m\)个询问.对每个询问,给定\(l , r\),查询:

\[ \sum_{ i = 1 }^n \sum_{ j = i + 1 }^n [ a_i = a_j ] \prod_{ k = i }^j [ l \leq y_k \leq r ] \]

注意到\(y_i = i\)的时候,这题等价于小Z的袜子.因此这题不会低于根号复杂度.轮流猜算法,猜到根号分治.

首先有一个性质:对于一对点\(( x , y ) , a_x = a_y , \nexists x < z < y , a_z = a_x\),对于\(( x , y )\)这个区间内部的点,它们其实是可以缩起来的!(比赛的时候没想到呜呜)具体来说,我们只需要保留它们中最大的那个和最小的那个就行.

接下来,对于出现次数大于\(\sqrt{ n }\)的数字,它们最多只有\(\sqrt{ n }\)个,考虑莫队复杂度\(O ( n \sqrt{ m } + m )\),因此我们可以对每个分别做莫队,总复杂度\(O ( n \sqrt{ m } + m \sqrt{ n } )\),注意用基数排序,甚至不能用桶排.

对于出现次数小于\(\sqrt{ n }\)的数字,这些数字一共最多有\(n\)个,每个点暴力配对就有\(O ( n \sqrt{ n } )\)个点对,然后\(O ( m )\)次询问,用根号平衡做扫描线,这里复杂度\(O ( n \sqrt{ n } + m \sqrt{ n } )\).

重链分治

Example1(Luogu5314 [Ynoi2011]ODT)

其实不是根号分治,但是差不多,扔这里了.

给一棵树,边权为\(1\),支持把一条链上所有点加上\(k\),或者查询距离一个点\(< = 1\)的所有点的点权\(kth\).\(n \leq 2 \times 10^5\).

每个点周围的点一共有三种可能:父亲,重儿子,轻儿子,特判重儿子和父亲,然后处理出所有轻儿子的情况,这个怎么做都能做(大不了把所有轻儿子全扔平衡树里),然后重链剖分的时候只会改\(O ( \log n )\)个轻儿子.

扫描线

一维扫描线

最经典的应用是对于一个\(B\)维的静态问题,我们可能可以用扫描线扫掉一维,让它变成一个\(B - 1\)维的动态问题.不过扫描线处理的时候可能需要是低\(side\)的问题,具体情况具体分析.

主席树通常就是解决强制在线不能处理扫描线的问题.

另外,通常认为时间也是一维,也就是即使是动态问题也一般是等价于对时间跑了扫描线.

二维扫描线

也就是莫队.

Example

Example1(CF1609F Interesting Sections)

首先枚举每个数的\(popcount\),相当于每次将一些点标记为关键点,然后查询有多少个区间满足区间最大值和最小值都是关键点.

可以求出每个点\(x\)作为最大值的影响区间\([ l , r ]\),也就是如果一个区间左端点在\([ l , x ]\),右端点在\([ x , r ]\)即可满足条件.我们考虑放入一个左下角坐标为\(( l , x )\),右上角坐标为\(( x , r )\)的矩阵.最小值也是同理的,最后也就是求所有最大值矩阵和所有最小值矩阵的交.注意到如果两个点相同,我们规定一下在前面的更小,那么最大值矩阵两两不交,最小值矩阵也两两不交,就是一个最简单的扫描线问题了.

Example2(CF833E)

离散化,设\(S = \{ l \} \cup \{ r \}\),考虑用\(len_i\)表示\(i\)节点及以前最多能有多少阳光.我们考虑用\(len_{ i - 1 }\)更新\(len_i\),如果\([ i - 1 , i ]\)没被覆盖,显然直接加上这段的长度.如果\([ i - 1 , i ]\)被覆盖大于两次,那显然直接继承\(len_{ i - 1 }\).

先考虑\([ i - 1 , i ]\)被两朵云覆盖了怎么办,我们考虑用\(h_{ j , k }\)表示当前被且只被\(j\)\(k\)共同覆盖的区间长度,不难发现\(h_{ j , k }\)有值的地方很少,用map.然后还要加上它们各自的贡献,用\(g_j\)表示当前被且只被\(j\)覆盖的区间长度,这样就可以计算答案.而这两个辅助数组也可以在判断\([ i - 1 , i ]\)是被一朵云还是被两朵云覆盖的时候更新掉.

如果\([ i - 1 , i ]\)被一朵云覆盖了怎么办呢?我们考虑把这朵云杀了,但我们还可能杀掉前面的某一朵云,假设为\(k\),那么就有两种情况:要么这两朵云有交,要么无交.

先考虑无交的情况,这个时候答案显然是\(g_j + g_k\),用线段树处理出当前代价和小于等于\(C\)\(k\)\(g_k\)的最大值就行.

再考虑有交的情况,答案应该为\(g_j + g_k + h_{ j , k }\),我们在每次遇到\(( j , k )\)的时候都在对方那里打个tag就好,也就是对于每个\(j\),处理出和它有交的云中\(g_j + g_k + h_{ j , k }\)的最大值.虽然这些值都会变,但是只会变大,因此可以处理.

那么怎么判断两朵云有交呢?我们不用判断两朵云是否有交,因为前者一定没有后者优秀.不过需要判断两朵云不能是同一朵,这个存一下次大值就可以解决.

这样就转移完了这个题,挺厉害的.

Example3(loj3489)

时间也是一维,扫序列维护时间,线段树二分就可以解决.

具体地,我们需要对每个询问找到这个询问前最近的队列为空的时刻,然后这个时刻后面的答案就可以直接拿前缀max二分,问题在于怎么求这个时刻.

这个时刻也是好求的,它一定是前缀的最小值(这个点一定清空了,这个点后面的数比它小,因此这个点变成\(0\)后那些数一定没清空).

Example4(luoguP7709 「Wdsr-2.7」八云蓝自动机 Ⅱ)

如果初始序列全为\(0\):

倒着扫操作序列,维护当前还没有得到答案的询问,每次找到一个操作一定将整个区间的询问全部得知了答案.

不然不会做.

Example5(luogu3863)

仍然是个数据结构维护时间维,扫描线扫序列维的东西.

Example6(qoj6304)

考虑横纵坐标是对称的,因此我们只需要考虑两横一竖的情况和三条横的情况.

先做三条横,枚举中间的那个横的位置,剩了一段前缀和一段后缀需要覆盖,这个可以前后缀预处理.

然后是两横一竖,扫竖线,问题转化为动态加入删除区间,求当前用两个点覆盖所有区间的方案数,不妨设这两个点是\(L < R\),自然有\(L \leq \min \{ r_i \} , R \geq \max \{ l_i \}\),那么当我们确定\(L\)后,我们有\(R \in [ \max \{ l_i \} , f ( L ) ]\).接下来我们考虑如何计算\(f ( L )\).

注意到\(L < l_i \Rightarrow R \leq r_i\),我们考虑将\(l_i\)这个点的权值设成\(r_i\),那么我们要做的就是一个后缀最小值求和,用楼房重建.

莫队

回滚莫队

带修莫队

也就是维护三维的扫描线,根据KDT不难发现复杂度是\(O ( nm^{ \frac{ 2 }{ 3 } } )\),\(B = n^{ \frac{ 2 }{ 3 } }\),排序原则是\(( ls , rs , t )\),复杂度算一算就知道是对的.

树上莫队

二次离线莫队

这个直接拿区间逆序对当例子记笔记好了.

如果我们用正常的莫队做区间逆序对,我们会得到带个\(\log n\)的复杂度:也就是每次扩展一个数,计算它对答案的贡献,这个是必须带\(\log n\)的,而且查询次数等价于移动次数,我们甚至不能用根号平衡.

那么怎么解决这个问题呢?我们现在无非是有\(n \sqrt{ n }\)次询问,每次询问\(f ( l , r , r + 1 )\)表示区间\([ l , r ]\)\(r + 1\)的逆序对贡献.考虑差分成\(f ( 1 , r , r + 1 ) - f ( 1 , l - 1 , r + 1 )\),前者显然可以迅速求出.而后者的右端点需要移动\(n\)次,需要查询总共\(n \sqrt{ n }\)次,zhe’ge

Example

Example1([Ynoi2016]这是我自己的发明)

dfn将子树转序列,注意到换根无非是把一个序列拆成了两个序列,这是好做的.不过这玩意都\(4 - side\)了,但是有可减性,减成\(2 - side\)就能莫队了.

Example2([HNOI2016]大数)

区间子区间问题对于莫队是有一个套路的:即转化为二元组计数问题.

具体怎么做呢?首先这个题我们特判掉\(p = 2\)\(p = 5\)的情况,这个只需要判断个位数就可以.然后我们考虑求每个点后缀代表的数字\(\bmod p\)的值,设为\(suf_i\),假设存在两个点\(l , r\)满足\(p | ( suf_l - suf_{ r + 1 } )\),那么\([ l , r ]\)就是合法的,这是自然的,也就等价于\(suf_l = suf_{ r + 1 }\),相当于要对满足\(suf_l = suf_{ r + 1 }\)的二元组\(( l , r )\)计数,这个是可以用莫队维护的.

Example3(luoguP3604 美好的每一天)

类似上面那个题,用哈希(其实就是将26个字母表示成26个二的幂次)然后异或起来,和上面的题就完全一样了,做二元组计数.

区间子区间问题

求有多少个子区间满足条件.

上二维平面,子区间所代表的\(( l , r )\)的点一定是在一条角平分线上的一个等腰直角三角形.

Example1(CF997E)

考虑转化为二维平面,\(a_{ l , r } = maxn - minn - ( r - l )\),显然只需要找到为\(0\)的操作就行,这四个数可以转化为四个矩形加法,做扫描线.

另外这里的矩阵加法有\(3 - side\)的,但是可差分成\(2 - side\).

时间倒流

Example1([2022qbxt国庆Day6]sgtbeats)

首先考虑:如果一个点被清空了多次,那么只有最后一次有意义.

删除操作很难做,考虑变成插入,然后就可以拿数据结构维护操作序列的后缀max,存一下每个点最后被清空的时间,然后处理即可.

Example2([WC2006]水管局长)

时间倒流,删边变加边,LCT做一下.

数据结构维护分段函数

Example1(CF1540D Inverse Inversions)

考虑对于一个数列怎么构造:假设只考虑前\(k\)个数,它们的取值是\([ 1 , k ]\),现在加入第\(k + 1\)个数,由于我们知道它是前缀第几小,所以我们可以直接将它设成这个值,然后将前面所有大于等于这个值的点全都\(+ 1\),不难发现这一定是唯一构造.

那么我们现在要知道\(p_i\)是多少,根据上面的构造过程,首先将\(p_i = a_i\),然后不断向后遍历,每遇到一个\(a_j\),如果\(a_j \leq p_i\),则把\(p_i + = 1\).

我们将数列分块,设块长为\(B\),那一个值经过一个块的时候最多加块长个\(1\).也就是经过整块的时候是一个\(B\)段的分段函数.

考虑暴力求出这个分段函数,每次询问的时候直接二分,修改的时候考虑每个块维护一个线段树,线段树的区间表示这个区间对应的分段函数.这样单点修改复杂度是\(\sum{ \cfrac{ B }{ 2^i } } = B\)的,

于是最后复杂度为\(O ( T ( B + \cfrac{ n }{ B } \log n ) )\),取\(B = \sqrt{ n \log n }\)即可.

根号平衡

根号平衡主要用到下面四个东西:

  1. \(O ( 1 )\)单点加,\(O ( \sqrt{ n } )\)区间和:维护块内的和即可.

  2. \(O ( \sqrt{ n } )\)单点加,\(O ( 1 )\)区间和:维护块内和块间的前缀和即可.

  3. \(O ( \sqrt{ n } )\)区间加,\(O ( 1 )\)单点和:差分转化为\(( 2 )\).当然打标记也是可以的.

  4. \(O ( 1 )\)区间加,\(O ( \sqrt{ n } )\)单点和:差分转化为\(( 1 )\).当然打标记也是可以的.

还有一些拓展的东西:

  1. 维护值域\(O ( n )\)的集合,支持\(O ( 1 )\)插入,\(O ( \sqrt{ n } )\)查询第\(k\)小:值域分块就可以.

  2. 维护值域\(O ( n )\)的集合,支持\(O ( \sqrt{ n } )\)插入,\(O ( 1 )\)查询第\(k\)小:值域分块,然后暴力改变每个点所属的块就行.

Example

Example1(区间众数)

首先分块,处理出\(f_{ l , r }\)表示块\([ l , r ]\)的答案.这样每次只需要加入散块中的每个数并判断答案即可,由于判断每个数在区间出现次数是\(\log n\)的,因此复杂度\(O ( n \sqrt{ n \log n } )\).

但是可以优化,我们设\(mx\)表示当前众数出现次数,注意到我们判断一个数字在区间中出现次数是否大于\(mx\)可以\(O ( 1 )\)判断(处理出这个数所有的出现位置),而如果遇到两个数需要对冲,显然\(mx\)增加总次数也不会超过\(O ( \sqrt{ n } )\),因此做到\(O ( n \sqrt{ n } )\).

不删除莫队也能做.

当然,如果只要求区间众数的出现次数,可以直接莫队.

Example2(CodeChef Chef and Churu)

首先发现函数是不会被修改的,因此考虑对函数分块,对于那些散着的函数肯定可以用一个\(O ( 1 )\)查询区间和,\(O ( \sqrt{ n } )\)单点修改的进行根号平衡.

而怎么快速处理整块呢?发现函数可差分,差分后就可以算出每一个位置对这个块内的总贡献,这样就可以更新了.

Example3([Ahoi2013]作业)

莫队,发现有\(m\)次查询,\(n \sqrt{ m }\)次移动,于是根号平衡.

Example4(Bzoj4241历史研究)

回滚莫队板子.

事实上考虑可能的答案只有\(O ( n )\)种,用值域分块就可以平衡复杂度.

实数

首先我们拿到了有理数,然后我们按照以下步骤定义无理数:

首先我们注意到有理数是不连续的.问题在于我们要将其中不连续的部分给补上.首先我们应当去发现一下如何去发现有理数中的一个断点:

\(S\)是一个全序非空集合,我们找到它的两个非空子集\(A , B\),若满足:

  1. \(A \cap B = \emptyset , A \cup B = S\).

  2. \(\forall a \in A , b \in B , a < b\).

  3. \(A\)中无最大元素.

则称这是\(S\)的一个分划,记作\(( A | B )\).接下来我们先考虑\(S = \mathbb{ Q }\)的情况.

我们注意到一些事,比如说注意到\(B\)中有可能没有最小元素.举个例子的话,我们令\(S = \mathbb{ Q } , A = \{ x | x \leq 0 \lor ( x > 0 \land x^2 < 2 ) \}\),显然\(A\)中无最大元素,此时取\(B = S \setminus A\),则显然\(B\)中无最小元素(反证法),假设存在最小元素则可以调整到更小的元素,因为容易证明不存在一个有理数的平方为\(2\).

通过上面的铺垫我们知道,有理数并非连续的,因此如果\(B\)中有最小元素,则称这是一个有理分划;如果\(B\)中无最小元素,则称这是一个无理分划.容易发现有理分划与有理数一一对应.我们将无理分划也去对应到一些数上,这就产生了无理数的定义.只需比较\(A\)集合的大小包含关系就可以比较两个实数的大小.

那我们还需要做的一件事是去证明无理数也有四则运算法则.不妨直接拿分划去验证四则运算法则:

  1. 加法:对于\(( A_c | B_c ) + ( A_d | B_d )\),我们取\(A_{ c + d } = \{ x + y | x \in A_c , y \in A_d \}\)即可.

  2. 减法:只需定义加法逆元.如果是无理分划的话,直接把\(A , B\)中的元素全部取反再交换即可;如果是有理分划的话,需要注意取反再交换后\(A\)中出现了最大元素,只需要在这里把那个元素给提出来就行.

  3. 乘法:两个正数相乘可以直接模仿加法,如果有负数的话就把负号提出来再把绝对值作乘法即可.

  4. 除法:只需定义乘法逆元,这个有点麻烦需要判断\(A\)\(B\)哪个集合是同号的,但总之这个是平凡的.

戴德金分割定理

\(\mathbb{ R }\)的任一分划\(( A | B )\),\(B\)中必定有最小元素.

这个怎么证明呢?对于分划\(( A | B )\),我们直接取\(A ' = A \cap \mathbb{ Q } , B ' = B \cap \mathbb{ Q }\),不难发现\(( A ' | B ' )\)一定是\(\mathbb{ Q }\)的一个分划,也就是说\(( A ' | B ' )\)对应了一个实数\(x\).

既然如此就可以考虑\(x\)应该属于哪个集合.我们注意到:如果\(x \in A\),那么\(x\)必定是\(A\)中的最大元素;如果\(x \in B\),那么\(x\)必定是\(B\)中的最小元素.

两部分是类似的,只考虑前一部分.考虑反证,如果\(\exists y > x , y \in A , x \in A\),那么\(A ' \subsetneq A_y\),那么\(A_y\)就一定不是\(A\)的子集.换言之,\(\exists w \in A_y\),\(\forall z \in A , w > z\).但我们有\(y > w\),这必然意味着\(y \notin A\),与假设不符.

确界存在定理

\(M\)有上(下)界,则必然有上(下)确界.

\(M\)有上界\(c\),由于它是一个实数,它应该可以写作\(( A_c | B_c )\)的形式.\(\forall \alpha \in M , A_\alpha \subset A_c\).

于是我们取\(A = \bigcup_{ \alpha \in M } A_\alpha , B = \mathbb{ Q } \setminus A\),我们来说明\(( A | B )\)是一个分划.

首先由于有上界,显然\(A , B \ne \emptyset , A \cap B = \emptyset , A \cup B = \mathbb{ Q }\).

如果 \(\exists b \in B , a \in A , b < a\),这是不可能的,因为如果\(b < a\),那么\(b \in A , b \notin B\).

因为所有的\(A_\alpha\)中都没有最大元素,反证即可说明\(A\)中无最大元素.

那么\(( A | B )\)就是\(M\)的上确界.

Example1

证明对于单增函数\(f : [ 0 , 1 ] \rightarrow [ 0 , 1 ]\),\(f ( [ 0 , 1 ] ) \subseteq ( 0 , 1 )\),则\(f\)\(y = x\)一定有交点.

\(A = \{ x | f ( x ) < x \}\),则\(1 \in A , A \subseteq [ 0 , 1 ]\).取\(a = \inf A\).

此时我们断言\(f ( a ) = a\),否则:

如果\(f ( a ) < a\),取\(\epsilon = a - f ( a )\),注意到\(f ( a - \frac{ \epsilon }{ 2 } ) < f ( a ) < a - \frac{ \epsilon }{ 2 }\),因此\(( a - \frac{ \epsilon }{ 2 } ) \in A\),与\(a\)是下确界矛盾.

如果\(f ( a ) > a\),取\(\epsilon = f ( a ) - a\).考虑由于\(a\)是下确界,因此\(\exists b \in A , b \in ( a , a + \frac{ \epsilon }{ 2 } )\).那么\(b < a + \frac{ \epsilon }{ 2 } < f ( a ) < f ( b )\),这与\(b \in A\)矛盾.

阿基米德性质

以下命题等价,任取其一均可作为阿基米德性质:

  1. \(\forall y \in \mathbb{ R }\),\(\exists n \in \mathbb{ N } , n > y\).

  2. \(\forall x \in \mathbb{ R }_+ , \exists n \in \mathbb{ N }\),\(nx > 1\).

  3. \(\{ \frac{ 1 }{ n } \}\)有聚点.

  4. \(\lim_{ n \rightarrow \infty } \frac{ 1 }{ n }\)存在.

  5. \(\lim_{ n \rightarrow \infty } \frac{ 1 }{ n } = 0\).

  6. \(\lim_{ n \rightarrow \infty } \frac{ 1 }{ 2^n } = 0\).

(1)\(\Rightarrow\)(2)\(\Rightarrow\)(3)\(\Rightarrow\)(4)\(\Rightarrow ( 5 )\)是显然的.又考虑\(\{ \frac{ 1 }{ 2^n } \}\)\(\{ \frac{ 1 }{ n } \}\)的子列,所以\(( 5 ) \Rightarrow ( 6 )\).而取一个\(\frac{ 1 }{ 2^k } < \frac{ 1 }{ | y | }\)即可(6)\(\Rightarrow\)(1).

阿基米德性质可以由确界存在定理推来,简单来说考虑\(x \in \mathbb{ R }_+ , A = \{ nx | nx < 1 \}\).反证,如果\(A\)是无限集合,那么根据确界存在定理一定存在最小上确界\(\alpha \leq 1\)\(\forall n , nx < \alpha , ( n + 1 ) x < \alpha , nx < \alpha - x\),这就说明\(\alpha - x\)是一个更小的上界,这就矛盾了.

实数集上的一元函数

性质

奇偶性

首先需要定义域关于原点对称.

然后注意到取\(f ( x ) = \frac{ f ( x ) + f ( - x ) }{ 2 } + \frac{ f ( x ) - f ( - x ) }{ 2 }\),可将任意定义域关于原点对称的函数写作奇偶函数之和.

事实上,对于一个可以求任意次导数的偶函数\(f\),是否总存在一个可以求任意次导数的函数\(g\)使得\(f ( x ) = g ( x^2 )\).

这个问题的难点肯定在于\(0\)附近对吧.

这个证明要用到泰勒展开.

\[ f ( \sqrt{ x } ) = \sum_{ k = 0 }^n \frac{ f^{ ( k ) } ( 0 ) }{ k ! } x^\frac{ k }{ 2 } + \frac{ f^{ ( n + 1 ) } ( \xi_n ) }{ ( n + 1 ) ! } x^\frac{ n + 1 }{ 2 } \]

两边求导,应该有:

\[ ( f ( \sqrt{ x } ) )^{ ( t ) } = \sum_{ k = 0 }^n \frac{ f^{ ( k ) } ( 0 ) \prod \limits_{ i = 0 }^{ t - 1 } ( \frac{ k }{ 2 } - i ) }{ k ! } x^{ \frac{ k }{ 2 } - t } + \frac{ f^{ ( n + 1 ) } ( \xi_n ) \prod \limits_{ i = 0 }^{ t - 1 } ( \frac{ n + 1 }{ 2 } - i ) }{ ( n + 1 ) ! } x^{ \frac{ n + 1 }{ 2 } - t } \]

我们知道\(f\)任意阶导数存在,所以在闭区间\([ - 1 , 1 ]\)上任意阶导数有界.这就意味着,对于固定的\(t\).只要取足够大的\(n = 2 t + 2\)满足\(\frac{ n + 1 }{ 2 } - t > 1\),就可以让余项趋于\(0\).

现在来数学归纳,用多项式的特殊情况,假设\(g^{ ( t ) } ( 0 ) = \frac{ t ! }{ ( 2 t ) ! } f^{ ( 2 t ) } ( 0 )\),考虑:

$$ \[\begin{aligned} g^{ ( t + 1 ) } ( 0 ) = \frac{ ( f ( \sqrt{ x } ) )^{ ( t ) } - \frac{ t ! }{ ( 2 t ) ! } f^{ ( 2 t ) } ( 0 ) }{ x } \\ = \cfrac{ \sum_{ k = 0 }^{ 2 t + 2 } \frac{ f^{ ( k ) } ( 0 ) \prod \limits_{ i = 0 }^{ t - 1 } ( \frac{ k }{ 2 } - i ) }{ k ! } x^{ \frac{ k }{ 2 } - t } - \frac{ t ! }{ ( 2 t ) ! } f^{ ( 2 t ) } ( 0 ) }{ x } \\ = \cfrac{ \sum_{ k = 0 }^{ 2 t + 2 } \frac{ f^{ ( k ) } ( 0 ) \prod \limits_{ i = 0 }^{ t - 1 } ( \frac{ k }{ 2 } - i ) }{ k ! } x^{ \frac{ k }{ 2 } } - \frac{ t ! }{ ( 2 t ) ! } f^{ ( 2 t ) } ( 0 ) x^t }{ x^{ 1 + t } } \\ \end{aligned}\]

$$

一片混乱,考虑一下下面这项:

$$ \[\begin{aligned} & \frac{ f^{ ( k ) } ( 0 ) \prod \limits_{ i = 0 }^{ t - 1 } ( \frac{ k }{ 2 } - i ) }{ k ! } x^{ \frac{ k }{ 2 } } \\ = & \frac{ f^{ ( k ) } ( 0 ) \prod \limits_{ i = 0 }^{ t - 1 } ( k - 2 i ) }{ k ! 2^t } x^{ \frac{ k }{ 2 } } \\ \end{aligned}\]

$$

这个时候我们注意到,当\(k\)是奇数的时候应该有\(f^{ ( k ) } ( 0 ) = 0\),当\(k\)是偶数并且\(k \leq t - 1\)的时候应该有\(\prod \limits_{ i = 0 }^{ t - 1 } ( k - 2 i ) = 0\),这意味着这个求和最后只会剩下\(\frac{ f^{ ( 2 t ) } ( 0 ) t ! }{ ( 2 t ) ! } x^{ t } + \frac{ f^{ 2 t + 2 } ( 0 ) ( t + 1 ) ! }{ ( 2 t + 2 ) ! } x^{ t + 1 }\),然而前半部分和后面的刚好消掉了,这就数学归纳成立了.

有界性
单调性
周期性

周期函数不一定有最小正周期,比如狄利克雷函数.

还有个思考题:

如果\(f , g\)是定义域为\(R\)的最小正周期分别为\(T_1 , T_2\)的周期函数,求问:

  1. \(\frac{ T_1 }{ T_2 } \in \mathbb{ Q }\),则\(f + g\)是周期函数.

  2. \(\frac{ T_1 }{ T_2 } \in \mathbb{ R } \setminus \mathbb{ Q }\),结论如何.

  3. \(f , g\)均连续,结论如何.

(1)显然,(3)必定不是周期函数,原因是考虑反证:

如果是的话,必定有:

\[ \begin{aligned} f ( x + T ) + g ( x + T ) & = f ( x ) + g ( x ) \\ f ( x + T ) - f ( x ) & = g ( x ) - g ( x + T ) \end{aligned} \]

\(h ( x ) = f ( x + T ) - f ( x ) = g ( x ) - g ( x + T )\),则\(h ( x )\)\(T_1 , T_2\)为周期,那么其以\(pT_1 + qT_2\)为周期,可逼近这个无理数使得其周期趋近于\(0\),用\(h\)的连续性,于是\(h ( x )\)为常函数,不符题意.

(2)怎么办呢?有没有一种构造方式使得它是周期函数呢?

构造\(d_{ p , q } ( x ) = \begin{cases}1 & \exists m , n \in \mathbb{ Z } , mp + nq = x \\ 0 & \forall m , n \in \mathbb{ Z } , mp + nq \ne x\end{cases}\).

\(f ( x ) = d_{ 1 , \sqrt{ 2 } } ( x ) - d_{ \sqrt{ 2 } , \sqrt{ 3 } } ( x ) , g ( x ) = d_{ \sqrt{ 2 } , \sqrt{ 3 } } ( x ) - d_{ 1 , \sqrt{ 3 } }\),容易见到\(f + g\)的周期为\(1\),下面证明\(f\)的最小正周期是\(\sqrt{ 2 }\),而\(g\)的最小正周期是\(\sqrt{ 3 }\).

二者相似,只考虑证明前者,如若存在一个\(T\),使得\(f ( x ) = f ( x + T )\),则有:

\[ \begin{aligned} d_{ 1 , \sqrt{ 2 } } ( x ) - d_{ \sqrt{ 2 } , \sqrt{ 3 } } ( x ) & = d_{ 1 , \sqrt{ 2 } } ( x + T ) - d_{ \sqrt{ 2 } , \sqrt{ 3 } } ( x + T ) \\ d_{ 1 , \sqrt{ 2 } } ( x ) - d_{ 1 , \sqrt{ 2 } } ( x + T ) & = d_{ \sqrt{ 2 } , \sqrt{ 3 } } ( x ) - d_{ \sqrt{ 2 } , \sqrt{ 3 } } ( x + T ) \end{aligned} \]

\(x = \sqrt{ 3 }\)得到:

\[ d_{ \sqrt{ 2 } , \sqrt{ 3 } } ( \sqrt{ 3 } + T ) - d_{ 1 , \sqrt{ 2 } } ( \sqrt{ 3 } + T ) = 1 \]

这就意味着:

$$ \[\begin{cases} d_{ \sqrt{ 2 } , \sqrt{ 3 } } ( \sqrt{ 3 } + T ) = 1 \\ d_{ 1 , \sqrt{ 2 } } ( \sqrt{ 3 } + T ) = 0 \\ \end{cases}\]

$$

从而\(T = n \sqrt{ 2 } + m \sqrt{ 3 }\),其中\(m \ne - 1\).再取\(x = 0\)得到:

\[ d_{ 1 , \sqrt{ 2 } } ( T ) = d_{ \sqrt{ 2 } , \sqrt{ 3 } } ( T ) = 1 \]

这就必然意味着\(T = n \sqrt{ 2 }\),从而\(f\)的最小正周期恰好就是\(\sqrt{ 2 }\).

基本初等函数

  1. 常值函数

  2. 指数函数

  3. 对数函数

  4. 幂函数

  5. 三角函数

  6. 反三角函数

其中有一些函数的定义其实有一些缺陷,我们将在讨论完连续性后给出.

初等函数

由基本初等函数经过有限次四则运算和复合得到的函数.

举个逆天例子:

\[ f ( x ) = \begin{cases} \sqrt{ - x } & x < 0 \\ 0 & x \in [ 0 , 1 ] \\ \ln x & x > 1 \end{cases} \]

注意到\(f ( x ) = \sqrt{ \frac{ \sqrt{ x^2 } - x }{ 2 } } + \ln \frac{ x + \sqrt{ ( x - 1 )^2 } + 1 }{ 2 }\).

代数函数

存在多项式\(F ( x , y )\)满足\(F ( x , f ( x ) ) \equiv 0\)的函数\(f ( x )\)称为代数函数.

数列极限

定义

\(\{ a_n \}\)是一个给定的序列,若\(\exists l\),\(\forall \epsilon > 0\),\(\exists N \in \mathbb{ N }\),\(\forall n > N , | a_n - l | < \epsilon\).我们称\(l\)是这个序列的极限,记作\(\lim_{ n \rightarrow \infty } a_n = l \\\).

性质

  1. 若数列存在极限,则极限唯一.

  2. 有极限的数列有界.

  3. 数列的极限可以四则运算.

  4. 设序列\(\{ a_n \} , \{ b_n \}\)有极限并且分别为\(l_a , l_b\),若\(\exists N \in \mathbb{ N }\),\(\forall n > N , a_n \geq b_n\),则\(l_a \geq l_b\).

  5. 设序列\(\{ a_n \} , \{ b_n \}\)有极限并且分别为\(l_a , l_b\),如果\(l_a > l_b\),则\(\exists N \in \mathbb{ N }\),\(\forall n > N , a_n > b_n\).

  6. 夹逼定理:设\(\{ a_n \} , \{ b_n \} , \{ c_n \}\)是三个序列,且\(\exists N_0 , \forall n > n_0 , a_n \leq b_n \leq c_n\).那么如果\(\lim_{ n \rightarrow \infty } a_n = \lim_{ n \rightarrow \infty } c_n = l \\\),则\(\lim_{ n \rightarrow \infty } b_n = l \\\).

  7. 对于原序列,若它有极限\(l\),取出它的无穷项子序列,那这个子序列的极限必然也是\(l\).(如果一个序列能取出两个无穷项子序列使得极限不相同,那么原序列必然无极限)

大部分的证明都很显然,只需要套用极限定义即可,这里举几个证明为例.

(3):

设序列\(\{ a_n \} , \{ b_n \}\)有极限并且分别为\(l_a , l_b\),则要证\(\lim_{ n \rightarrow \infty } ( a_n \pm b_n ) = l_a \pm l_b \\\),\(\lim_{ n \rightarrow \infty } ( a_n b_n ) = l_a l_b \\\),若\(l_b \ne 0\),\(\lim_{ n \rightarrow \infty } ( \frac{ a_n }{ b_n } ) = \frac{ l_a }{ l_b } \\\).

先证明加减法,取\(\frac{ 1 }{ 2 } \epsilon\)然后合并起来就行.

乘法也类似,首先有:

\[ \begin{aligned} l_a - \epsilon_1 & < a_n < l_a + \epsilon_1 \\ l_b - \epsilon_2 & < b_n < l_b + \epsilon_2 \end{aligned} \]

于是自然有:

\[ \begin{aligned} | a_n b_n - l_a l_b | & = | ( a_n - l_a ) b_n + l_a ( b_n - l_b ) | \\ & \leq | b_n | | a_n - l_a | + | l_a | | b_n - l_b | \\ & < | b_n | \epsilon_1 + | l_a | \epsilon_2 \\ & < | l_b \pm \epsilon_2 | \epsilon_1 + | l_a | \epsilon_2 \end{aligned} \]

不妨令\(\epsilon_1 = \epsilon_2\),尝试构造一组解使得\(\forall \epsilon > 0 , \exists \epsilon_1 > 0\),\(| l_b \pm \epsilon_1 | \epsilon_1 + | l_a | \epsilon_1 < \epsilon\).限制一下\(\epsilon < 1 , \epsilon_1 < 1\),取\(\epsilon_1 = \frac{ \epsilon }{ 1 + | l_b | + | l_a | }\)即可.

接下来证明除法,实际上只需要证明若\(l_b \ne 0\),\(\lim_{ n \rightarrow \infty } ( \frac{ 1 }{ b_n } ) = \frac{ 1 }{ l_b } \\\).

考虑:\(l_b \lim_{ n \rightarrow \infty } b_n = l_b^2 > 0 \\\),这意味着当\(\exists N_0 , \forall n > N_0 , l_b b_n > 0 \\\),或者更强一点,\(\exists N_0 , \forall n > N_0 , l_b b_n > \frac{ 1 }{ 2 } l_b^2 \\\).

不妨设\(\epsilon ' > 0 , \exists N_1 , \forall n > N_1 , | l_b - b_n | < \epsilon '\)

\(n > \max ( N_0 , N_1 )\)此时自然有:

\[ | \frac{ 1 }{ b_n } - \frac{ 1 }{ l_b } | = \frac{ | l_b - b_n | }{ | b_n l_b | } \leq \frac{ 2 }{ l_b^2 } \epsilon ' \]

\(\epsilon ' = \frac{ l_b^2 }{ 2 } \epsilon\)即可得证.

(4):

反证,设\(l_a < l_b\),那么取\(\epsilon = \frac{ l_b - l_a }{ 2 }\),立刻有:

\[ \begin{aligned} | a_N - l_a | & < \epsilon \\ a_N & < \frac{ l_a + l_b }{ 2 } < b_N \end{aligned} \]

这是不可能的.

单调收敛准则

单调有界无穷数列有极限.

不妨设\(\{ a_n \}\)是一个单调有界无穷数列(不妨假设其单增,不然可以取反变成单增),且\(\forall n , a_n \leq l_a\).

考虑集合\(A = \{ x_n | n \in \mathbb{ N }_+ \}\),根据确界存在定理,其一定有上确界.令\(a\)是它的上确界,我们来证明\(a\)一定是数列的极限.

由于\(a\)是上确界,这意味着\(\forall \epsilon > 0 , a - \epsilon\)不是上确界,所以\(\forall \epsilon > 0\),\(\exists N\),\(\forall n > N , a - \epsilon < a_n \leq a < a + \epsilon\),这就是极限的定义.

自然对数的底数

定义\(e = \lim_{ n \rightarrow \infty } ( 1 + \frac{ 1 }{ n } )^n \\\).如何证明它存在极限呢?考虑单调有界无穷序列必定存在极限,定义\(x_n = ( 1 + \frac{ 1 }{ n } )^n\),于是先证明它有界:

\[ \begin{aligned} ( 1 + \frac{ 1 }{ n } )^n & = \sum_{ k = 0 }^n \frac{ n^{ \underline{ k } } }{ k ! } \frac{ 1 }{ n^k } \\ & < \sum_{ k = 0 }^n \frac{ 1 }{ k ! } \\ & < 2 + \sum_{ k = 2 }^n \frac{ 1 }{ k ( k - 1 ) } \\ & = 2 + \sum_{ k = 2 }^n ( \frac{ 1 }{ k - 1 } - \frac{ 1 }{ k } ) < 3 \end{aligned} \]

接下来证明单调,只需证明:

\[ \begin{aligned} \sqrt[n + 1]{ ( 1 + \frac{ 1 }{ n } )^n } & < \frac{ n + 2 }{ n + 1 } \\ \sqrt[n + 1]{ 1 ( 1 + \frac{ 1 }{ n } )^n } & < \frac{ 1 + n ( 1 + \frac{ 1 }{ n } ) }{ n + 1 } \end{aligned} \]

由均值不等式显然.

如果我们考虑另一个极限\(y_n = ( 1 + \frac{ 1 }{ n } )^{ n + 1 }\),注意到:

\[ \frac{ 1 }{ y_n } = ( \frac{ n }{ n + 1 } )^{ n + 1 } \times 1 < ( \frac{ n + 1 }{ n + 2 } )^{ n + 2 } = \frac{ 1 }{ y_{ n + 1 } } \]

发现\(y_n\)单调递减且\(y_n > x_n\),并且\(\lim_{ n \rightarrow \infty } y_n - x_n = 0\),这就意味着二者必然同时趋向于一个常数的两侧,定义为\(e = 2 . 7182818284 \cdots\).

这里还可以推出一些结论.因为我们知道:

\[ \begin{aligned} x_n & < e < y_n \\ n \ln ( 1 + \frac{ 1 }{ n } ) & < 1 < ( n + 1 ) \ln ( 1 + \frac{ 1 }{ n } ) \\ \frac{ 1 }{ n + 1 } & < \ln ( n + 1 ) - \ln ( n ) < \frac{ 1 }{ n } \\ H_{ n + 1 } - 1 & < \ln ( n + 1 ) < H_n \end{aligned} \]

用这个可以注意到定义\(z_n = H_n - \ln n\),这个东西肯定\(\geq 0\)\(\leq 1\),而且注意到\(z_{ n + 1 } - z_n = \frac{ 1 }{ n + 1 } - \ln \frac{ n + 1 }{ n } < 0\),所以单调有界,这个极限就是欧拉常数\(\gamma = 0 . 57 \cdots\).

接下来证明\(e\)是无理数.

考虑\(e = \lim_{ n \rightarrow \infty } ( 1 + \frac{ 1 }{ n } )^n\),取二项式定理,取\(x_k = \sum_{ k = 0 }^n \frac{ n^{ \underline{ k } } }{ k ! n^k } \leq \sum_{ k = 0 }^n \frac{ 1 }{ k ! } = U_n\).

而又注意到\(x_n = \sum_{ k = 0 }^n \frac{ n^{ \underline{ k } } }{ k ! n^k }\),取定一个确定的上界\(m \leq n\),则\(x_n \geq \sum_{ k = 0 }^m \frac{ n^{ \underline{ k } } }{ k ! n^k } = y_n\).由于\(m\)有限,所以当\(n \rightarrow \infty\)时,\(y_n \rightarrow U_n\)的前\(m\)项,此时再令\(m \to \infty\),根据夹逼定理,立刻得到\(x_n \rightarrow U_n\).换言之,\(m\)增大引起的误差总可以被后面的\(n\)的增大抹平.

考虑一下计算误差,设\(r_n = e - U_n\),则\(r_n = \sum_{ k \geq n + 1 } \frac{ 1 }{ k ! } = \frac{ 1 }{ ( n + 1 ) ! } \sum_{ k \geq 0 } \frac{ 1 }{ ( n + 2 )^{ \overline{ k } } } < \frac{ 1 }{ ( n + 1 ) ! } \sum_{ k \geq 0 } \frac{ 1 }{ ( n + 2 )^k } = \frac{ 1 }{ ( n + 1 ) ! } \frac{ n + 2 }{ n + 1 } < \frac{ 1 }{ n \times n ! }\).

如果\(e\)是有理数,设\(e = \frac{ m }{ n } \in \mathbb{ Q }\),考虑:

\[ \begin{aligned} 0 & < r_n = \frac{ m }{ n } - U_n < \frac{ 1 }{ n \times n ! } \\ 0 & < m \times ( n - 1 ) ! - U_n \times n ! < \frac{ 1 }{ n } \end{aligned} \]

这立刻导出矛盾,因为\(U_n \times n !\)一定是整数.

开区间与闭区间

定义一个集合的内部点:\(x , \exists \delta > 0 , ( x - \delta , x + \delta ) \subseteq A\).我们将一个集合的所有内部点组成的集合记作\(A^{ \degree }\).

这样就可以定义一个集合是内部为空的,就是其没有内部点.反之,如果每个点都是其内部点,那么称其为稠密的.

定义一个集合的边界点:\(x , \forall \delta > 0 , ( x - \delta , x + \delta ) \cap A \ne \emptyset , ( x - \delta , x + \delta ) \cap A^C \ne \emptyset\).

一个集合称为开集合,当且仅当\(A = A^{ \degree }\).

一个集合称为闭集合,当且仅当对于集合中的任何一个数列,数列极限也存在于这个集合中.

当然也可以用补集来用开集合定义闭集合(补集是开集合的集合是闭集合)或者反之.

由此我们知道开集的并是开集,有限个开集的交是开集;闭集的交是闭集,有限个闭集的并是闭集.

容易发现包含于\(A\)的所有开集的并是\(A^{ \degree }\).

我们类似定义\(A\)的闭包是\(\bar{ A }\).

而且容易发现如果\(f\)是连续函数,那么如果\(U\)是开集,那么\(f^{ - 1 } ( U )\)(也就是\(U\)的原像)也是开集.

区间套定理

\(I_n = [ a_n , b_n ] \ne \emptyset , I_{ n + 1 } \subseteq I_{ n }\),则\(I = \bigcap_{ n \geq 1 } I_n\)存在且是一个非空闭区间.

怎么证明?考虑\(a_n\)单增,\(b_n\)单减并且\(a_1 \leq a_n \leq b_n \leq b_1\),所以\(a_n\)存在极限,不妨设为\(l_a\),同理\(b_n\)也存在极限,设为\(l_b\).容易验证\(I = [ l_a , l_b ]\).

类似地,设\(I_n = ( a_n , b_n ) \ne \emptyset , I_{ n + 1 } \subseteq I_{ n }\),并且\(a_n , b_n\)不会从某一项开始往后全都是常数(换言之其极限不等于其每一项,且不会上下波动),则\(I = \bigcap_{ n \geq 1 } I_n\)存在且是一个非空闭区间.

特别地,当\(\lim | b_n - a_n | = 0\)的时候,上述给出一个单点.

Example1

\(x_1 = a , x_2 = b , a \ne b , x_{ n + 2 } = \frac{ x_{ n + 1 } + x_n }{ 2 }\),问\(\lim_{ n \rightarrow \infty } x_n\)是否存在.

可以设\(c_n = \min \{ x_n , x_{ n + 1 } \} , d_n = \max \{ x_n , x_{ n + 1 } \}\),讨论\(x_{ n + 1 }\)\(x_n\)的大小关系(二者显然不相等)可以知道\([ c_n , d_n ]\)满足区间套定理的条件,又注意到\(| I_{ n + 1 } | = | x_{ n + 2 } - x_{ n + 1 } | = \frac{ 1 }{ 2 } | I_n |\),所以区间长度趋近于\(0\),这样的话\(\lim_{ n \rightarrow \infty } c_n = \lim_{ n \rightarrow \infty } x_n = \lim_{ n \rightarrow \infty } d_n\).

Example2

\(a_1 > b_1 > 0\),\(a_{ n + 1 } = \frac{ a_n + b_n }{ 2 } , b_{ n + 1 } = \sqrt{ a_n b_n }\).求证\(a_n , b_n\)极限都存在且相等.

还是区间套定理,容易验证满足区间套定理的条件,那么要注意到\(| I_{ n + 1 } | = \frac{ a_n + b_n }{ 2 } - \sqrt{ a_n b_n } < \frac{ a_n + b_n }{ 2 } - b_n = \frac{ 1 }{ 2 } | I_n |\),所以\(\lim_{ n \rightarrow \infty } | I_n | = 0\),这就证明了二者存在且相等.

其实先用单调有界数列有极限,再对着递推式两边求下极限就可以了.

有限覆盖定理

覆盖:\(\Sigma :\)由一些开区间组成的集合.若\(M \subset \mathbb{ R }\),称\(M\)\(\Sigma\)覆盖,当且仅当\(M \subseteq \bigcup_{ \sigma \in \Sigma } \sigma\).

有限覆盖定理是说,如果\(M = [ a , b ]\)是一个有界闭区间,且\(M\)\(\Sigma\)覆盖,则一定存在一个\(\Sigma\)的有限子集\(\Sigma_1\),使得\(M\)能被\(\Sigma_1\)覆盖.

换言之,有界闭区间若能被开区间覆盖,则一定能被有限个开区间覆盖.

反证:如果\(M\)不能被有限覆盖,那么\([ a , \frac{ a + b }{ 2 } ]\)\([ \frac{ a + b }{ 2 } , b ]\)至少有一个不能被有限覆盖(如果它俩都能那\([ a , b ]\)肯定也能).不妨取出二者中任意一个不能被有限覆盖的区间,设为\([ a_1 , b_1 ]\),再进行上面的操作就可以得到\([ a_2 , b_2 ]\),以此类推,如此我们得到了一个满足区间套定理的区间序列而且均不能被有限覆盖,根据区间套定理,可以取出它们交集的那个元素\(c\).由于\(\{ c \} \in M\),所以\(\exists \sigma \in \Sigma , c \in \sigma\).因为\(\sigma\)是开区间,所以\(\exists \epsilon > 0 , [ c - \epsilon , c + \epsilon ] \in \sigma\),而显然可以找到一个\(N > 0\),\(\forall n \geq N\),\([ a_n , b_n ] \in [ c - \epsilon , c + \epsilon ]\),这就矛盾了.

Example1

证明:有界闭区间上的局部有界(对于每一个点,它都存在一个开区间邻域是有界的)函数是整体有界函数.

设定义域为\([ a , b ]\),考虑\(\forall x_0 \in [ a , b ] , \exists \sigma > 0\),\(f\)\(( x_0 - \sigma , x_0 + \sigma )\)上有界,注意到设\(I_{ x_0 } = ( x_0 - \sigma , x_0 + \sigma )\),那么\([ a , b ]\)一定被\(I\)这个区间集合开覆盖,那么就能被有限开覆盖,取出那有限个区间对应的值域并起来就行.

Example2

证明:有界闭区间上的局部增(对于每一个点,它都存在一个开区间邻域是增的)函数是整体增函数.

证明和上面一样,合并两个开区间的时候找任意一个交集元素即可.

外测度与零测集

定义外测度:对于\(E \subseteq \mathbb{ R }\),定义\(m^* ( E )\)\(E\)的外测度,\(m^* ( E ) = \inf \{ ( \sum | I_k | ) \mid \bigcup I_k \supseteq E \}\),也就是找一列区间使得其并起来能包含\(E\).

定义零测集:外测度为\(0\)的集合.容易发现\(m^* ( \bigcup E_k ) \leq \sum m^* ( E_k )\).于是可数个零测集的并仍然是零测集.

如果一个集合的势可数,那它当然是零测集,原因是可以构造\(I_n = ( x_n - \delta , x_n + \delta ) , \delta = \frac{ 1 }{ 2^{ n + 1 } }\).由这个构造\(\epsilon_k = \frac{ \epsilon }{ 2^{ k + 1 } }\)可以说明可数个零测集的并仍然是零测集.

反之,一个集合是零测集不一定代表其可数,例如康托三分集:先把\([ 0 , 1 )\)上扣去\([ \frac{ 1 }{ 3 } , \frac{ 2 }{ 3 } )\),然后再对剩下的线段也做类似的操作,每次扣掉中间一段.算一下每次扣去的长度,发现长度恰好为\(1\),于是当然是零测集.但注意到这对应着一个三进制小数并且每一位只能是\(0 , 2\),那这当然势仍然是\(2^\mathbb{ N }\),于是不可数.

Vitali覆盖引理

\(E \subseteq R\),称一族区间\(\Gamma = \{ I_\alpha \}\)\(E\)的一个Vitali覆盖,若对\(\forall x \in E , \epsilon > 0\),\(\exists I_{ \alpha } \in \Gamma , | I_\alpha | < \epsilon , x \in I_\alpha\).也就是对于任何一个点都存在足够小的区间把它盖住.

Vitali覆盖引理是说,如果\(E\)是一个有界集(或者推广到外测度有限的集合),\(\Gamma\)\(E\)的一个Vitali覆盖,则\(\forall \epsilon > 0\),\(\Gamma\)中可以拿出有限个两两不交的区间\(I_j \in \Gamma\),满足\(m^* ( E \setminus ( \bigcup I_j ) ) < \epsilon\).注意这里取区间的方式依赖于\(\epsilon\)的选取.

取一个开集\(G \supseteq E , m^* ( G ) < \infty\),不妨设\(\Gamma\)中的每个区间都\(\subseteq G\)(原因在于Vitali覆盖保证了任意小的区间覆盖,而开集的性质使得总有区间在其中).在此基础上,由于上面的\(\Gamma\)是任意一个Vitali覆盖,所以我们不妨假设\(\Gamma\)中的每个区间都是闭区间(也就是把端点加进去,那当然仍然是Vitali覆盖而且更难满足限制,因为闭区间更难以两两不交),这当然仍是可以的.

现在我们归纳取区间,我们任取一个\(I_1 \in \Gamma\),开始不断往上添区间.设\(I_1 , \cdots , I_k\)已经被我们拿到,而且两两不交.

如果此时\(E \subseteq \bigcup_{ j = 1 }^k I_j\),当然直接满足条件.

反之,令\(\delta_k = \sup \{ ( | I | ) \mid I \in \Gamma , I \cap I_j = \emptyset , 1 \leq j \leq k \}\).容易发现\(\delta_k < \infty\).那我们取\(I_{ k + 1 }\)使得\(\forall 1 \leq j \leq k , I_{ k + 1 } \cap I_j = \emptyset , | I_{ k + 1 } | > \frac{ 1 }{ 2 } \delta_k\),这当然做得到.

如果一直做下去都没有使得\(E \subseteq \bigcup I_j\),那我们就可以拿到一个区间列.接下来我们考虑\(\sum | I_k |\),此时由于\(I_k\)两两不交,当然有\(\sum | I_k | \leq m^* ( G ) < \infty\),那么根据单调收敛准则,\(\sum | I_k |\)趋于一个极限,于是\(| I_k |\)当然趋近于\(0\),那么\(\delta_k\)趋近于\(0\).在此基础上,我们当然可以取一个\(N > 0\),\(\forall n \geq N , \sum_{ k \geq n + 1 } | I_k | < \frac{ 1 }{ 5 } \epsilon\).

此时\(\forall x \in E \setminus ( \bigcup_{ k \leq N } I_k )\).由于\(I_k\)均为闭区间,所以\(E \setminus ( \bigcup_{ k \leq N } I_k )\)必定是开区间,这也就是说\(x\)存在一个小邻域\(I ' \in \Gamma\)并且\(I ' \subseteq E \setminus ( \bigcup_{ k \leq N } I_k )\).那当然有\(I ' \cap ( \bigcup_{ k \leq N } I_k ) = \emptyset\),也就是\(I ' \cap I_k = \emptyset , 1 \leq k \leq N\).由于\(| I ' |\)有限且不为\(0\),而\(\delta_n \rightarrow 0\).一定\(\exists n \geq N\),使得\(I ' \cap ( \bigcup_{ k \leq n } I_k ) = \emptyset , I ' \cap I_{ n + 1 } \ne \emptyset\).发现此时\(| I ' | \leq \delta_n < 2 | I_{ n + 1 } |\).

此时会出个什么事呢?由于\(| I ' | < 2 | I_{ n + 1 } |\),所以我们把\(I_{ n + 1 }\)这个区间扩大五倍(中心不变,半径扩大到原本的五倍)就一定能盖住\(I '\).

那会怎么样呢?那\(m^* ( E \setminus ( \bigcup_{ k \leq N } I_k ) ) \leq 5 \sum_{ k \geq N + 1 } | I_k | < \epsilon\).于是证毕.

聚点原理

假设\(M\)是一个实数集,称\(x_0\)\(M\)的聚点,当且仅当\(\forall \epsilon > 0\),\(( ( x_0 - \epsilon , x_0 ) \cup ( x_0 , x_0 + \epsilon ) ) \cap M \ne \emptyset\),或说,\(\forall \epsilon > 0 , ( x_0 - \epsilon , x_0 + \epsilon ) \cap M\)是一个无限集.可以理解为,\(x_0\)不是一个孤点.

引理:\(x_0\)\(M\)的聚点,当且仅当\(\exists \{ x_n \} \in M \setminus \{ x_0 \} , \lim_{ n \rightarrow \infty } x_n = x_0\).充分性显然,必要性的话只需取\(\epsilon = 2^{ - n }\)然后从上面的交集拿点就行.

聚点原理:有界无穷集\(M\)必有聚点.

我们可以找一个\(I_0 = [ a , b ] , M \subset I_0\),我们找\([ a , \frac{ a + b }{ 2 } ] , [ \frac{ a + b }{ 2 } , b ]\),其中至少有一个和\(M\)的交集为无穷集,我们取其为\([ a_1 , b_1 ]\),不断这么做又会得到一个闭区间套列,交起来得到的那个元素\(c\)就是聚点,因为\(\forall \epsilon > 0 , \exists N > 0 , \forall n \geq N , | b_n - a_n | < \epsilon\),那么\([ a_n , b_n ] \subseteq ( c - \epsilon , c + \epsilon )\),立刻证毕.

Baire纲定理

  1. \(\{ F_n \}\)是一列内部为空(没有除空集以外的开子集)的闭集,则\(\bigcup_{ n = 1 }^{ \infty } F_n\)内部为空.

  2. \(\{ G_n \}\)是一列稠密(补集内部为空)的开集,则\(\bigcap_{ n = 1 }^{ \infty } G_n\)稠密.

(1)(2)等价,下面只证明(1):

反证,假设\(F = \bigcup_{ n = 1 }^{ \infty } F_n\)内部不为空,也就是其存在一个内部开集\(( x_0 - \delta_0 , x_0 + \delta_0 ) \subseteq F\).由于\(F_1\)是一个闭集,因此\(( x_0 - \delta_0 , x_0 + \delta_0 ) \setminus F_1\)当然是一个开集,于是其就存在一个子区间\([ x_1 - \delta_1 , x_1 + \delta_1 ] \subseteq ( x_0 - \delta_0 , x_0 + \delta_0 )\)并且\([ x_1 - \delta_1 , x_1 + \delta_1 ] \cap F_1 = \emptyset\),同理可以找到一列闭区间\(\{ [ x_k - \delta_k , x_k + \delta_k ] \}\)使得\([ x_k - \delta_k , x_k + \delta_k ] \cap \bigcup_{ j = 1 }^k F_j = \emptyset\).

容易见到我们可以任意调小\(\delta_k\)的大小,调整使得\(\delta_k < \frac{ 1 }{ k }\)总成立就得到了一列闭区间套,必然拿到了一个单独的点\(\xi\),那么\(\xi \in ( x_0 - \delta_0 , x_0 + \delta_0 ) \subseteq F\),然而对于任意区间都有\(\xi \notin F_n\),因此\(\xi \notin F\),这就导出了矛盾.

Example1

证明:如果\(f ( x )\)连续,并且\(\forall x > 0 , \lim_{ n \rightarrow \infty } f ( nx ) = 0\),则\(\lim_{ x \rightarrow \infty } f ( x ) = 0\).

对于一个\(\epsilon > 0\),考虑构造内部为空的闭集\(F_n = \{ x | \forall k \geq n , f ( kx ) \leq \epsilon \}\)(为什么这是闭集呢?因为当你设\(F_{ n , k }\)满足上述定义,那\(F_{ n , k }\)肯定是闭集,然后\(F_n\)就是上述这些的交,当然也是闭集).容易发现\(F_n\)的并是\(\mathbb{ R }_+\),那就一定至少有一个闭集内部不为空,我们就可以取出其中的一个区间设为\(( a , b )\),然后用这个区间在若干倍后覆盖后半部分数轴,原因是当\(n\)足够大的时候,一定有\(nb > ( n + 1 ) a\)存在.

致密性定理

有界无穷数列有收敛的子列.

考虑数列值域\(M = \{ x | x = x_n , n \in \mathbb{ N }_+ \}\).

如果\(M\)是有限集合,那\(\exists a\),\(I = \{ n | x_n = a \}\)是无限集合,把这些数拿出来就是一个无限的常数列.

如果\(M\)是无限集,那其存在聚点,设\(a\)为其中一个聚点.则\(M_k = ( ( a - \frac{ 1 }{ k } , a + \frac{ 1 }{ k } ) \setminus \{ a \} ) \cap M , k \in \mathbb{ N }_+\)是个无限集.

那只需要取\(x_{ n_k }\)\(M_k\)中的某个\(x_{ n ' }\)满足\(n ' > n_{ k - 1 }\)即可,由于这是无限集,所以显然可以取出.拿出来的这个数列显然以\(a\)为极限.

柯西收敛准则

称一个数列为柯西数列,当且仅当\(\forall \epsilon > 0 , \exists N > 0 , \forall n , m \geq N , | x_n - x_m | < \epsilon\).

一个数列收敛的充要条件是他是一个柯西数列.

先证必要性:

\(\forall \epsilon > 0 , \exists N > 0 , \forall n , m \geq N , | a - x_n | < \frac{ \epsilon }{ 2 } , | a - x_m | < \frac{ \epsilon }{ 2 } , | x_n - x_m | \leq | x_n - a | + | a - x_m | < \epsilon\).

再证充分性:

考虑取\(\epsilon = 1\),则\(\exists N_1 , \forall n \geq N_1 , | x_n - x_{ N_1 } | < 1\),于是\(| x_n | < | x_{ N_1 } | + 1\),于是\(\forall n , | x_n | < \max_{ k = 1 }^{ N_1 } \{ | x_k | \} + 1\),于是这个数列有界,那么存在无穷子列有极限\(a\).

那么\(\forall \epsilon > 0 , \exists N > 0 , \forall n_k , m \geq N , | x_{ n_k } - x_m | < \epsilon\),其中\(\{ x_{ n_k } \}\)\(a\)为极限,于是可以取足够远的\(x_{ n_k }\).接下来就是简单说明的环节了.

柯西收敛准则的充分性还可以用上下极限证明:

\(\forall \epsilon > 0 , \exists N , \forall n \geq N , x_n \in ( x_N - \epsilon , x_N + \epsilon )\),那么上下极限之差\(\leq 2 \epsilon\).

于是引出了实数的第二种定义方式:我们定义两个柯西列等价,有\(\{ x_n \} \sim \{ y_n \} \Leftrightarrow \lim_{ n \rightarrow \infty } | x_n - y_n | = 0\).那么所有有理数组成的柯西列的等价类构成实数集合.不难证明这样定义出来的实数和戴德金分割等价.

这个定义方式只依赖于距离的定义.而且我们可以证明任何一次扩充后得到的空间一定是封闭的.用这个例子就是说你对于一个实数的柯西列,证明它一定收敛到一个实数.那么就可以把这个柯西列的每一个数(作为实数,实际上对应了一个柯西列)中抽出一个数来,然后证明这些数组成的新的柯西列与刚才那个柯西列等价,这样就证明了其封闭性.其实只要第\(k\)个数把其代表的任意一个柯西列中选第\(k\)个元素构造即可.

上下极限

我们推广广义极限,也就是一个数列可以以\(+ \infty\)或者\(- \infty\)为极限.这个容易用\(\epsilon - N\)语言写出来.这样的话我们立刻得到单调数列有极限.

那我们取任意一个数列从某一项往后的上确界\(h_n = \sup_{ k \geq n } \{ x_k \}\)和下确界\(l_n = \inf_{ k \geq n } \{ x_k \}\),那么注意到\(\{ l_n \}\)单调不降,\(\{ h_n \}\)单调不增,所以二者都存在极限.由此可以定义上下极限,并且任意数列都一定存在上下极限.

注意到\(\lim_{ n \rightarrow \infty } l_n = \sup_{ n \geq 1 } \inf_{ k \geq n } \{ x_k \} , \lim_{ n \rightarrow \infty } h_n = \inf_{ n \geq 1 } \sup_{ k \geq n } \{ x_k \}\),于是\(\varliminf_{ n \rightarrow \infty } x_n = \lim_{ n \rightarrow \infty } l_n \leq \lim_{ n \rightarrow \infty } h_n = \varlimsup_{ n \rightarrow \infty } x_n\).

那么\(x_n\)存在极限当且仅当\(\varlimsup_{ n \rightarrow \infty } x_n = \varliminf_{ n \rightarrow \infty } x_n\).

充分性很好证明,只需要使用夹逼定理即可.

必要性也很好说如果极限不是\(\infty\),\(\forall \epsilon > 0 , \exists N , \forall n \geq N , a - \epsilon < x_n < a + \epsilon\),那么\(a - \epsilon < l_n \leq h_n < a + \epsilon\).自然得到两者极限相等.是\(\infty\)也很好说.

上下极限同样有保序性,相反数有\(\varlimsup ( - x ) = - \varliminf x\),但是不能简单的四则运算,而是有\(\varliminf x_n + \varliminf y_n \leq \varliminf ( x_n + y_n ) \leq \varlimsup ( x_n + y_n ) \leq \varlimsup x_n + \varlimsup y_n\),我们这里先不讨论出现\(\infty - \infty\)的情况.

证明的话只需注意到\(\inf_{ k \geq n } x_k + \inf_{ k \geq n } y_k \leq x_m + y_m , \forall m \geq n\),因此对右边可以取下确界,然后两边一起取极限即可.

另外还有结论是\(\varliminf ( x_n + y_n ) \leq \varlimsup x_n + \varliminf y_n\).这个又如何证明呢?只需证明:

$$ \[\begin{aligned} \varliminf ( x_n + y_n ) - \varlimsup x_n & \leq \varliminf y_n \\ \varliminf ( x_n + y_n ) + \varliminf ( - x_n ) & \leq \varliminf y_n \\ \end{aligned}\]

$$

于是证毕.

乘法的话需要规定\(x_n , y_n > 0\),然后和加法的不等式形式是类似的(同样先不考虑\(0 \times \infty\)的情况).

如果\(\{ x_n \} , \{ y_n \}\)其中一个存在极限,那么上面的不等式就可以取等了(当然仍然不讨论出现\(\infty - \infty\)\(0 \times \infty\)的情况).如果\(x_n = y_n > 0\)的话上面的乘法不等式也可以取等,换言之\(x_n > 0\)的时候\(\varlimsup x_n^2 = ( \varlimsup x_n )^2\)成立.

Example1

对于数列\(\{ a_n \}\),满足\(a_n > 0\),\(a_{ n + 2 } = \frac{ 2 }{ a_{ n + 1 } + a_n }\).

求证:

  1. \(\{ a_n \}\)有界.

  2. \(\lim_{ n \rightarrow \infty } a_n = 1\).

  3. \(\exists \lambda \in ( 0 , 1 ) , c > 0\),\(\forall n , | a_n - 1 | < c \lambda^n\).

  4. 对所有满足条件的数列,求\(\min ( \lambda ) = \frac{ \sqrt{ 2 } }{ 2 }\).

对于(1),取\(M = \max ( \max ( a_1 , a_2 ) , \frac{ 1 }{ \min ( a_1 , a_2 ) } )\),数学归纳可证明\(a_n \in [ \frac{ 1 }{ M } , M ]\).

两边取一下上极限和下极限,立刻得到\(1 \leq \overline{ a } \underline{ a } \leq 1\),于是\(\overline{ a } \underline{ a } = 1\).

后面不会了(乐).

Stolz定理

如果\(\lim_{ n \rightarrow \infty } \frac{ a_{ n + 1 } - a_n }{ b_{ n + 1 } - b_n } = A\),并且\(\{ b_n \}\)单调递增且发散,那么\(\lim_{ n \rightarrow \infty } \frac{ a_n }{ b_n } = A\).

这个怎么证明呢?先取\(c_n = a_n - Ab_n\),考虑\(\forall \epsilon > 0 , \exists N > 0 , \forall n \geq N\),有:

\[ c_{ n + 1 } - c_n \leq | c_{ n + 1 } - c_n | < \epsilon ( b_{ n + 1 } - b_n ) \]

两边求和,立刻有:

\[ \begin{aligned} c_{ n } - c_N & < \epsilon ( b_{ n } - b_N ) \\ \frac{ c_n - c_N }{ b_n - b_N } & < \epsilon \\ \frac{ \frac{ c_n }{ b_n } - \frac{ c_N }{ b_n } }{ 1 - \frac{ b_N }{ b_n } } & < \epsilon \end{aligned} \]

由于\(b_n\)发散,对左边取极限就得到\(\lim_{ n \rightarrow \infty } \frac{ c_n }{ b_n } = 0\),也就证明了原结论.

如果将上述条件改为:

  1. \(\{ b_n \}\)单调递减且\(\lim b_n = 0\).

  2. \(\lim a_n = 0\).

上述定理也是成立的.

证明仍然是上面那个过程,只是做一些小修改:

\[ \begin{aligned} c_{ N } - c_n & < \epsilon ( b_{ N } - b_n ) \\ \frac{ c_N - c_n }{ b_N - b_n } & < \epsilon \\ \frac{ \frac{ c_N }{ b_N } - \frac{ c_n }{ b_N } }{ 1 - \frac{ b_n }{ b_N } } & < \epsilon \end{aligned} \]

两边取极限.

把Stolz定理推广到上下极限上.换言之,当:

  1. \(\{ b_n \}\)单调上升且趋近于无穷.

或:

  1. \(\{ b_n \}\)单调递减且\(\lim b_n = 0\).

  2. \(\lim a_n = 0\).

此时应当有:

\[ \varliminf \frac{ a_{ n + 1 } - a_n }{ b_{ n + 1 } - b_n } \leq \varliminf \frac{ a_n }{ b_n } \leq \varlimsup \frac{ a_n }{ b_n } \leq \varlimsup \frac{ a_{ n + 1 } - a_n }{ b_{ n + 1 } - b_n } \]

上述命题的一个平凡推论是:

\[ \varliminf ( a_{ n + 1 } - a_n ) \leq \varliminf \frac{ a_n }{ n } \leq \varlimsup \frac{ a_n }{ n } \leq \varlimsup ( a_{ n + 1 } - a_n ) \]

实数的完备性基本定理

我们将以下定理称作实数的完备性的基本定理:

  1. 戴德金分割定理

  2. 确界存在定理

  3. 单调收敛准则

  4. 闭区间套定理(+阿基米德性质)

  5. 有限覆盖定理

  6. 聚点原理

  7. 致密性定理

  8. 柯西收敛准则(+阿基米德性质)

这七条定理(除了3和7,它们需要与阿基米德性质配合使用)全部与戴德金分割定理等价.

我们上面已经论证了其中的部分推导关系,我们在下面声称它们分为若干组推导链条,分别代表了实数的不同性质.

函数极限

定义

函数的极限类型比较多:

  1. \(x\)是从一点\(a\)的右侧趋向于\(a\),这时记作\(x \rightarrow a + 0\).

  2. \(x\)是从一点\(a\)的左侧趋向于\(a\),这时记作\(x \rightarrow a - 0\).

  3. \(x\)同时从一点\(a\)的两侧趋向于\(a\),这时记作\(x \rightarrow a\).

  4. \(x\)无限制增大,记作\(x \rightarrow + \infty\).

  5. \(x\)无限制减小,记作\(x \rightarrow - \infty\).

  6. \(| x |\)无限制增大,\(x\)同时增大或减小,记作\(x \rightarrow \infty\).

序列极限的定理在函数极限的条件下几乎也全都成立.

单侧极限

\(x \rightarrow a + 0\)\(x \rightarrow a - 0\),这两种是对称的,我们只讨论前一种.

\(\exists l , \forall \epsilon > 0 , \exists \delta > 0 , \forall 0 < x - a < \delta , | f ( x ) - l | < \epsilon\).我们称\(l\)\(x \rightarrow a + 0\)\(f ( x )\)右极限,记作\(\lim_{ x \rightarrow a + 0 } f ( x ) = l \\\),同理可以定义左极限.

双侧极限

若左右极限都存在且相等,那么双侧极限也存在并且\(\lim_{ x \rightarrow a } f ( x ) = \lim_{ x \rightarrow a + 0 } f ( x ) = \lim_{ x \rightarrow a - 0 } f ( x ) \\\).

自变量趋于无穷时的极限

设函数\(f ( x )\)\(( a , + \infty )\)上有定义,若\(\exists l\),\(\forall \epsilon , \exists A \geq a , \forall x > A , | f ( x ) - l | < \epsilon\),则记\(\lim_{ x \rightarrow + \infty } f ( x ) = l \\\),同理定义\(\lim_{ x \rightarrow - \infty }\),若二者均存在且相等,定义\(\lim_{ x \rightarrow \infty } = \lim_{ x \rightarrow + \infty } = \lim_{ x \rightarrow - \infty }\).

上下极限

定义去心邻域\(U_0 ( x_0 , \delta ) = ( x_0 - \delta , x_0 + \delta ) \setminus \{ x_0 \}\).

定义\(\varlimsup_{ x \rightarrow x_0 } f ( x ) = \lim_{ \delta \rightarrow + 0 } \sup_{ x \in U_0 ( x_0 , \delta ) } f ( x )\),下极限同理.

显然\(\lim_{ x \rightarrow x_0 } f ( x ) = A \Leftrightarrow \varlimsup_{ x \rightarrow x_0 } f ( x ) = \varliminf_{ x \rightarrow x_0 } f ( x ) = A\).

第一可数公理

函数极限当然满足四则运算法则,保序性,夹逼定理,单调收敛准则,柯西收敛准则.

事实上函数极限和数列极限满足关系:

\(\forall \{ x_n \} \in U_0 ( x_0 )\),如果\(\lim_{ n \rightarrow \infty } x_n = x_0\),那么\(\lim_{ n \rightarrow \infty } f ( x_n ) = \lim_{ x \rightarrow x_0 } f ( x )\),前提是这两个极限都存在.

证明是堆\(\delta - \epsilon\)语言,不再赘述.

而它们之间关系的本质其实是:\(x_0\)处的”任意小邻域”其实可以用某列邻域替代.

我们定义邻域基:一个由\(x_0\)的邻域组成的集合\(U\),如果对于任意小邻域,\(U\)中都存在一个邻域比这个邻域更小,那么就称\(U\)是一个邻域基.\(\mathbb{ R }\)的特殊之处在于任意一个点都有可数邻域基,这被称为第一可数公理(\(C_1\)公理).

另外\(\mathbb{ R }\)是可分的,也就是它存在可数稠密集(\(\mathbb{ Q }\)).

无穷大量和无穷小量

如果\(x \rightarrow x_0\)时,\(f ( x )\)有界,称\(f ( x ) = O ( 1 )\).

如果\(x \rightarrow x_0\)的时候,\(f ( x ) \rightarrow 0\),称\(f ( x ) = o ( 1 )\).

如果\(f , g = o ( 1 )\),\(\frac{ f }{ g } \rightarrow 1\),那么称二者为等价无穷小;如果\(\frac{ f }{ g } = c \ne 0\),则称二者为同阶无穷小(可记作\(f \sim g\));如果\(\frac{ f }{ g } = 0\),则称\(f\)\(g\)高阶无穷小,可记作\(f = o ( g )\).

同阶无穷小在做乘除法的时候是可以替换的.

如果\(\frac{ f }{ g }\)是有界的,那么可以写作\(f = O ( g )\).

Example1

\(\lim_{ x \rightarrow 0 } \frac{ \sin x }{ x } = 1\).

因为其左右对称,考虑取\(x \in ( 0 , \frac{ \pi }{ 2 } )\)我们有\(\sin x < x < \tan x\)(用单位元的面积证明).

那么考虑\(\frac{ \sin x }{ x } < 1\),又注意到:

\[ \frac{ \sin x }{ x } > \frac{ \sin x }{ \tan x } = \cos x \]

夹逼定理一下就行.

类似可以证明\(\lim_{ x \rightarrow 0 } \frac{ \tan x }{ x } = 1 , \lim_{ x \rightarrow 0 } \frac{ 1 - \cos x }{ x^2 } = \frac{ 1 }{ 2 } ,\)

Example2

\(\lim_{ x \rightarrow 0 } \frac{ x - \sin x }{ x^3 } = \frac{ 1 }{ 6 }\).

下面有个三次方,考虑套用一下三倍角公式,我们知道:

\[ \begin{aligned} f ( x ) & = \frac{ x - \sin x }{ x^3 } = \frac{ x - ( 3 \sin \frac{ x }{ 3 } - 4 \sin^3 \frac{ x }{ 3 } ) }{ x^3 } \\ & = \frac{ 3 ( \frac{ x }{ 3 } - \sin \frac{ x }{ 3 } ) + 4 \sin^3 \frac{ x }{ 3 } }{ ( \frac{ x }{ 3 } )^3 } \frac{ 1 }{ 27 } \\ & = \frac{ 1 }{ 9 } f ( \frac{ x }{ 3 } ) + \frac{ 4 }{ 27 } ( \frac{ \sin \frac{ x }{ 3 } }{ \frac{ x }{ 3 } } )^3 \end{aligned} \]

看上去两边取上下极限就做完了对吧!但是还差一点,因为我们要证明上下极限都不是无穷,起码得说明它有界.

注意到\(\frac{ x - \sin x }{ x^3 } < \frac{ \tan x - \sin x }{ x^3 } = \frac{ \sin x }{ x } ( \frac{ 1 - \cos x }{ x^2 \cos x } ) = \frac{ \sin x }{ x } ( \frac{ 2 \sin^2 \frac{ x }{ 2 } }{ x^2 \cos x } )\),这样两边限定一下范围再取上极限可以说明原式上极限有界.

Example3

\(\lim_{ x \rightarrow 0 } \frac{ \sin x - \tan x }{ x^3 }\).

考虑\(\frac{ \sin x - \tan x }{ x^3 } = \frac{ \sin x }{ x } \frac{ 1 }{ x^2 } \frac{ \cos x - 1 }{ \cos x } = \frac{ \tan x }{ x } \frac{ \cos x - 1 }{ x^2 } = - \frac{ 1 }{ 2 }\).

Example4

\(\lim_{ t \rightarrow 0 } \frac{ \log_{ a } ( 1 + t ) }{ t } = \frac{ 1 }{ \ln a }\).

\[ \lim_{ t \rightarrow 0 } \frac{ \log_{ a } ( 1 + t ) }{ t } = \log_a \lim_{ t \rightarrow 0 } ( 1 + t )^{ \frac{ 1 }{ t } } = \log_a e = \frac{ 1 }{ \ln a } \]

Example5

\(\lim_{ t \rightarrow 0 } \frac{ a^t - 1 }{ t } = \ln a\).

\(s = a^t - 1\),则原式等于\(\lim_{ s \rightarrow 0 } \frac{ s }{ \log_a ( s + 1 ) } = \ln a\).

Example6

\(\lim_{ t \rightarrow 0 } \frac{ ( 1 + t )^\mu - 1 }{ t } = \mu\).

\(s = ( 1 + t )^\mu - 1\),那么原式等于\(\lim_{ t \rightarrow 0 , s \rightarrow 0 } \mu \frac{ s }{ \ln ( 1 + s ) } \frac{ \ln ( 1 + t ) }{ t } = \mu\).

连续函数

不妨设\(f ( x )\)\(( a , b )\)上有定义,若对于\(x_0 \in ( a , b )\),\(f ( x )\)\(x_0\)处有双侧极限且\(\lim_{ x \rightarrow x_0 } f ( x ) = f ( x_0 )\),称其在\(x_0\)连续,\(x_0\)称为连续点,若\(\forall x_0 \in ( a , b )\),\(f ( x )\)\(x_0\)处连续,则称其在\(( a , b )\)连续.连续性相当于说:取极限和\(f\)可以交换顺序,换言之\(\lim_{ x \rightarrow x_0 } f ( x ) = f ( \lim_{ x \rightarrow x_0 } x )\).

我们也可以类似上面定义左连续右连续,若\(f ( x )\)\([ a , b ]\)上有定义,且在\(( a , b )\)上连续,在\(a\)处右连续,在\(b\)处左连续,称其在\([ a , b ]\)上连续.

如果\(f ( x )\)\(x_0\)附近有定义且不连续,则称\(x_0\)是一个间断点,间断点有以下几种:

  1. 如果\(\lim_{ x \rightarrow x_0 + 0 } f ( x )\)\(\lim_{ x \rightarrow x_0 - 0 } f ( x )\)都存在但不相等或者不等于\(f ( x_0 )\),则称为第一类间断点.如果是后者情况,可以通过修改\(f ( x_0 )\)的定义来去掉这个间断点,因而一般被称为可去间断点.

  2. 反之,如果\(\lim_{ x \rightarrow x_0 + 0 } f ( x )\)\(\lim_{ x \rightarrow x_0 - 0 } f ( x )\)至少有一个不存在,则称为第二类间断点.

使用单调收敛准则,可证明单调函数没有第二类间断点.并且单调函数的间断点只有可数个(几乎处处连续).

这个怎么证明呢?考虑设\(M\)是函数\(f\)的第一类间断点集,取\(x \in M , I_x = ( f ( x_0 - 0 ) , f ( x_0 + 0 ) )\),由于函数单调,所以这些\(I_x\)两两不交.考虑映射\(M \rightarrow \mathbb{ Q } , x \mapsto \min ( I_x \cap \mathbb{ Q } )\),也就是考虑每一个\(I_x\)中都有若干个有理数,且互不相交,那么显然这个映射是个单射,\(M\)可数.

事实上有更强的结论:任意函数的第一类间断点集都是可数的.

\(M\)是函数\(f\)的第一类间断点集,取\(M_n = \{ x \in M \mid | f ( x + 0 ) - f ( x - 0 ) | > \frac{ 1 }{ n } \} , M ' = \{ x \in M | f ( x + 0 ) = f ( x - 0 ) \ne f ( x ) \}\).

注意到\(M = ( \bigcup_{ n \geq 1 } M_n ) \cup M '\).

我们定义孤立点:如果\(x \in A , \exists \sigma , ( x - \sigma , x + \sigma ) \nsubseteq A\),则称\(x\)\(A\)中的一个孤立点.类似刚才证明可数性,我们每个孤立点都可以取一段邻域,领域中一定存在有理数,所以任意一个集合中的孤立点个数一定是可数的.

又发现所有的\(x \in M_n\),\(x\)都是孤立点,原因很显然因为在\(x\)的两侧小区间都在趋近于一个极限,所以它们肯定不是第一类间断点.所以所有的\(M_n\)都是可数集.

那怎么证明\(M '\)是可数集呢?考虑取\(M '_n = \{ x \in M | | f ( x ) - f ( x - 0 ) | > \frac{ 1 }{ n } \}\),现在\(M ' = \bigcup_{ n \geq 1 } M '_n\),而\(M '_n\)一定是孤立点集,所以\(M '\)可数.

综上就可以看出\(M\)是一个可数集.

而第二类间断点则是可以有任意多个,例如对于迪利克雷函数,其处处都是第二类间断点.

由于连续性由极限定义,这意味着在\(( a , b )\)上的连续函数的有定义的四则运算必定得到的还是在\(( a , b )\)上的连续函数.那么,如果我们对于一个区间\(I\),定义\(C ( I )\)为所有在\(I\)上连续的函数组成的集合,\(C ( I )\)就是一个线性空间.且不难发现,连续函数的复合仍然是连续函数.这其实对应着\(\lim_{ x \rightarrow a } g ( f ( x ) ) = g ( \lim_{ x \rightarrow a } f ( x ) ) = g ( f ( a ) ) \\\).

另外,如果一个连续函数有单值反函数,则反函数必连续.

不难证明,所有的初等函数在定义域上都是连续的.

另外:连续周期非常值函数一定有最小正周期.

考虑设正周期的集合是\(\{ t \}\),取\(T = \inf \{ t \}\).

\(T = 0\)的时候,取一个正周期的数列\(\{ t_n \} \rightarrow 0\),然后\(\forall x < y , x_n = x + \lfloor \frac{ y - x }{ t_n } \rfloor t_n , | y - x_n | \leq t_n \rightarrow 0\),于是\(\lim_{ n } f ( x_n ) = f ( y )\),而恒有\(f ( x ) = f ( x_n )\)于是这是一个常值函数.

反之,则取\(\{ t_n \} \rightarrow T , f ( x + T ) = \lim_{ n } f ( x + t_n ) = f ( x )\).

一致连续

假设\(f : I \rightarrow \mathbb{ R }\),若\(\forall \epsilon > 0 , \exists \delta > 0 , \forall x_1 , x_2 \in I , | x_1 - x_2 | < \delta , | f ( x_1 ) - f ( x_2 ) | < \epsilon\),则称其一致连续.一致连续性是一个比连续性强得多的性质,例如\(f ( x ) = x^2\)就不是一致连续的.

李氏连续

假设\(f : I \rightarrow \mathbb{ R }\),若\(\exists L , \forall x_1 , x_2 \in I , | f ( x_1 ) - f ( x_2 ) | \leq L | x_1 - x_2 |\),则称其李氏连续.李氏连续当然强于一致连续.

闭区间下的连续函数

介值定理(零点存在定理)

\(f ( x )\)\([ a , b ]\)上有定义且连续,\(f ( a ) \ne f ( b )\),则\(\forall \eta \in ( f ( a ) , f ( b ) ) , \exists c \in ( a , b ) , f ( c ) = \eta\).这当然等价于\(f ( a ) f ( b ) < 0 \Rightarrow \exists c \in ( a , b ) , f ( c ) = 0\).

考虑取\(f ( \frac{ a + b }{ 2 } )\),如果\(f ( \frac{ a + b }{ 2 } ) = 0\)那就完事了.不然的话考虑\(f ( a ) f ( \frac{ a + b }{ 2 } )\)\(f ( \frac{ a + b }{ 2 } ) f ( b )\)中必定有恰好一个小于\(0\),这当然给出一个闭区间套,不妨设最后套出了一个单点\(c\).此时取极限立刻有\(0 \geq \lim f ( a_n ) f ( b_n ) = f ( c )^2\),于是\(f ( c ) = 0\).

也有一个存在性证明:反证,如果\(\forall x \in [ a , b ]\),\(f ( x ) \ne 0\).那么\(\forall x \in [ a , b ] , \exists \delta ( x ) > 0\),\(f\)\(( x - \delta ( x ) , x + \delta ( x ) )\)\(f ( x )\)同号.根据有限覆盖定理,我们可以拿出有限个开区间来覆盖整个区间.此时可以将这些开区间排序,相邻两个区间两两有交,自然导出矛盾.

介质定理还有两个推论:

  1. 介值定理的推论1:设\(f ( x )\)\([ a , b ]\)上有定义且连续,那么\([ f ( a ) , f ( b ) ] \subseteq\)其值域.

  2. 介值定理的推论2:单调连续函数的反函数仍然是单调连续函数.

推论(1)显然,考虑推论(2)的证明:

考虑对于连续单增函数\(f ( x ) \in C ( a , b ) , \alpha = f ( a + 0 ) , \beta = f ( b - 0 )\).先要证明其存在反函数\(\varphi \in C ( \alpha , \beta )\).

这里有一点小问题是我们要用介值定理要把定义域控制在闭区间,但这当然是好做的,对于任何一个\(c \in ( a , b )\),你一定可以取一个\(a_1 , b_1\)使得\(f ( a_1 ) < f ( c ) < f ( b_1 )\),这样\(f ( x ) \in C [ a_1 , b_1 ]\).

这样的话容易说明\(f\)\(( a , b ) \rightarrow ( \alpha , \beta )\)的双射,于是反函数是存在的.反函数的单调性是好证的.

对于反函数的连续性,反证,假设其在某一点\(c \in ( \alpha , \beta )\)处不连续,必然意味着\(a < \varphi ( c - 0 ) < \varphi ( c + 0 ) < b\).此时容易说明\(\varphi ( x ) \in ( a , b ) \setminus ( \varphi ( c - 0 ) , \varphi ( c + 0 ) ) \cup \{ \varphi ( c ) \}\),那只需要取\(w \in ( \varphi ( c - 0 ) , \varphi ( c + 0 ) ) \setminus \{ \varphi ( c ) \}\),\(\nexists x , \varphi ( x ) = w\),这当然与我们上述结论不符.

Example1

对于连续函数\(f \in C [ a , b ] , \forall x_0 \in [ a , b ] \setminus \mathbb{ Q } , \varlimsup_{ \Delta x \rightarrow 0 + 0 } \frac{ f ( x_0 + \Delta x ) - f ( x_0 ) }{ \Delta x } \geq 0\),求证:\(f\)单调递增.

先考虑把条件改成\(\forall x_0 \in [ a , b ]\)怎么做.

一个想法是反证,如果不单调的话,找一个点使得它的右上导数小于\(0\).最自然的想法是找最大值,但最大值有可能只能证明右上导数\(\leq 0\).所以有一个想法是拿一条稍微斜一点(也就是斜率为较小的负数)的直线去截整个曲线.

下面反证,如果其不单增,总能找到两个点\(a ' < b '\),使得\(f ( a ' ) > f ( b ' )\).此时任意取一个\(\epsilon_0 < f ( a ' ) - f ( b ' )\),然后取一个点\(B = ( b ' , f ( b ' ) + \epsilon_0 )\).当然可以再取一个\(\epsilon > 0\)使得\(\epsilon + \epsilon_0 < f ( a ' ) - f ( b ' )\),然后取一个点\(A = ( a ' , f ( b ' ) + \epsilon_0 + \epsilon )\),这样\(AB\)这条直线确定了一条斜率\(k < 0\)的一次函数\(g ( x )\),不妨设\(h ( x ) = f ( x ) - g ( x )\),容易发现\(h ( a ' ) > 0 , h ( b ' ) < 0\),所以可以取一个变号零点\(x_\epsilon = \sup \{ x | h ( x ) \geq 0 , x \in [ a ' , b ' ] \}\).当\(\epsilon\)取值不一样的时候当然可以取不同的而且是不可数个\(x_\epsilon\),此时可以取出一个无理数\(x_0\),那考虑\(\varlimsup_{ \Delta x \rightarrow 0 + 0 } \frac{ f ( x_0 + \Delta x ) - f ( x_0 ) }{ \Delta x } = \varlimsup_{ \Delta x \rightarrow 0 + 0 } \frac{ h ( x_0 + \Delta x ) }{ \Delta x } + k \leq k < 0\),这就矛盾了.

有界定理

\(f ( x )\)\([ a , b ]\)上有定义且连续,\(\exists A , B\),\(\forall x_0 \in [ a , b ] , A \leq f ( x_0 ) \leq B\).

可以用之前的有限覆盖定理所证明的闭区间上的局部有界函数是有界函数,然后还有另一个证明:

假设无界,则存在一个数列\(\{ x_n \}\)使得\(| f ( x_n ) | \rightarrow + \infty\).由于\(\{ x_n \}\)是有界数列,其一定有收敛子列\(\{ x '_n \}\)收敛于\(x '\),当然\(| f ( x ' ) | = \lim_{ n \rightarrow \infty } | f ( x_n ) | = + \infty\),这当然产生了矛盾.

还有一个闭区间套的证明方式:你考虑每次区间分两半,一定有其中一半是无界的,然后做闭区间套.

最值定理

\(f ( x )\)\([ a , b ]\)上有定义且连续,\(\exists x_1 , x_2 \in [ a , b ]\),\(\forall x_0 \in [ a , b ] , f ( x_1 ) \leq f ( x_0 ) \leq f ( x_2 )\).

考虑先用有界定理得知\(f ( x ) \in C [ a , b ]\)有界,然后就可以拿到其上下确界\(m \leq f ( x ) \leq M\),只需证明其上下确界均能取到就行.

反证,考虑若\(M\)取不到,那考虑定义\(g ( x ) = \frac{ 1 }{ M - f ( x ) } > 0\),根据有界定理\(g ( x )\)有上界\(C\),于是\(\frac{ 1 }{ M - f ( x ) } \leq C \Rightarrow f ( x ) \leq M - \frac{ 1 }{ C }\),矛盾.

或者我们知道\(M\)是上确界则\(M - \frac{ 1 }{ n }\)不是上界,取出\(\{ x_n \}\)使得\(M - \frac{ 1 }{ n } < f ( x_n ) \leq M\),那么\(\{ x_n \}\)必然有收敛子列,设其收敛于\(x_0\),那么根据夹逼定理必然能得到\(f ( x_0 ) = M\).

康托尔定理

有界闭区间上的连续函数必然一致连续.

考虑反证,反命题是\(\exists \epsilon_0 > 0 , \forall n > 0 , \exists x '_n , x ' '_n , | x '_n - x ' '_n | < \frac{ 1 }{ n } , | f ( x '_n ) - f ( x ' '_n ) | \geq \epsilon_0\).

用致密性定理,取出\(\{ x '_n \}\)的收敛子列,可以拿到\(\{ x ' '_n \}\)与其对应的数列,二者必然同时收敛于一个值\(x_0\),那么\(| f ( x '_n ) - f ( x ' '_n ) | = 0 \geq \epsilon_0\),当然矛盾.

如果是开区间呢?如果\(f ( x ) \in C ( a , b ]\),其在开区间\(( a , b ]\)上一致连续,这需要等价于\(\forall x_n \in ( a , b ) , x_n \rightarrow a\),\(\{ f ( x_n ) \}\)是柯西列(也就是\(f ( a + 0 )\)极限存在),由此看出开区间上的一致连续函数必然能延拓称闭区间上的连续函数.

不动点和周期点

定义\(f ( x )\)不动点\(\text{ fix } f ( x ) \Leftrightarrow f ( x ) = x\),周期点\(P_n = \{ x | f^{ [ n ] } ( x ) = x \land \forall 0 < m < n , f^{ [ m ] } ( x ) \ne x \}\),其中\(f^{ [ n ] } ( x )\)表示将\(f\)复合\(n\)次.

压缩映照原理

\(f ( x )\)\([ a , b ]\)上有定义并且\(f ( [ a , b ] ) \subseteq [ a , b ]\),并且满足\(\exists 0 \leq q < 1 , \forall x , y \in [ a , b ] , | f ( x ) - f ( y ) | \leq q | x - y |\),那么\([ a , b ]\)上存在唯一的不动点\(c\).

任取一个点\(x_0 \in [ a , b ]\),考虑\(x_{ n + 1 } = f ( x_n )\),然后尝试判断这个数列的极限,注意到:

\[ \begin{aligned} | x_{ n + 1 } - x_n | & = | f ( x_n ) - f ( x_{ n - 1 } ) | \leq q | x_n - x_{ n - 1 } | \leq q^{ n } | x_1 - x_0 | \\ | x_{ n + p } - x_n | & \leq \sum_{ k = 1 }^p | x_{ n + k } - x_{ n + k - 1 } | \\ & \leq \sum_{ k = 0 }^{ p - 1 } q^{ n + k } | x_1 - x_0 | = | x_1 - x_0 | q^n \frac{ 1 - q^{ p } }{ 1 - q } \end{aligned} \]

所以\(\{ x_n \}\)是柯西列,其极限存在,取\(c = \lim x_n\),容易发现:

\[ | f ( x_n ) - f ( c ) | \leq q | x_n - c | \]

两边取极限得知\(f ( c ) = c\),于是\(c\)是一个不动点.如果还存在一个不动点\(c ' \ne c\),那么:

\[ | c - c ' | = | f ( c ) - f ( c ' ) | \leq q | c - c ' | \]

不符.

李-约克定理

对于一个\(f ( x ) \in C [ a , b ]\),如果\(P_3 \ne \emptyset\),那么\(\forall n \in \mathbb{ N }_+\),\(P_n \ne \emptyset\).

引理一

\(J\)是实区间,\(G : J \rightarrow \mathbb{ R }\)是连续函数,\(\forall I = [ a , b ] \subseteq G ( J )\),\(\exists Q = [ a ' , b ' ] \subseteq J , G ( Q ) = I\).

根据介值定理,当然存在一对点\(p , q\),\(I = [ G ( p ) , G ( q ) ]\).不妨设\(p < q\),那么\(a ' = \sup \{ x \in [ p , q ] | G ( x ) = G ( p ) \} , b ' = \inf \{ x \in [ a ' , q ] | G ( x ) = G ( q ) \}\)即可.

换言之,我们可以拿到一个区间使得它的像正是我们想要的区间.感性理解的话我们可以对一个区间求原像并且原像当然也是一个区间.那我们自然可以对区间进行迭代.这样迭代的区间有什么性质么?

引理二

\(J\)是实区间,\(F : J \rightarrow J\)是连续函数,取一列闭区间\(I_n\),满足\(\forall n \geq 0 , I_n \subseteq J , I_{ n + 1 } \subseteq F ( I_n )\).不妨把这种区间列记作\(I_0 \Rightarrow I_1 \Rightarrow I_2 \Rightarrow \cdots\).

那么我们可以找到一列闭区间\(I_0 = Q_0 \supseteq Q_1 \supseteq Q_2 \cdots\),\(\forall n \geq 0\),有\(F^{ [ n ] } ( Q_n ) = I_n\).

考虑数学归纳,假设对于\(\leq n\)的都已经满足,现在有\(I_{ n + 1 } \subseteq F ( I_n ) = F^{ [ n + 1 ] } ( Q_n )\),令\(G = F^{ [ n + 1 ] }\)然后用引理一就可以.

这个引理的意义在于,\(\{ I_n \}\)当然不必是一条链,但是只要其满足一定的性质,我们就可以在它们中找到一条链,也就是每迭代一次都可能会将射出去的那个集合变小,或者是射出需要的集合所需要的初始集合变小.

这个当然也是给我们求原像的机会.我们尝试感性理解一下这个在干什么:

如果一个函数操作完一个区间后会把这个区间变小,那显然我如果想求\(F^{ [ - n ] } ( I )\),\(n\)越大得到的原像就越大对吧.反之,如果会把这个区间变大,那\(n\)越大得到的原像就越小对吧.

这个讨论显然是不好的,我们得想办法刻画一下这个东西.那当然要在这里蕴含一个\(F\)本身.

于是用上面的定义会发现,即使\(F\)会把这个区间扩张到奇怪的大小,只要我们能把它缩回去,那不断取原像的过程照样是可行的.

引理三

\(J\)是实区间,\(G : J \rightarrow \mathbb{ R }\)是连续函数,\(I \subseteq J\)是闭区间,并且\(I \subseteq G ( I )\)或者\(G ( I ) \subseteq I\),都可以推出\(\exists p \in I , G ( p ) = p\).

只需构造函数\(H ( x ) = x - G ( x )\)然后用介值定理即可.

李-约克定理

\(q_3 \in P_3\),则\(F ( q_3 ) , F ( F ( q_3 ) ) \in P_3\),容易看出,这三个点中必然有一个点\(a \in P_3\),使得\(a , b = F ( a ) , c = F ( F ( a ) )\)这三个数单调递增或单调递减.不妨设\(a < b < c\).

下面证明对于任意\(k > 0\),存在\(k\)周期点.

我们接下来取\(K = [ a , b ] , L = [ b , c ]\),立刻由介值定理发现\(F ( K ) \supseteq L\)以及\(F ( L ) \supseteq [ a , c ] = K \cup L\).

接下来我们开始构造一列满足引理二的闭区间,我们考虑:

  1. \(k = 1\)的时候,我们直接取\(\forall n , I_n = L\).

  2. \(k > 1\)的时候,取\(I_n = \begin{cases}K & n \equiv 0 \pmod{ k } \\ L & \text{ otherwise }\end{cases}\)

现在我们可以用引理二立刻拿到区间列\(\{ Q_n \}\),我们发现\(Q_k \subseteq Q_0 = I_0 = I_k = F^{ [ k ] } ( Q_k )\),根据引理三立刻得到\(\exists q \in Q_k , F^{ [ k ] } ( q ) = q\).

那么这个\(q\)有没有可能存在更小的周期\(d\)呢?如果有的话,不妨取其中最小的那个\(d\),辗转相除一下自然有\(d | k\),那么当然要有\(F^{ [ k ] } ( q ) = F^{ [ k - d ] } ( q ) = q\).

此时我们发现\(q \in Q_k \subseteq Q_{ k - d }\),\(q \in I_{ k } \cap I_{ k - d } = K \cap L = \{ b \}\),于是\(F^{ [ k ] } ( q ) = b , F^{ [ k + 1 ] } ( q ) = c , F^{ [ k + 2 ] } ( q ) = a\).

这说明此时\(d = 3\).

而当\(k \geq 4\)的时候,\(F^{ [ k + 2 ] } ( q ) = a \notin L\),这当然与\(I_{ k + 2 } = L\)矛盾.

仔细观察一下上面的过程,我们到底依赖于什么东西得到了这个?

首先找到\(q\)使得\(F^{ [ k ] } ( q ) = q\)这个其实反而并不是最主要的,因为只要\(F ( q ) = q\)那么显然\(F^{ [ k ] } ( q ) = q\),真正离谱的是竟然要让这个点在之前从未跳到过\(q\).这也是这个证明的最精髓的部分,那就是证明任何一个\(d < q\)都不是周期.

那我们考虑取一个区间(也就是\(K\)),在\(K\)中取一个合法的\(q\),然后我们只要找到一个闭区间(也就是\(Q_k \subseteq K\)),使得它当且仅当复合\(k\)次的时候才会打到\(K\)上,在其它时候都得打在\(K\)的外面(在这里是\(L\))上,那自然是可行的了对吧.而数字\(3\)恰好完美地给出了这个构造.

如果我们再总结一下上面的过程,我们需要找到两个区间\(K , L\),找到一个\(Q_k \subseteq K\),使得\(F^k ( Q_k )\)可以打到\(K\)上但是对于\(d < k\),\(F^d ( Q_k )\)打到\(L\)上.于是根据引理三其存在\(k\)周期点,但是几乎不可能存在\(d\)周期点(这里就需要简单判断一下\(L \cap K\)的部分了)

这样的\(K\)\(L\)怎么构造呢?如果我们构造\(F ( K )\)打到\(L\)上,\(F ( L )\)打到\(K\)上显然是吧不合理的,那就可以一个打到另一个,另一个打到全集上再用引理一缩一下,这个看上去合理多了.这当然就是\(F ( K ) \supseteq L\)以及\(F ( L ) \supseteq [ a , c ] = K \cup L\).

Sharkovskii定理

定义如下的一种序关系\(\prec\)(称为Sharkovskii序):

\[ \begin{gathered} 3 \prec 5 \prec 7 \prec \cdots \\ \prec 2 \times 3 \prec 2 \times 5 \prec \cdots \\ \cdots \\ \prec 2^k \times 3 \prec 2^k \times 5 \prec \cdots \\ \cdots \\ \cdots \prec 2^n \prec 2^{ n - 1 } \prec \cdots \prec 4 \prec 2 \prec 1 \end{gathered} \]

对于\(f ( x ) \in C [ l , r ] , f : [ l , r ] \rightarrow [ l , r ]\).那么如果\(m \prec n , P_m \ne \emptyset \Rightarrow P_n \ne \emptyset\).

(首先发现当然存在不动点)

这咋办呢?我们刚才用了\(3\)的最重要的性质就是\(3\)个点可以排成有序的一列,如果有类似的引理,那我们就可以尝试推广上面的结论.

引理

\(f : I \rightarrow I\)是连续函数,\(f\)\(2 n + 1\)周期点但无更小非一奇数阶周期点,我们取出其一个周期轨\(x_0 \rightarrow x_1 \rightarrow \cdots x_{ 2 n }\),必有以下两者成立其一:

  1. \(x_{ 2 n } < x_{ 2 n - 2 } < \cdots < x_2 < x_0 < x_1 < \cdots < x_{ 2 n - 3 } < x_{ 2 n - 1 }\).

  2. \(x_{ 2 n } > x_{ 2 n - 2 } > \cdots > x_2 > x_0 > x_1 > \cdots > x_{ 2 n - 3 } > x_{ 2 n - 1 }\).

这个引理怎么证明呢?考虑把周期轨排一下序然后归纳,我们不妨假设排好序后的结果是\(y_0 < y_1 < \cdots < y_{ 2 n }\).

如果引理成立,(第一种情况下)取\(I_0 = [ x_0 , x_1 ]\),则\(I_0 \Rightarrow I_0\).容易发现其实只有\(I_0\)有这个性质,那我们不妨来看看满足\([ y_k , y_{ k + 1 } ] \Rightarrow [ y_k , y_{ k + 1 } ]\)的情况是什么样子的,尝试去满足\([ f ( y_{ k + 1 } ) , f ( y_{ k } ) ] \supseteq [ y_k , y_{ k + 1 } ]\).这个时候注意到我们可以把所有点分成两类:满足\(f ( y_i ) \geq y_{ i + 1 }\)(称为\(\alpha\)类点,容易见到这里也就等价于\(f ( y_i ) > y_i\))和\(f ( y_i ) \leq y_{ i - 1 }\)(称为\(\beta\)类点)的.那我们就是要找到一个\(k\)使得\(y_k\)\(\alpha\)类点并且\(y_{ k + 1 }\)\(\beta\)类点.

由于\(f ( y_0 ) \geq y_1 , f ( y_{ 2 n } ) \leq y_{ 2 n - 1 }\),这两类点显然都有,那就一定存在交界的地方,这样我们就可以拿出这个分界的地方记作\(I_0 = [ y_k , y_{ k + 1 } ]\),其中\(y_k\)\(\alpha\)类点,\(y_{ k + 1 }\)\(\beta\)类点.

我们不妨定义一个集合\(S\)的张成区间\(A\)\(A = [ \inf S , \sup S ]\),那我们现在取\(S_0 = \{ y_k , y_{ k + 1 } \}\),设周期轨为\(O_f = \{ x_0 , \cdots x_{ 2 n } \}\),我们递归定义\(S_{ k + 1 } = f ( A_k ) \cap O_f\),容易根据上面对\(S_0\)的构造发现\(S_0 \subsetneq S_1\),并且\(S_k\)中因为取了一段极大的区间(但并没有包含所有周期点),所以一定能跳出这个区间(不然这个区间内部就可以自己射自己),所以\(S_k \subsetneq S_{ k + 1 }\).

那由此我们当然可以得到一条链:

\[ S_0 \subsetneq S_1 \subsetneq \cdots \subsetneq S_t = O_f \]

按理来说应该有\(t = 2 n - 1\)(这就会给出每次\(S\)扩张只会多一个数),让我们先来证明这个结论:

反证,假设\(t < 2 n - 1\),尝试找到一个更小的奇数周期来推出矛盾,不妨尝试找到一个\(2 n - 1\)的周期(当然,如果\(2 n + 1 = 3\)的话,这个结论我们在李约克定理已经证明了,所以下面假设\(2 n + 1 \geq 5\)).

我不说你也知道我要干啥,我们考虑在末尾补\(2 n - t - 1\)\(A_t\),并把最后一个缩成\(A_0\),当然有:

\[ A_0 \Rightarrow A_1 \Rightarrow A_2 \Rightarrow \cdots \Rightarrow A_t \Rightarrow A_t \supseteq A_0 \]

但这样并不太行,因为这些区间的交不是空的,我们起码得把其中的一个区间给挪出去,不妨考虑改掉最后一个\(A_t\),试图取一个\(l \ne k\)使得\([ y_l , y_{ l + 1 } ] \Rightarrow A_0 = [ y_k , y_{ k + 1 } ]\).如果我们结合一下下面的主定理的证明部分,其实我们可以发现这里的\([ y_l , y_{ l + 1 } ]\)也就是\(I_{ 2 n - 1 }\).

我们上面已经保证了\(f ( y_{ k + 1 } ) \leq y_k\),如果有\(f ( y_{ k + 2 } ) \geq y_{ k + 1 }\),那当然可以取\(l = k + 1\).也就是如果我们的这一列点类别中出现了\(\alpha \beta \alpha\)这样的结构就完事了.如果找不到,那说明\(f ( y_{ k + 2 } ) \leq y_{ k + 1 }\).我们继续往后找,如果可以遇到第一个\(f ( y_i ) \geq y_{ k + 1 }\),那\([ y_{ i - 1 } , y_i ]\)自然是满足条件的.如果一直都找不到,说明始终有\(f ( y_i ) < y_{ k + 1 } \leq y_{ i - 1 } , i \in [ k + 2 , 2 n ]\),那说明后面全是\(\beta\)点.

同理如果出现了\(\beta \alpha \beta\)这样的结构也找到了.不然类似同理,如果一直找不到就说明前面全是\(\alpha\)点,前面的点始终满足\(f ( y_i ) \geq y_{ k + 1 } , i \in [ 0 , k ]\).

这已经推导出了矛盾,因为我们发现前面的点射到后面,后面的点射到前面,问题在于前面有\(k + 1\)个点,后面有\(2 n - k\)个点,于是\(k + 1 = 2 n - k \Rightarrow 2 k + 1 = 2 n\),这导出了矛盾.

所以确实可以找到这样的\(l \ne k , [ y_l , y_{ l + 1 } ] \Rightarrow [ y_k , y_{ k + 1 } ]\),那我们用上面的区间列自然可以推导出存在一个\(2 n - 1\)周期点(或者其因子周期点,不过那也导出矛盾了).

于是\(t = 2 n - 1\),这表示我们拿到的这条链\(S_0 \subsetneq S_1 \subsetneq \cdots \subsetneq S_t = O_f\)每次只增加一个元素.如果\(S_0\)\(S_1\)是只增加了一个元素,当然说明\(f ( y_k ) = y_{ k + 1 }\)或者\(f ( y_{ k + 1 } ) = y_k\).两者的证明是一样的,不妨设\(f ( y_k ) = y_{ k + 1 }\).

此时我们取\(x_0 = y_k , x_1 = y_{ k + 1 }\),此时其实也可以发现\(x_2 < x_0 < x_1\).并且根据上面的说法,我们知道\(A_{ k } \subsetneq A_{ k + 1 }\),那这个扩张一定是每次在边界上往外跑一个,也就是每次取一个新的迭代出来的结果扔到左边或者扔到右边.

网络上有关于这一点的证明往往是反证,假设不按规则走的话然后去尝试构造三周期点推到矛盾,但我们这里给出另一个证明方法:

考虑由于每次只增大一个数,那么如果我们能证明这一列\(y\)形如\(\alpha \cdots \alpha \beta \cdots \beta\)的形式就做完了,这等价于\(I_0\)的唯一性.

假设还有另一个区间也满足要求,对于这个新的区间,我们设其是\([ y_l , y_{ l + 1 } ]\),我们再拿一个周期点\(y_{ l + 2 }\)出来,假设这三个数按照顺序是\(a < b < c\),那么根据上面的结论一定有\(b \rightarrow c \rightarrow a\)或者\(b \rightarrow a \rightarrow c\)成立,这就说明\(b\)被夹在了中间.而我们从一个\(I_0\)扩张当然是逐步的,会将\(x_3 , x_4 \cdots\)逐个加入,这必然意味着在\(b\)加入之前,\(a , c\)中已经有一个加进去了,但这是不可能的,只有\(b\)加入后才能把\(a , c\)给加进去.

sharkovskii定理

有了引理就可以开始类比了,不妨假设\(x_{ 2 n } < x_{ 2 n - 2 } < \cdots < x_2 < x_0 < x_1 < \cdots < x_{ 2 n - 3 } < x_{ 2 n - 1 }\).

现在我们要取区间列了,显然有一些奇偶对跳的现象,事实上我们取\(I_0 = [ x_0 , x_1 ] , I_{ 2 k - 1 } = [ x_{ 2 k } , x_{ 2 k - 2 } ] , I_{ 2 k } = [ x_{ 2 k - 1 } , x_{ 2 k + 1 } ]\)显然就是满足条件的.而且这些区间除了端点外完全不相交(而且任意三个区间的交都是空集).这一列一共有\(2 n\)个区间.我们事实上可以取\(J = [ x_{ 0 } , x_{ 2 n - 1 } ] = \bigcup I_{ 2 k }\)放到整个区间的最后.

接下来我们用这些东西去对于多种情况来对跳.

Case1

(假设\(2 n + 1\)是最小的非空的非一奇数周期)首先证明\(P_{ 2 n + 1 } \ne \emptyset \Rightarrow \forall 0 < k , P_{ k + 2 n } \ne \emptyset\).

在前面补\(k\)\(I_0\),在最后也补一个\(I_0\),构造区间列:

\[ I_0 \Rightarrow I_0 \Rightarrow \cdots \Rightarrow I_0 \Rightarrow I_1 \Rightarrow I_2 \Rightarrow \cdots \Rightarrow I_{ 2 n - 1 } \Rightarrow I_0 \]

也就是在前面补\(I_0\)直到整个区间列的数量为\(k + 2 n + 1\),此时当然存在\(x_0 \in Q_{ k + 2 n }\)使得\(f^{ [ k + 2 n ] } ( x_0 ) = x_0\),只需证明\(\nexists d | ( k + 2 n )\),\(f^{ [ d ] } ( x_0 ) = x_0\)即可.这当然好证,因为\(d \leq \frac{ k + 2 n }{ 2 } \leq \max ( k , 2 n )\),因为你只需要把它卡在那一堆\(I_0\)\(I_k\)的分界线上就行.

Case2

(假设\(2 n + 1\)是最小的非空的非一奇数周期)接下来我们来证明\(P_{ 2 n + 1 } \ne \emptyset \Rightarrow \forall 0 < m , P_{ 2 m } \ne \emptyset\).

\(2 m > 2 n + 1\)的时候我们已经证完了,接下来考虑\(2 m < 2 n + 1\)的情况.

由于\(\forall k , I_{ 2 n - 1 } \Rightarrow I_{ 2 k }\),我们考虑取出\(2 m + 1\)个区间列,恰好有:

\[ I_{ 2 n - 2 m } \Rightarrow I_{ 2 n - 2 m + 1 } \Rightarrow \cdots \Rightarrow I_{ 2 n - 1 } \Rightarrow I_{ 2 n - 2 m } \]

接下来就是简单说明的过程了.

Case3

接下来考虑证明:\(P_{ 4 } \ne \emptyset \Rightarrow P_2 \ne \emptyset\).

这个证明就比较无聊了,我们进行暴力讨论,不妨假设\(a < b < c < d\),那么:

  1. \(a \rightarrow b \rightarrow c \rightarrow d \rightarrow a\).

此时\([ a , b ] \Rightarrow [ b , c ] \Rightarrow [ c , d ] \Rightarrow [ a , d ] \supseteq [ a , b ]\),于是可证明有三周期点,当然有二周期点.

  1. \(a \rightarrow b \rightarrow d \rightarrow c \rightarrow a\).

此时\([ a , b ] \Rightarrow [ b , d ] \Rightarrow [ c , d ] \Rightarrow [ a , c ] \supseteq [ a , b ]\),于是可证明有三周期点,当然有二周期点.

  1. \(a \rightarrow c \rightarrow b \rightarrow d \rightarrow a\).

此时\([ a , b ] \Rightarrow [ c , d ] \Rightarrow [ a , b ]\),当然有二周期点.

  1. \(a \rightarrow c \rightarrow d \rightarrow b \rightarrow a\).

此时\([ a , c ] \Rightarrow [ c , d ] \Rightarrow [ b , d ] \Rightarrow [ a , b ] \Rightarrow [ a , c ] \supseteq [ b , c ] \Rightarrow [ a , d ] \supseteq [ a , c ]\).于是有五周期点,于是有二周期点.

  1. \(a \rightarrow d \rightarrow b \rightarrow c \rightarrow a\).

此时\([ a , b ] \Rightarrow [ c , d ] \Rightarrow [ a , b ]\),当然有二周期点.

  1. \(a \rightarrow d \rightarrow c \rightarrow b \rightarrow a\).

此时\([ b , c ] \Rightarrow [ a , b ] \Rightarrow [ a , d ] \supseteq [ b , c ]\),于是有二周期点.

Case4

接下来考虑证明:\(P_{ 2^{ n + 1 } } \ne \emptyset \Rightarrow P_{ 2^n } \ne \emptyset\).

考虑上面命题等价于\(f^{ [ 2^{ n - 1 } ] }\)有四周期点,则其有二周期点.

Case5

接下来考虑证明:\(P_{ 2^{ n } p } \ne \emptyset \Rightarrow P_{ 2^n q } \ne \emptyset\),其中\(p , q \in \text{ odd } , p < q\).

考虑\(f^{ [ 2^n ] }\)\(p\)周期点,当然也就有\(q\)周期点.

Case6

接下来考虑证明:\(P_{ 2^{ n } p } \ne \emptyset \Rightarrow P_{ 2^m q } \ne \emptyset\),其中\(p , q \in \text{ odd } , m > n\).

考虑\(f^{ [ 2^n ] }\)\(p\)周期点,当然也就有\(q 2^{ m - n }\)周期点.

Case7

接下来考虑证明:\(P_{ 2^{ n } p } \ne \emptyset \Rightarrow P_{ 2^m } \ne \emptyset\),其中\(p \in \text{ odd }\).

选取\(N = \max ( n + 1 , m + 1 )\),则考虑\(f^{ [ 2^n ] }\)\(p\)周期点,则其有\(2^{ N - n }\)周期点,\(P_{ 2^N } \ne \emptyset\).于是\(P_{ 2^m } \ne \emptyset\).

导数

设函数\(f ( x )\)在一个区间\(( a , b )\)上有定义,对于给定的\(x_0 \in ( a , b )\),考虑增量\(\Delta x \ne 0 \land x_0 + \Delta x \in ( a , b )\),则\(\Delta y = f ( x_0 + \Delta x ) - f ( x_0 )\)称为关于\(\Delta x\)增量.若极限\(\lim_{ \Delta x \rightarrow 0 } \frac{ \Delta y }{ \Delta x } \\\)存在则称这个函数在\(x_0\)可导,并称这个值为这个函数在\(x_0\)处的导数或者微商,记作\(f ' ( x_0 )\)\(\frac{ \text{ d } f }{ \text{ d } x } |_{ x = x_0 }\).同理可以定义出左导数右导数.如果某个函数的导数构成一个函数,我们称这个函数为其对应的导函数.

显然右可导能推出右连续,左可导能推出左连续.换言之,可导一定连续.

但是连续不一定可导,相当漂亮的一个反例是\(f ( x ) = \begin{cases}0 & x = 0 \\ x \sin \frac{ 1 }{ x } & \text{ otherwise }\end{cases}\),其在零点没有左右导数.

如果\(f\)\(n - 1\)次导数存在,记作\(f^{ ( n - 1 ) } ( x )\),如果该函数可导则其导数称作\(f^{ ( n ) } ( x )\).

如果\(f^{ ( n ) } ( x )\)\(I\)上连续,则称\(f \in C^{ n } ( I )\).如果其任意阶可导,则称\(f \in C^{ \infty } ( I )\).

特别地,如果称一个函数是\(\alpha\)次可导,即\(| f ( x ) - f ( y ) | \leq | x - y |^\alpha\).其实就是Holder连续.

导数基本运算

导数也可以类似求出四则运算以及复合的法则:

  1. \([ cf ( x ) ] ' = cf ' ( x )\).

  2. \([ f ( x ) \pm g ( x ) ] ' = f ' ( x ) \pm g ' ( x )\).

  3. \([ f ( x ) g ( x ) ] ' = f ' ( x ) g ( x ) + g ' ( x ) f ( x )\).

  4. (莱布尼茨公式):\([ f ( x ) g ( x ) ]^{ ( n ) } = \sum_{ k = 0 }^n \binom{ n }{ k } f^{ ( k ) } ( x ) g^{ ( n - k ) } ( x )\).

  5. \([ \frac{ f ( x ) }{ g ( x ) } ] ' = \frac{ f ' ( x ) g ( x ) - g ' ( x ) f ( x ) }{ g^2 ( x ) } , g ( x ) \ne 0\).

  6. \([ g ( f ( x ) ) ] ' = g ' ( f ( x ) ) f ' ( x )\).

(1)(2)比较平凡.

(3)(4)的证明的话,考虑:

\[ \begin{aligned} & \frac{ f ( x + \Delta x ) g ( x + \Delta x ) - f ( x ) g ( x ) }{ \Delta x } \\ = & \frac{ f ( x + \Delta x ) - f ( x ) }{ \Delta x } g ( x + \Delta x ) + f ( x ) \frac{ g ( x + \Delta x ) - g ( x ) }{ \Delta x } \end{aligned} \]

取一下极限就行.

(5)的话,其实求出\(( \frac{ 1 }{ g ( x ) } ) '\)就行了,我们来看:

\[ \begin{aligned} ( \frac{ 1 }{ g ( x ) } ) ' & = \lim_{ \Delta x \rightarrow 0 } \frac{ \frac{ 1 }{ g ( x + \Delta x ) } - \frac{ 1 }{ g ( x ) } }{ \Delta x } \\ & = \lim_{ \Delta x \rightarrow 0 } \frac{ \frac{ g ( x ) - g ( x + \Delta x ) }{ g ( x + \Delta x ) g ( x ) } }{ \Delta x } \\ & = \frac{ - g ' ( x ) }{ g^2 ( x ) } \end{aligned} \]

对于(6),不妨设\(f ( x_0 ) = y_0\).

\(\Delta y \ne 0\)的时候,我们有:

\[ \begin{aligned} \lim_{ \Delta y \rightarrow 0 } \frac{ g ( y_0 + \Delta y ) - g ( y_0 ) }{ \Delta y } & = g ' ( y_0 ) \\ \lim_{ \Delta y \rightarrow 0 } [ \frac{ g ( y_0 + \Delta y ) - g ( y_0 ) }{ \Delta y } - g ' ( y_0 ) ] & = 0 \end{aligned} \]

\(\eta ( \Delta y ) = \frac{ g ( y_0 + \Delta y ) - g ( y_0 ) }{ \Delta y } - g ' ( y_0 ) = \frac{ \Delta z }{ \Delta y } - g ' ( y_0 ) , \Delta y \ne 0\),那么\(\lim_{ \Delta y \rightarrow 0 } \eta ( \Delta y ) = 0\).

此时有:

$$ \[\begin{aligned} \frac{ \Delta z }{ \Delta x } & = \frac{ \Delta z }{ \Delta y } \frac{ \Delta y }{ \Delta x } = \eta ( \Delta y ) \frac{ \Delta y }{ \Delta x } + g ' ( y_0 ) \frac{ \Delta y }{ \Delta x } \\ \end{aligned}\]

$$

带上极限,前者为\(0\).

另一种写法是,类似上面的讨论,我们这里有一些无穷小量,而且(除了\(\frac{ \Delta z }{ \Delta x }\)以外)也不会出现无穷小量之间的除法,用一下当然有,\(g ( y + \Delta y ) - g ( y ) = ( g ' ( y ) + o ( 1 ) ) \Delta y , f ( x + \Delta x ) - f ( x ) = ( f ' ( x ) + o ( 1 ) ) \Delta x\).

考虑:

$$ \[\begin{aligned} \Delta z & = ( g ' ( y ) + o ( 1 ) ) \Delta y \\ & = ( g ' ( y ) + o ( 1 ) ) ( f ' ( x ) + o ( 1 ) ) \Delta x \\ \end{aligned}\]

$$

两边除一下\(\Delta x\)两边求极限就行.

不难发现上面的过程等价于啥呢?等价于:

\[ \frac{ \text{ d } z }{ \text{ d } x } = \frac{ \text{ d } z }{ \text{ d } y } \frac{ \text{ d } y }{ \text{ d } x } \]

反函数的导数

我们首先声称:如果\(x = \varphi ( y ) , \varphi ' \ne 0 \Rightarrow\)\(有 反 函 数\)f=^{-1}

然后我们声称:如果\(x = \varphi ( y ) \in C ( c , d )\),并且其严格单调且连续.如果\(( x_0 , y_0 )\)处其导数存在,则\(f ' ( x_0 ) = \frac{ 1 }{ \varphi ' ( f ( x_0 ) ) }\).

这个可以用极限证明,我们有:

\[ \begin{aligned} f ' ( x_0 ) & = \lim_{ x \rightarrow x_0 } \frac{ f ( x ) - f ( x_0 ) }{ x - x_0 } \\ & = \lim_{ y \rightarrow y_0 } \frac{ y - y_0 }{ \varphi ( y ) - \varphi ( y_0 ) } \\ & = \lim_{ y \rightarrow y_0 } \frac{ 1 }{ \frac{ \varphi ( y ) - \varphi ( y_0 ) }{ y - y_0 } } \\ & = \frac{ 1 }{ \varphi ' ( y_0 ) } \end{aligned} \]

现在我们证明了反函数有导数,立即有:

\[ f ( g ( x ) ) = x \Rightarrow f ' ( x ) g ' ( f ( x ) ) = 1 \]

隐函数求导

这里我们不加证明地给出隐函数求导法则,也就是暂且把\(y\)当成\(x\)的函数.

Example1

举例的话,我们来看方程:

\[ x = y + \epsilon \sin y \]

两边对\(x\)求导:

\[ \begin{aligned} 1 & = y ' + y ' \epsilon \cos y \\ y ' & = \frac{ 1 }{ 1 + \epsilon \cos y } \end{aligned} \]

参数方程的求导

如果\(\begin{cases}x = x ( t ) \\ y = y ( t )\end{cases}\),考虑求导\(\frac{ \text{ d } y }{ \text{ d } x }\).

这个做法就是反函数+链式法则.当然要保证下面需要的地方导数都不是\(0\).

不妨设\(t = t ( x )\),当然有\(y = y ( t ( x ) )\),那么\(\frac{ \text{ d } y }{ \text{ d } x } = y ' ( t ( x ) ) t ' ( x ) = \frac{ y ' ( t ) }{ x ' ( t ) }\).

Example1

极坐标的求导:

\[ \begin{cases} x = r ( \theta ) \cos \theta \\ y = r ( \theta ) \sin \theta \end{cases} \]

当然\(\frac{ \text{ d } y }{ \text{ d } x } = \frac{ r ' \sin \theta + r \cos \theta }{ r ' \cos \theta - r \sin \theta } = \frac{ \tan \theta + \frac{ r }{ r ' } }{ 1 - \tan \theta \frac{ r }{ r ' } } = \tan ( \theta + \arctan ( \frac{ r }{ r ' } ) ) = \tan \alpha\).

而容易发现\(\tan \alpha\)其实是切线和\(x\)轴正半轴的夹角.

初等函数的导数

下面给出若干初等函数的导数.

常函数

常函数的连续性显然.

导数有:

\[ f ( x ) = c \Rightarrow f ' ( x ) = 0 \]

证明显然.

三角函数

三角函数的连续性比较有意思,考虑只需证明\(\sin x\)连续即可,使用和差化积得到\(| \sin x - \sin x_0 | = | 2 \sin \frac{ x - x_0 }{ 2 } \cos \frac{ x + x_0 }{ 2 } | \leq 2 | \sin \frac{ x - x_0 }{ 2 } | \leq | x - x_0 |\).

导数有:

\[ \begin{aligned} \sin ' ( x ) & = \cos ( x ) \\ \cos ' ( x ) & = - \sin ( x ) \end{aligned} \]

只给出前者的证明,后者类似,或者换个元做诱导公式也行.

我们有和差化积:

\[ \begin{aligned} & \sin ( x + \Delta x ) - \sin ( x ) \\ = & 2 \sin ( \frac{ \Delta x }{ 2 } ) \cos ( x + \frac{ \Delta x }{ 2 } ) \end{aligned} \]

自然有:

\[ \begin{aligned} \lim_{ \Delta x \rightarrow 0 } \frac{ \Delta y }{ \Delta x } & = \lim_{ \Delta x \rightarrow 0 } \frac{ 2 \sin ( \frac{ \Delta x }{ 2 } ) \cos ( x + \frac{ \Delta x }{ 2 } ) }{ \Delta x } \\ & = \lim_{ \Delta x \rightarrow 0 } \frac{ \sin ( \frac{ \Delta x }{ 2 } ) }{ \frac{ \Delta x }{ 2 } } \cos ( x + \frac{ \Delta x }{ 2 } ) \\ & = \cos ( x ) \end{aligned} \]

进一步,我们可以考虑高阶导数:

\[ \begin{aligned} ( \sin x )^{ ( n ) } & = \sin ( x + \frac{ n \pi }{ 2 } ) \\ ( \cos x )^{ ( n ) } & = \cos ( x + \frac{ n \pi }{ 2 } ) \end{aligned} \]

而考虑\(( \tan x ) '\),我们有:

\[ \begin{aligned} ( \tan x ) ' & = \lim_{ \Delta x \rightarrow 0 } \frac{ \frac{ \sin ( x + \Delta x ) }{ \cos ( x + \Delta x ) } - \frac{ \sin x }{ \cos x } }{ \Delta x } \\ & = \lim_{ \Delta x \rightarrow 0 } \frac{ \sin \Delta x }{ \Delta x } \frac{ 1 }{ \cos x \cos ( x + \Delta x ) } \\ & = \frac{ 1 }{ \cos^2 x } \end{aligned} \]

反三角函数

使用反函数的导数公式:

\[ \begin{aligned} \arctan ' ( x ) & = \frac{ 1 }{ 1 + x^2 } \\ \arccos ' ( x ) & = \frac{ - 1 }{ \sqrt{ 1 - x^2 } } \\ \arcsin ' ( x ) & = \frac{ 1 }{ \sqrt{ 1 - x^2 } } \end{aligned} \]

反三角函数的高阶导数比较困难,我们来看个例子:

考虑\(y = \arctan x\),\(y ' = \frac{ 1 }{ 1 + x^2 } = \frac{ 1 }{ 1 + \tan^2 y } = \cos^2 y\),那么\(y ' ' = - 2 \cos y \sin y \times y ' = - \cos^2 y \sin 2 y\),事实上容易用归纳法证明\(y^{ ( n ) } = ( n - 1 ) ! \cos^n y \sin ( n ( y + \frac{ \pi }{ 2 } ) )\).

不过还有一种办法,那就是我们考虑\(y ' = - \frac{ 1 }{ 2 i } ( \frac{ 1 }{ i + x } + \frac{ 1 }{ i - x } )\),用这个归纳立刻得到\(y^{ ( n ) } = - \frac{ ( n - 1 ) ! }{ 2 i } ( ( i - x )^{ - n } - ( - 1 )^n ( i + x )^{ - n } )\).

然而\(y = \arcsin x\)要麻烦得多.下面我们来看一下:

\[ \begin{aligned} y ' & = \frac{ 1 }{ \sqrt{ 1 - x^2 } } \\ ( y ' )^2 ( 1 - x^2 ) & = 1 \\ ( 1 - x^2 ) 2 y ' y ' ' - 2 x ( y ' )^2 & \equiv 0 \\ ( 1 - x^2 ) 2 y ' ' - 2 xy ' & \equiv 0 \end{aligned} \]

两边求\(n - 2\)次导,利用莱布尼茨公式,化简后得到:

\[ ( 1 - x^2 ) y^{ ( n ) } + ( 3 - 2 n ) xy^{ ( n - 1 ) } - ( n - 2 )^2 y^{ ( n - 2 ) } \equiv 0 \]

指数函数

我们需要首先拿到指数为有理数的东西.

首先整数次方是有定义的,我们需要拿到形如\(f ( x ) = a^{ \frac{ 1 }{ x } }\)的东西,这个考虑取一下反函数即可.然后二者嵌套一下得到形如\(a^{ \frac{ q }{ p } }\)的幂函数,取反一下得到形如\(a^{ - \frac{ q }{ p } }\)的幂函数.

然后要定义无理数指数幂,类似戴德金分割,定义\(a^x = \sup_{ q \leq x , q \in Q } a^q\).

当然我们要验证那些指数的运算法则,还有一些单调性(两个无理数之间插入两个有理数就可以拆成单调的,这里还需要讨论一下和\(1\)的大小关系),这些当然都是对的.

然后我们就可以拿出指数函数,用反函数定义对数函数.

指数函数的连续性:考虑对于\(f ( x ) = a^x\),\(\forall \epsilon > 0\),\(\exists N > 0 , a < ( 1 + \epsilon )^N\),此时取\(q_1 < x_0 < q_2\),\(q_2 - q_1 < \frac{ 1 }{ N }\),这当然能做得到.考虑\(a^{ x_0 } \leq f ( x_0 + 0 ) \leq f ( q_2 )\),于是\(1 \leq \frac{ a^{ q_2 } }{ a^{ q_1 } } \leq a^{ \frac{ 1 }{ N } } \leq 1 + \epsilon\).

先来看最特殊的指数函数:

\[ f ( x ) = e^x \Rightarrow f ' ( x ) = e^x \]

事实上我们还有:

\[ f ( x ) = a^x \Rightarrow f ' ( x ) = a^x \ln a , a > 0 \]

下面来看下为啥:

\[ \begin{aligned} f ' ( x ) & = \lim_{ \Delta x \rightarrow 0 } \frac{ a^{ x + \Delta x } - a^x }{ \Delta x } \\ & = a^x \lim_{ \Delta x \rightarrow 0 } \frac{ a^{ \Delta x } - 1 }{ \Delta x } \\ & = a^x \ln a \end{aligned} \]

而高阶导数有:

\[ f ( x ) = e^{ ax } \Rightarrow f^{ ( n ) } = a^n e^{ ax } \]

对数函数

先看:

\[ f ( x ) = \log_a ( x ) \Rightarrow f ' ( x ) = \frac{ 1 }{ x \ln a } \]

证明的话考虑:

\[ \begin{aligned} f ' ( x ) & = \lim_{ \Delta x \rightarrow 0 } \frac{ \log_a ( 1 + \frac{ \Delta x }{ x } ) }{ \Delta x } \\ & = \lim_{ \Delta x \rightarrow 0 } \frac{ \log_a ( 1 + \frac{ \Delta x }{ x } ) }{ \frac{ \Delta x }{ x } } \frac{ 1 }{ x } \\ & = \frac{ 1 }{ x \ln a } \end{aligned} \]

再看:

\[ f ( x ) = \ln | x | \Rightarrow f ' ( x ) = \frac{ 1 }{ x } \]

考虑\(f ( x ) = \ln | x | = \frac{ 1 }{ 2 } \ln x^2\).

考虑对数函数的高阶导数:

\[ f ( x ) = \ln x \Rightarrow f^{ ( n ) } ( x ) = ( - 1 )^{ n - 1 } ( n - 1 ) ! x^{ - n } \]

幂函数

我们只需要定义\(x^{ \alpha } = e^{ \alpha \ln x }\)即可.

导数有:

\[ f ( x ) = x^\mu \Leftrightarrow f ' ( x ) = \mu x^{ \mu - 1 } \]

证明的话,考虑\(x = 0\)的时候根据定义显然,如果\(x \ne 0\),那么:

\[ \begin{aligned} f ' ( x ) & = \lim_{ \Delta x \rightarrow 0 } \frac{ ( x + \Delta x )^\mu - x^\mu }{ \Delta x } \\ & = \lim_{ \frac{ \Delta x }{ x } \rightarrow 0 } \frac{ ( 1 + \frac{ \Delta x }{ x } )^\mu - 1 }{ \frac{ \Delta x }{ x } } x^{ \mu - 1 } \\ & = \mu x^{ \mu - 1 } \end{aligned} \]

容易发现其高阶导数是:

\[ f ( x ) = x^\alpha \Rightarrow f^{ ( n ) } ( x ) = \alpha^{ \underline{ n } } x^{ \alpha - n } \]

一般初等函数

定理:初等函数在其定义域上除了至多一个孤立点集外,可求导并且导函数也是初等函数.

单调函数的导数

定义右上导数\(D^+ f ( x_0 ) = \varlimsup_{ h \rightarrow 0 + 0 } \frac{ f ( x_0 + h ) - f ( x_0 ) }{ h }\),同理定义右下导数\(D_+\),左上导数\(D^{ - }\),左下导数\(D_-\).那么\(f ' ( x_0 )\)存在的充要条件当然是\(D_+ = D^+ = D_- = D^-\)并且有限.

下面证明单调(不妨设为单增)函数\(f : [ a , b ] \rightarrow \mathbb{ R }\)几乎处处有导数.

我们接下来尝试证明\(E_1 = \{ x \in [ a , b ] \mid D^+ f ( x ) > D_- f ( x ) \} , E_2 = \{ x \in [ a , b ] \mid D^- f ( x ) > D_+ f ( x ) \}\)两个集合是零测集.此时\(E_1 \cup E_2\)就是零测集,而\(\mathbb{ R } \setminus ( E_1 \cup E_2 )\)中的点都满足\(D^{ + } f ( x ) \leq D_- f ( x ) \leq D^- f ( x ) \leq D_+ f ( x ) \leq D^+ f ( x )\),于是它们都相等(可能等于\(+ \infty\)).

二者类似,我们下面挑选前者进行证明:

考虑设\(A_{ r , s } = \{ x | D^+ f ( x ) > r > s > D_- f ( x ) \}\),其中\(r , s\)都是正有理数(因为是单调递增).这当然是可数个集合,所以只需要证明其中任意一个是零测集就可以.我们取\(A = A_{ r , s }\),下面证明\(A\)是零测集.

反证,先假设\(A\)不是零测集,\(m^* ( A ) > 0\)且有限(最大是\(b - a\)).

首先删除\(A\)中的孤立点集.由于孤立点集是零测集,这当然不会对答案有什么影响,也不会删成空集.这样下面可以直接假设\(A\)是开集.

根据定义,存在任意小的\(h > 0\)使得\(\frac{ f ( x - h ) - f ( x ) }{ - h } < s \Rightarrow f ( x ) - f ( x - h ) < sh\),那么我们取出这些\(I_{ x , h } = [ x - h , x ]\),并且满足\(I_{ x , h } \subseteq A\).它们当然构成\(A\)的一个Vitali覆盖.

根据Vitali覆盖引理我们有\(\exists I_{ k } = [ x_k - h_k , x_k ]\)两两不交并且满足\(m^* ( A \setminus ( \bigcup I_k ) ) < \epsilon\).而考虑\(m^* ( A \setminus ( \bigcup I_k ) ) + m^* ( \bigcup I_k ) \geq m^* ( A )\),不妨令\(B = \bigcup I_k\)于是我们得到了\(m^* ( B ) > m^* ( A ) - \epsilon\).

这里我曾经以为可以直接写\(m^* ( B ) = m^* ( A )\),但实际上是不行的,因为我们\(B\)的构造依赖于\(\epsilon\).

同时由于所有的\(I_k \subseteq A\)并且两两不交,我们还有\(\sum_j h_j \leq m^* ( A ) < ( 1 + \epsilon ) m^* ( A )\).

而我们发现我们又有\(f ( x_j ) - f ( x_j - h_j ) < sh_j\),两边求和就有\(\sum f ( x_j ) - f ( x_j - h_j ) < sm^* ( A )\).

而接下来考虑\(B\),\(B\)当然仍然是一个开集.对于\(\forall y \in B\),当然应该存在一个任意小的\(k > 0\)使得\(f ( y + k ) - f ( y ) > rk\).取出这些区间\([ y , y + k ]\)当然仍然构成\(B\)的一个Vitali覆盖.类似上面,我们当然有结论\(\sum f ( y_j + k_j ) - f ( y_j ) > rm^* ( B ) > r ( m^* ( A ) - \epsilon )\).但考虑\([ y_j , y_j + k_j ]\)一定被包含在某个\([ x_j - h_j , x_j ]\)中,又根据函数的单调性,自然可以知道\(sm^* ( A ) > \sum f ( x_j ) - f ( x_j - h_j ) \geq \sum f ( y_j + k_j ) - f ( y_j ) > r ( m^* ( A ) - \epsilon )\).于是\(sm^* ( A ) \geq rm^* ( A )\),这当然导出\(m^* ( A ) = 0\),与条件不符!

接下来的修补工作是证明\(E = \{ x | f ' ( x ) = + \infty \}\)的集合是零测集.这意味着对于\(\forall N > 0 , \exists \Delta x > 0 , f ( x + \Delta x ) - f ( x ) > N \Delta x\),取\([ x , x + \Delta x ]\)当然仍然是\(E\)的一个Vitali覆盖.同样根据Vitali覆盖引理得知\(\sum \Delta x > m^* ( E ) - \epsilon\),如果\(m^* ( E ) \ne 0\),做Vitali覆盖后对\(f ( x + \Delta x ) - f ( x ) > N \Delta x\)左右两边分别求和,左边是有界,上界当然是\(f ( b ) - f ( a )\),但右边无界.这就给出矛盾了.

理解一下上面的过程的话就是,由于该单调函数定义在一个闭区间上,那么这个单调函数应该有某种最值性.这必然会限制其大小,而如果哪里的大小崩坏了导致没有导数,这些地方的外测度一定要是\(0\),不然整体的最值性无法保证.

李氏连续函数的导数

注意到李氏连续的定义\(| f ( x ) - f ( y ) | \leq L | x - y |\),注意到\(f ( x ) = f ( x ) - Lx + Lx\).

如果钦定\(x < y\),那李氏连续等价于\(f ( y ) - f ( x ) \leq | f ( x ) - f ( y ) | \leq L ( y - x ) , f ( y ) - Ly \leq f ( x ) - Lx\),于是\(f ( x ) - Lx\)是单调降函数,当然几乎处处可导,而\(Lx\)作为初等函数当然处处可导.

李氏连续几乎等价于导函数有界.

下面我们证明:如果\(f ( x )\)\([ a , b ]\)上可导,那么\(| f ' | \leq L \Leftrightarrow | f ( x_1 ) - f ( x_2 ) | \leq L | x_1 - x_2 |\).

右推左是显然的,除一下然后取极限即可.

左推右也很显然,只需用一下拉格朗日中值定理即可.

微分

\(y = f ( x )\)\(x_0\)处有定义,假设有一个常数\(A\)使得\(f ( x_0 + \Delta x ) - f ( x_0 ) = A \Delta x + o ( \Delta x ) , \Delta x \rightarrow 0\),称\(f ( x )\)\(x_0\)可微,并把\(\text{ d } f = \text{ d } y = A \Delta x\)称为\(f ( x )\)\(x_0\)处的微分,由于后半部分是一个更高阶的无穷小量,我们说微分是函数改变量的线性主要部分.

微分与导数(微商)

结合导数极限的定义,就可以得到\(\text{ d } y = f ' ( x ) \text{ d } x\),\(f ' ( x ) = \frac{ \text{ d } y }{ \text{ d } x } \\\).这就是我们将导数称作微商的原因.换言之,一阶可微一定一阶可导,反之亦然.但容易发现,可微的定义要比可导好得多,可微可以往外拓展到平面等拓扑结构,但可导不行.

一阶微分具有形式不变性.换言之就是,我们在求导的时候是需要选定一个自变量的,当选定的自变量是\(y\)的时候,根据上面自然会有\(z = g ( y ) , \text{ d } z = g ' ( y ) \text{ d } y\).

但是当选定的自变量不是\(y\)的时候,上面的形式是同样成立的.我们下面证明这个结论,令\(y = f ( x )\):

$$ \[\begin{aligned} [ g ( f ( x ) ) ] ' & = g ' ( f ( x ) ) f ' ( x ) \\ \text{ d } z & = g ' ( f ( x ) ) f ' ( x ) \text{ d } x \\ \text{ d } z & = g ' ( y ) \text{ d } y \\ \end{aligned}\]

$$

必须提出高阶微分不存在形式不变性,换句话说,\(z = g ( y )\)的二阶微分的形式不等价于\(z = g ( y = f ( x ) )\)的二阶微分,你不能乱换元.

一般将高阶微分记作\(\frac{ \text{ d }^n y }{ \text{ d } x^n }\).

导函数的性质

费马定理

如果\(f ( x )\)在邻域\(U ( \xi , \delta )\)上有定义,\(\xi\)是其的一个极值点,在\(\xi\)处存在导数,那么\(f ' ( \xi ) = 0\).

不妨考虑最大值情况,\(f ' ( \xi ) = \lim_{ \Delta x \to + 0 } \frac{ f ( \xi + \Delta x ) - f ( \xi ) }{ \Delta x } = \lim_{ \Delta x \to - 0 } \frac{ f ( \xi + \Delta x ) - f ( \xi ) }{ \Delta x }\),前者\(\leq 0\),后者\(\geq 0\),此时当然\(f ' ( \xi ) = 0\).

罗尔中值定理

如果\(f \in C [ a , b ]\)且可导,并且\(f ( a ) = f ( b )\).则\(\exists \xi \in ( a , b )\),\(f ' ( \xi ) = 0\).

即:可导函数两个零点间一定有导数的零点.

\(M\)\(f [ a , b ]\)上的最大值,\(m\)是最小值,当二者相等即常值函数的时候,当然成立.

\(M > m\)的时候,则\(M > f ( a )\)\(m < f ( a )\)至少有一个成立.不妨设\(f ( M ) > f ( a ) = f ( b )\).

根据费马定理,这个极值点的导数为\(0\).

由此可以推论:函数的零点数量\(| \{ x | f ( x ) = 0 \} | \leq 1 + | \{ x | f ' ( x ) = 0 \} |\).

这当然可以推出\(n\)次多项式至多\(n\)个实根.

事实上可以证明更强的结论,当\(c_i\)不全为\(0\)的时候,取\(n\)个不同实数\(\lambda_k\),\(f ( x ) = \sum_{ i = 1 }^n c_i x^{ \lambda_i }\)至多有\(n - 1\)个正根.

归纳法,\(n = 1\)的时候显然成立.\(n - 1\)时成立的话,考虑\(f ( x ) = 0 \Leftrightarrow x^{ - \lambda_n } f ( x ) = 0\),而后者有一项是常数项,求导后少一项.

拉格朗日中值定理

\(f \in C [ a , b ]\),并且在\(( a , b )\)上可导,\(\exists \xi \in ( a , b ) , f ' ( \xi ) = \frac{ f ( b ) - f ( a ) }{ b - a }\).

考虑先把函数放平,设\(g ( x ) = f ( x ) - \frac{ f ( b ) - f ( a ) }{ b - a } ( x - a ) - f ( a )\),容易发现\(g ( a ) = g ( b ) = 0\),根据罗尔中值定理,\(\exists \xi , g ' ( \xi ) = 0 = f ' ( \xi ) - \frac{ f ( b ) - f ( a ) }{ b - a } , f ' ( \xi ) = \frac{ f ( b ) - f ( a ) }{ b - a }\).

Example1

证明:如果\(f ' ( x ) \equiv 0 \Rightarrow f ( x ) \equiv C\).

考虑\(\forall x , y , x \ne y\),\(\forall \xi , f ' ( \xi ) = \frac{ f ( y ) - f ( x ) }{ y - x } = 0 \Rightarrow f ( x ) = f ( y )\).

Example2

证明:如果\(f ' ( x ) \equiv g ' ( x )\),那么\(f ( x ) = g ( x ) + C\).

考虑\(h ( x ) = f ( x ) - g ( x ) , h ' ( x ) \equiv 0 \Rightarrow h ( x ) = C\).

Example3

考虑对抛物线用拉格朗日中值定理,设\(f ( x ) = px^2 + qx + r\),则\(\frac{ f ( b ) - f ( a ) }{ b - a } = \frac{ p ( b^2 - a^2 ) + q ( b - a ) }{ b - a } = p ( b + a ) + q = f ' ( \frac{ a + b }{ 2 } )\).

反过来,如果恒有\(\frac{ f ( b ) - f ( a ) }{ b - a } = f ' ( \frac{ a + b }{ 2 } )\),事实上也可以推出\(f ( x )\)是抛物线.

此时我们有\(f ( x + y ) - f ( x - y ) = 2 yf ' ( x )\),取\(y = 1\),知道\(f ( x ) \in C^{ \infty }\),于是可以两边对\(y\)求两次导数,得到\(f ' ' ( x + y ) - f ' ' ( x - y ) \equiv 0\),取\(y = x\),这当然意味着\(f ' ' ( x )\)是常函数.

柯西中值定理

\(f , g \in C [ a , b ]\),并且均在\(( a , b )\)上可导,其中\(g ' ( x ) \ne 0\).则\(\exists \xi \in ( a , b )\),\(\frac{ f ( b ) - f ( a ) }{ g ( b ) - g ( a ) } = \frac{ f ' ( \xi ) }{ g ' ( \xi ) }\).

此时注意到\(g ( b ) \ne g ( a )\),原因是根据拉格朗日中值定理,如果\(g ( b ) = g ( a ) , \exists \xi \in ( a , b ) , g ' ( \xi ) = 0\),这与\(g ' ( x ) \ne 0\)矛盾.

\(F ( x ) = f ( x ) ( g ( b ) - g ( a ) ) - g ( x ) ( f ( b ) - f ( a ) )\).

接下来注意到上述命题等价于\(\exists \xi \in ( a , b ) , F ' ( \xi ) = 0\).

而注意到\(F ( a ) = f ( a ) g ( b ) - g ( a ) f ( b ) = F ( b )\),根据罗尔中值定理立刻得到答案.

然而这个东西竟然还能推广,我们有:

如果\(f , g , h \in C [ a , b ]\)并且在\(( a , b )\)上可导,\(\exists \xi \in ( a , b ) ,\)有:

\[ \left | \begin{matrix} f ' ( \xi ) & g ' ( \xi ) & h ' ( \xi ) \\ f ( a ) & g ( a ) & h ( a ) \\ f ( b ) & g ( b ) & h ( b ) \end{matrix} \right | = 0 \]

证明的话考虑构造:

\[ F ( x ) = \left | \begin{matrix} f ( x ) & g ( x ) & h ( x ) \\ f ( a ) & g ( a ) & h ( a ) \\ f ( b ) & g ( b ) & h ( b ) \end{matrix} \right | \]

注意到\(F ( a ) = F ( b ) = 0\).

广义微分中值定理
广义罗尔中值定理

如果\(f \in C [ a , b ]\)\(\forall x \in ( a , b ) , f '_\pm ( x )\)均存在,并且\(f ( a ) = f ( b ) = 0\).则\(\exists \xi \in ( a , b )\),\(f_+ ' ( \xi ) f_- ' ( \xi ) \leq 0\).

证明和罗尔中值定理没区别,仍然是找最值.

广义拉格朗日中值定理

如果\(f \in C [ a , b ]\)\(\forall x \in ( a , b ) , f '_\pm ( x )\)均存在,\(\eta = \frac{ f ( a ) - f ( b ) }{ a - b }\),则\(\exists \xi \in ( a , b )\),\(( f_+ ' ( \xi ) - \eta ) ( f_- ' ( \xi ) - \eta ) \leq 0\).

证明差不多,仍然是把函数放平然后用广义罗尔中值定理就行.

导函数与间断点

导函数不存在第一类间断点.

证明的话,考虑证明当\(f ( x )\)\(x_0\)处可导的时候,\(\exists x_n < x_0 < y_n\),使得\(x_n , y_n \rightarrow x_0\),并且满足\(\lim f ' ( x_n ) = \lim f ' ( y_n ) = f ' ( x_0 )\).

原因根据拉格朗日中值定理,\(\exists x_n \in ( x_0 - \frac{ 1 }{ n } , x_0 )\),\(f ' ( x_n ) = \frac{ f ( x_0 ) - f ( x_0 - \frac{ 1 }{ n } ) }{ \frac{ 1 }{ n } }\),直接这么取当然就是可行的.

函数的升降性

\(f \in C [ a , b ]\)并且在\(( a , b )\)上可导,\(f\)单调不减\(\Leftrightarrow\)f’(x)

左推右当然是导数定义,右推左可以用拉格朗日微分中值定理.

另外由于保号性,\(f ' ( x ) > 0 \Rightarrow f \uparrow\),但反之不成立.

函数的极值

\(f\)\(( x_0 - \delta , x_0 + \delta )\)\(n - 1\)次可导,\(\forall 1 \leq k \leq n - 1 , f^{ ( k ) } ( x_0 ) = 0\).而且\(f\)\(x_0\)处存在\(n\)阶导数并有\(f^{ ( n ) } ( x_0 ) \ne 0\).我们有以下结论:

  1. \(n\)是奇数的时候,\(x_0\)不是极值点.

  2. \(n\)是偶数且\(f^{ ( n ) } ( x_0 ) < 0\)时,\(x_0\)是极大值点.

  3. \(n\)是偶数且\(f^{ ( n ) } ( x_0 ) > 0\)时,\(x_0\)是极小值点.

证明考虑泰勒公式:

\[ \begin{aligned} f ( x ) & = f ( x_0 ) + \sum_{ k = 1 }^n \frac{ f^{ ( k ) } ( x_0 ) }{ k ! } ( x - x_0 )^k + o ( ( x - x_0 )^n ) \\ f ( x ) - f ( x_0 ) & = ( x - x_0 )^n ( \frac{ f^{ ( n ) } ( x_0 ) }{ n ! } + o ( 1 ) ) \end{aligned} \]

于是取极小邻域并且\(n\)是偶数的时候\(f ( x ) - f ( x_0 )\)\(f^{ ( n ) } ( x_0 )\)同号,上述命题立见.

达布定理

也即:导函数拥有介值性.

如果\(f\)\([ a , b ]\)上可导,\(f ' ( a ) f ' ( b ) < 0\),那么\(\exists \xi \in ( a , b ) , f ' ( \xi ) = 0\).

不妨设\(f ' ( a ) > 0 > f ' ( b )\),那么\(f\)\(a\)处附近递增,在\(b\)处附近递减.那我们取一下\(f ( \xi ) = \max_{ [ a , b ] } \{ f ( x ) \}\),那么\(\xi \ne a , \xi \ne b\),于是\(\xi \in ( a , b )\),\(f ' ( \xi ) = 0\).

那我们加个常数就可以把这个推广到导函数的介值性.

然而这个介值性比连续性弱得多,例如下面这个函数的导函数就在闭区间\([ 0 , 1 ]\)上有界但没有最值:

\[ f ( x ) = \begin{cases} - x^2 ( 1 + \sin{ \frac{ 1 }{ x } } ) & x \ne 0 \\ 0 & x = 0 \end{cases} \]

其构造思路是让其在\(0\)附近的导数在\(( - 1 , 1 )\)上下波动,这样上确界为\(1\),但\(0\)处跳出去,所以取不到\(1\).

下面这个函数更极端,其导函数在闭区间\([ 0 , 1 ]\)上无界:

\[ f ( x ) = \begin{cases} x^2 \sin{ \frac{ 1 }{ x^2 } } & x \ne 0 \\ 0 & x = 0 \end{cases} \]

其构造思路应当是让其在\(0\)处相当厉害地波动.

函数的凹凸性

定义一个函数是下凸的,若对\(\forall x_1 , x_2 \in I , \forall \lambda \in [ 0 , 1 ] , f ( \lambda x_1 + ( 1 - \lambda ) x_2 ) \leq \lambda f ( x_1 ) + ( 1 - \lambda ) f ( x_2 )\).

如果一个函数是下凸的,那么其充要条件是\(\forall x_1 , x_2 , x_3 \in I\)满足\(x_1 < x_2 < x_3\),\(\left | \begin{matrix}1 & x_1 & f ( x_1 ) \\ 1 & x_2 & f ( x_2 ) \\ 1 & x_3 & f ( x_3 )\end{matrix} \right | \geq 0\).只需设\(x_2 = \lambda x_1 + ( 1 - \lambda ) x_3\)然后简单变形即可.

不妨设\(k ( x_1 , x_2 ) = \frac{ f ( x_1 ) - f ( x_2 ) }{ x_1 - x_2 }\)也就是这里的割线斜率.还可以证明如果一个函数是下凸的,那么其充要条件是\(\forall x_1 , x_2 , x_3 \in I , x_1 < x_2 < x_3\),斜率有\(k ( x_1 , x_2 ) \leq k ( x_1 , x_3 ) \leq k ( x_2 , x_3 )\),即所谓三弦引理.这个性质容易证明,而且该性质立刻说明开区间上的有界下凸函数一定是李氏连续函数.这意味着其应当几乎处处可导.另外三弦引理还可以改为\(k ( x_1 , x_2 ) \leq k ( x_2 , x_3 )\),原因是中间项一定是两项的带权平均.

另外显然的是:

  1. 如果\(f\)可导,那么\(f\)下凸\(\Leftrightarrow\)f’

  2. 如果\(f\)可二阶导,那么\(f\)下凸\(\Leftrightarrow\)f’’

如果\(f ( x )\)\(x_0\)附近连续并且在\(x_0\)左右小邻域内凸性相反,称其为\(f ( x )\)的一个拐点.

容易说明\(f ' ' ( x_0 ) = 0\)是拐点的必要条件,原因是拐点处\(f ' ( x )\)的增减性相反,\(x_0\)必定是\(f ' ( x )\)的极值点.由此还可以套用之前的极值点结论:

\(f\)\(( a , b )\)\(n\)次可导,\(\exists x_0 \in ( a , b ) , \forall 1 \leq k \leq n - 1 , f^{ ( k ) } ( x_0 ) = 0\).并且\(\forall x \in ( a , b ) , f^{ ( n ) } ( x ) > 0\)我们有以下结论:

  1. \(n\)是奇数的时候,\(f ( x )\)是严格单增函数.

  2. \(n\)是偶数的时候,\(f ( x )\)是严格下凸函数.

但上述条件疑似有点过强,能不能放弱一点呢?

可以发现一个在开区间\(( a , b )\)上的函数是下凸的充要条件应当是以下条件同时成立:

  1. \(\forall x \in ( a , b )\),\(f '_\pm ( x )\)均存在,并且\(f '_- ( x ) \leq f '_+ ( x )\).

  2. \(\forall x_1 , x_2 \in ( a , b ) , x_1 < x_2\),\(f '_+ ( x_1 ) \leq f '_- ( x_2 )\).

必要性几乎是显然的,只需用三弦引理然后在每个点都卡一下极限就行.

充分性略有麻烦.考虑反证,只需反推三弦引理即可.设其不是凸的,那就\(\exists x_1 , x_2 , x_3 \in ( a , b ) , x_1 < x_2 < x_3 , k ( x_1 , x_2 ) > k ( x_2 , x_3 )\).不妨设\(\eta_1 = k ( x_1 , x_2 ) , \eta_2 = k ( x_2 , x_3 )\)那么根据广义拉格朗日中值定理,\(\exists \xi_1 \in ( x_1 , x_2 ) , \xi_2 \in ( x_2 , x_3 )\),使得\(( f_+ ' ( \xi_1 ) - \eta_1 ) ( f '_- ( \xi_1 ) - \eta_1 ) \leq 0 , ( f_+ ' ( \xi_2 ) - \eta_2 ) ( f '_- ( \xi_2 ) - \eta_2 ) \leq 0\).

立刻得到\(f '_+ ( \xi_1 ) \geq \eta_1 \geq f_- ' ( \xi_1 ) , f '_+ ( \xi_2 ) \geq \eta_2 \geq f_- ' ( \xi_2 )\),由于\(\eta_1 > \eta_2\),所以\(f '_+ ( \xi_1 ) \geq \eta_1 > \eta_2 \geq f '_- ( \xi_2 )\),但\(\xi_1 < \xi_2\),这就出现了矛盾.

还可以证明下凸函数除了可数个点以外都可导,并且几乎处处有二阶导数.

这个怎么证明呢?考虑由(1)(2),可以发现\(f '_+ ( x )\)\(f_- ' ( x )\)都是单调函数,那么除了可数个点以外它们均连续,而它们在连续处必定可导,原因是\(f_+ ' ( x_0 - \epsilon ) \leq f '_- ( x_0 ) \leq f '_+ ( x_0 )\),夹逼一下就可以了.而这样的话其导数单调,于是处处二阶可导.

由此还可以发现:\(f\)在开区间\(I\)上,是下凸的等价于:

  1. \(\forall x_0 \in I , f '_\pm ( x_0 )\)存在.

  2. \(\forall x \in I , f ( x ) \geq f ( x_0 ) + f '_\pm ( x_0 ) ( x - x_0 )\).

必要性:

考虑已知凸函数,只需证明\(f ( x ) - f ( x_0 ) \geq f '_\pm ( x_0 ) ( x - x_0 )\).不妨假设\(x > x_0\)(另一方向同理),于是只需证明\(\frac{ f ( x ) - f ( x_0 ) }{ x - x_0 } \geq f '_\pm ( x_0 )\),用广义拉格朗日微分中值定理立刻得见此成立.

充分性:

任取两点\(x_1 , x_2 \in I , x_1 < x_2\),有\(\frac{ f ( x_2 ) - f ( x_1 ) }{ x_2 - x_1 } \geq f_- ' ( x_1 )\),那么左边那个东西取极限得到\(f '_+ ( x_1 )\),这样就说明了任何一个点都有\(f '_+ ( x ) \geq f '_- ( x )\).

接下来仍然容易得到:

\[ \begin{aligned} f ( x_2 ) & \geq f ( x_1 ) + f '_+ ( x_1 ) ( x_2 - x_1 ) \\ f ( x_1 ) & \geq f ( x_2 ) + f '_- ( x_2 ) ( x_1 - x_2 ) \end{aligned} \]

由上述式子立刻得到\(f_+ ' ( x_1 ) ' \leq f_- ' ( x_2 )\).这样就证明了充分性.

经典不等式

琴生不等式

如果\(f\)在区间\(I\)上是下凸的,则\(\forall x_i \in I , \lambda_i \in [ 0 , 1 ] , \sum \lambda_i = 1\),那么\(f ( \sum \lambda_i x_i ) \leq \sum \lambda_i f ( x_i )\).从几何角度来看,这意味着在\(f ( \sum \lambda_i x_i )\)处作的切线位于原函数下方.所以函数如果是上凸的话不等号要反向.

当所有\(x_i\)均相等的时候显然成立.

不然考虑直接取\(x_0 = \sum \lambda_i x_i\),此时发现\(x_0\)一定在区间内部.于是我们知道\(f ( x_i ) \geq f ( x_0 ) + f '_+ ( x_0 ) ( x_i - x_0 )\),求和得到\(\sum \lambda_i f ( x_i ) \geq f ( x_0 ) + f_+ ' ( x_0 ) \sum \lambda_i ( x_i - x_0 ) = f ( x_0 )\),这样就证毕了.

容易将琴生不等式推广到积分形式,当\(\varphi ( x )\)是下凸连续函数的时候,当然有\(\varphi ( \int_0^1 f \text{ d } x ) \leq \int_0^1 \varphi ( f ( x ) ) \text{ d } x\),证明只需对黎曼和求极限.

Example1

证明:圆内接\(n\)边形以正\(n\)边形面积和周长最大.

不妨设其为单位元,用圆心向顶点连边,会得到一圈圆心角\(\alpha_1 , \ldots , \alpha_n\),它们之和应当是\(2 \pi\)并且范围均在\(( 0 , \pi ]\)里(原因是圆心肯定得包含在正\(n\)边形里,不然肯定不算大),此范围内\(\sin\)是下凸函数,那么\(S = \frac{ 1 }{ 2 } \sum \sin \alpha_i \leq \frac{ n }{ 2 } \sin \frac{ \sum \alpha_i }{ n } = \frac{ n }{ 2 } \sin \frac{ 2 \pi }{ n }\),\(L = 2 \sum \sin \frac{ \alpha_i }{ 2 } \leq 2 n \sin \frac{ \sum \alpha_i }{ 2 n } = 2 n \sin \frac{ \pi }{ n }\).

同理还可以证明圆外接\(n\)边形以正\(n\)边形面积和周长最小,证明可以考虑取切线然后用\(\tan\)的凸性.

均值不等式

\(x_i > 0\)时:

\[ \frac{ n }{ \sum \frac{ 1 }{ x_i } } \leq ( \prod x_i )^{ \frac{ 1 }{ n } } \leq \frac{ \sum x_i }{ n } \]

\(f ( x ) = \ln x\),\(f ( x )\)是上凸的,于是\(\ln \frac{ \sum x_i }{ n } \geq \frac{ 1 }{ n } \sum \ln x_i\),右边得证,取倒数得到左边.

柯西-赫尔德不等式

\(a_i , b_i > 0\)并且\(\frac{ 1 }{ p } + \frac{ 1 }{ q } = 1\)时,有\(\sum a_i b_i \leq ( \sum a_i^p )^{ \frac{ 1 }{ p } } ( \sum b_i^q )^{ \frac{ 1 }{ q } }\).其特例给出柯西不等式.

套用琴生不等式,取\(f ( x ) = x^{ \frac{ 1 }{ q } } , \lambda_i = \frac{ a_i^p }{ \sum_j a_j^p } , x_i = \frac{ b_i^q }{ a_i^p }\),容易发现\(f ( x )\)上凸.

这样就会得到:

$$ \[\begin{aligned} f ( \sum \lambda_i x_i ) & \geq \sum \lambda_i f ( x_i ) \\ ( \sum_i \frac{ b_i^q }{ \sum_j a_j^p } )^{ \frac{ 1 }{ q } } & \geq \sum_i \frac{ a_i b_i }{ \sum_j a_j^p } \\ \end{aligned}\]

$$

化简一下就可以了.

在这里也可以将此形式拓展到积分形式,注意到当\(\frac{ 1 }{ p } + \frac{ 1 }{ q } = 1\)时,\(a^{ \frac{ 1 }{ p } } b^{ \frac{ 1 }{ q } } = e^{ \frac{ \ln a }{ p } + \frac{ \ln b }{ q } } \leq \frac{ a }{ p } + \frac{ b }{ q }\),原因是琴生不等式.

此时令\(F = ( \int_a^b | f ( x ) |^p \text{ d } x )^{ \frac{ 1 }{ p } } , G = ( \int_a^b | g ( x ) |^q \text{ d } x )^{ \frac{ 1 }{ q } }\),再令\(a = \frac{ | f ( x ) |^p }{ F^p } , b = \frac{ | g ( x ) |^q }{ G^q }\),根据上面的不等式立刻得到\(\frac{ | f ( x ) g ( x ) | }{ FG } \leq \frac{ a }{ p } + \frac{ b }{ q }\),此时做两边积分,注意到\(\int a = \int b = 1\),立刻得到\(( \int_a^b | f ( x ) |^p \text{ d } x )^{ \frac{ 1 }{ p } } ( \int_a^b | g ( x ) |^q \text{ d } x )^{ \frac{ 1 }{ q } } \geq \int_a^b | f ( x ) g ( x ) | \text{ d } x\).

闵可夫斯基(Minkovski)不等式

\(x_i , y_i \geq 0 , p \geq 1\),则\(( \sum ( x_i + y_i )^p )^{ \frac{ 1 }{ p } } \leq ( \sum x_i^p )^{ \frac{ 1 }{ p } } + ( \sum y_i^p )^{ \frac{ 1 }{ p } }\).这其实揭示了某种度量下的三角形不等式.

套用琴生不等式,取\(f ( x ) = ( 1 - x^{ \frac{ 1 }{ p } } )^p , x \in ( 0 , 1 )\).求导得到\(f ' ( x ) = - ( 1 - x^{ \frac{ 1 }{ p } } )^{ p - 1 } x^{ \frac{ 1 }{ p } - 1 }\),再来一次化简得到\(f ' ' ( x ) = ( 1 - \frac{ 1 }{ p } ) ( 1 - x^{ \frac{ 1 }{ p } } )^{ p - 2 } x^{ \frac{ 1 }{ p } - 2 } \geq 0\).于是\(f ( x )\)下凸.

\(\lambda_i = \frac{ ( x_i + y_i )^p }{ \sum_j ( x_j + y_j )^p }\),\(u_i = ( \frac{ x_i }{ x_i + y_i } )^p\).这样得到:

\[ \begin{aligned} ( 1 - \frac{ ( \sum x_i^p )^{ \frac{ 1 }{ p } } }{ ( \sum_j ( x_j + y_j )^p )^{ \frac{ 1 }{ p } } } )^p & \leq \sum_i \frac{ ( x_i + y_i )^p }{ \sum_j ( x_j + y_j )^p } ( \frac{ y_i }{ x_i + y_i } )^p \\ ( ( \sum ( x_i + y_i )^p )^{ \frac{ 1 }{ p } } - ( \sum x_i^p )^{ \frac{ 1 }{ p } } )^p & \leq \sum y_i^p \end{aligned} \]

化简一下就做完了.

洛必达法则

来看几个抽象的问题:

  1. \(\infty - \infty\).

  2. \(0 \times \infty\).

  3. \(\frac{ 0 }{ 0 }\).

  4. \(\frac{ \infty }{ \infty }\).

  5. \(0^0\).

  6. \(1^\infty\).

  7. \(\infty^0\).

(1)可以写成\(\infty ( 1 - \frac{ \infty }{ \infty } )\),这样就转化成了(4)和(2).

(2)可以写成\(\frac{ 0 }{ \frac{ 1 }{ \infty } }\),就转化成了(3).

(5)可以写成\(e^{ 0 \ln 0 }\),就转化成了(2).

(6)可以写成\(e^{ \infty \ln 1 }\),就转化成了(2).

(7)可以写成\(e^{ 0 \ln \infty }\),就转化成了(2).

这样的话我们只需要解决俩问题就行了,也就是\(\frac{ 0 }{ 0 }\)\(\frac{ \infty }{ \infty }\).

0/0型

如果\(f , g\)\(U_0 ( a , \delta )\)上可导,\(g ' ( x ) \ne 0\),\(\lim_{ x \rightarrow a } f ( x ) = \lim_{ x \rightarrow a } g ( x ) = 0\).那么若\(\lim_{ x \rightarrow a } \frac{ f ' ( x ) }{ g ' ( x ) } = k \Rightarrow \lim_{ x \rightarrow a } \frac{ f ( x ) }{ g ( x ) } = k\).

这个只需要定义\(f ( a ) = g ( a ) = 0\),这样这俩函数就连续了.然后直接跑柯西中值定理就可以对\(\frac{ f ( x ) - f ( a ) }{ g ( x ) - g ( a ) } = \frac{ f ' ( \xi ) }{ g ' ( \xi ) }\).

这里可以看出洛必达法则是单向的,因为我们取得\(\xi\)并不是连续变化的,只是取了一个\(\rightarrow 0\)\(\xi\)的子列.

而如果\(a = \infty\),那就考虑取\(t \rightarrow 0\),然后把\(x\)换成\(\frac{ 1 }{ t }\),做复合函数求导即可,结论无差异.

\(\infty\)/\(\infty\)

如果\(f , g\)\(U_0 ( a , \delta )\)上可导,\(g ' ( x ) \ne 0\),\(\lim_{ x \rightarrow a } g ( x ) = \infty\).那么若\(\lim_{ x \rightarrow a } \frac{ f ' ( x ) }{ g ' ( x ) } = k \Rightarrow \lim_{ x \rightarrow a } \frac{ f ( x ) }{ g ( x ) } = k\).

这个证明麻烦一点,先来讨论\(k \ne \pm \infty\)的情况.

考虑\(\forall \epsilon > 0\),\(\exists \delta > 0 , \forall \xi \in ( a , a + \delta )\),应当有\(k - \epsilon < \frac{ f ' ( \xi ) }{ g ' ( \xi ) } < k + \epsilon\),那么\(\forall x \in ( a , a + \delta )\),取\(x_1 = a + \delta\)当然有:

\[ \begin{aligned} \frac{ f ( x ) - f ( x_1 ) }{ g ( x ) - g ( x_1 ) } & = \frac{ f ' ( \xi ) }{ g ' ( \xi ) } \\ \frac{ f ( x ) }{ g ( x ) } & = \frac{ f ' ( \xi ) }{ g ' ( \xi ) } ( 1 - \frac{ g ( x_1 ) }{ g ( x ) } ) + \frac{ f ( x_1 ) }{ g ( x ) } \end{aligned} \]

两边取极限就做完了.

\(k = \pm \infty\)的时候容易发现上面那个还能用.

泰勒公式

\(f ( x )\)\(x_0\)处有\(n\)阶导数,则泰勒公式声称\(x \rightarrow x_0\)\(f ( x ) = \sum_{ k = 0 }^n f^{ ( k ) } ( x_0 ) \frac{ ( x - x_0 )^k }{ k ! } + o ( ( x - x_0 )^n )\),其中\(o ( ( x - x_0 )^n )\)称作皮亚诺余项.特别地,当\(x_0 = 0\)的时候,称其为麦克劳林公式.

要证明这个式子只需证明\(\lim_{ x \rightarrow x_0 } \frac{ f ( x ) - \sum_{ k = 0 }^n f^{ ( k ) } ( x_0 ) \frac{ ( x - x_0 )^k }{ k ! } }{ ( x - x_0 )^n } = 0\).对上下分别用\(n - 1\)次洛必达法则后,那么只需要证明\(\lim_{ x \rightarrow x_0 } \frac{ f^{ ( n - 1 ) } ( x ) - f^{ ( n - 1 ) ( x_0 ) } }{ ( x - x_0 ) } - f^{ ( n ) } ( x_0 ) = 0\).而这当然就是导数的定义,于是就证毕了.

拉格朗日余项

\(f ( x )\)\(( a , b )\)上有\(n + 1\)阶导数,并且\(f ( x ) \in C^n [ a , b ]\),泰勒公式有\(f ( x ) = \sum_{ k = 0 }^n f^{ ( k ) } ( x_0 ) \frac{ ( x - x_0 )^k }{ k ! } + \frac{ f^{ ( n + 1 ) } ( \xi ) }{ ( n + 1 ) ! } ( x - x_0 )^{ n + 1 }\),其中\(\xi \in ( x_0 , x )\).一般将\(\frac{ f^{ ( n + 1 ) } ( \xi ) }{ ( n + 1 ) ! } ( x - x_0 )^{ n + 1 }\)称作拉格朗日余项.

证明的话,考虑对于一个固定的\(x\),构造\(F ( t ) = f ( x ) - \sum_{ k = 0 }^n f^{ ( k ) } ( t ) \frac{ ( x - t )^k }{ k ! }\),\(G ( t ) = ( x - t )^{ n + 1 }\).这里之所以固定\(x\)而移动\(x_0\)的原因是,如果反过来固定则求导就不能实现下面的错项相消.不难发现\(F ( x ) = G ( x ) = 0\),此时考虑必定有一个\(\xi \in ( x_0 , x )\)满足\(\frac{ F ' ( \xi ) }{ G ' ( \xi ) } = \frac{ F ( x_0 ) - F ( x ) }{ G ( x_0 ) - G ( x ) } = \frac{ F ( x_0 ) }{ G ( x_0 ) }\).

这个时候研究一下他们的导数,注意到\(G ' ( t ) = - ( n + 1 ) ( x - t )^{ n }\),\(F ' ( t ) = - \sum_{ k = 0 }^n f^{ ( k + 1 ) } ( t ) \frac{ ( x - t )^k }{ k ! } + \sum_{ k = 1 }^n f^{ ( k ) } ( t ) \frac{ ( x - t )^{ k - 1 } }{ ( k - 1 ) ! } = - f^{ ( n + 1 ) } ( t ) \frac{ ( x - t )^n }{ n ! }\).

于是\(\frac{ F ( x_0 ) }{ G ( x_0 ) } = \frac{ f^{ ( n + 1 ) } ( \xi ) }{ ( n + 1 ) ! }\),\(F ( x_0 ) = \frac{ f^{ ( n + 1 ) } ( \xi ) }{ ( n + 1 ) ! } ( x - x_0 )^{ n + 1 }\).

下面给出一些常见的泰勒展开公式(其中\(0 < \theta < 1\)):

  1. \(e^x = \sum_{ k = 0 }^n \frac{ x^k }{ k ! } + \frac{ e^{ \theta x } x^{ n + 1 } }{ ( n + 1 ) ! } = 1 + \frac{ x }{ 1 ! } + \frac{ x^2 }{ 2 ! } + \frac{ x^3 }{ 3 ! } + o ( x^3 )\).

  2. \(\sin x = \sum_{ k = 0 }^{ n } \frac{ ( - 1 )^k x^{ 2 k + 1 } }{ ( 2 k + 1 ) ! } + ( - 1 )^{ n + 1 } \frac{ \cos \theta x }{ ( 2 n + 3 ) ! } x^{ 2 n + 3 } = x - \frac{ 1 }{ 3 ! } x^3 + o ( x^4 )\).

  3. \(\cos x = \sum_{ k = 0 }^n \frac{ ( - 1 )^k x^{ 2 k } }{ ( 2 k ) ! } + ( - 1 )^{ n + 1 } \frac{ \cos \theta x }{ ( 2 n + 2 ) ! } x^{ 2 n + 2 } = 1 - \frac{ 1 }{ 2 ! } x^2 + \frac{ 1 }{ 4 ! } x^4 + o ( x^5 )\).

  4. \(\tan x = x + \frac{ 1 }{ 3 } x^3 + \frac{ 2 }{ 15 } x^5 + o ( x^6 )\).

  5. \(\ln ( 1 + x ) = \sum_{ k = 1 }^n \frac{ ( - 1 )^{ k - 1 } x^k }{ k } + ( - 1 )^n \frac{ x^{ n + 1 } }{ ( n + 1 ) ( 1 + \theta x )^{ n + 1 } } = x - \frac{ 1 }{ 2 } x^2 + \frac{ 1 }{ 3 } x^3 + o ( x^3 )\).

  6. \(( 1 + x )^\alpha = \sum_{ k = 0 }^n \frac{ \alpha^{ \underline{ k } } }{ k ! } x^k + \frac{ \alpha^{ \underline{ n + 1 } } }{ ( n + 1 ) ! } ( 1 + \theta x )^{ \alpha - n - 1 } x^{ n + 1 }\).

解析函数

不妨设\(f_n ( x , x_0 ) = \sum_{ k = 0 }^n f^{ ( k ) } ( x_0 ) \frac{ ( x - x_0 )^k }{ k ! }\).我们称\(f\)\(x_0\)处解析,若\(\exists \delta > 0\),\(\lim_{ n \rightarrow \infty } f_n ( x , x_0 ) = f ( x )\),也即泰勒展式在一个邻域上可以逼近原函数.

如果其在\(( a , b )\)上任何一点都解析,那么称其在\(( a , b )\)上解析,记作\(f \in C^\omega ( a , b )\).

解析函数应当有如下性质:

  1. \(f , g\)\(x_0\)处解析,那么\(f , g\)的四则运算在\(x_0\)处也解析.

  2. \(f , g\)均解析,并且\(f \circ g\)有意义,那么\(f \circ g\)也解析.

  3. \(f\)\(x_0\)处解析,那么\(f^{ - 1 }\)\(f ( x_0 )\)处解析.

  4. 初等函数基本是解析函数.

对于(1):

\(f \pm g\)当然是平凡的,至于\(fg\)\(\frac{ f }{ g }\)如何证明解析性,我们回头再说.

对于(2):

回头再说.

拉格朗日插值

构造多项式\(P_n = \sum_{ i = 0 }^{ n } y_i ( \prod_{ j = 0 \land j \ne i }^{ n } \frac{ x - x_j }{ x_i - x_j } ) \\\).显然当\(x = x_i\)时,该多项式的答案为\(y_i\).

用这个在一个\(n + 1\)次可导的函数\(f \in C ( a , b )\)上打\(n + 1\)个点并且取出这个多项式\(P_n\),考虑它们的误差.取\(\omega ( x ) = \prod_{ k = 0 }^n ( x - x_k )\),事实上有:\(\exists \xi \in ( a , b ) , f ( x ) = P_n ( x ) + \frac{ f^{ ( n + 1 ) } ( \xi ) }{ ( n + 1 ) ! } \omega ( x )\).

\(h ( t ) = f ( t ) - P_n ( t )\),考虑对于一个固定的\(x \ne x_i\),取\(g ( t ) = \frac{ h ( x ) }{ \omega ( x ) } \omega ( t ) - h ( t )\).注意到\(g ( x ) = 0 , g ( x_i ) = 0\),所以\(g\)\(n + 2\)个零点,所以\(g^{ ( n + 1 ) }\)一定有一个零点,记为\(\xi\).

那么我们就有\(g^{ ( n + 1 ) } ( \xi ) = \frac{ h ( x ) }{ \omega ( x ) } ( n + 1 ) ! - f^{ ( n + 1 ) } ( \xi ) = 0\).上述命题就得证了.

那么怎么样能让\(\omega ( x )\)这个东西的最大值尽可能小呢?

我们定义所谓\(n\)次切比雪夫多项式\(f\),使得对于任何一个首项为\(1\)的多项式\(T_n\),\(\max_{ ( a , b ) } | T_n | \geq \max_{ ( a , b ) } | f |\).

事实上\([ - 1 , 1 ]\)上的切比雪夫多项式可以用递推关系描述:

\[ P_n = \begin{cases} 1 & n = 0 \\ x & n = 1 \\ x^2 - \frac{ 1 }{ 2 } & n = 2 \\ xP_{ n - 1 } - \frac{ 1 }{ 4 } P_{ n - 2 } & \text{ otherwise } \end{cases} \]

还可以写成\(P_n = \frac{ 1 }{ 2^{ n - 1 } } \cos ( n \arccos x )\).

函数的作图

渐近线

如果对于一个函数\(y = f ( x )\),存在一条直线\(l\)使得函数上一点\(P ( x , f ( x ) )\)距离原点距离\(\to + \infty\)的时候,\(( x , f ( x ) )\)\(l\)的距离\(\to 0\).

大概可以有以下几类渐近线:

  1. 水平渐近线:\(f ( + \infty ) = C\)\(f ( - \infty ) = C\).

  2. 垂直渐近线:\(f ( x_0 - 0 ) = \infty\)\(f ( x_0 + 0 ) = \infty\).

  3. 斜渐近线:\(l = kx + b\),那么\(\lim_{ x \to + \infty } \frac{ f ( x ) }{ x } = a , \lim_{ x \to \infty } ( f ( x ) - ax ) = b\).

作图
  1. 确定定义域和值域.

  2. 研究其奇偶性,周期性.

  3. 研究\(f ' ( x ) = 0\)的根以确定极值点和升降区间.

  4. 研究\(f ' ' ( x ) = 0\)的根找出拐点.

  5. 求出渐近线.

牛顿迭代

目的是找到一个函数\(f\)的零点,尝试取上面任何一点并作切线,找到切线与\(x\)轴的交点.或者说任取\(x_0\),取\(x_{ n + 1 } = x_n - \frac{ f ( x_n ) }{ f ' ( x_n ) }\).

我们需要证明这个做法的正确性,事实上:

如果\(f ' , f ' '\)\([ a , b ]\)上非零,\(\exists c \in [ a , b ] , f ( c ) = 0\),那我们取\(x_0 \in [ a , b ]\)满足\(f ( x_0 ) f ' ' ( x_0 ) > 0\),那么取\(x_{ n + 1 } = x_n - \frac{ f ( x_n ) }{ f ' ( x_n ) }\)的数列\(\{ x_n \} \rightarrow c\).事实上:

  1. \(f ' f ' ' > 0\),\(x_n\)单调下降趋近于\(c\).

  2. \(f ' f ' ' < 0\),\(x_n\)单调上升趋近于\(c\).

并且\(| x_n - c | \sim O ( 2^{ - 2^n } )\).

上述讨论情况有点多,我们下面只讨论其中一种进行证明:

\(f ' > 0 , f ' ' > 0\)的时候,\(f\)是一个单调上升的下凸函数.容易发现这个数列单调下降并且应当大于\(c\),那它就有极限,两边取极限得知\(\lim_{ n \to \infty } f ( x_n ) = 0\).

接下来看一下逼近速度,泰勒公式展开一下知道\(0 = f ( c ) = f ( x_n ) + f ' ( x_n ) ( c - x_n ) + \frac{ f ' ' ( \xi ) }{ 2 } ( c - x_n )^2\).从上面的结果容易看出\(n \geq 1\)的时候,\(| x_{ n + 1 } - c | = \frac{ | f ( x_n ) + f ' ( x_n ) ( c - x_n ) | }{ | f ' ( x_n ) | } = \frac{ f ' ' ( \xi ) }{ 2 | f ' ( x_n ) | } ( c - x_n )^2\).前面那个系数是有界的,可以看作一个常数.于是这一次的误差应当是上一次误差的平方级别.

积分

不定积分

如果存在可导函数\(F\)满足\(F ' ( x ) = f ( x )\),则称一个函数\(f\)可积的,\(F ( x )\)\(f ( x )\)原函数,或称其为\(f ( x )\)的不定积分.

我们之前已经证明过导数相等的两个函数最多只差一个常数,因此一个函数的原函数是有唯一的\(F ( x ) + C\)的形式的.

不定积分的运算

只给出以下两个运算法则:

\[ \begin{aligned} \int ( f ( x ) \pm g ( x ) ) \text{ d } x & = \int f ( x ) \text{ d } x \pm \int g ( x ) \text{ d } x \\ \int \alpha f ( x ) \text{ d } x & = \alpha \int f ( x ) \text{ d } x \end{aligned} \]

积分表
  1. \(\int x^\alpha \text{ d } x = \frac{ x^{ \alpha + 1 } }{ \alpha + 1 } + C , \alpha \ne - 1\).

  2. \(\int \frac{ \text{ d } x }{ x } = \ln | x | + C\).

  3. \(\int e^x \text{ d } x = e^x + C\).

  4. \(\int \cos x \text{ d } x = \sin x + C\).

  5. \(\int \sin x \text{ d } x = - \cos x + C\).

  6. \(\int \frac{ \text{ d } x }{ \cos^2 x } = \tan x + C\).

  7. \(\int \frac{ \text{ d } x }{ \sin^2 x } = - \cot x + C = - \frac{ 1 }{ \tan x } + C\).

  8. \(\int \frac{ \text{ d } x }{ 1 + x^2 } = \arctan x + C\).

  9. \(\int \frac{ \text{ d } x }{ \sqrt{ 1 - x^2 } } = \arcsin x + C\).

  10. \(\int \frac{ \text{ d } x }{ \sqrt{ x^2 \pm a^2 } } = \ln | x + \sqrt{ x^2 \pm a^2 } | + C\).

  11. \(\int \sqrt{ a^2 - x^2 } \text{ d } x = \frac{ 1 }{ 2 } ( x \sqrt{ a^2 - x^2 } + a^2 \arcsin \frac{ x }{ a } ) + C\).

  12. \(\int \sqrt{ x^2 \pm a^2 } \text{ d } x = \frac{ 1 }{ 2 } ( x \sqrt{ x^2 \pm a^2 } \pm a^2 \ln | x + \sqrt{ x^2 \pm a^2 } | ) + C\).

换元法

第一换元法:设\(\int g ( t ) \text{ d } t = G ( t ) + C\),\(w ( x )\)可导,则\(\int g ( w ( x ) ) w ' ( x ) \text{ d } x = G ( w ( x ) ) + C\).证明只需对右边求导即可.

第二换元法:设\(x ( t )\)可导,且有反函数\(t ( x )\),那么如果\(\int f ( x ( t ) ) x ' ( t ) \text{ d } t = G ( t ) + C\),则\(\int f \text{ d } x = G ( t ( x ) ) + C\).

Example1

\(I_n = \int \tan^n x \text{ d } x\).

注意到:

\[ \begin{aligned} I_n & = \int \tan^{ n - 2 } ( \frac{ 1 }{ \cos^2 x } - 1 ) \text{ d } x \\ & = \int \tan^{ n - 2 } x ( \text{ d } \tan x ) - I_{ n - 2 } \\ & = \frac{ \tan^{ n - 1 } x }{ n - 2 } - I_{ n - 2 } \end{aligned} \]

边界条件的话\(I_0 = x + C , I_1 = \int \frac{ \sin x }{ \cos x } \text{ d } x = - \int \frac{ 1 }{ \cos x } ( \text{ d } \cos x ) = - \ln ( \cos x ) + C\).

分部积分

我们应当有\(( uv ) ' = u ' v + v ' u\),两边积分得到\(uv = \int u ' v \text{ d } x + \int v ' u \text{ d } x\),变形得到\(\int v \text{ d } u = uv - \int u \text{ d } v\).

Example1

\(I_n = \int \cos^n x \text{ d } x\).

注意到:

\[ \begin{aligned} I_n & = \int \cos^{ n - 1 } x ( \text{ d } \sin x ) \\ & = \cos^{ n - 1 } x \sin x + ( n - 1 ) \int \sin^2 x \cos^{ n - 2 } x \text{ d } x \\ & = \cos^{ n - 1 } x \sin x + ( n - 1 ) \int ( 1 - \cos^2 x ) \cos^{ n - 2 } x \text{ d } x \\ & = \cos^{ n - 1 } \sin x + ( n - 1 ) I_{ n - 2 } - ( n - 1 ) I_n \end{aligned} \]

整理得到\(I_n = \frac{ 1 }{ n } \cos^{ n - 1 } x \sin x + \frac{ n - 1 }{ n } I_{ n - 2 }\).

边界条件当然是\(I_0 = x + C , I_1 = \sin x + C\).

Example2

\(I_n = \int \frac{ \text{ d } x }{ \cos^n x }\).

注意到:

\[ \begin{aligned} I_n & = \int \frac{ \text{ d } \tan x }{ \cos^{ n - 2 } x } \\ & = \frac{ \tan x }{ \cos^{ n - 2 } x } - \int \tan x ( \text{ d } \cos^{ 2 - n } x ) \\ & = \frac{ \tan x }{ \cos^{ n - 2 } x } + ( 2 - n ) \int \cos^{ - n } x \sin^2 x \text{ d } x \\ & = \frac{ \tan x }{ \cos^{ n - 2 } x } + ( 2 - n ) \int \cos^{ - n } x ( 1 - \cos^2 x ) \text{ d } x \\ & = \frac{ \tan x }{ \cos^{ n - 2 } x } + ( 2 - n ) I_n - ( 2 - n ) I_{ n - 2 } \end{aligned} \]

整理得到\(I_n = \frac{ 1 }{ n - 1 } \frac{ \tan x }{ \cos^{ n - 2 } x } + \frac{ n - 2 }{ n - 1 } I_{ n - 2 }\).

Example3

\(I_{ m , n } = \int \sin^m x \cos ( nx ) \text{ d } x\),其中\(m < n\).

注意到:

\[ \begin{aligned} I_{ m , n } & = \int \sin^m x \cos ( nx ) \text{ d } x \\ & = \frac{ 1 }{ n } \int \sin^m x \text{ d } \sin ( nx ) \\ & = \frac{ 1 }{ n } \left ( \sin^m x \sin ( nx ) - \frac{ m }{ n } \int \sin ( nx ) \sin^{ m - 1 } x \cos x \text{ d } x \right ) \end{aligned} \]

然后观察到:

\[ \begin{aligned} & \int \sin ( nx ) \sin^{ m - 1 } x \cos x \text{ d } x \\ = & - \frac{ 1 }{ n } \int \sin^{ m - 1 } x \cos x \text{ d } \cos ( nx ) \\ = & - \frac{ 1 }{ n } ( \cos ( nx ) \sin^{ m - 1 } x \cos x - \int \cos ( nx ) ( \text{ d } \sin^{ m - 1 } x \cos x ) ) \end{aligned} \]

观察到:

\[ \begin{aligned} & \int \cos ( nx ) ( \text{ d } \sin^{ m - 1 } x \cos x ) \\ = & \int \cos ( nx ) ( - \sin^{ m } + ( m - 1 ) \sin^{ m - 2 } x \cos^2 x ) \text{ d } x \\ = & \int \cos ( nx ) ( ( m - 1 ) \sin^{ m - 2 } x - m \sin^m x ) ) \text{ d } x \\ = & ( m - 1 ) I_{ m - 2 , n } - mI_{ m , n } \end{aligned} \]

往回倒腾倒腾,边界条件是:

\[ \begin{aligned} I_{ 0 , n } & = \int \cos ( nx ) \text{ d } x = \frac{ \sin ( nx ) }{ n } + C \\ I_{ 1 , n } & = \int \sin x \cos ( nx ) \text{ d } x \\ & = \frac{ 1 }{ 2 } \int ( \sin ( ( n + 1 ) x ) - \sin ( ( n - 1 ) x ) ) \text{ d } x \\ & = \frac{ 1 }{ 2 } ( \frac{ - \cos ( ( n + 1 ) x ) }{ n + 1 } + \frac{ \cos ( ( n - 1 ) x ) }{ n - 1 } ) + C \end{aligned} \]

Example4

\(I_n = \int \frac{ \text{ d } x }{ ( x^2 + a^2 )^n }\).

注意到:

\[ \begin{aligned} I_n & = \frac{ x }{ ( x^2 + a^2 )^n } - \int x \text{ d } \frac{ 1 }{ ( x^2 + a^2 )^n } \\ & = \frac{ x }{ ( x^2 + a^2 )^n } + 2 n \int \frac{ x^2 + a^2 - a^2 }{ ( x^2 + a^2 )^{ n + 1 } } \text{ d } x \\ & = \frac{ x }{ ( x^2 + a^2 )^n } + 2 nI_{ n } - 2 a^2 nI_{ n + 1 } \end{aligned} \]

边界是\(I_1 = \frac{ 1 }{ a } \arctan \frac{ x }{ a } + C\).

Example5

\(I = \int x \cos^3 x \text{ d } x\).

考虑:

$$ \[\begin{aligned} I & = \int x \cos^3 x \text{ d } x = \int x \cos^2 x \text{ d } ( \sin x ) \\ & = x \cos^2 x \sin x - \int \sin x ( \cos^2 x \text{ d } x - 2 x \cos x \sin x ) \\ & = x \cos^2 x \sin x + \int \cos^2 x ( \text{ d } \cos x ) + 2 \int x \cos x \sin^2 x \text{ d } x \\ & = x \cos^2 x \sin x + \frac{ \cos^3 x }{ 3 } + 2 \int x \cos x ( 1 - \cos^2 x ) \text{ d } x \\ & = x \cos^2 x \sin x + \frac{ \cos^3 x }{ 3 } + 2 \int x \cos x \text{ d } x - 2 I \\ & = x \cos^2 x \sin x + \frac{ \cos^3 x }{ 3 } + 2 \int x ( \text{ d } \sin x ) - 2 I \\ & = x \cos^2 x \sin x + \frac{ \cos^3 x }{ 3 } + 2 ( x \sin x + \cos x ) - 2 I + C \\ \end{aligned}\]

$$

也就是\(3 I = x \cos^2 x \sin x + \frac{ \cos^3 x }{ 3 } + 2 ( x \sin x + \cos x ) + C\).

有理分式的不定积分

考虑真分式\(R ( x ) = \frac{ P ( x ) }{ Q ( x ) }\),其中\(\deg P ( x ) < \deg Q ( x )\).至于其他分式可以做长除法变成真分式.

定义最简真分式形如\(\frac{ A }{ ( x - a )^m } , \frac{ Bx + C }{ ( x^2 + px + q )^n }\).

先证明一个引理:实数域上,任何一个多项式可以分解为若干不可约的一次多项式和二次多项式的乘积.

原因是复根一定成对出现,如果\(z\)是复根,那么\(\bar{ z }\)一定也是复根,原因是\(\overline{ zw } = \bar{ z } \bar{ w }\),对一个多项式两边逐项取共轭就可以发现上述结论.那只需要把成对的复根扔到一个二次多项式里就行.

再证明一个引理:实数上,任何一个真分式都可以转化为若干最简真分式的线性组合.

先拆一次项,如上将\(Q ( x ) = ( x - a )^m R ( x )\),其中\(R ( a ) \ne 0\),那我们考虑:

$$ \[\begin{aligned} \frac{ P ( x ) }{ Q ( x ) } - \frac{ A_1 }{ ( x - a )^m } & = \frac{ P ( x ) - A_1 R ( x ) }{ ( x - a )^m R ( x ) } \\ \end{aligned}\]

$$

此时取\(A_1 = \frac{ P ( a ) }{ R ( a ) }\),立刻见到\(( x - a ) | ( P ( x ) - A_1 R ( x ) )\),于是上下至少少一次,这样就可以继续分解了.

再拆二次项,如上将\(Q ( x ) = ( x^2 + px + q )^m R ( x )\),其中\(( x^2 + px + q ) \nmid R ( x )\),那:

\[ \frac{ P ( x ) }{ Q ( x ) } - \frac{ A_1 x + B_1 }{ ( x^2 + px + q )^m } = \frac{ P ( x ) - ( A_1 x + B_1 ) R ( x ) }{ ( x^2 + px + q )^m R ( x ) } \]

\(T ( x ) = P ( x ) - ( A_1 x + B_1 ) R ( x )\),类似上面应当要确定\(A_1 , B_1\)使得上面那部分是\(x^2 + px + q\)的倍数就可以.直接取\(x^2 + px + q\)的某个复根\(\alpha\),则只需\(T ( \alpha ) = 0\)即可,这是两个方程(实部虚部),而我们有两个未知数,理应可以解出答案.具体解得过程其实也可以直接把\(P ( x )\)\(R ( x )\)直接先用多项式长除法杀一杀然后剩的部分判一下方程.

这样最后就只需要对拆出来的东西逐项积分就行.意味着有理函数的原函数是初等函数.

有理三角函数的不定积分

\(\sin x , \cos x\)经过有限步四则运算得到的函数.

我们定义二元有理函数\(R ( u , v )\),那么有理三角函数实际上是\(R ( \cos x , \sin x )\).

下面给出以下命题:

  1. 如果其对于\(u\)是奇函数,也即\(R ( u , v ) = - R ( - u , v )\),那么\(R ( u , v ) = uR_1 ( u^2 , v )\),其中\(R_1\)是另一个二元有理函数.如果对于\(v\)是奇函数则同理.

  2. \(R ( - u , - v ) = R ( u , v )\)时,那么\(R ( u , v ) = R_1 ( \frac{ u }{ v } , v^2 )\).

证明只需要拆做\(R ( u , v ) = \frac{ P ( u , v ) }{ Q ( u , v ) }\),其中\(P , Q\)是两个多项式,然后只需简单书写即可证明.

对于(1)形式的有理三角函数,注意到:

\[ \begin{aligned} & \int R ( \cos x , \sin x ) \text{ d } x \\ = & \int \cos xR ( \cos^2 x , \sin x ) \text{ d } x \\ \\ = & \int R_1 ( 1 - \sin^2 x , \sin x ) \text{ d } ( \sin x ) \\ = & \int R_1 ( 1 - t^2 , t ) \text{ d } t \end{aligned} \]

对于(2)形式的有理三角函数,我们有:

\[ \begin{aligned} & \int R ( \cos x , \sin x ) \text{ d } x \\ = & \int R_1 ( \cos^2 x , \tan x ) \text{ d } x \\ = & \int R_1 ( \frac{ 1 }{ 1 + \tan^2 x } , \tan x ) \text{ d } x \\ = & \int R_1 ( \frac{ 1 }{ 1 + t^2 } , t ) \frac{ \text{ d } t }{ 1 + t^2 } \end{aligned} \]

有了这两种形式后呢?我们注意到任意的有理三角函数都可以表示为以上两种函数之和,原因是:

\[ \begin{aligned} & R ( u , v ) \\ = & \frac{ R ( u , v ) - R ( - u , v ) }{ 2 } \\ + \frac{ R ( - u , v ) - R ( - u , - v ) }{ 2 } \\ + \frac{ R ( - u , - v ) + R ( u , v ) }{ 2 } \end{aligned} \]

或者,令\(t = \tan \frac{ x }{ 2 }\),那么\(\sin x = \frac{ 2 t }{ 1 + t^2 } , \cos x = \frac{ 1 - t^2 }{ 1 + t^2 } , \text{ d } x = 2 \frac{ \text{ d } t }{ 1 + t^2 }\).

无理函数的不定积分

我们考虑以下几类无理函数:

第一类是\(R ( x , \sqrt[m]{ \frac{ ax + b }{ cx + d } } )\)的形式.只需做换元\(t^m = \frac{ a_1 x + b_1 }{ a_2 x + b_2 }\),立刻得到原式其实就是\(R ( \frac{ b_2 t^m - b_1 }{ a_1 - a_2 t^m } , t )\),并且\(\text{ d } x\)也可以转化到\(\text{ d } t\).

第二类是形如\(\int x^m ( a + bx^n )^p \text{ d } x\),其中\(m , n , p \in \mathbb{ Q }\).

\(t = x^n\),上式就变成了\(\frac{ 1 }{ n } \int t^{ \frac{ m + 1 }{ n } - 1 } ( a + bt )^p \text{ d } t\).令\(q = \frac{ m + 1 }{ n } - 1\).我们只需要做\(\frac{ 1 }{ n } \int t^q ( a + bt )^p \text{ d } t = \frac{ 1 }{ n } \int t^{ p + q } ( \frac{ a + bt }{ t } )^p\).事实上,下面三种情况可以积出来:

  1. \(p \in \mathbb{ Z }\).

  2. \(q \in \mathbb{ Z }\).

  3. \(p + q \in \mathbb{ Z }\).

其它的都无初等形式.

第三类是形如\(R ( x , \sqrt{ ax^2 + bx + c } )\),不妨假设\(b^2 - 4 ac \ne 0 , a \ne 0\).

  1. \(b^2 - 4 ac > 0\),则有两个实根\(\alpha > \beta\),此时提一下实根就可以知道原式等于\(R ( x , ( x - \beta ) \sqrt{ \frac{ a ( x - \alpha ) }{ x - \beta } } )\),这就能做了.

  2. \(b^2 - 4 ac < 0\),则无实根,不妨假设\(a > 0\).则做\(t - \sqrt{ a } x = \sqrt{ ax^2 + bx + c }\)并两边平方就可以反解出\(x = \frac{ t^2 - c }{ b + 2 \sqrt{ a } t }\),原本的积分就变成了关于\(t\)的有理函数的积分.

双曲换元

引入双曲三角函数\(\sinh ( x ) = \frac{ e^x - e^{ - x } }{ 2 } , \cosh = \frac{ e^x + e^{ - x } }{ 2 }\)以及\(\tanh ( x ) = \frac{ \sinh ( x ) }{ \cosh ( x ) }\).留意到\(\cosh^2 - \sinh^2 = 1\).以及:

  1. \(\frac{ \text{ d } }{ \text{ d } x } \sinh ( x ) = \cosh ( x )\)

  2. \(\frac{ \text{ d } }{ \text{ d } x } \cosh ( x ) = \sinh ( x )\)

  3. \(\frac{ \text{ d } }{ \text{ d } x } \tanh ( x ) = \frac{ 1 }{ \cosh^2 ( x ) } = 1 - \tanh^2 ( x )\)

应当发现:

  1. \(\sinh ( 2 x ) = 2 \sinh ( x ) \cosh ( x )\)

  2. \(\cosh ( 2 x ) = \cosh^2 ( x ) + \sinh^2 ( x ) = 2 \cosh^2 ( x ) - 1 = 1 + 2 \sinh^2 ( x )\)

另外其反函数应当是:

  1. \(\text{ arsinh } ( x ) = \ln ( x + \sqrt{ x^2 + 1 } )\)

  2. \(\text{ arcosh } ( x ) = \ln ( x + \sqrt{ x^2 - 1 } )\)

应当发现:

  1. \(\frac{ \text{ d } }{ \text{ d } x } \text{ arsinh } ( x ) = \frac{ 1 }{ \sqrt{ x^2 + 1 } }\)

  2. \(\frac{ \text{ d } }{ \text{ d } x } \text{ arcosh } ( x ) = \frac{ 1 }{ \sqrt{ x^2 - 1 } }\)

  3. \(\frac{ \text{ d } }{ \text{ d } x } \text{ artanh } ( x ) = \frac{ 1 }{ 1 - x^2 }\)

Example1

\(I = \int \frac{ \text{ d } x }{ \sqrt{ x^2 \pm a^2 } }\),其中\(a > 0\).

于是\(\int \frac{ \text{ d } x }{ \sqrt{ x^2 \pm a^2 } } = \ln | x + \sqrt{ x^2 \pm a^2 } | + C\).

Example2

\(I = \int \sqrt{ a^2 - x^2 } \text{ d } x\).

考虑三角换元,应当小心符号,这里注意到\(x \in [ - a , a ]\),因此直接取\(x = a \sin t\),\(t \in [ - \frac{ \pi }{ 2 } , \frac{ \pi }{ 2 } ]\),此时\(\cos t \geq 0\)恒成立,则有:

\[ \begin{aligned} I & = a^2 \int \cos^2 t \text{ d } t \\ & = a^2 \int \frac{ 1 + \cos ( 2 t ) }{ 2 } \text{ d } t \\ & = \frac{ a^2 t }{ 2 } + \frac{ a^2 }{ 4 } \sin ( 2 t ) + C \\ & = \frac{ 1 }{ 2 } ( x \sqrt{ a^2 - x^2 } + a^2 \arcsin \frac{ x }{ a } ) + C \end{aligned} \]

Example3

\(I = \int \sqrt{ x^2 \pm a^2 } \text{ d } x\).

使用双曲换元,先考虑\(\int \sqrt{ x^2 + a^2 } \text{ d } x\)的情况,此时换\(x = a \sinh t\),\(\cosh t \geq 0\),根号是平凡开出的,应当有:

\[ \begin{aligned} I & = a^2 \int \cosh^2 t \text{ d } t \\ & = a^2 \int \frac{ 1 + \cosh ( 2 t ) }{ 2 } \text{ d } t \\ & = \frac{ a^2 t }{ 2 } + \frac{ a^2 }{ 4 } \sinh ( 2 t ) + C \\ & = \frac{ 1 }{ 2 } ( x \sqrt{ x^2 + a^2 } + a^2 \text{ arsinh } \frac{ x }{ a } ) + C \end{aligned} \]

另一个同理,仍然使用双曲换元,结果是\(\frac{ 1 }{ 2 } ( x \sqrt{ x^2 - a^2 } + a^2 \text{ arcosh } \frac{ x }{ a } ) + C\)

椭圆积分

以下是几个常见的无初等形式的积分:

  1. \(\int \frac{ e^x }{ x } \text{ d } x\).

  2. \(\int \frac{ \text{ d } x }{ \ln x }\).

  3. \(\int \frac{ \sin x }{ x } \text{ d } x\).

  4. \(\int \frac{ \cos x }{ x } \text{ d } x\).

  5. \(\int e^{ x^2 } \text{ d } x\).

另外还有一类椭圆积分也无初等形式:设\(R ( x , y )\)是二元有理函数,其中\(y = \sqrt{ P_3 ( x ) }\)\(\sqrt{ P_4 ( x ) }\),也即根号下放了个三次或者四次多项式,那么\(\int R ( x , y ) \text{ d } x\)可能很难有初等形式.这样的积分可以被归结为三类椭圆积分.

首先说明\(R ( x , \sqrt{ P_3 ( x ) } )\)可以转化,原因是\(P_3 ( x ) = 0\)一定有至少一个实数解,任意取出一个设为\(\lambda\),则\(P_3 ( x ) = ( x - \lambda ) P_2 ( x )\),令\(t^2 + \lambda = x\),带入可以转化为\(R ( t^2 + \lambda , \sqrt{ P_2 ( t^2 + \lambda ) } ) = R_1 ( t , \sqrt{ P_4 ( t ) } )\).这就意味着其实根号下四次多项式是更本质一些的.

而四次多项式可以分解为\(P_4 ( x ) = a ( x^2 + p_1 x + q_1 ) ( x^2 + p_2 x + q_2 )\).不妨假设其无重根(如果有重根的话,那么根号下就可以开出去一部分,那就可积了),设其四个根(可能有复根)分别为\(\alpha_1 , \beta_1 , \alpha_2 , \beta_2\),并且\(\alpha_1 , \beta_1\)是上述分解中前半部分的根,特别地,如果这是四个实根,则不妨调整它们的顺序使得\(\alpha_1 > \beta_1 > \alpha_2 > \beta_2\).那么根据韦达定理总有:\(p_1 = - ( \alpha_1 + \beta_1 ) , q_1 = \alpha_1 \beta_1\),后半部分同理.

我们尝试把这两个式子的一次项都去掉,当\(p_1 = p_2\)的时候可以直接一起配方令\(x = t - \frac{ p }{ 2 }\).当\(p_1 \ne p_2\)的时候,尝试换元用\(t\)代替\(x\),不妨设\(x = \frac{ u t + v }{ 1 + t }\),那么\(( x^2 + p_1 x + q_1 ) = \frac{ P_2 ' ( t ) }{ ( 1 + t )^2 }\).为了让其没有一次项应当解以下方程:

\[ \begin{cases} 2 u v + p_1 ( u + v ) + 2 q_1 = 0 \\ 2 u v + p_2 ( u + v ) + 2 q_2 = 0 \end{cases} \]

此时可以解出来\(\begin{cases}u + v = - \frac{ 2 ( q_1 - q_2 ) }{ p_1 - p_2 } \\ u v = \frac{ p_2 q_1 - p_1 q_2 }{ p_1 - p_2 }\end{cases}\),为了解出\(u , v\)是两个实数,应当检验\(( u + v )^2 - 4 uv \geq 0\)是否成立.带入韦达定理发现左边等于\(( \alpha_1 - \alpha_2 ) ( \alpha_1 - \beta_2 ) ( \beta_1 - \alpha_2 ) ( \beta_1 - \beta_2 ) > 0\).原因是如果是四个实根,则根据假设立刻得到.如果存在复根则配对一下复根也可以立刻得到.

总之,在上面的一系列操作后,我们要研究的形式统一成了\(R ( t , y = \sqrt{ A ( 1 + m_1 t^2 ) ( 1 + m_2 t^2 ) } ) = \frac{ a ( t ) + b ( t ) y }{ c ( t ) + d ( t ) y } = B_1 ( t ) + B_2 ( t ) y\),其中\(B_1 ( t ) , B_2 ( t )\)都是\(t\)的有理函数.前者可以直接积分拆出去,那我们关心的就只剩下后面的\(B_2 ( t ) y = \frac{ B_2 ( t ) y }{ y }\)的部分.

我们之前已经提过可以将一个函数拆为偶函数和奇函数之和,事实上:

\[ R ( t ) = \frac{ R ( t ) + R ( - t ) }{ 2 } + \frac{ R ( t ) - R ( - t ) }{ 2 } = R_1 ( t^2 ) + tR_2 ( t^2 ) \]

那么后者立刻可以换元积分,只剩下前者做不动.剩下的形式是:\(\int \frac{ R ( t^2 ) }{ \sqrt{ A ( 1 + m_1 t^2 ) ( 1 + m_2 t^2 ) } } \text{ d } t\),其中\(A\)可以先扔出去一些,使得\(A = \pm 1\).而且由于被积函数是偶函数,所以还可以不妨设\(t \geq 0\).由于根号下不能变成二次函数(不然就直接做完了),还不妨设\(m_1 \ne m_2 , m_1 \ne 0 , m_2 \ne 0\).下面开始讨论:

  1. \(A = 1\),\(m_1 = - h_1^2 , m_2 = - h_2^2 , h_1 > h_2 > 0\).

此时令\(t = \frac{ z }{ h_1 }\)带入化简变形再扔出去点常数得到原式变化为\(\int \frac{ R ( z^2 ) }{ \sqrt{ ( 1 - z^2 ) ( 1 - k^2 z^2 ) } } \text{ d } z\),其中\(k = \frac{ h_2 }{ h_1 }\).

  1. \(A = 1\),\(m_1 = - h_1^2 , m_2 = h_2^2 , h_1 > 0 , h_2 > 0\).

此时令\(t = \frac{ \sqrt{ 1 - z^2 } }{ h_1 }\).扔出去一些常数仍然可以化简成(1)的形式,只是\(k = \frac{ h_2 }{ \sqrt{ h_1^2 + h_2^2 } }\).

  1. \(A = 1 , m_1 = h_1^2 , m_2 = h_2^2 , h_1 > h_2 > 0\).

\(t = \frac{ z }{ h_1 \sqrt{ 1 - z^2 } }\).扔出去一些常数仍然是(1)的形式,只是\(k = \frac{ \sqrt{ h_1^2 - h_2^2 } }{ h_1 }\).

  1. \(A = - 1\),\(m_1 = - h_1^2 , m_2 = h_2^2 , h_1 > 0 , h_2 > 0\).

\(t = \frac{ 1 }{ h_1 \sqrt{ 1 - z^2 } }\),还是(1)的形式,只是\(k = \frac{ h_1 }{ \sqrt{ h_1^2 + h_2^2 } }\).

  1. \(A = - 1\),\(m_1 = - h_1^2 , m_2 = - h_2^2 , h_1 > h_2 > 0\).

\(t = \frac{ \sqrt{ 1 - \frac{ h_1^2 - h^2_2 }{ h_1^2 } z^2 } }{ h_2 }\),还是(1),只是\(k = \frac{ \sqrt{ h_1^2 - h_2^2 } }{ h_1 }\).

这样就全都转化为了\(\int \frac{ R ( z^2 ) }{ \sqrt{ ( 1 - z^2 ) ( 1 - k^2 z^2 ) } } \text{ d } z\)的形式了.然后把\(R ( z^2 )\)给拆开,那么这个式子就应该是\(I_n = \int \frac{ z^{ 2 n } }{ \sqrt{ ( 1 - z^2 ) ( 1 - k^2 z^2 ) } } \text{ d } z\)\(H_m = \int \frac{ \text{ d } z }{ ( z^2 - a )^m \sqrt{ ( 1 - z^2 ) ( 1 - k^2 z^2 ) } }\)的线性组合,注意这里系数有可能是复数.

此时注意到

\[ \begin{aligned} & ( z^{ 2 n - 3 } \sqrt{ ( 1 - z^2 ) ( 1 - k^2 z^2 ) } ) ' \\ = & ( 2 n - 3 ) z^{ 2 n - 4 } \sqrt{ ( 1 - z^2 ) ( 1 - k^2 z^2 ) } + z^{ 2 n - 3 } \frac{ 2 k^2 z^3 - ( k^2 + 1 ) z }{ \sqrt{ ( 1 - z^2 ) ( 1 - k^2 z^2 ) } } \\ = & \frac{ ( 2 n - 3 ) z^{ 2 n - 4 }{ ( 1 - z^2 ) ( 1 - k^2 z^2 ) } + z^{ 2 n - 3 } ( 2 k^2 z^3 - ( k^2 + 1 ) z ) }{ \sqrt{ ( 1 - z^2 ) ( 1 - k^2 z^2 ) } } \\ = & \frac{ ( 2 n - 1 ) k^2 z^{ 2 n } - ( 2 n - 2 ) ( k^2 + 1 ) z^{ 2 n - 2 } + ( 2 n - 3 ) z^{ 2 n - 4 } }{ \sqrt{ ( 1 - z^2 ) ( 1 - k^2 z^2 ) } } \end{aligned} \]

两边积分得到:

\[ \begin{aligned} & ( 2 n - 1 ) k^2 I_n - ( 2 n - 2 ) ( k^2 + 1 ) I_{ n - 1 } + ( 2 n - 3 ) I_{ n - 2 } \\ = & z^{ 2 n - 3 } \sqrt{ ( 1 - z^2 ) ( 1 - k^2 z^2 ) } \end{aligned} \]

上述只要\(n\)是整数就行,甚至不需要\(n\)是正的.所以所有的\(I_n\),包括负整数\(n\),都可以被\(I_0 , I_1\)表示.

接下来看\(H_m\),当\(a = 0\)的时候无非是\(H_m = I_{ - m }\),

接下来注意到:

$$ \[\begin{aligned} & ( \frac{ z }{ ( z^2 - a )^{ m - 1 } } \sqrt{ ( 1 - z^2 ) ( 1 - k^2 z^2 ) } ) ' \\ = & \frac{ ( 2 - 2 m ) z^2 + z^2 - a }{ ( z^2 - a )^m } \sqrt{ ( 1 - z^2 ) ( 1 - k^2 z^2 ) } \\ + \frac{ 2 k^2 z^4 - ( k^2 + 1 ) z^2 }{ \sqrt{ ( 1 - z^2 ) ( 1 - k^2 z^2 ) } } \frac{ 1 }{ ( z^2 - a )^{ m - 1 } } \\ \end{aligned}\]

$$

\(C = \sqrt{ ( 1 - z^2 ) ( 1 - k^2 z^2 ) }\),\(W = z^2 - a\),那么\(C^2 = k^2 ( W + a )^2 - ( k^2 + 1 ) ( W + a ) + 1\).上式化简为:

\[ \begin{aligned} & = \frac{ ( 2 - 2 m ) ( W + a ) C^2 }{ W^m C } + \frac{ C^2 + 2 k^2 ( W + a )^2 - ( k^2 + 1 ) ( W + a ) }{ W^{ m - 1 } C } \\ & = \frac{ ( 2 - 2 m ) ( W + a ) ( k^2 ( W + a )^2 - ( k^2 + 1 ) ( W + a ) + 1 ) }{ W^m C } \\ + \frac{ 3 k^2 ( W + a )^2 - 2 ( k^2 + 1 ) ( W + a ) + 1 }{ W^{ m - 1 } C } \end{aligned} \]

接下来是繁复的化简,然后两边积分得到:

\[ \begin{aligned} & \frac{ z }{ ( z^2 - a )^{ m - 1 } } \sqrt{ ( 1 - z^2 ) ( 1 - k^2 z^2 ) } \\ = & ( 2 m - 2 ) ( - a + ( k^2 + 1 ) a^2 - k^2 a^3 ) H_m \\ - ( 2 m - 3 ) ( 1 - 2 a ( k^2 + 1 ) + 3 k^2 a^2 ) H_{ m - 1 } \\ + ( 2 m - 4 ) ( k^2 + 1 - 3 k^2 a ) H_{ m - 2 } \\ - ( 2 m - 5 ) k^2 H_{ m - 3 } \end{aligned} \]

而注意到\(H_0 = I_0 , H_{ - 1 } = I_1 - aI_0\).

综上,所有的椭圆积分都可以由\(I_0 , I_1 , H_1\)表示.也就是椭圆积分可以转化为以下三种积分:

  1. \(\int \frac{ \text{ d } z }{ \sqrt{ ( 1 - z^2 ) ( 1 - k^2 z^2 ) } }\).

  2. \(\int \frac{ z^2 \text{ d } z }{ \sqrt{ ( 1 - z^2 ) ( 1 - k^2 z^2 ) } }\).

  3. \(\int \frac{ \text{ d } z }{ ( 1 + hz^2 ) \sqrt{ ( 1 - z^2 ) ( 1 - k^2 z^2 ) } }\),其中\(h\)可以是复数.

有意思的是如果令\(z = \sin \varphi\),\(\text{ d } z = \sqrt{ 1 - z^2 } \text{ d } \varphi\),这样形式就好看了很多.椭圆积分可以用以下的优美形式表示:

  1. \(E ( k , \varphi ) = \int \frac{ \text{ d } \varphi }{ \sqrt{ 1 - k^2 \sin^2 \varphi } }\).

  2. \(F ( k , \varphi ) = \int \sqrt{ 1 - k^2 \sin^2 \varphi } \ \text{ d } \varphi\).

  3. \(\Pi ( h , k , \varphi ) = \int \frac{ \text{ d } \varphi }{ ( 1 + h \sin^2 \varphi ) \sqrt{ 1 - k^2 \sin^2 \varphi } }\),其中\(h\)可以是复数.

其中:

\[ \begin{aligned} \int \frac{ z^2 \text{ d } z }{ \sqrt{ ( 1 - z^2 ) ( 1 - k^2 z^2 ) } } & = \int \frac{ \sin^2 \varphi \text{ d } \varphi }{ \sqrt{ 1 - k^2 \sin^2 \varphi } } \\ & = \int ( \frac{ 1 }{ k^2 \sqrt{ 1 - k^2 \sin^2 \varphi } } \text{ ) } - \frac{ 1 - k^2 \sin^2 \varphi }{ k^2 \sqrt{ 1 - k^2 \sin^2 \varphi } } \text{ ) } d \varphi \\ & = \frac{ E ( k , \varphi ) }{ k^2 } - \frac{ F ( k , \varphi ) }{ k^2 } \end{aligned} \]

黎曼积分

\(f ( x )\)是定义在\([ a , b ]\)上的函数,对于区间\([ a , b ]\)插入分点\(x_i ( i = 0 , 1 , \cdots , n )\),且有\(a = x_0 < x_1 < \cdots < x_n = b\),我们称之为对区间\([ a , b ]\)的一种分割,并记为\(\Delta\).又记\(\Delta x_i = x_i - x_{ i - 1 } , i \in [ 1 , n ]\),\(\lambda ( \Delta ) = \max \{ \Delta x_i \mid i \in [ 1 , n ] \}\),并定义黎曼和\(S_\Delta = \sum_{ i = 1 }^n f ( \xi_i ) \Delta x_i\).

若存在实数\(J\),对\(\forall \epsilon > 0 , \exists \delta > 0\),对于任意分划,只要\(\lambda ( \Delta ) < \delta\),都有\(| S_\Delta - J | < \epsilon \\\),则称\(f ( x )\)\([ a , b ]\)黎曼可积,这个\(J\)\(f ( x )\)\([ a , b ]\)上的定积分,记作\(\int_{ a }^b f ( x ) \text{ d } x \\\).容易见到定积分唯一,证明无非也是拿\(\epsilon\)去卡.

对于\([ a , b ]\)上的连续函数,定积分实际上就是其与\(f ( x )\)围成面积的代数和.

由此可以顺便定义达布上下和,即令\(m_i = \inf_{ [ x_{ i - 1 } , x_i ] } f ( x ) , M_i = \sup_{ [ x_{ i - 1 } , x_i ] } f ( x )\),并定义振幅\(w_i = M_i - m_i\),特别地定义\(M = \sup ( M_i ) , m = \inf ( m_i )\).定义\(\overline{ S }_\Delta = \sum M_i \Delta x_i , \underline{ S }_{ \Delta } = \sum m_i \Delta x_i\).

并在此基础上定义上下积分,上积分\(\overline{ \int_a^b } f ( x ) \text{ d } x = \inf \overline{ S }_\Delta , \underline{ \int_a^b } f ( x ) \text{ d } x = \sup \underline{ S }_\Delta\).上下积分显然都是存在的,我们会在后面证明黎曼可积等价于上下积分相等.

为了方便,我们约定:

  1. \(a = b\),\(\int_a^b f ( x ) \text{ d } x = 0\).

  2. \(a > b\),\(\int_a^b f ( x ) \text{ d } x = - \int_b^a f ( x ) \text{ d } x\).

下列性质应当是成立的:

  1. (必要条件)如果一个函数黎曼可积,则它在该闭区间上有界.

  2. 对于任意分划任取\(\xi\),都有\(\underline{ S }_\Delta \leq S_\Delta ( \xi ) \leq \overline{ S }_\Delta\).

  3. \(\forall \epsilon > 0\),\(\exists \xi_1 , \xi_2\),使得\(\underline{ S }_\Delta - \epsilon \leq S_\Delta ( \xi_1 )\),\(\overline{ S }_\Delta + \epsilon \geq S_\Delta ( \xi_2 )\).

再定义所谓加细:如果\(\Delta_1 \subseteq \Delta_2\),那么称\(\Delta_2\)\(\Delta_1\)的加细.此时应当有\(\overline{ S }_{ \Delta_1 } \geq \overline{ S }_{ \Delta_2 } , \underline{ S }_{ \Delta_1 } \leq \underline{ S }_{ \Delta_2 }\).另外容易注意到如果\(| \Delta_2 \setminus \Delta_1 | = k\),那么\(0 \leq \overline{ S }_{ \Delta_1 } - \overline{ S }_{ \Delta_2 } \leq k \lambda ( \Delta_1 ) ( M - m )\),原因是考虑把这些新的断点一个一个加上去,每次加一个会新断开原本的断点,此时最多造成\(( M - m ) \Delta x \leq ( M - m ) \lambda ( \Delta_1 )\)的差.注意到此时这些东西似乎全都可以被限制住.

这同样给出了原因:为什么我们会定义上下积分呢?因为随着分点的加多,也就是随着划分的加细,达布上下和会分别单调递减或递增,这样就应当存在一个极限,然而问题在于我们难以在划分上定义序,这样就少了某种极限的方式.然而,我们试图绕开来找到一种确定的能探到极限的方式.

另外的结论是对于任意两个分划\(\Delta_1 , \Delta_2\),总有\(\underline{ S }_{ \Delta_1 } \leq \overline{ S }_{ \Delta_2 }\).原因是\(\Delta = \Delta_1 \cup \Delta_2\),立刻见到\(\underline{ S }_{ \Delta_1 } \leq \underline{ S }_{ \Delta } \leq \overline{ S }_\Delta \leq \overline{ S }_{ \Delta_2 }\).这意味着\(\overline{ \int } f \geq \underline{ \int } f\).

接下来证明定积分中的达布定理,也就是\(\forall \epsilon > 0 , \exists \delta > 0\),\(\forall \Delta , \lambda ( \Delta ) < \delta\)的时候,\(0 \leq \overline{ S }_\Delta - \overline{ \int_a^b } f ( x ) \text{ d } x \leq \epsilon\).换言之\(\lim_{ \lambda ( \Delta ) \to 0 } \overline{ S }_{ \Delta } = \overline{ \int_a^b } f ( x ) \text{ d } x\),当然下积分也是同理的.

这个的证明考虑先用上积分的定义,应当存在一个\(\Delta '\),满足\(0 \leq \overline{ S }_{ \Delta ' } - \overline{ \int_a^b } f ( x ) \text{ d } x \leq \frac{ \epsilon }{ 2 }\).不妨设\(| \Delta ' | = n_0\),接下来取\(\delta < \frac{ \epsilon }{ 2 n_0 ( M - m ) }\),那么接下来对于\(\forall \Delta , \lambda ( \Delta ) < \delta\)的时候,取\(\Delta^* = \Delta ' \cup \Delta\),根据上面我们证明的步骤,这里最多会多\(n_0\)个断点,自然得知\(\overline{ S }_{ \Delta } - \overline{ S }_{ \Delta^* } \leq n_0 \lambda ( \Delta ) ( M - m ) < \frac{ \epsilon }{ 2 }\).

这样的话就可以注意到:

\[ \begin{aligned} & \overline{ S }_\Delta - \overline{ \int_a^b } f ( x ) \text{ d } x \\ = & ( \overline{ S }_{ \Delta ' } - \overline{ \int_a^b } f ( x ) \text{ d } x ) - ( \overline{ S }_{ \Delta ' } - \overline{ S }_{ \Delta } ) \\ < & \frac{ \epsilon }{ 2 } - ( \overline{ S }_{ \Delta^* } - \overline{ S }_\Delta ) < \epsilon \end{aligned} \]

这里可以证明原函数可积的充分必要条件是上下积分相等.

首先证明充分性:当上下积分相等的时候,设其为\(J\),取足够小的\(\epsilon\),由上知道\(\exists \delta > 0\),使得\(J - \epsilon < \underline{ S }_\Delta \leq S_\Delta ( \xi ) \leq \overline{ S }_\Delta < J + \epsilon\),夹逼一下立刻知道其满足.

然后证明必要性:当原函数可积分的时候,只要分点足够密,应当有\(J - \epsilon < \underline{ S }_\Delta \leq \underline{ \int } f ( x ) \text{ d } x \leq \overline{ \int } f ( x ) \text{ d } x \leq \overline{ S }_\Delta < J + \epsilon\).

而由于我们可以见到上和与下和应当是错开来的,而如果它们中间能接上自然意味着上下积分相等.因此推论为:如果\(f\)在闭区间上有界并且\(\forall \epsilon , \exists \Delta\)使得\(0 \leq \overline{ S }_\Delta - \underline{ S }_\Delta \leq \epsilon\),则\(f\)可积.我们最初拿到的那个定义也可以这么改:只需要存在一个分划而不需要使得任意分划都这么满足.方式就是用我们已经找到的这个去并我们想要限制的那个,然后把限制延后一点使得这些全被限制住.

由上述可以证明闭区间上的连续函数一定是闭区间上的可积函数.原因是闭区间上的连续函数一定是一致连续函数,那么对于一个\(\epsilon\),可以找到一个\(\delta\)控制住区间长度,使得极差\(< \epsilon\).此时直接找一个\(\Delta\),注意到\(\overline{ S } - \underline{ S } = \sum ( M_i - m_i ) \Delta x_i \leq \sum \epsilon \Delta x \leq ( b - a ) \epsilon\),只需取\(\epsilon \to 0\)就可以搞定.

还可以证明如果\(f\)在闭区间上有界并且只有有限个间断点,那么\(f\)可积.原因也很简单,只需要拿足够小的区间把这有限个间断点盖住,然后外面继续如上操作,间断点处尽可能缩小区间长度来取出其影响.

还可以证明单调函数一定可积,原因是\(\overline{ S } - \underline{ S } \leq \delta ( f ( b ) - f ( a ) ) \to 0\).

可积性与连续性的关系(勒贝格定理)

我们还可以进一步探索黎曼可积和连续性的关系,例如,我们可以证明:\(\forall f \in R [ a , b ] , \forall \epsilon > 0 , \exists g \in C [ a , b ] \int_a^b | f ( x ) - g ( x ) | \text{ d } x < \epsilon\).

如何证明呢?感觉上只需要用分段线性函数去逼近一下就可以了对吧.所以我们考虑对于划分\(\Delta\),直接把所有的\(( x_i , f ( x_i ) )\)连起来形成一个分段线性函数.然后观察此时的\(| f - g |\),不妨分段考虑,对于\(\int_{ x_{ i - 1 } }^{ x_i } ( f - g ) ( x ) \text{ d } x \leq ( M_i - m_i ) \Delta x_i\),而后者求和之后实际上就是\(\overline{ S } - \underline{ S }\),当\(f\)可积的时候这个当然会趋近于\(0\).

我们还可以证明\(f \in R [ a , b ]\)的连续点在\([ a , b ]\)上稠密,只需要证明\(\forall [ \alpha , \beta ] \in R [ a , b ] , \alpha < \beta\),\([ \alpha , \beta ]\)这个区间内存在连续点即可.考虑定义一点处的振幅\(w_{ f } ( x_0 ) = \lim_{ \delta \to + 0 } w_f ( x_0 - \delta , x_0 + \delta )\),这个随着\(\delta\)缩小当然应当是单调不增的,因此一定有非负极限(但可能是无穷大).我们注意到\(f\)\(x_0\)处连续的充要条件是\(f\)\(x_0\)处的振幅为\(0\).必要性和充分性都容易证明.

我们考虑用区间套来找到这个连续点,考虑对于\([ \alpha_0 , \beta_0 ] \in [ a , b ]\),取分划\(\Delta_0\)使得\(\sum w_i \Delta x_i < \frac{ 1 }{ 2 } ( \beta_0 - \alpha_0 )\),并且加细使得\(\lambda ( \Delta_0 ) < \frac{ 1 }{ 2 } ( \beta_0 - \alpha_0 )\),注意这里的两个\(\frac{ 1 }{ 2 }\)其实用处不同,前者是为了让\(w_i\)足够小,后者是为了让区间长度足够小.此时考虑由于\(\sum \Delta x_i = \beta_0 - \alpha_0\),所以一定存在一个\(w_i < \frac{ 1 }{ 2 }\),拿出这个区间作为\([ \alpha_1 , \beta_1 ]\),则区间长度至少折半,并且只需在上述对\([ \alpha_n , \beta_n ]\)时取\(\sum w_i \Delta x_i < \frac{ 1 }{ 2^{ n + 1 } } ( \beta_0 - \alpha_0 )\)就可以使得\(w_i\)也趋近于\(0\),这样就能用区间套找到一个点使得它是连续点.

事实上可以证明一个函数黎曼可积的充分必要条件是其有界并且几乎处处连续.

为了方便不妨把\(f\)延拓到整个实轴,令\(f ( x ) = \begin{cases}f ( a ) & x \leq a \\ f ( b ) & x \geq b \\ f ( x ) & \text{ otherwise }\end{cases}\).

下面定义\(E_r = \{ x_0 \mid w_f ( x_0 ) \geq \frac{ 1 }{ r } \}\).我们考虑证明其是闭集,也就是证明其补集\(E_r^c = \{ x_0 \in ( a , b ) \mid w_f ( x_0 ) < \frac{ 1 }{ r } \}\)是开集.如果\(x_0 \in E_r^c\),注意到此时\(\exists \delta > 0 , w_f ( x_0 - \delta , x_0 + \delta ) < \frac{ 1 }{ r }\),那么这必然意味着\(x_0\)邻域中的点的振幅也会\(< \frac{ 1 }{ r }\),这当然意味着其是开集.

\(D\)\(f\)的间断点集,容易见到\(D = \bigcup_{ n = 1 }^{ \infty } E_n\),下面只需要证明每个\(E_n\)都是零测集即可.

先证明必要性:当\(f \in R [ a , b ]\)时,则\(f\)有界,现在对于固定的\(m\),尝试证明\(E_m\)是零测的,由达布定理,\(\forall \epsilon > 0\),\(\exists \Delta\),使得\(\sum w_i \Delta x_i = \overline{ S }_\Delta - \underline{ S }_\Delta < \epsilon\).

观察前者,注意到:

\[ \begin{aligned} \epsilon & > \sum w_i \Delta x_i = \overline{ S }_\Delta - \underline{ S }_\Delta \\ & = \sum_{ E_m \cap ( x_{ k - 1 } , x_k ) \ne \emptyset } w_k \Delta x_k + \sum_{ E_m \cap ( x_{ k - 1 } , x_k ) = \emptyset } w_k \Delta x_k \\ & \geq \frac{ 1 }{ m } \sum_{ E_m \cap ( x_{ k - 1 } , x_k ) \ne \emptyset } \Delta x_k \end{aligned} \]

因此\(m^* ( E_m ) \leq \sum_{ E_m \cap ( x_{ k - 1 } , x_k ) \ne \emptyset } \Delta x_k < m \epsilon\),由于\(m\)一开始就固定,\(\epsilon\)可以尽量小,所以这意味着\(E_m\)是零测集.必要性得证.

再证明充分性:当每一个\(E_m\)都是零测集的时候,\(\forall \epsilon > 0\),取\(r \in N_+ , r > \frac{ 1 }{ \epsilon }\).此时见到\(E_{ r }^c\)是开集,那它可以写成若干两两不交开区间的并,不妨记作\(E_r^c = \bigcup_{ k = 1 }^{ \infty } T_k\).由于此时\(E_m\)是零测集,这意味着\(\sum | T_k | = b - a\).接下来可以取足够大的\(n\)使得\(\sum_1^n | T_k | > b - a - \frac{ \epsilon }{ 2 }\),接下来取\(T_k\)的闭子区间\(J_k\),使得\(\sum_1^n | J_k | > b - a - \epsilon\).这里为什么要把开区间再进一步缩成闭区间呢?原因是你这里如果直接用开区间构造分划可能会把端点处给包进去,因此我们不得不设其端点处的一部分值拿到闭区间,这样那些振幅较大的就被舍弃了.

接下来考虑由于每个点\(x_0 \in J_k\)\(w_f ( x_0 ) < \frac{ 1 }{ r } < \epsilon\),必定有其一个小邻域\(( x_0 - \delta , x_0 + \delta )\)满足整个邻域的振幅\(< \epsilon\),用有限覆盖定理拿出一个开覆盖,然后缩掉这些开覆盖的区间就能拿到一个\(J_k\)的分划(或者干脆将这些开区间的端点和\(J_k\)的端点直接当作一个分划),把这些分划全都并起来就得到了一个划分\(\Delta\).

此时观察这个划分,应当有:

\[ \begin{aligned} & \overline{ S }_\Delta - \underline{ S }_\Delta \\ = & \sum w_k \Delta x_k \\ = & \sum_{ [ x_{ k - 1 } , x_k ] \subseteq \bigcup J_i } w_k \Delta x_k + \sum_{ [ x_{ k - 1 } , x_k ] \subsetneq \bigcup J_i } w_k \Delta x_k \\ < & \epsilon ( b - a ) + ( M - m ) \epsilon \end{aligned} \]

这样就可以使其任意小.

上述证明同样声明了:黎曼可积的充要条件是震荡区间超过某个值的区间长度之和随着细分的增加应当尽可能小.

上述结论立刻能见到比如黎曼函数是黎曼可积的,因为其间断点集就是有理点集,就是零测集.

可积函数的简单性质

不妨设\(f , g \in R [ a , b ]\),则:

  1. \(m ( b - a ) \leq \int_a^b f ( x ) \text{ d } x \leq M ( b - a )\).

  2. \(f \geq 0\)\(\int_a^b f ( x ) \text{ d } x \geq 0\).

  3. \(\int_{ a }^b ( f \pm g ) \text{ d } x = \int_a^b f \text{ d } x \pm \int_a^b g \text{ d } x\).

  4. \(\int_{ a }^b Cf \text{ d } x = C \int_a^b f \text{ d } x\).

  5. (保序性)\(f \geq g\)\(\int_a^b f \text{ d } x \geq \int_a^b g \text{ d } x\).事实上只要\(f \geq g\)在一个稠密子集上成立即可.

  6. 如果\(c \in [ a , b ]\),那么此时\(f \in R [ a , c ] , f \in R [ c , b ]\),并且\(\int_a^b f \text{ d } x = \int_a^c f \text{ d } x + \int_c^b f \text{ d } x\).

  7. 如果\(g\)是连续函数,那么\(g ( f ( x ) ) \in R [ a , b ]\).

  8. \(| f | \in R [ a , b ]\),并且\(| \int_a^b f ( x ) \text{ d } x | \leq \int_a^b | f ( x ) | \text{ d } x\).

  9. 如果除了一个有限的点集以外,\(g = f\),则\(g \in R [ a , b ]\)并且\(\int_a^b g \text{ d } x = \int_a^b f \text{ d } x\).

  10. 如果\(f \geq 0 , \int_a^b f \text{ d } x = 0\),那么\(f\)在其连续点集合上恒等于\(0\).

(1)(2)是显然的,(3)(4)(5)只需将积分看作黎曼和的极限,(6)的话考虑在\([ a , b ]\)上间断点集都是零测的了,那么其子集\([ a , c ] , [ c , b ]\)上的间断点集当然也是零测集.

(7)的话考虑一个几乎处处连续的函数在外面套一层连续函数当然也是几乎处处连续的.

(8)的话考虑绝对值函数是连续函数,然后注意到\(- | f ( x ) | \leq f ( x ) \leq | f ( x ) |\)使用保序性就可以了.

(9)的证明是简单的.但是为什么是有限点集而不是零测集呢?因为如果是无限个点,那么它们不仅会影响自己的连续性,还会影响旁边点的连续性,例如迪利克雷函数.这里可以看出来黎曼函数是有其限制性的,推广到勒贝格积分后会消除这个问题.

(10)的话只需考虑反证法,对于一个连续点\(x_0\),如果\(f ( x_0 ) > 0\),那么周围应当有一个小邻域也大于\(0\),或者干脆用一致连续性取\(> \frac{ f ( x ) }{ 2 }\)的一个小邻域,这样就反证完了.

广义原函数

对于\(f ( x ) : I \to \mathbb{ R }\),称\(F ( x )\)为其广义原函数,若\(\forall c , d \in I , c < d\)满足\(\frac{ F ( d ) - F ( c ) }{ d - c } \in [ \inf_{ [ c , d ] } f ( x ) , \sup_{ [ c , d ] } f ( x ) ]\).容易见到原函数一定是广义原函数,原因是拉格朗日中值定理.

应当容易注意到以下命题:

  1. 局部有界函数的广义原函数是局部李氏连续的,故几乎处处有导数.

  2. \(f ( x )\)\(x_0\)处连续,\(F ( x )\)\(f ( x )\)的广义原函数,则\(F ' ( x_0 )\)存在并且恰好等于\(f ( x_0 )\).

(1)是显然的.

(2)的证明的话,考虑\(| \frac{ F ( x ) - F ( x_0 ) }{ x - x_0 } - f ( x_0 ) | \leq w_f [ x_0 , x ]\),由于\(f ( x_0 )\)连续,那么此时其振幅\(w_f [ x_0 , x ]\)\(x \to x_0\)时应当趋近于\(0\),使用夹逼定理,于是证毕.

牛顿-莱布尼茨公式(微积分基本定理)

先证明一个引理:如果\(f ( x ) \in [ a , b ]\),\(F ( x )\)是其广义原函数,那么\(\underline{ \int_a^b } f ( x ) \text{ d } x \leq F ( b ) - F ( a ) \leq \overline{ \int_a^b } f ( x ) \text{ d } x\).

证明的话,只需证明对于任意分划\(\Delta\)都有\(\underline{ S }_\Delta ( f ) \leq F ( b ) - F ( a ) \leq \overline{ S }_\Delta f ( x )\).而注意到\(F ( b ) - F ( a ) = \sum F ( x_i ) - F ( x_{ i - 1 } ) = \sum \frac{ F ( x_i ) - F ( x_{ i - 1 } ) }{ x_i - x_{ i - 1 } } \Delta x_i\).而根据广义原函数的定义,\(m_i \leq \frac{ F ( x_i ) - F ( x_{ i - 1 } ) }{ x_i - x_{ i - 1 } } \leq M_i\),立刻证毕.

由此显然证明了牛顿-莱布尼茨公式(NL公式):设\(f ( x ) \in R [ a , b ]\),并且能找到其一个广义原函数\(F ( x )\),则\(F ( b ) - F ( a ) = \int_a^b f ( x ) \text{ d } x\).

接下来声明一个定理:如果一个函数\(f ( x ) \in R [ a , b ]\),它就存在广义原函数,而且不同的广义原函数最多相差一个常数.

先证明存在性,我们注意到变限积分\(F ( x ) = \int_a^x f ( t ) \text{ d } t\)显然是\(f ( x )\)的广义原函数,而且它是处处连续的,只需套用定义就可以证明.

再证唯一性,设\(F_1 ( x ) , F_2 ( x )\)都是\(f ( x )\)的广义原函数.根据LN公式,有\(F_1 ( x ) - F_1 ( a ) = \int_{ a }^x f ( t ) \text{ d } t = F_2 ( x ) - F_2 ( a )\),立刻有\(F_1 ( x ) - F_2 ( x ) = F_1 ( a ) - F_2 ( a ) = C\).

此时回忆到\(f ( x )\)\(x_0\)处连续可以推出\(F ( x )\)可导,那么反过来是否成立呢?考虑以下经典反例:

\[ \begin{aligned} F ( x ) & = \begin{cases} 0 & x = 0 \\ x^2 \sin \frac{ 1 }{ x } & \text{ otherwise } \end{cases} \\ f ( x ) & = F ' ( x ) = \begin{cases} 0 & x = 0 \\ 2 x \sin \frac{ 1 }{ x } - \cos \frac{ 1 }{ x } & \text{ otherwise } \end{cases} \end{aligned} \]

但总之可以看到连续函数一定有原函数.

此时回忆到我们曾经定义过左右上下导数\(( F_\pm ) '\)\(( F^\pm ) '\).设\(f \in R [ a , b ]\),\(F\)\(f\)的广义原函数,不妨直接设\(F ( x ) = \int_a^x f ( t ) \text{ d } t\),那么我们声明\(\int_a^b ( F_\pm ) ' \text{ d } x = \int_a^b ( F^\pm ) ' \text{ d } x = \int_a^b f ( x ) \text{ d } x\).

四个证明类似,只考虑其中之一\(F_+ '\)如何证明.取\(m_0 = \inf_{ [ c , d ] } f\),下面令\(G ( x ) = F ( x ) - F ( c ) - m_0 ( x - c ) = \int_c^x ( f ( t ) - m_0 ) \text{ d } t\).当\(x \in [ c , d ]\)时,容易发现\(G ( x )\)单增.既然如此,其任意左右上下导数当然都\(\geq 0\),也就是\(( G_+ ) ' = ( F_+ ) ' - m_0 \geq 0\).同理如果取\(M_0 = \sup_{ [ c , d ] } f\)的话还可以证明\(( F_+ ) ' \leq M_0\).

那么就有\(w_{ F_+ ' } [ c , d ] \leq w_{ f } [ c , d ]\),我们知道\(f\)是黎曼可积的,也就是\(0 \leq \sum w_{ F_+ ' } [ x_{ i - 1 } , x_i ] \Delta x_i \leq \sum w_f [ x_{ i - 1 } , x_i ] \Delta x_i < \epsilon\),此时就可以证明其可积性.

而注意到\(f\)几乎处处连续,\(F\)几乎处处可导,并且在\(f\)的连续点处\(f ( x ) = F_+ '\),这个连续点集当然是稠密集,因此它们的积分相等,这样就做完了.

Example1

\(\int_a^b \text{ sgn } ( x ) \text{ d } x\).

注意到\(\text{ sgn } ( x )\)的广义原函数是\(| x |\),所以\(\int_a^b \text{ sgn } ( x ) \text{ d } x = | b | - | a |\).

Example2(黎曼引理)

\(f \in R [ a , b ] , g \in R [ 0 , T ]\)并且\(g\)\(\mathbb{ R }\)上以\(T\)为周期.求证:

\[ \lim_{ \lambda \to \infty } \int_a^b f ( x ) g ( \lambda x ) \text{ d } x = \cfrac{ \int_0^T g ( x ) \text{ d } x }{ T } \int_a^b f ( x ) \text{ d } x \]

首先注意到:

$$ \[\begin{aligned} & \lim_{ \lambda \to \infty } \int_a^b f ( x ) g ( \lambda x ) \text{ d } x \\ = & \lim_{ \lambda \to \infty } \int_a^b f ( x ) ( g ( \lambda x ) - \cfrac{ \int_0^T g ( x ) \text{ d } x }{ T } + \cfrac{ \int_0^T g ( x ) \text{ d } x }{ T } ) \text{ d } x \\ \end{aligned}\]

$$

因此可以用\(g ( \lambda x ) - \cfrac{ \int_0^T g ( x ) \text{ d } x }{ T }\)代替\(g\),这样就能满足\(\int_0^T g ( x ) \text{ d } x = 0\).

接下来只需证明\(\lim_{ \lambda \to \infty } \int_a^b f ( x ) g ( \lambda x ) \text{ d } x = 0\),不妨设\(| f ( x ) | \leq M , | g ( x ) | \leq M\).

考虑对分划\(\Delta\),满足\(\sum w_i \Delta x_i \leq \epsilon\):

\[ \begin{aligned} & | \int_a^b f ( x ) g ( \lambda x ) \text{ d } x | \\ = & | \sum \int_{ x_{ i - 1 } }^{ x_i } ( f ( x ) - f ( x_i ) + f ( x_i ) ) g ( \lambda x ) \text{ d } x | \\ \leq & | \sum \int_{ x_{ i - 1 } }^{ x_i } f ( x_i ) g ( \lambda x ) \text{ d } x | + | \sum \int_{ x_{ i - 1 } }^{ x_i } ( f ( x ) - f ( x_i ) ) g ( \lambda x ) \text{ d } x | \\ \leq & \sum | f ( x_i ) | \cdot | \int_{ x_{ i - 1 } }^{ x_i } g ( \lambda x ) \text{ d } x | + M \sum w_i \Delta x_i \\ \leq & M \sum | \int_{ x_{ i - 1 } }^{ x_i } g ( \lambda x ) \text{ d } x | + M \sum w_i \Delta x_i \\ \leq & M \sum | \frac{ 1 }{ \lambda } \int_{ \lambda x_{ i - 1 } }^{ \lambda x_i } g ( x ) \text{ d } x | + M \epsilon \end{aligned} \]

接下来设\(G ( x ) = \int_0^x g ( t ) \text{ d } t\),由于\(g\)的周期性,而且其在任何一个长度为\(T\)的区间上积分为\(0\),所以\(| G ( x ) | \leq W\),那么\(\forall x , y , | G ( x ) - G ( y ) | \leq 2 W\).

那么上式就\(\leq 2 MW \frac{ n }{ \lambda } + M \epsilon\),这里虽然有个无穷大的\(n\),但由于\(\lambda\)可以尽可能大且在\(n\)之后决定取值,因此这个影响可以被消除.

这个命题的一个平凡推论是\(g ( x ) = \sin ( nx )\):

\[ \lim_{ \lambda \to \infty } \int_a^b f ( x ) \sin ( \lambda x ) \mathrm{ d } x = \lim_{ \lambda \to \infty } \int_a^b f ( x ) \cos ( \lambda x ) \mathrm{ d } x = 0 \]

Example3

\(\lim_{ n \to \infty } I_n\),其中\(I_n = \frac{ 1 }{ n^{ 1 + \alpha } } ( \sum_{ k = 1 }^n k^\alpha ) = \frac{ 1 }{ n } \sum_{ k = 1 }^n ( \frac{ k }{ n } )^\alpha\).

注意到\(n \to \infty\)的时候,上面就等于\(\int_0^1 x^\alpha \text{ d } x = \frac{ 1 }{ 1 + \alpha }\).

Example4(Dirichlet核)

\(\int_0^{ \frac{ \pi }{ 2 } } \frac{ \sin ( ( 2 n + 1 ) x ) }{ \sin x } \text{ d } x\).

注意到根据积化和差有:

\[ \begin{aligned} & \int_0^{ \frac{ \pi }{ 2 } } \frac{ \sin ( ( 2 n + 1 ) x ) }{ \sin x } \text{ d } x \\ = & \int_0^{ \frac{ \pi }{ 2 } } ( 1 + 2 \sum_k \cos ( 2 kx ) ) \text{ d } x \\ = & \frac{ \pi }{ 2 } + 2 \sum_{ k } \frac{ 1 }{ 2 k } \sin ( k \pi ) \\ = & \frac{ \pi }{ 2 } \end{aligned} \]

Example5

考虑\(f \in \mathbb{ R }\),\(\forall a < b\),都有\(f \in R [ a , b ]\),已知\(f ( x ) = \int_0^x f ( t ) \text{ d } t\),求证\(f \equiv 0\).

首先注意到变限积分是李氏连续的,因此\(f\)当然就是局部李氏连续的,因此自然看出\(f\)\(\mathbb{ R }\)上都是连续的.既然如此,那\(f\)就在\(\mathbb{ R }\)上处处可导并且\(f ' ( x ) \equiv f ( x )\),同理还可以看出\(f\)实际上任意阶可导.理应见到\(f\)应当和\(e^x\)有关,凑\(g ( x ) = \frac{ f ( x ) }{ e^x }\),则\(g ' ( x ) = \frac{ f ' - f }{ e^x } \equiv 0\),这立刻得到\(g ( x ) \equiv C\).

然而\(g ( 0 ) = f ( 0 ) = 0\),于是\(g \equiv C \equiv 0\),所以\(f \equiv 0\).

换元法

不妨设\(f \in R [ a , b ] , F ' = f\),\(\varphi ( t ) : [ \alpha , \beta ] \to [ a , b ]\),\(\varphi ( \alpha ) = a , \varphi ( \beta ) = b\),并且\(\varphi\)可导,而且\(f ( \varphi ( t ) ) \varphi ' ( t ) \in R [ \alpha , \beta ]\),则:

\[ \int_a^b f ( x ) \text{ d } x = \int_\alpha^\beta f ( \varphi ( t ) ) \varphi ' ( t ) \text{ d } t \]

证明的话,考虑考虑NL公式,应当有:

\[ \begin{aligned} ( F ( \varphi ( t ) ) ) ' & = f ( \varphi ( t ) ) \varphi ' ( t ) \\ \int_\alpha^\beta ( F ( \varphi ( t ) ) ) ' & = \int_\alpha^\beta f ( \varphi ( t ) ) \varphi ' ( t ) \\ F ( b ) - F ( a ) & = \int_\alpha^\beta f ( \varphi ( t ) ) \varphi ' ( t ) \end{aligned} \]

然而回忆到有原函数和是否黎曼可积之间是有区别的,适当调整条件可以得到另一个策略的换元法:不妨设\(f \in R [ a , b ] , \varphi ( t ) : [ \alpha , \beta ] \to [ a , b ]\),并且\(\varphi ( t )\)单增,\(\varphi ( \alpha ) = a , \varphi ( \beta ) = b\),\(\varphi\)可导并且\(\varphi ' \in R [ \alpha , \beta ]\),则\(f ( \varphi ( t ) ) \varphi ' ( t ) \in R [ \alpha , \beta ]\)且上述积分仍然成立.

策略是对两边做黎曼和,利用\(\varphi\)的单调性和一致连续性,可以取\(S_{ \Delta } = \sum f ( \eta_k ) \Delta x_k\),利用中值定理可以写作\(S_{ \Delta } = \sum f ( \varphi ( \xi_k ) ) \varphi ' ( \mu_k ) \Delta t_k\).

而另一边的黎曼和\(\sigma_{ \Delta ' } = \sum f ( \varphi ( \xi_k ) ) \varphi ' ( \xi_k ) \Delta t_k\).

只需证明二者之差趋近于\(0\),令\(M = \sup | f | ,\)做差得到:

\[ \begin{aligned} & | \sum f ( \varphi ( \xi_k ) ) ( \varphi ' ( \xi_k ) - \varphi ' ( \mu_k ) ) \Delta t_k | \\ \leq & M | \sum ( \varphi ' ( \xi_k ) - \varphi ' ( \mu_k ) ) \Delta t_k | \\ \leq & M | \sum w_k \Delta t_k | \end{aligned} \]

\(\varphi\)可积,上述趋近于\(0\).

这些定理都有点诡异,它们会在RS积分处再详细讨论.

Example1

\(\int_0^{ \frac{ \pi }{ 2 } } \frac{ \sin x }{ \sin x + \cos x } \text{ d } x\).

注意到:

\[ \begin{aligned} & \int_0^{ \frac{ \pi }{ 2 } } \frac{ \sin x }{ \sin x + \cos x } \text{ d } x \\ = & \int_0^{ \frac{ \pi }{ 4 } } \left ( \frac{ \sin x }{ \sin x + \cos x } + \frac{ \sin ( \frac{ \pi }{ 2 } - x ) }{ \sin ( \frac{ \pi }{ 2 } - x ) + \cos ( \frac{ \pi }{ 2 } - x ) } \right ) \text{ d } x \\ = & \int_0^{ \frac{ \pi }{ 4 } } \frac{ \sin x + \cos x }{ \sin x + \cos x } \text{ d } x \\ = & \frac{ \pi }{ 4 } \end{aligned} \]

其实就是找个点对折.

Example2

\(I = \int_0^\pi \frac{ \theta \sin \theta }{ a + b \cos^2 \theta } \text{ d } \theta\),其中\(a , b > 0\).

\(\theta = \pi - \varphi\),应当有:

\[ \begin{aligned} I & = - \int_\pi^0 \frac{ ( \pi - \varphi ) \sin \varphi }{ a + b \cos^2 \varphi } \text{ d } \varphi \\ & = \int_0^\pi \frac{ ( \pi - \varphi ) \sin \varphi }{ a + b \cos^2 \varphi } \text{ d } \varphi \\ & = \pi \int_{ 0 }^\pi \frac{ \sin \varphi }{ a + b \cos^2 \varphi } \text{ d } \varphi - I \end{aligned} \]

移项得到:

\[ \begin{aligned} I & = \frac{ \pi }{ 2 } \int_0^\pi \frac{ - \text{ d } \cos \theta }{ a + b \cos^2 \theta } \\ & = \frac{ \pi }{ \sqrt{ ab } } \arctan \sqrt{ \frac{ b }{ a } } \end{aligned} \]

Example3

如果\(\forall a < b , f \in R [ a , b ]\),并且\(f ( x + y ) = f ( x ) + f ( y )\)恒成立,求证\(f ( x ) \equiv f ( 1 ) x\).

固定\(x\),对\(y\)\([ 0 , 1 ]\)积分,得到:

\[ f ( x ) = \int_x^{ x + 1 } f ( t ) \text{ d } t - \int_0^1 f ( y ) \text{ d } y \]

而变限积分是局部李氏连续的,所以\(f ( x )\)局部连续,所以\(f ( x )\)整体连续,立刻得到\(f ( x )\)可导,立刻得到其是\(C^\infty\)的.

那就可以两边对\(x\)求导,得到\(\forall y , f ' ( x + y ) = f ' ( x )\),因此\(f ' \equiv C\).

分部积分

\(u , v \in R [ a , b ]\)并且均可导,而且\(u ' , v ' \in R [ a , b ]\),则:

\[ ( uv ) ' = u ' v + uv ' \]

从这里能看出\(( uv ) '\)也是黎曼可积的,那就可以用牛顿莱布尼茨公式两边积分得到:

\[ \begin{aligned} \int_a^b uv ' \text{ d } x & = uv \mid_a^b - \int_a^b u ' v \text{ d } x \\ & = \int_a^b u \text{ d } v = uv \mid_a^b - \int_a^b v \text{ d } u \end{aligned} \]

这个版本当然是简单的,那能不能上点难度呢?

不妨考虑\(f , g \in R [ a , b ]\),那它们的广义原函数可以取为\(F ( x ) = \int_a^x f ( t ) \text{ d } t + A , G ( x ) = \int_a^x g ( t ) \text{ d } t + B\).

\(\int_a^b Fg \text{ d } x = FG \mid_a^b - \int_a^b Gf \text{ d } x\).

先证明一个引理:

\[ \lim_{ \lambda ( \Delta ) \to 0 } \sum_k^n f ( \xi_k ) \int_{ x_{ i - 1 } }^{ x_i } g ( t ) \text{ d } t = \int_a^b f ( x ) g ( x ) \text{ d } x \]

证明无非是用黎曼和,设\(M = \sup | f |\),直接考虑:

\[ \begin{aligned} & | \sum_k^n f ( \xi ) \int_{ x_{ i - 1 } }^{ x_i } g \mathrm{ d } t - \sum_k^n \int_{ x_{ i - 1 } }^{ x_i } fg \text{ d } t | \\ \leq & \sum | f ( \xi_k ) | \int_{ x_{ i - 1 } }^{ x_i } | g ( t ) - g ( \xi_k ) | \text{ d } t + | \sum f ( \xi_k ) g ( \xi_k ) \Delta t_k - \int_a^b f g \text{ d } t | \\ \leq & M \sum w_k ( g ) \text{ d } t + \sum w_k ( fg ) \Delta t_i \end{aligned} \]

这个当然趋向于\(0\).

使用abel求和法则,得到:

\[ \begin{aligned} ( FG ) \mid_a^b & = \sum_k ( F ( x_k ) G ( x_k ) - F ( x_{ k - 1 } ) G ( x_{ k - 1 } ) ) \\ & = \sum_k ( F ( x_k ) G ( x_k ) - F ( x_{ k - 1 } ) G ( x_k ) + F ( x_{ k - 1 } ) G ( x_k ) - F ( x_{ k - 1 } ) G ( x_{ k - 1 } ) ) \\ & = \sum_{ k }^n G ( x_k ) ( F ( x_k ) - F ( x_{ k - 1 } ) ) + \sum_{ k } F ( x_{ k - 1 } ) ( G ( x_i ) - G ( x_{ i - 1 } ) ) \\ & = \sum_k G ( x_i ) \int_{ x_{ i - 1 } }^{ x_i } f ( x ) \text{ d } x + \sum_{ k }^n F ( x_{ i - 1 } ) \int_{ x_{ i - 1 } }^{ x_i } g ( x ) \text{ d } x \end{aligned} \]

使用引理就完事了.

Example1

求证:

\[ \int_a^x ( \int_a^t f ( u ) \text{ d } u ) \text{ d } t = \int_a^x ( x - t ) f ( t ) \text{ d } t \]

\(F ( x ) = \int_a^t f ( t ) \text{ d } t\),\(g ( x ) = 1 , G ( x ) = x - a\)就可以直接套用分部积分公式得到:

$$ \[\begin{aligned} LHS & = \int_a^x F ( t ) g ( t ) \text{ d } t \\ & = FG \mid_a^x - \int_a^x f ( t ) G ( t ) \text{ d } t \\ & = ( x - a ) \int_a^x f ( t ) \text{ d } t - \int_a^x f ( t ) ( t - a ) \text{ d } t \\ \end{aligned}\]

$$

这样就做完了.

或者设\(F ( a ) = 0\),将上式记作:

\[ \int_a^x F ( t ) \mathrm{ d } t = \int_a^x ( x - t ) F ' ( t ) \mathrm{ d } t \]

Example2

\(I = \int_0^{ \frac{ \pi }{ 2 } } \frac{ x \sin x \cos x }{ ( a^2 \cos^2 x + b^2 \sin^2 x )^2 } \text{ d } x\),其中\(a , b > 0\).

有:

\[ \begin{aligned} & \int_0^{ \frac{ \pi }{ 2 } } \frac{ x \sin x \cos x }{ ( a^2 \cos^2 x + b^2 \sin^2 x )^2 } \text{ d } x \\ = & \frac{ - 1 }{ 2 ( b^2 - a^2 ) } \int_0^{ \frac{ \pi }{ 2 } } x \text{ d } ( \frac{ 1 }{ a^2 + ( b^2 - a^2 ) \sin^2 x } ) \\ = & \frac{ - 1 }{ 2 ( b^2 - a^2 ) } ( \frac{ \pi }{ 2 b^2 } - \int_0^{ \frac{ \pi }{ 2 } } \frac{ \text{ d } x }{ a^2 \cos^2 x + b^2 \sin^2 x } ) \\ = & \frac{ 1 }{ 2 ( b^2 - a^2 ) } ( - \frac{ \pi }{ 2 b^2 } + \int_0^{ \frac{ \pi }{ 2 } } \frac{ \text{ d } \tan x }{ a^2 + b^2 \tan^2 x } ) \\ = & \frac{ 1 }{ 2 ( b^2 - a^2 ) } ( - \frac{ \pi }{ 2 b^2 } + \frac{ \pi }{ 2 ab } ) \\ = & \frac{ \pi }{ 4 ab^2 ( a + b ) } \end{aligned} \]

Example3(Wallis公式)

\(I_n = \int_0^{ \frac{ \pi }{ 2 } } \sin^n x \text{ d } x\).

换元后直接分部积分:

$$ \[\begin{aligned} I_n & = - \int_0^{ \frac{ \pi }{ 2 } } \sin^{ n - 1 } x \text{ d } \cos x \\ & = \int_0^{ \frac{ \pi }{ 2 } } \cos x \text{ d } ( \sin^{ n - 1 } x ) \\ & = ( n - 1 ) \int_0^{ \frac{ \pi }{ 2 } } \sin^{ n - 2 } x ( 1 - \sin^2 x ) \text{ d } x \\ & = ( n - 1 ) I_{ n - 2 } - ( n - 1 ) I_n \\ \end{aligned}\]

$$

于是\(I_n = \frac{ n - 1 }{ n } I_{ n - 2 }\).

注意到\(I_0 = \frac{ \pi }{ 2 } , I_1 = 1\),所以\(I_{ 2 m } = \frac{ ( 2 m - 1 ) ! ! }{ ( 2 m ) ! ! } \frac{ \pi }{ 2 } , I_{ 2 m + 1 } = \frac{ ( 2 m ) ! ! }{ ( 2 m + 1 ) ! ! }\).

然而注意到\(I_n\)随着\(n\)增大而减小,于是应该有\(I_{ 2 m + 1 } \leq I_{ 2 m } \leq I_{ 2 m - 1 }\),展开得到:

\[ \begin{aligned} a_n & = \frac{ 1 }{ 2 n + 1 } ( \frac{ ( 2 n ) ! ! }{ ( 2 n - 1 ) ! ! } )^2 \\ & \leq \frac{ \pi }{ 2 } \leq \\ \frac{ 1 }{ 2 n } ( \frac{ ( 2 n ) ! ! }{ ( 2 n - 1 ) ! ! } )^2 & = b_n \end{aligned} \]

\(\lim a_n = \lim b_n\),因此\(\lim a_n = \lim b_n = \frac{ \pi }{ 2 }\).

泰勒公式的积分余项

回忆到泰勒公式的余项:

\(f ( x )\)\(a\)处有\(n\)阶导数,则\(f ( x ) = \sum_{ k = 0 }^n \frac{ f^{ ( k ) } ( a ) }{ k ! } ( x - a )^k + o ( ( x - a )^n )\).

\(f ( x )\)\(( \alpha , \beta )\)上有\(n + 1\)阶导数,则\(f ( x ) = \sum_{ k = 0 }^n \frac{ f^{ ( k ) } ( a ) }{ k ! } ( x - a )^k + \frac{ f^{ ( n + 1 ) } ( \xi ) }{ ( n + 1 ) ! } ( x - a )^{ n + 1 }\).

事实上还可以写积分余项,若\(f^{ ( n + 1 ) } \in R [ \alpha , \beta ]\),则\(f ( x ) = \sum_{ k = 0 }^n \frac{ f^{ ( k ) } ( a ) }{ k ! } ( x - a )^k + \frac{ 1 }{ n ! } \int_a^x ( x - t )^n f^{ ( n + 1 ) } ( t ) \text{ d } t\).

首先能写出\(f ( x ) = f ( a ) + \int_a^x f ' ( t ) \text{ d } t\),考虑不断展开后面那一项,用分部积分注意到:

\[ \begin{aligned} & \int_a^x f^{ ( m + 1 ) } ( t ) \frac{ ( x - t )^m }{ m ! } \text{ d } t \\ = & \int_a^x f^{ ( m + 1 ) } ( t ) \text{ d } ( - \frac{ ( x - t )^{ m + 1 } }{ ( m + 1 ) ! } ) \\ = & f^{ ( m + 1 ) } ( a ) \frac{ ( x - a )^{ m + 1 } }{ ( m + 1 ) ! } + \frac{ 1 }{ ( m + 1 ) ! } \int_a^x ( x - t )^{ m + 1 } f^{ ( m + 2 ) } ( t ) \text{ d } t \end{aligned} \]

Example1

函数\(f ( x )\)\([ a , b ]\)上各阶导数存在且非负,求证:

\[ f ( x ) = \sum_{ n = 0 }^\infty \frac{ f^{ ( n ) } ( a ) }{ n ! } ( x - a )^n \]

其实这个题应该放到幂级数那里,不过确实和积分余项关系更大.分析的话首先会发现要证两边相等一定要搞定余项对吧,但是拉格朗日余项要求对所有的点的任意阶导数都存在一个控制,但这是做不到的,原函数对导函数的控制只能是在一段连续区间上的控制(用NL公式),而做不到对所有单点的控制.因此使用积分余项,一个自然的想法是除了\(b\)端点以外的误差应该都比\(b\)处的误差要小,注意到:

\[ \frac{ x - t }{ x - a } \leq \frac{ b - t }{ b - a } \]

所以:

\[ \begin{aligned} R_n ( x ) & = \frac{ 1 }{ n ! } \int_a^x f^{ ( n + 1 ) } ( t ) ( x - t )^n \mathrm{ d } t \\ & \leq \frac{ ( x - a )^n }{ ( b - a )^n } \frac{ 1 }{ n ! } \int_a^x f^{ ( n + 1 ) } ( t ) ( b - t )^n \mathrm{ d } t \\ & \leq \frac{ ( x - a )^n }{ ( b - a )^n } R_n ( b ) \end{aligned} \]

接下来如果能控制\(R_n ( b )\)就万事大吉,发现:

\[ \begin{aligned} R_n ( b ) & = \frac{ 1 }{ n ! } \int_a^b f^{ ( n + 1 ) } ( t ) ( b - t )^n \mathrm{ d } t \\ & = \frac{ 1 }{ n ! } \int_a^b ( b - t )^n \mathrm{ d } f^{ ( n ) } ( t ) \\ & = - \frac{ ( b - a )^n }{ n ! } f^{ ( n ) } ( a ) + \frac{ 1 }{ ( n - 1 ) ! } \int_a^b ( b - t )^{ n - 1 } f^{ ( n ) } ( t ) \\ & \leq R_{ n - 1 } ( b ) \\ & \leq \cdots \leq f ( b ) - f ( a ) \end{aligned} \]

这就搞定了,当\(x \in [ a , b )\)的时候,由于\(\frac{ ( x - a )^n }{ ( b - a )^n } \to 0\)而自然完事.而单调函数的端点是随便延拓的,写下来的话,如果端点处不满足则必然端点处不收敛,意味着:

\[ \lim_{ x \to b - 0 } \sum_{ n = 0 }^\infty \frac{ f^{ ( n ) } ( a ) }{ n ! } ( x - a )^n = + \infty \]

但这不可能,因为左边的恰好是原本收敛的那个函数\(x \to b - 0\)处的表现.

积分第一中值定理

\(f , g \in R [ a , b ]\)并且\(g\)不变号.不妨设\(f\)的连续点集为\(A\),称它的本性上界\(M = \inf_{ x \in A } ( f ( x ) )\),同理定义本性下界\(m\).则\(\exists \mu \in [ m , M ]\)使得:

\[ \int_a^b fg ( x ) \text{ d } x = \mu \int_a^b g ( x ) \text{ d } x \]

来证明这个事,不妨设\(g ( x ) \geq 0\).

\(\int_a^b g ( x ) \text{ d } x = 0\)的时候,此时由于\(g ( x ) \geq 0\),因此\(g ( x )\)一定几乎处处为零(否则,存在一个\(g\)的连续点处不为\(0\),在这个点邻域附近卡一下就能卡掉),那左右两边都等于\(0\).

\(\int_a^b g ( x ) \text{ d } x > 0\)的时候,由于\(mg \leq gf \leq Mg\)对于\(f\)的连续点集\(A\)成立,而这是个稠密集,立刻见到\(\int_a^b mg \text{ d } x \leq \int_a^b gf \text{ d } x \leq \int_a^b Mg \text{ d } x\).于是\(\mu = \frac{ \int_a^b f g \text{ d } x }{ \int_a^b g \text{ d } x } \in [ m , M ]\).

作为更加常见的版本,当\(f \in C [ a , b ]\)的时候,\(\exists \xi \in ( a , b )\)使得:

\[ \int_a^b fg ( x ) \text{ d } x = f ( \xi ) \int_a^b g ( x ) \text{ d } x \]

该版本与之前的区别在于要断言\(\xi \ne a , \xi \ne b\).使用反证法,在\(\int_a^b g ( x ) \text{ d } x > 0\)的时候,不妨假设\(\xi = b\),此时前面\(( a , b )\)中不能有和\(f ( b )\)相同的,又因为其是连续函数,因此不妨设\(( a , b )\)\(f ( x )\)均比\(f ( b )\)要小,用极限把端点用保号性卡出来就知道\([ a , b ]\)\(f ( x ) \leq f ( b )\).

由于此时\(\int_a^b g ( x ) \text{ d } x > 0\),于是一定存在一个\(x_0 , g ( x_0 ) > 0\),并且\(x_0\)是一个连续点.此时就存在其一个小邻域都\(> \frac{ 1 }{ 2 } g ( x_0 ) > 0\),并且这个邻域上的\(f ( x ) < f ( b )\).在这个邻域上立刻可以发现:

\[ \int_a^b ( M - f ( x ) ) g ( x ) \text{ d } x > 0 \]

这就有了矛盾.

Example1

\(f \in R [ 0 , 1 ]\),\(f ( + 0 )\)存在,则:

\[ \lim_{ n \to + \infty } \int_0^1 \frac{ n f ( x ) }{ 1 + n^2 x^2 } \text{ d } x = \frac{ \pi }{ 2 } f ( + 0 ) \]

不妨设\(f ( 0 ) = f ( + 0 )\),因为改变有限个点的取值是不会改变其积分的.

此时:

\[ \begin{aligned} & \int_0^1 \frac{ n f ( x ) }{ 1 + n^2 x^2 } \text{ d } x \\ = & \int_0^{ \frac{ 1 }{ \sqrt{ n } } } \frac{ n f ( x ) }{ 1 + n^2 x^2 } \text{ d } x + \int_{ \frac{ 1 }{ \sqrt{ n } } }^{ 1 } \frac{ n f ( x ) }{ 1 + n^2 x^2 } \text{ d } x \end{aligned} \]

而考虑:

\[ \begin{aligned} & \int_0^{ \frac{ 1 }{ \sqrt{ n } } } \frac{ n f ( x ) }{ 1 + n^2 x^2 } \text{ d } x \\ = & \mu \int_0^{ \frac{ 1 }{ \sqrt{ n } } } \frac{ n }{ 1 + n^2 x^2 } \text{ d } x \\ = & \mu \arctan \sqrt{ n } \to f ( 0 ) \frac{ \pi }{ 2 } \end{aligned} \]

而后者:

\[ \begin{aligned} & | \int_{ \frac{ 1 }{ \sqrt{ n } } }^{ 1 } \frac{ n f ( x ) }{ 1 + n^2 x^2 } \text{ d } x | \\ \leq & \sup | f | ( \arctan ( nx ) \mid_{ \frac{ 1 }{ \sqrt{ n } } }^1 ) \\ = & \sup | f | \arctan ( \frac{ n - \sqrt{ n } }{ 1 + n \sqrt{ n } } ) \to 0 \end{aligned} \]

这样就做完了.这里拆成两部分可能是难以想到的,事实上这么做的意义是使得\(\mu \to f ( 0 )\)而放缩,其中这个\(nx\)的变化量很大,因此可以稍微匀一下变化.

Example2

\(f\)二阶可导,并且一,二阶导可积,则\(\exists \xi \in ( a , b )\),使得\(\int_a^b f ( x ) \text{ d } x = ( b - a ) f ( \frac{ a + b }{ 2 } ) + \frac{ ( b - a )^3 }{ 24 } f ' ' ( \xi )\).

考虑:

\[ \begin{aligned} & \int_a^b f ( x ) \text{ d } x \\ = & \int_{ a }^{ \frac{ a + b }{ 2 } } f ( x ) \text{ d } x + \int_{ \frac{ a + b }{ 2 } }^{ b } f ( x ) \text{ d } x \\ = & \int_0^{ \frac{ b - a }{ 2 } } f ( a + t ) \text{ d } t + \int_0^{ \frac{ b - a }{ 2 } } f ( b - t ) \text{ d } t \\ = & \int_0^{ \frac{ b - a }{ 2 } } f ( a + t ) + f ( b - t ) \text{ d } t \\ = & t ( f ( a + t ) + f ( b - t ) ) \mid_0^{ \frac{ b - a }{ 2 } } - \int_0^{ \frac{ b - a }{ 2 } } t ( f ' ( a + t ) - f ' ( b - t ) ) \text{ d } t \\ = & ( b - a ) f ( \frac{ a + b }{ 2 } ) - \int_0^{ \frac{ b - a }{ 2 } } t ( f ' ( a + t ) - f ' ( b - t ) ) \text{ d } t \end{aligned} \]

前半部分已经完事了,接下来看后半部分,继续分部积分:

\[ \begin{aligned} & \int_0^{ \frac{ b - a }{ 2 } } t ( f ' ( a + t ) - f ' ( b - t ) ) \text{ d } t \\ = & \frac{ 1 }{ 2 } \int_0^{ \frac{ b - a }{ 2 } } ( f ' ( a + t ) - f ' ( b - t ) ) \text{ d } ( t^2 ) \\ = & \left ( \frac{ t^2 }{ 2 } ( f ' ( a + t ) - f ' ( b - t ) ) \right ) \mid_{ 0 }^{ \frac{ b - a }{ 2 } } - \int_0^{ \frac{ b - a }{ 2 } } \frac{ t^2 }{ 2 } ( f ' ' ( a + t ) + f ' ' ( b - t ) ) \text{ d } t \\ = & - \int_0^{ \frac{ b - a }{ 2 } } \frac{ t^2 }{ 2 } ( f ' ' ( a + t ) + f ' ' ( b - t ) ) \text{ d } t \\ = & \mu \int_0^{ \frac{ b - a }{ 2 } } \frac{ t^2 }{ 2 } \text{ d } t \\ = & \mu \frac{ ( b - a )^3 }{ 48 } \end{aligned} \]

接下来看\(\mu\),\(\mu \in [ \inf ( f ' ' ( a + t ) + f ' ' ( b - t ) ) , \sup ( f ' ' ( a + t ) + f ' ' ( b - t ) ) ]\),由导函数介值性,意味着必然\(\exists \xi_1 \in [ 0 , \frac{ b - a }{ 2 } ]\)使得\(\mu = f ' ' ( a + \xi_1 ) + f ' ' ( b - \xi_1 )\).再用一次\(2 f ' '\)的介值性得到\(\mu = 2 f ' ' ( \xi ) , \xi \in ( a + \xi_1 , b - \xi_1 ) \subseteq ( a , b )\).

积分第二中值定理

\(g \in R [ a , b ] , f \geq 0\),并且\(f\)单调,则:

  1. \(f\)单调递减时,\(\exists \xi \in [ a , b ]\),\(\int_a^b f g \text{ d } x = f ( a + 0 ) \int_a^\xi g ( x ) \text{ d } x\).

  2. \(f\)单调递增时,\(\exists \xi \in [ a , b ]\),\(\int_a^b f g \text{ d } x = f ( b - 0 ) \int_\xi^b g ( x ) \text{ d } x\).

  3. \(\exists \xi \in [ a , b ]\),\(\int_a^b f g \text{ d } x = f ( a + 0 ) \int_a^\xi g \text{ d } x + f ( b - 0 ) \int_\xi^b g \text{ d } x\).

  4. 在上述基础上,如果\(f\)不是几乎常值函数,那么上述的\(\xi \in ( a , b )\).

(1)(2)相似,下面只对(1)进行证明:

不妨设\(f ( a ) = f ( a + 0 ) , G = \int_a^x g ( x ) \text{ d } x\)\(g\)的广义原函数,其满足\(G ( a ) = 0\),不妨设\(M = \sup G , m = \inf G\),回忆到:

\[ \begin{aligned} \int_a^b f g \text{ d } x & = \lim_{ \lambda ( \Delta ) \to 0 } \sum_{ i = 1 }^n f ( x_{ i - 1 } ) \int_{ x_{ i - 1 } }^{ x_i } g \text{ d } x \\ & = \sum_{ i = 1 }^n f ( x_{ i - 1 } ) ( G ( x_i ) - G ( x_{ i - 1 } ) ) \\ & = f ( x_{ n - 1 } ) G ( x_n ) + \sum_{ i = 1 }^{ n - 1 } ( f ( x_{ i - 1 } ) - f ( x_{ i } ) ) G ( x_i ) \\ & \leq f ( a ) M \end{aligned} \]

在最后一步放缩进行修改就可以改为\(\geq f ( a ) m\),而我们已经得知\(G\)的连续性,因此用介值性就可以解决上述问题.

难点在于(4)如何证明.

当其不是几乎常值函数的时候,应该满足\(f ( a + 0 ) > f ( b - 0 )\).

\(\int_a^b f g \text{ d } x = 0\)的时候,如果迫不得已必须取端点就应当有\(\forall \xi \in ( a , b )\),都有\(\int_a^\xi g \text{ d } x \ne 0\),由于其连续导出的介值性那就当然拿到了\(G\)的保号性.我们上面已经用Abel变换得到了:

$$ \[\begin{aligned} \int_a^b f g \text{ d } x & = \sum_{ i = 1 }^n f ( x_{ i - 1 } ) ( G ( x_i ) - G ( x_{ i - 1 } ) ) \\ & = f ( x_{ n - 1 } ) G ( x_n ) + \sum_{ i = 1 }^{ n - 1 } ( f ( x_{ i - 1 } ) - f ( x_{ i } ) ) G ( x_i ) \\ \end{aligned}\]

$$

此时考虑取\(c , d\)使得\(a < c < d < b\),并且满足\(f ( c ) > f ( d )\),由于\(f\)并不是几乎常值函数,这当然可以做到,上式每一项都是\(\geq 0\)的,那就可以把区间从\([ a , b ]\)重新控制到\([ c , d ]\)中.于是此时上式立刻:

\[ \begin{aligned} & \int_a^b f g \text{ d } x \\ \geq & ( f ( c ) - f ( d ) ) \min_{ [ c , d ] } G ( x ) > 0 \end{aligned} \]

然而我们假设中\(\int_a^b f g \text{ d } x = 0\),这样就导出了矛盾.

接下来考虑\(\int_a^b f g \text{ d } x \ne 0\)的情况,如果其迫不得已必须取在端点的话当然要取到右端点此时应该有\(\int_a^b f g \text{ d } x = f ( a ) \int_a^b g \text{ d } x\).

仍然看上面的Abel变换后的结果,同时按照上面同样的办法取出一个子区间\([ c , d ]\).回忆到为了保证前面都没有能和\(G ( b )\)相同的,因此\(G ( b )\)必然是前面的最大值.再回忆到\(G ( a ) = 0\),立刻能得到\(G ( b ) > \sup_{ [ a , c ] } G ( x )\),设后者为\(M\),应当有:

$$ \[\begin{aligned} & \int_a^b f g \text{ d } x \\ = & f ( x_{ n - 1 } ) G ( b ) + \sum_{ i = 1 }^{ n - 1 } ( f ( x_{ i - 1 } ) - f ( x_{ i } ) ) G ( x_i ) \\ \leq & f ( x_{ n - 1 } ) G ( b ) + M ( f ( a ) - f ( c ) ) + G ( b ) ( f ( c ) - f ( b ) ) \\ \end{aligned}\]

$$

这里这个\(f ( x_{ n - 1 } )\)很烦,但是当\(\lambda ( \Delta ) \to 0\)的时候当然会使得\(f ( x_{ n - 1 } ) \to f ( b - 0 )\),上式变更为:

\[ \begin{aligned} & \int_a^b f g \text{ d } x \\ \leq & f ( b ) G ( b ) + M ( f ( a ) - f ( c ) ) + G ( b ) ( f ( c ) - f ( b ) ) \\ = & M ( f ( a ) - f ( c ) ) + G ( b ) f ( c ) \\ < & f ( a ) G ( b ) \end{aligned} \]

这就导出了矛盾.

最后来看(3),不妨设\(f\)单减,设\(\varphi ( x ) = f ( x ) - f ( b ) \geq 0\)且单减,用(1)的结论得到\(\exists \xi \in [ a , b ]\)使得\(\int_a^b \varphi g \text{ d } x = \varphi ( a ) \int_a^\xi g \text{ d } x\).变形后就可以得到原本的式子.单增是同理的.总之,(3)是(1)(2)的一个更为优美的推论.

Example1

\(f \in C^1 [ a , b ]\),并且满足\(f '\)单调递减,且\(f ' ( b ) \geq M > 0\).求证:\(| \int_a^b \cos f ( x ) \text{ d } x | \leq \frac{ 2 }{ M }\).

注意到:

$$ \[\begin{aligned} & \int_a^b \cos f ( x ) \text{ d } x \\ = & \int_a^b \frac{ f ' \cos f }{ f ' } \text{ d } x \\ = & \frac{ 1 }{ f ' ( b ) } \int_\xi^b f ' \cos f \text{ d } x \\ = & \frac{ 1 }{ f ' ( b ) } ( \sin f ( b ) - \sin f ( \xi ) ) \\ \end{aligned}\]

$$

这就完事了.

有界变差函数

对于一个\(f : [ a , b ] \to R\)的函数,做分划\(\Delta : a = x_0 < \cdots < x_n = b\),定义其变差为\(V_\Delta = \sum_k | f ( x_i ) - f ( x_{ i - 1 } ) |\),定义其全变差为\(V_{ [ a , b ] } ( f ) = \sup_\Delta V_\Delta\).当全变差为有限的时候,称\(f\)是有界变差函数.容易见到由介值定理,如果\(f\)可导而且\(f '\)可积,则\(V_{ [ a , b ] } ( f ) = \int_a^b | f ' | \mathrm{ d } x\).

应当容易见到,闭区间上的单调函数是有界变差的,且\(V_{ | f | } \leq V_f , V_{ f + g } \leq V_f + V_g\).

接下来我们来证明:\(f\)是有界变差函数,当且仅当\(f\)是两个单调(不一定严格)函数的差.或者更严格一点,可以写成两个单调不减函数的差.另外,作为这个命题的平凡推论,我们知道有界变差函数几乎处处可导,并且有至多可数个间断点,且只有第一类间断点.

充分性显然,下面来看必要性.假设\(f\)是有界变差的,此时类似积分可以定义一个变上限函数\(V_f ( x ) = V_f [ a , x ]\),其显然是单调不降的.

接下来定义\(g = V_f ( x ) - f ( x )\),我们来说明它一定也是单调不减的.

那考虑当\(x_2 > x_1\)时,观察\(g ( x_2 ) - g ( x_1 ) = V_f ( x_2 ) - V_f ( x_1 ) - ( f ( x_2 ) - f ( x_1 ) )\).

既然全变差的定义依赖于分划,我们当然可以加分点,自然有\(V_f ( x_2 ) - V_f ( x_1 ) = V_{ f , [ x_1 , x_2 ] } \geq | f ( x_2 ) - f ( x_1 ) | \geq f ( x_2 ) - f ( x_1 )\).

自然得证.

可应当意识到连续函数不一定是有界变差函数,原因仍然考虑\(f ( x ) = \begin{cases}0 & x = 0 \\ x \sin \frac{ 1 }{ x } & \text{ otherwise }\end{cases}\).在闭区间\([ 0 , 1 ]\)上取\(x_k = \frac{ 1 }{ ( k + \frac{ 1 }{ 2 } ) \pi }\),这样\(\sin \frac{ 1 }{ x_i }\)的取值正负交替,容易见到出现了调和级数.

然而,稍微加点条件,我们可以证明李氏连续是有界变差的.可以直接套用定义,也可以回忆到\(f ( x ) = f ( x ) - Lx + Lx = Lx - ( Lx - f ( x ) )\).因此导函数有界就一定有界变差.并且此时,可以让其拆出两个不降的可导函数.

定积分的应用
Example1(图形证明不等式)

回忆到我们证明积分形式的柯西不等式的时候,证明了当\(\frac{ 1 }{ p } + \frac{ 1 }{ q } = 1\)时,\(a^{ \frac{ 1 }{ p } } b^{ \frac{ 1 }{ q } } = e^{ \frac{ \ln a }{ p } + \frac{ \ln b }{ q } } \leq \frac{ a }{ p } + \frac{ b }{ q }\).

下面可以用类似的策略理解这个式子,首先等价于证明\(ab \leq \frac{ a^p }{ p } + \frac{ b^q }{ q }\).原因是考虑设\(S_1 = \frac{ a^p }{ p } , S_2 = \frac{ b^q }{ q }\),设\(f ( x ) = x^{ p - 1 }\),留意到\(f ( x )\)的积分表示出了\(S_1\),而\(f^{ - 1 } ( x )\)恰好表示出了\(S_2\).

Example2(参数方程曲线面积)

回忆到换元法,取参数方程\(\begin{cases}x = x ( t ) \\ y = y ( t )\end{cases}\),此时不妨假设\(x ( \alpha ) = a , x ( \beta ) = b\),且\(x ( t )\)单调递增且连续,\(x ' ( t )\)除有限点外都存在且黎曼可积.那当然应当有:

\[ \int_a^b f ( x ) \text{ d } x = \int_\alpha^\beta y ( t ) x ' ( t ) \text{ d } t \]

注意到如果反之条件使得\(x ( \alpha ) = b , x ( \beta ) = a\),则需要补一个\(- 1\).

由此可见,对于不自交的任意参数方程表示的曲线,直接积分的正负号一抵消,仍然可以求出曲线下方的面积.如果自交,就是要把自交部分的面积减去.顺便而言,简单封闭曲线(例如圆或者椭圆)当然是上述我们所说的特殊情况.

不过对于封闭曲线,由于转一圈会回到同一个点处,使用分部积分得到:

\[ \begin{aligned} & \int_\alpha^\beta y x ' \text{ d } t \\ = & \int_\alpha^\beta y \text{ d } x \\ = & xy |_a^b - \int_\alpha^\beta xy ' \text{ d } t \\ = & - \int_\alpha^\beta xy ' \text{ d } t \end{aligned} \]

兼顾一下对称性,可以写作\(S = \frac{ 1 }{ 2 } | \int_\alpha^\beta ( x ' y - y ' x ) \text{ d } t |\).由此立刻得到椭圆面积为\(ab \pi\).

Example3(极坐标的面积)

\(r = r ( \theta ) , \theta \in [ \alpha , \beta ] , r ( \theta ) \in C ( \alpha , \beta )\).

此时考虑对\(\theta\)做划分,取\(\Delta : \alpha = \theta_0 < \cdots < \theta_n = \beta\),并取\(m_i = \inf_{ [ \theta_{ i - 1 } , \theta_i ] } r , M_i = \sup_{ [ \theta_{ i - 1 } , \theta_i ] }\),立刻得到\(\frac{ 1 }{ 2 } m_i^2 \Delta \theta_i \leq \Delta S_i \leq \frac{ 1 }{ 2 } \sum M_i^2 \Delta \theta_i\),这样加密后得到\(S = \frac{ 1 }{ 2 } \int_\alpha^\beta r^2 ( \theta ) \text{ d } \theta\).

Example4(参数方程曲线的弧长)

取参数方程\(\begin{cases}x = x ( t ) \\ y = y ( t )\end{cases}\),并且假设\(x , y\)均连续.首先我们应当定义其”弧长”的含义.

可以使用折线逼近的策略定义弧长.具体而言,直接取分划\(\Delta : \alpha = t_0 < \cdots < t_n = \beta\).定义一个点\(P_i = ( x ( t_i ) , y ( t_i ) )\),这样我们当然就得到了若干个点,在这些点上就可以将相邻两个点求出折线,设折线长为\(\overline{ M_{ i - 1 } M_i }\).

接下来,称曲线是可求长的,当且仅当取出的折线的上确界是有限的,并将此上确界定义为曲线长.

我们接下来证明,其可求长当且仅当\(x ( t )\)\(y ( t )\)都是有界变差的.

先看必要性,任取分划\(\Delta : \alpha = t_0 < \cdots < t_n = \beta\).立刻得到\(V_\Delta ( x ) = \sum | x_i - x_{ i - 1 } | \leq \sum \overline{ M_{ i - 1 } M_i }\),当然是有界的,对于\(y ( t )\)同理.

另外,斜边小于两条直角边的和(三角形不等式),于是充分性也显然.

然而真要实际应用需要稍加条件,即:\(x ( t ) , y ( t )\)可导且导函数黎曼可积(说明其导函数有界,为李氏连续函数,那自然是有界变差函数).则弧长为\(\int_\alpha^\beta \sqrt{ ( x ' ( t ) )^2 + ( y ' ( t ) )^2 } \text{ d } t\).

证明比较容易,考虑勾股定理,\(\overline{ M_{ i - 1 } M_i } = \sqrt{ ( x ( t_i ) - x ( t_{ i - 1 } ) )^2 + ( y ( t_i ) - y ( t_{ i - 1 } ) )^2 }\).使用微分中值定理,得到其等于\(\Delta t_i \sqrt{ ( x ' ( \xi_i ) )^2 + ( y ' ( \eta_i ) )^2 }\).这里强行换成一个东西,于是就会得到\(\Delta t_i \sqrt{ ( x ' ( \xi_i ) )^2 + ( y ' ( \xi_i ) )^2 } + w_i\)的形式,其中\(w_i\)恰为两项之差.然后换黎曼和,只需证明后者\(w_i\)随着加密而趋向于\(0\).而这个根号差可以做分子有理化.具体而言:

\[ \begin{aligned} w_i & = \Delta t_i \left ( \sqrt{ ( x ' ( \xi_i ) )^2 + ( y ' ( \eta_i ) )^2 } - \sqrt{ ( x ' ( \xi_i ) )^2 + ( y ' ( \xi_i ) )^2 } \right ) \\ & = \Delta t_i \frac{ y ' ( \eta_i )^2 - y ' ( \xi_i )^2 }{ \sqrt{ ( x ' ( \xi_i ) )^2 + ( y ' ( \eta_i ) )^2 } + \sqrt{ ( x ' ( \xi_i ) )^2 + ( y ' ( \xi_i ) )^2 } } \\ & = \Delta t_i \frac{ ( y ' ( \eta_i ) + y ' ( \xi_i ) ) }{ \sqrt{ ( x ' ( \xi_i ) )^2 + ( y ' ( \eta_i ) )^2 } + \sqrt{ ( x ' ( \xi_i ) )^2 + ( y ' ( \xi_i ) )^2 } } ( y ' ( \eta_i ) - y ' ( \xi_i ) ) \\ & \leq \Delta t_i ( y ' ( \eta_i ) - y ' ( \xi_i ) ) \end{aligned} \]

最后会得到\(\leq \sum \omega_{ y ' } \Delta t_i\),立刻得到其趋向于\(0\).顺便还要证明这个是上确界,只需要证明加点后答案增加即可,然后用黎曼积分那一部分的对划分取并的技巧即可.

由此应当能推出直角坐标系下弧长公式,即\(l = \int_a^b \sqrt{ 1 + ( f ' ( x ) )^2 } \text{ d } x\).

Example5(极坐标下的弧长公式)

此时应当有\(x ' = r ' \cos \theta - r \sin \theta , y ' = r ' \sin \theta + r \cos \theta\),注意到\(( x ' )^2 + ( y ' )^2 = r^2 + ( r ' )^2\),于是极坐标下的公式当然是\(l = \int_\alpha^\beta \sqrt{ r^2 + ( r ' )^2 } \text{ d } \theta\).

Example6(等周不等式)

求给定长度的闭合曲线能围出的最大面积.

\(\Gamma\)是一个周长为\(l\)的简单可求长闭曲线,其面积为\(A\),我们下面证明\(A \leq \frac{ l^2 }{ 4 \pi }\).

先考虑\(\Gamma\)比较光滑的情况,也就是其有导函数且导函数可积.参数方程给出\(l = \int_\alpha^\beta \sqrt{ ( x ' )^2 + ( y ' )^2 } \text{ d } \theta\)\(A = \int_\alpha^\beta xy ' \text{ d } \theta\).注意这里假设曲线是逆时针方向旋转的.

接下来,考虑在原基础上画个圆,这个圆的参数方程横坐标继承自上述\(x ( \theta )\)而纵坐标由圆定义为\(\bar{ y } = \pm \sqrt{ r^2 - x^2 }\),这里的\(2 r = \sup x - \inf x\).也就是横着的最长距离.为了使得这个圆转起来是合理的,实际上应该找到上述曲线的左右端点然后分段函数定义,我们这里略去此细节.

然后呢,此时观察到应当有\(\pi r^2 = - \int_\alpha^\beta \bar{ y } x ' \text{ d } \theta\),发挥注意力得到:

\[ \begin{aligned} 2 \sqrt{ A \pi r^2 } & \leq A + \pi r^2 \\ & = \int_\alpha^\beta ( xy ' + \bar{ y } x ' ) \text{ d } \theta \\ & \leq \int_\alpha^\beta \sqrt{ x^2 + ( \bar{ y } )^2 } \sqrt{ y '^2 + x '^2 } \text{ d } t \\ & = rl \end{aligned} \]

于是证毕.

那么不光滑怎么办呢?可以用分段光滑函数(比如折线)逼近,这样就行了.

Example7(求多面体体积)

体积的定义无非类似面积,用夹逼定理定义任意形状的体积.

考虑对于每个\(x\),在\(x\)那里做截面,设得到的截面面积是\(S ( x )\),那么体积感觉上应当是\(V = \int_a^b S ( x ) \text{ d } x\).

然而这个结论的准确证明可能需要一些重积分知识.我们尝试越级打怪,加一个很神秘的条件:就是两个截面之间一定存在包含关系以及\(S ( x )\)是关于\(x\)连续变化的.然后看看能不能把这个结论证出来.

考虑\(x\)的范围是\([ a , b ]\),接下来对其作分划\(\Delta : a = x_0 < \cdots < x_n = b\).接下来取\(\eta_i , \xi_i\)满足\(S ( \xi_i ) = \max_{ [ x_{ i - 1 } , x_i ] } S ( x ) , S ( \eta_i ) = \min_{ [ x_{ i - 1 } , x_i ] } S ( x )\).此时回忆到包含关系,那么我们拿出来的\(\xi_i\)\(\eta_i\)当然就是包含别人以及被包含的两个截面,以它们为底面积做柱体,留意到此时当然有:

\[ S ( \eta_i ) ( x_{ i } - x_{ i - 1 } ) \leq V_{ [ x_{ i - 1 } , x_i ] } \leq S ( \xi_i ) ( x_i - x_{ i - 1 } ) \]

回忆到假设\(S ( x )\)是连续变化的因此黎曼可积,于是这个东西两边其实就是达布上下和,立刻得到积分的结论.

旋转体当然满足以上条件,易见旋转体的体积为\(\pi \int_a^b f^2 ( x ) \mathrm{ d } x\),参数方程同理.

Example8(旋转体的侧面积公式)

曲面的面积难以定义,所以我们现在暂时成为物理系学生.下面只考虑旋转体.

对于旋转体来说,先用折线逼近原曲线,然后旋转后得到若干圆台,用圆台的侧面积之和去逼近旋转体的侧面积.

对于\([ a , b ]\),我们先做一个分划\(\Delta : a = x_0 < \cdots < x_n = b\),\(y_i = f ( x_i )\).圆台侧面积给出\(\Delta S_i = \pi ( y_{ i - 1 } + y_i ) | \overline{ M_{ i - 1 } M_i } | = \pi ( y_{ i - 1 } + y_i ) \sqrt{ 1 + ( \cfrac{ y_i - y_{ i - 1 } }{ x_i - x_{ i - 1 } } )^2 } \Delta x_i\),利用微分中值定理,就有:

\[ \begin{aligned} S_i & = \pi ( y_{ i - 1 } + y_i ) \sqrt{ 1 + ( f ' ( \xi_i ) )^2 } \Delta x_i \\ & = 2 \pi f ( \xi_i ) \sqrt{ 1 + ( f ' ( \xi_i ) )^2 } \Delta x_i + ( y_i + y_{ i - 1 } - 2 \pi f ( \xi_i ) ) \sqrt{ 1 + ( f ' ( \xi_i ) )^2 } \Delta x_i \end{aligned} \]

加密后第二项可以用振幅控制住,所以答案就是\(2 \pi \int_a^b f ( x ) \sqrt{ 1 + ( f ' ( x ) )^2 } \mathrm{ d } x\).

对于参数方程当然也是平凡的,答案应当是\(2 \pi \int_a^b y \sqrt{ 1 + ( \frac{ y ' }{ x ' } )^2 } x ' \mathrm{ d } t = 2 \pi \int_a^b y \sqrt{ ( x ' )^2 + ( y ' )^2 } \mathrm{ d } t\),注意这里是按照\(x\)轴翻转.应当看到由此一段球面上的环的面积就是\(2 \pi r \Delta x\).

Example9(\(\pi\)的无理性证明)

假设\(\pi = \frac{ p }{ q } \in \mathbb{ Q }\)并且\(p \bot q , p , q \in \mathbb{ N_+ }\).

考虑设\(f_n ( x ) = q^n x^n ( p - qx )^n\),留意到\(\forall 0 \leq i \leq n - 1\),有\(f_n^{ ( i ) } ( 0 ) = f_n^{ ( i ) } ( \pi ) = 0\).

接下来考察\(\forall n \leq i \leq 2 n\),此时留意到\(f_n^{ ( i ) } ( 0 )\)\(f_n^{ ( i ) } ( \pi )\)都应当是整数并且是\(n !\)的倍数(是\(0\)也是\(n !\)的倍数).

考虑积分\(I_n = \frac{ 1 }{ n ! } \int_0^\pi f_n ( x ) \sin x \mathrm{ d } x > 0\).对其狂暴使用分部积分:

$$ \[\begin{aligned} I_n & = \frac{ 1 }{ n ! } \int_0^\pi f_n ( x ) \sin x \mathrm{ d } x \\ & = \frac{ 1 }{ n ! } \int_0^\pi f_n ( x ) \mathrm{ d } ( - \cos x ) \\ \end{aligned}\]

$$

不断做分部积分,前面扔出来的项也就是\(f_n^{ ( i ) } ( 0 )\)或者\(f_n^{ ( i ) } ( \pi )\)然后再乘上\(\sin , \cos\)\(0 , \pi\)之类取值的问题.总之,这个东西算出来一定是\(n !\)的倍数,前面乘了个\(\frac{ 1 }{ n ! }\),他就一定是整数.又因为其大于\(0\),他就一定\(\geq 1\).

那么矛盾在哪呢?留意到\(f_n = ( qx ( p - qx ) )^n \leq ( \frac{ p }{ 2 } )^{ 2 n } , \sin x \leq 1\),所以\(I_n \leq \frac{ 1 }{ n ! } ( \frac{ p }{ 2 } )^{ 2 n } \pi \to 0\).

Example10(古鲁金第一定理)

躲开微元法,要证明一些东西可以扔进去的话(比如密度函数),应当可以通过”平均密度”的概念用之前那个引理(分部积分那里,步骤是先积分,乘系数,后求和),总之都是平凡的.

考虑一个旋转体,反正用上面那套东西,搞出来质心应当有\(\bar{ y } = \frac{ \int_\alpha^\beta y \sqrt{ x '^2 + y '^2 } \mathrm{ d } t }{ l }\).移项得到\(2 \pi \bar{ y } l = 2 \pi \int_\alpha^\beta y \sqrt{ x '^2 + y '^2 } \mathrm{ d } t\).也就是:旋转线转一圈,质心周长乘以曲线的弧长等于侧面积.

Example11(古鲁金第二定理)

考虑两条曲线夹起来的部分,也就是设\([ a , b ]\)上有\(f ( x ) \geq g ( x ) \geq 0\),那这两条线就会围出一块二维出来.这一块的质心能不能求呢?当然也可以,只不过略有区别,\(\bar{ x } = \frac{ \int_a^b x ( f ( x ) - g ( x ) \mathrm{ d } x ) }{ S }\),而\(\bar{ y } = \frac{ 1 }{ 2 } \frac{ \int_a^b ( f^2 ( x ) - g^2 ( x ) \mathrm{ d } x ) }{ S }\).移项得到\(2 S \bar{ y } = \int_a^b ( f^2 ( x ) - g^2 ( x ) \mathrm{ d } x )\),也就是旋转面转一圈,质心周长乘以面积等于体积.

Example12(转动惯量)

定义为\(J = \int mr^2\).

考虑以\(x\)轴为旋转轴,先考虑线的情况,无非是分成小段每一段分别处理,对于每一段用长度和密度的乘积来逼质量,关于\(x\)轴的转动惯量\(J = \int_\alpha^\beta y^2 ( t ) \rho ( t ) \sqrt{ ( x ' ( t ) )^2 + ( y ' ( t ) )^2 } \text{ d } t\).

Example13

\(F\)是所有满足\(f \in C^1 [ 0 , 1 ] \mid f ( 0 ) = 0 , f ( 1 ) = 1 , f ' \geq 0\),\(f '\)单调不降的函数\(f\)组成的集合,记\(S_f\)\(f ( x )\)\(x\)轴转一圈得到的侧面积,求\(\sup_{ f \in F } S_f\)\(\inf_{ f \in F } S_f\).

先猜下确界是\(\pi\),上确界是\(\sqrt{ 2 } \pi\).

先证明下界是对的,考虑:

\[ \begin{aligned} S_f & = 2 \pi \int_0^1 f \sqrt{ 1 + ( f ' )^2 } \mathrm{ d } x \geq 2 \pi \int_0^1 f \cdot f ' \mathrm{ d } x \\ & = \pi \end{aligned} \]

怎么逼近呢?这个当然是直接平的是最优秀的对吧,考虑\(f_n ( x ) = x^n\),发现:

\[ \pi \leq S_{ f_n } \leq 2 \pi \int_0^1 f_n ( 1 + f_n ' ) \mathrm{ d } x = \pi + 2 \pi \int_0^1 f_n \mathrm{ d } x = \pi + \frac{ 2 \pi }{ n + 1 } \to \pi \]

上界怎么搞定呢?考虑肯定是\(f ( x ) = x\)是最好的,我们下面证明任意一段曲线,如果把曲线拉直就更优秀.

也就是考虑\(( 0 , 0 )\)\(( x_0 , f ( x_0 ) )\)的连线\(y = \frac{ f ( x_0 ) }{ x_0 } x\),容易见到:

\[ \begin{aligned} & \int_0^{ x_0 } y \sqrt{ 1 + ( y ' )^2 } \mathrm{ d } x \\ = & \int_0^{ x_0 } \frac{ f ( x_0 ) }{ x_0 } x \sqrt{ 1 + ( \frac{ f ( x_0 ) }{ x_0 } )^2 } \mathrm{ d } x \\ = & \frac{ 1 }{ 2 } f ( x_0 ) \sqrt{ x_0^2 + f ( x_0 )^2 } \end{aligned} \]

只要我们证明:

\[ \int_0^x f ( t ) \sqrt{ 1 + ( f ' ( t ) )^2 } \mathrm{ d } t \leq \frac{ 1 }{ 2 } f ( x ) \sqrt{ x^2 + f^2 ( x ) } \]

即可.注意到它们在零点的取值相同,因此直接算导数之差,要证:

\[ \begin{aligned} \frac{ 1 }{ 2 } f ' \sqrt{ x^2 + f^2 } + \frac{ x + f \cdot f ' }{ 2 \sqrt{ x^2 + f^2 } } f - f \sqrt{ 1 + ( f ' )^2 } & \geq 0 \\ 2 f \sqrt{ 1 + ( f ' )^2 } \sqrt{ x^2 + f^2 } & \leq ( x^2 + 2 f^2 ) f ' + xf \end{aligned} \]

敢算就敢赢,两边平方得到:

\[ 3 f^2 x^2 + 4 f^4 \leq x^4 ( f ' )^2 + 2 x^3 f \cdot f ' + 2 xf^3 f ' \]

注意到下凸函数满足\(f ' \geq \frac{ f }{ x }\),上述结论刚刚好得证,出这个题的lwg老师真是高人了.

定积分近似计算

考虑对\(\int_a^b f ( x ) \mathrm{ d } x\)做数值近似,将\([ a , b ]\)等分,取\(x_k = a + \frac{ k }{ n } ( b - a )\),其中\(0 \leq k \leq n\),而\(\Delta x = \frac{ b - a }{ n }\),\(x_{ k - \frac{ 1 }{ 2 } } = \frac{ x_k + x_{ k - 1 } }{ 2 }\).

那么用黎曼和逼积分,那么无非三种方式:要么算左端点的函数值,要么算右端点的函数值,要么算中间点的函数值.

问题在于计算误差,我们下面证明,如果\(f\)一阶可导,则:

  1. \(\int_a^b f ( x ) \mathrm{ d } x = \frac{ b - a }{ n } \sum_{ k = 1 }^n y_k - \frac{ ( b - a )^2 }{ 2 n } f ' ( \xi )\)

  2. \(\int_a^b f ( x ) \mathrm{ d } x = \frac{ b - a }{ n } \sum_{ k = 1 }^n y_{ k - 1 } + \frac{ ( b - a )^2 }{ 2 n } f ' ( \eta )\)

两个是类似的,只证第一个,考虑:

\[ \begin{aligned} & \int_a^b f ( x ) \mathrm{ d } x - \frac{ b - a }{ n } \sum_{ k = 1 }^n y_k \\ = & \sum_{ k = 1 }^n \int_{ x_{ k - 1 } }^{ x_k } ( f ( x ) - f ( x_k ) ) \mathrm{ d } x \\ = & \sum_{ k = 1 }^n \int_{ x_{ k - 1 } }^{ x_k } ( f ( x ) - f ( x_k ) ) \mathrm{ d } ( x - x_{ k - 1 } ) \\ = & - \sum_{ k = 1 }^n \int_{ x_{ k - 1 } }^{ x_k } ( x - x_{ k - 1 } ) f ' ( x ) \mathrm{ d } x \\ = & - \sum_{ k = 1 }^n f ' ( \xi_k ) \int_{ x_{ k - 1 } }^{ x_k } ( x - x_{ k - 1 } ) \mathrm{ d } x \\ = & - \sum_{ k = 1 }^n f ' ( \xi_k ) \frac{ ( b - a )^2 }{ 2 n^2 } \\ = & - \frac{ ( b - a )^2 }{ 2 n } f ' ( \xi ) \end{aligned} \]

最后一步是因为求均值也可以用介值定理.

那么在中点估计会怎么样呢?考虑给\(f\)更好的条件,让\(f\)二阶可导,则:

\[ \int_a^b f ( x ) \mathrm{ d } x = \frac{ b - a }{ n } \sum_{ k = 1 }^n y_{ k - \frac{ 1 }{ 2 } } - \frac{ ( b - a )^3 }{ 24 n^2 } f ' ' ( \xi ) \]

\(x_{ k - \frac{ 1 }{ 2 } }\)处做泰勒展开,应当有:

$$ \[\begin{aligned} f ( x ) - f ( x_{ k - \frac{ 1 }{ 2 } } ) & = ( x - x_{ k - \frac{ 1 }{ 2 } } ) f ' ( x_{ k - \frac{ 1 }{ 2 } } ) + \frac{ 1 }{ 2 } ( x - x_{ k - \frac{ 1 }{ 2 } } )^2 f ' ' ( \xi_k ) \\ \end{aligned}\]

$$

不妨设\(m_k \leq f ' ' ( \xi_k ) \leq M_k\),则:

\[ \begin{aligned} \int_{ x_{ k - 1 } }^{ x_k } ( f ( x ) - f ( x_{ k - \frac{ 1 }{ 2 } } ) ) \mathrm{ d } x & \leq \frac{ M_k }{ 2 } \int_{ x_{ k - 1 } }^{ x_k } ( x - x_{ k - \frac{ 1 }{ 2 } } )^2 \mathrm{ d } x \\ & = M_k \frac{ ( b - a )^3 }{ 24 n^3 } \end{aligned} \]

用介值定理就可以求和,原命题自然得证.

而上面的做法是矩形逼近,能不能用梯形逼近呢?用梯形逼近的话其实无非是\(\frac{ b - a }{ n } ( \frac{ y_0 + y_n }{ 2 } \sum_{ k = 1 }^{ n - 1 } y_k )\),然而,对于\(f \in C^2 [ a , b ]\),我们声明:

\[ \int_a^b f ( x ) \mathrm{ d } x = \frac{ b - a }{ n } ( \frac{ y_0 + y_n }{ 2 } \sum_{ k = 1 }^{ n - 1 } y_k ) - \frac{ ( b - a )^3 }{ 12 n^2 } f ' ' ( \xi ) \]

证明当然还是分部积分,考虑:

$$ \[\begin{aligned} & \int_{ x_{ k - 1 } }^{ x_k } f ( x ) \mathrm{ d } x \\ = & \int_{ x_{ k - 1 } }^{ x_k } f ( x ) \mathrm{ d } ( x - x_{ k - 1 } ) \\ = & f ( x_k ) \frac{ b - a }{ n } - \int_{ x_{ k - 1 } }^{ x_k } ( x - x_{ k - 1 } ) f ' ( x ) \mathrm{ d } x \\ = & f ( x_k ) \frac{ b - a }{ n } - \frac{ 1 }{ 2 } \int_{ x_{ k - 1 } }^{ x_k } f ' ( x ) \mathrm{ d } ( x - x_{ k - 1 } )^2 \\ = & f ( x_k ) \frac{ b - a }{ n } - \frac{ 1 }{ 2 } f ' ( x_k ) ( \frac{ b - a }{ n } )^2 + \frac{ 1 }{ 2 } \int_{ x_{ k - 1 } }^{ x_k } f ' ' ( x ) ( x - x_{ k - 1 } )^2 \mathrm{ d } x \\ \end{aligned}\]

$$

同理,在上面换\(x - x_k\)而非\(x - x_{ k - 1 }\),就可以得到:

$$ \[\begin{aligned} & \int_{ x_{ k - 1 } }^{ x_k } f ( x ) \mathrm{ d } x \\ = & f ( x_{ k - 1 } ) \frac{ b - a }{ n } + \frac{ 1 }{ 2 } f ' ( x_{ k - 1 } ) ( \frac{ b - a }{ n } )^2 + \frac{ 1 }{ 2 } \int_{ x_{ k - 1 } }^{ x_k } f ' ' ( x ) ( x - x_{ k } )^2 \mathrm{ d } x \\ \end{aligned}\]

$$

此时用NL公式,应当能见到把上面两式子相加可以得到:

\[ \begin{aligned} & \int_{ x_{ k - 1 } }^{ x_k } f ( x ) \mathrm{ d } x \\ = & \frac{ f ( x_{ k - 1 } ) + f ( x_k ) }{ 2 } \frac{ b - a }{ n } + \frac{ 1 }{ 4 } \int_{ x_{ k - 1 } }^{ x_k } f ' ' ( x ) ( ( x - x_{ k } )^2 + ( x - x_{ k - 1 } )^2 - ( \frac{ b - a }{ n } )^2 ) \mathrm{ d } x \\ = & \frac{ f ( x_{ k - 1 } ) + f ( x_k ) }{ 2 } \frac{ b - a }{ n } + \frac{ 1 }{ 2 } \int_{ x_{ k - 1 } }^{ x_k } f ' ' ( x ) ( x - x_k ) ( x - x_{ k - 1 } ) \mathrm{ d } x \\ = & \frac{ f ( x_{ k - 1 } ) + f ( x_k ) }{ 2 } \frac{ b - a }{ n } + \frac{ 1 }{ 2 } f ' ' ( \xi_k ) \int_{ x_{ k - 1 } }^{ x_k } ( x - x_k ) ( x - x_{ k - 1 } ) \mathrm{ d } x \\ = & \frac{ y_{ k - 1 } + y_k }{ 2 } \Delta x - \frac{ 1 }{ 12 } f ' ' ( \xi_k ) \frac{ ( b - a )^3 }{ n^3 } \end{aligned} \]

这样就完事了,接下来对\(n\)求个和就能得到之前的公式.

接下来是二次曲线逼近.考虑用\(( x_{ k - 1 } , y_{ k - 1 } ) , ( x_{ k - \frac{ 1 }{ 2 } } , y_{ k - \frac{ 1 }{ 2 } } ) , ( x_k , y_k )\)三个点确定一条二次曲线.不妨设这条二次曲线为\(Q_k ( x ) = px^2 + qx + r\).然而,此时观察到:

\[ \begin{aligned} & \int_{ x_{ k - 1 } }^{ x_k } Q_k ( x ) \mathrm{ d } x \\ = & \frac{ p }{ 3 } ( x_k^3 - x_{ k - 1 }^3 ) + \frac{ q }{ 2 } ( x_k^2 - x_{ k - 1 }^2 ) + r ( x_k - x_{ k - 1 } ) \\ = & \frac{ x_k - x_{ k - 1 } }{ 6 } ( Q_k ( x_k ) + Q_k ( x_{ k - 1 } ) + Q_k ( x_{ k - \frac{ 1 }{ 2 } } ) ) \\ = & \frac{ b - a }{ 6 n } ( y_{ k - 1 } + y_k + 4 y_{ k - \frac{ 1 }{ 2 } } ) \end{aligned} \]

这也很合理,观察一下就可以知道这个恰好是在尝试把梯形逼近和中点逼近两种方式尝试约掉后面的误差项系数.

定理是,如果\(f \in C^4 [ a , b ]\),误差项为\(- \frac{ ( b - a )^5 }{ 2880 n^4 } f^{ ( 4 ) } ( \xi )\).这就是所谓辛普森积分法.

广义积分

考虑函数\(f : [ a , + \infty ) \to \mathbb{ R }\),如果其\(\forall b > a\),\(f \in R [ a , b ]\),我们称其内闭可积.那我们就定义其广义积分为\(\int_a^{ + \infty } f \mathrm{ d } x = \lim_{ b \to + \infty } \int_a^b f \mathrm{ d } x\),当后者极限存在时.同理当然可以定义区间\(( - \infty , b ]\)上的广义积分.而如果\(\int_0^{ + \infty } f \mathrm{ d } x\)\(\int_{ - \infty }^0 f \mathrm{ d } x\)都收敛,则定义它们的和为\(\int_{ - \infty }^{ + \infty } f \mathrm{ d } x\).

称一个函数的瑕点为其局部无界的点,则考虑\(f : [ a , b ) \to \mathbb{ R }\),其中\(b\)\(f\)的瑕点,且\(f\)内闭可积,则\(\int_a^b f ( x ) \mathrm{ d } x = \lim_{ A \to b - 0 } \int_a^A f ( x ) \mathrm{ d } x\),若后者极限存在.瑕积分和上述广义积分并无明显区别,下述也不再区分.

在进一步讨论前,我们应当再仔细研究一下广义积分的收敛性,也就是当什么时候其极限存在呢?我们有以下命题:

  1. \(f ( x ) \geq 0 , x \in [ a , + \infty )\)时,\(F ( A ) = \int_a^A f ( x ) \mathrm{ d } x\)单增.那么此时\(F ( + \infty )\)存在当且仅当\(F ( A )\)有界.

  2. 比较原理:\(0 \leq f \leq cg , c > 0\),若\(\int_a^{ + \infty } g \mathrm{ d } x\)收敛,则\(\int_a^{ + \infty } f \mathrm{ d } x\)收敛.该结论可以移植到瑕积分上.

  3. 比较原理的推论:\(f , g \geq 0 , 0 < c_1 \leq \frac{ f }{ g } \leq c_2\),则\(\int f \mathrm{ d } x , \int g \mathrm{ d } x\)收敛性相同.进一步地,如果\(f , g \geq 0\),在趋近于某个瑕点的时候,\(\frac{ f }{ g }\)趋近于某个非零常数,那它们在这一点的收敛性相同.

(1)是根据单调收敛准则,而(2)则是(1)的推论,只是给出了一个界.

定义函数\(f\)绝对收敛,当\(\int_a^{ + \infty } | f | \mathrm{ d } x < \infty\)时.而考虑\(f = | f | - ( | f | - f )\),而\(0 \leq | f | - f \leq 2 | f |\),所以绝对收敛可以推出收敛,但反之不可.因此,我们将收敛但不绝对收敛的函数称为条件收敛.该结论也可以移植到瑕积分上.

接下来,我们有柯西收敛原理:\(\int_a^{ + \infty } f \mathrm{ d } x\)收敛的充要条件是对于\(\forall \epsilon > 0 , \exists M > a\)使得\(\forall A > B \geq M\),都有\(| \int_{ B }^A f \mathrm{ d } x | < \epsilon\).

证明当然无非是函数部分柯西收敛准则的重复应用.

柯西收敛原理推到瑕积分上的话,考虑\(F ( x ) = \int_a^x f ( t ) \mathrm{ d } t\),则瑕积分\(\lim_{ t \to b - 0 } F ( t )\)存在当且仅当\(\forall \epsilon > 0\),\(\exists \delta > 0\),当\(x_1 , x_2 \in ( b - \delta , b )\)的时候,有\(| F ( x_1 ) - F ( x_2 ) | < \epsilon\).

接下来还有Dirichlet-Abel判别法,设\(f , g : [ a , + \infty ) \to \mathbb{ R }\)内闭可积,\(f\)单调,那有:

  1. Dirichlet判别法:如果\(f ( + \infty ) = 0\),\(G ( A ) = \int_a^A g \mathrm{ d } x\)有界,则\(\int_a^{ + \infty } fg \mathrm{ d } x\)收敛.

  2. Abel判别法:如果\(f\)有界,\(\int_a^{ \infty } g \mathrm{ d } x\)收敛,则\(\int_a^{ + \infty } fg \mathrm{ d } x\)收敛.

用第二积分中值定理,就有\(\int_A^B f g \mathrm{ d } x = f ( A ) \int_A^\xi g \mathrm{ d } x + f ( B ) \int_{ \xi }^B g \mathrm{ d } x\).用柯西收敛原理则上述两条均为显然.结论当然可以推广到瑕积分上.

Example1

\(f\)\(( - \infty , + \infty )\)上内闭可积,且\(f ( + \infty ) = A , f ( - \infty ) = B\),对于\(a > 0\),求证\(\int_{ - \infty }^{ + \infty } \left ( f ( x + a ) - f ( x ) \right ) \mathrm{ d } x\)收敛并求其值.

注意到:

\[ \begin{aligned} \int_0^{ C } \left ( f ( x + a ) - f ( x ) \right ) \mathrm{ d } x & = \int_{ a }^{ C + a } f ( x ) \mathrm{ d } x - \int_0^C f ( x ) \mathrm{ d } x \\ & = \int_{ C }^{ C + a } f ( x ) \mathrm{ d } x - \int_0^a f ( x ) \mathrm{ d } x \\ & \to aA - \int_0^a f ( x ) \mathrm{ d } x \end{aligned} \]

另一侧同理为:

\[ \begin{aligned} \int_{ - C }^{ 0 } \left ( f ( x + a ) - f ( x ) \right ) \mathrm{ d } x & = \int_{ - C + a }^{ a } f ( x ) \mathrm{ d } x - \int_{ - C }^0 f ( x ) \mathrm{ d } x \\ & = - \int_{ - C }^{ - C + a } f ( x ) \mathrm{ d } x + \int_0^a f ( x ) \mathrm{ d } x \\ & \to - aB + \int_0^a f ( x ) \mathrm{ d } x \end{aligned} \]

于是答案是\(a ( A - B )\).

Example2

求证:

\[ \int_{ 1 }^{ + \infty } \frac{ \mathrm{ d } x }{ x^p } = \begin{cases} \lt \infty & p \gt 1 \\ \infty & p \leq 1 \end{cases} \]

显然.

Example3

求证:\(\int_a^{ + \infty } \frac{ \sin^2 x }{ x^2 } \mathrm{ d } x\)收敛.

原因是由比较原理,所以\(0 \leq \frac{ \sin^2 x }{ x^2 } \leq \frac{ 1 }{ x^2 }\),立刻知其收敛性.

Example4

判断\(\int_0^{ + \infty } \frac{ x \mathrm{ d } x }{ 1 + x^4 \sin^2 x }\)的收敛性.

考虑取\(F ( A ) = \int_0^A \frac{ x \mathrm{ d } x }{ 1 + x^4 \sin^2 x }\),接下来考虑\(F ( n \pi ) = \sum_{ k = 1 }^n U_k\),其中\(U_k = \int_{ ( k - 1 ) \pi }^{ k \pi } \frac{ x \mathrm{ d } x }{ 1 + x^4 \sin^2 x }\).

考虑:

\[ \begin{aligned} U_k & = \int_{ ( k - 1 ) \pi }^{ k \pi } \frac{ x \mathrm{ d } x }{ 1 + x^4 \sin^2 x } \\ & \geq \int_{ ( k - 1 ) \pi }^{ k \pi } \frac{ x \mathrm{ d } x }{ 1 + ( k \pi )^4 \sin^2 x } \\ & \geq 2 ( k - 1 ) \pi \int_{ 0 }^{ \frac{ \pi }{ 2 } } \frac{ x \mathrm{ d } x }{ 1 + ( k \pi )^4 ( \sin x )^2 } \\ & \geq 2 ( k - 1 ) \pi \int_{ 0 }^{ \frac{ \pi }{ 2 } } \frac{ x \mathrm{ d } x }{ 1 + ( k \pi )^4 x^2 } \\ & = \frac{ 2 ( k - 1 ) \pi }{ k^2 \pi^2 } \arctan ( k^2 \pi^2 x ) |_0^{ \frac{ \pi }{ 2 } } \\ & \geq \frac{ 2 ( k - 1 ) \pi }{ k^2 \pi^2 } \arctan ( \frac{ \pi^3 }{ 2 } ) \\ & = O ( \frac{ 1 }{ k } ) \end{aligned} \]

这就证完了,必然发散.

Example5

\(f : ( - \infty , + \infty ) \to \mathbb{ R }\)且内闭可积,\(p > 0\),并且\(\int_{ - \infty }^{ + \infty } | f |^p \mathrm{ d } x < \infty\),求证\(\lim_{ h \to 0 } \int_{ - \infty }^{ + \infty } \left | f ( x + h ) - f ( x ) \right |^p \mathrm{ d } x\)收敛.

既然\(\int_{ - \infty }^{ + \infty } | f |^p \mathrm{ d } x < \infty\),那么一定存在一个足够大的\(A\),使得\(\int_{ A }^{ + \infty } | f |^p \mathrm{ d } x\)足够小,不妨取足够大的\(A > 0\)使得\(\int_{ A - 1 }^{ + \infty } | f |^p \mathrm{ d } x < \epsilon_1\).

事实上考虑\(| u + v | \leq | u | + | v | \leq 2 \max ( | u | , | v | )\),那么\(| u + v |^p \leq 2^p ( | u |^p + | v |^p )\),取\(| h | < 1\),则:

\[ \begin{aligned} & \int_{ A }^{ + \infty } \left | f ( x + h ) - f ( x ) \right |^p \mathrm{ d } x \\ \leq & 2^p \int_{ A }^{ + \infty } | f ( x + h ) |^p \mathrm{ d } x + 2^p \int_{ A }^{ + \infty } | f ( x ) |^p \mathrm{ d } x \\ = & 2^p \int_{ A + h }^{ + \infty } | f ( x ) |^p \mathrm{ d } x + 2^p \int_{ A }^{ + \infty } | f ( x ) |^p \mathrm{ d } x \\ \leq & 2^{ p + 1 } \int_{ A - 1 }^{ + \infty } | f |^p \mathrm{ d } x \\ \leq & 2^{ p + 1 } \epsilon_1 \end{aligned} \]

同理,另一侧也可以放掉.现在的问题在于\(( - A + 1 , A - 1 )\)中间这一段.

考虑用一个线性函数逼近,做分划\(\Delta : - A + 1 = x_0 < \cdots < x_n = A - 1\),取线性函数逼近,策略为\(x \in [ x_{ k - 1 } , x_k ]\)的时候\(g ( x ) = \frac{ f ( x_k ) - f ( x_{ k - 1 } ) }{ x_k - x_{ k - 1 } } ( x - x_{ k - 1 } ) + f ( x_{ k - 1 } )\).接下来考虑对于每一段,设\(M_k = \sup_{ [ x_{ k - 1 } , x_k ] } f , m_k = \inf_{ [ x_{ k - 1 } , x_k ] } f\),则每一段可以被控制为\(M_k - m_k\).我们早在之前就提过黎曼可积的函数可被线性函数逼近,然而疑问是这种逼近能否在\(p\)次方意义下满足,于是取足够小的划分使得\(\sum_{ k = 1 }^n ( M_k - m_k ) \Delta x_k < \epsilon_2^2\).

接下来常规分治,取\(C = \{ 1 \leq k \leq n | M_k - m_k \geq \epsilon_2 \}\)\(B = \{ 1 \leq k \leq n | M_k - m_k < \epsilon_2 \}\).见到\(\sum_{ k \in C } \Delta x_k < \epsilon_2\).不妨设\(M = \sup_{ [ - A + 1 , A - 1 ] } f , m = \inf_{ [ - A + 1 , A - 1 ] } f\)立刻有:

\[ \begin{aligned} & \int_{ - A + 1 }^{ A - 1 } \left | f - g \right |^p \mathrm{ d } x \\ \leq & \sum_{ k } | M_k - m_k |^p \Delta x_k \\ = & \sum_{ k \in C } | M_k - m_k |^p \Delta x_k + \sum_{ k \in B } | M_k - m_k |^p \Delta x_k \\ \leq & | M - m |^p \epsilon_2 + \epsilon_2^p ( 2 A - 2 ) \end{aligned} \]

这样这里就被限制住了,而考虑:

$$ \[\begin{aligned} & \int_{ - \infty }^{ + \infty } \left | f ( x + h ) - f ( x ) \right |^p \mathrm{ d } x \\ \leq & \int_{ - \infty }^{ + \infty } 3^p \left ( \left | f ( x + h ) - g ( x + h ) \right |^p + \left | g ( x + h ) - g ( x ) \right |^p + \left | f ( x ) - g ( x ) \right |^p \right ) \mathrm{ d } x \\ \end{aligned}\]

$$

前后两项都能被上述控制住,只剩中间的\(| g ( x + h ) - g ( x ) |^p\)\(O ( h^p )\)的,只需调整\(h\)就能控制住.

Example6

求证:\(\int_1^{ + \infty } \frac{ \sin x }{ x } \mathrm{ d } x\)是条件收敛的.

用DA判别法,取\(f = \frac{ 1 }{ x }\)当然趋近于\(0\),而\(| \int_1^A \sin x \mathrm{ d } x | \leq 2\),于是收敛.

那接下来就要证明它并非绝对收敛.只需考虑:

\[ \begin{aligned} & \int_1^{ + \infty } \frac{ | \sin x | }{ x } \mathrm{ d } x \\ \geq & \int_1^{ + \infty } \frac{ \sin^2 x }{ x } \mathrm{ d } x \\ = & \int_1^{ + \infty } \frac{ 1 - \cos^2 x }{ x } \mathrm{ d } x \end{aligned} \]

当然并不绝对收敛.

事实上还可以直接求出来这个积分的值.

接下来考虑\(f ( x ) = \begin{cases}0 & x = 0 \\ \frac{ 1 }{ x } - \frac{ 1 }{ 2 \sin \frac{ x }{ 2 } } & x \in [ - \pi , \pi ] \setminus \{ 0 \}\end{cases}\).只需泰勒展开就知道它是解析的.回忆到黎曼引理:

\[ \begin{aligned} & \int_0^{ \infty } \frac{ \sin x }{ x } \mathrm{ d } x \\ = & \lim_{ n \to + \infty } \int_{ 0 }^{ ( n + \frac{ 1 }{ 2 } ) \pi } \frac{ \sin x }{ x } \mathrm{ d } x \\ = & \lim_{ n \to + \infty } \int_{ 0 }^{ \pi } \frac{ \sin ( ( n + \frac{ 1 }{ 2 } ) t ) }{ t } \mathrm{ d } t \\ = & \lim_{ n \to + \infty } \int_{ 0 }^{ \pi } \left ( f ( t ) + \frac{ 1 }{ 2 \sin \frac{ t }{ 2 } } \right ) \sin ( ( n + \frac{ 1 }{ 2 } ) t ) \mathrm{ d } t \\ = & \lim_{ n \to + \infty } \int_{ 0 }^{ \pi } \frac{ 1 }{ 2 \sin \frac{ t }{ 2 } } \sin ( ( n + \frac{ 1 }{ 2 } ) t ) \mathrm{ d } t \\ = & \lim_{ n \to + \infty } \int_{ 0 }^{ \pi } \left ( \frac{ 1 }{ 2 } + \sum_{ k = 1 }^n \cos ( kt ) \right ) \mathrm{ d } t \\ = & \frac{ \pi }{ 2 } \end{aligned} \]

Example7

给定\(f \in C [ 0 , + \infty ]\),\(\int_0^{ + \infty } f^2 \mathrm{ d } x < + \infty , f ( 0 ) = 0\),取\(g ( x ) = \int_0^x f ( t ) \mathrm{ d } t\),求证:\(\int_0^{ + \infty } \frac{ g^2 ( x ) }{ x^2 } \mathrm{ d } x \leq 4 \int_0^{ + \infty } f^2 \mathrm{ d } x\)以证明前者存在.

当然是分部积分,用洛必达法则知道\(\lim_{ x \to 0 } \frac{ g }{ x } \to 0\),考虑:

\[ \begin{aligned} \int_0^A \frac{ g^2 }{ x^2 } \mathrm{ d } x & = \int_0^A g^2 \mathrm{ d } ( - \frac{ 1 }{ x } ) \\ & = - \frac{ g^2 ( x ) }{ x } |_0^A + \int_0^A \frac{ 2 gf }{ x } \mathrm{ d } x \\ & = - \frac{ g^2 ( A ) }{ A } + 2 \int_0^A \frac{ g }{ x } f \mathrm{ d } x \\ & \leq 2 ( \int_0^A \frac{ g^2 }{ x^2 } \mathrm{ d } x )^{ \frac{ 1 }{ 2 } } ( \int_0^A f^2 \mathrm{ d } x )^{ \frac{ 1 }{ 2 } } \end{aligned} \]

整理一下就做完了.

Example8(欧拉积分)

\(\int_0^{ + \infty } \frac{ x^{ p - 1 } }{ 1 + x } \mathrm{ d } x , 0 < p < 1\)的收敛性和值.

考虑\(\frac{ x^{ p - 1 } }{ 1 + x }\)\(x \to 0\)的时候趋近于\(x^{ p - 1 }\),而在\(x \to \infty\)的时候趋近于\(x^{ p - 2 }\),因此绝对收敛.

难点在于把这个东西求出来.接下来将采取一些不严谨的说法.

考虑\(0 \leq x < 1\)的时候,有:

$$ \[\begin{aligned} \frac{ x^{ p - 1 } }{ 1 + x } & = x^{ p - 1 } \sum_{ j = 0 }^\infty ( - x )^j \\ & = \sum_{ j = 0 } ( - 1 )^j x^{ p + j - 1 } \\ \end{aligned}\]

$$

暂时抛开多余的思量,两边做积分:

\[ \begin{aligned} \int_0^1 \frac{ x^{ p - 1 } }{ 1 + x } \mathrm{ d } x & = \sum_{ j = 0 } ( - 1 )^j \int_0^1 x^{ p + j - 1 } \mathrm{ d } x \\ & = \sum_{ j = 0 } ( - 1 )^j \frac{ 1 }{ p + j } \end{aligned} \]

另一边,其实只需换元,可以发现:

$$ \[\begin{aligned} & \int_1^{ + \infty } \frac{ x^{ p - 1 } }{ 1 + x } \mathrm{ d } x \\ = & \int_0^1 \frac{ t^{ 1 - p } }{ 1 + t^{ - 1 } } \frac{ \mathrm{ d } t }{ t^2 } \\ = & \int_0^1 \frac{ t^{ - p } }{ 1 + t } \mathrm{ d } t \\ = & \int_0^1 \frac{ t^{ 1 - p - 1 } }{ 1 + t } \mathrm{ d } t \\ = & \sum_{ j = 0 }^{ \infty } ( - 1 )^j \frac{ 1 }{ 1 - p + j } \\ = & \sum_{ j = 0 }^{ \infty } ( - 1 )^{ j + 1 } \frac{ 1 }{ p - ( j + 1 ) } \\ = & \sum_{ j = 1 }^{ \infty } ( - 1 )^{ j } \frac{ 1 }{ p - j } \\ \end{aligned}\]

$$

结合起来,答案当然就是\(\sum_{ j = - \infty }^{ + \infty } \frac{ ( - 1 )^j }{ p + j }\).

我们暂且断言上面那个无穷级数等于\(\frac{ \pi }{ \sin ( p \pi ) }\),原因是我们权且承认下述级数是正确的:

\[ \frac{ 1 }{ \sin t } = \sum_{ j = - \infty }^{ + \infty } \frac{ ( - 1 )^j }{ p + j \pi } \]

Example9(Frullani积分)

\(f \in C [ 0 , + \infty )\),且\(\int_0^{ + \infty } \frac{ f ( x ) }{ x } \mathrm{ d } x\)收敛,求证\(\int_0^{ + \infty } \frac{ f ( ax ) - f ( bx ) }{ x } \mathrm{ d } x = f ( 0 ) \ln \frac{ b }{ a }\).

考虑:

$$ \[\begin{aligned} & \int_A^{ B } \frac{ f ( ax ) - f ( bx ) }{ x } \mathrm{ d } x \\ = & \int_{ aA }^{ aB } \frac{ f ( x ) }{ x } \mathrm{ d } x - \int_{ bA }^{ bB } \frac{ f ( x ) }{ x } \mathrm{ d } x \\ = & \int_{ aA }^{ bA } \frac{ f ( x ) }{ x } \mathrm{ d } x - \int_{ aB }^{ bB } \frac{ f ( x ) }{ x } \mathrm{ d } x \\ = & \int_{ a }^{ b } \frac{ f ( Ax ) }{ x } \mathrm{ d } x - \int_{ aB }^{ bB } \frac{ f ( x ) }{ x } \mathrm{ d } x \\ \end{aligned}\]

$$

前者当\(A \to 0\)的时候当然转化为\(\int_{ a }^{ b } \frac{ f ( 0 ) }{ x } \mathrm{ d } x\),而后者用柯西判准知道趋近于\(0\),立刻完事.

Example10

\(I = \int_0^{ \frac{ \pi }{ 2 } } \ln ( \sin x ) \mathrm{ d } x\).

考虑\(x \to 0\)的时候,\(\ln ( \sin x ) \sim \ln x\),而\(\int \ln x = x \ln x - x\),因此是绝对收敛的.

那怎么求这个积分呢?考虑一些对称技巧,立刻有:

$$ \[\begin{aligned} I & = \int_0^{ \frac{ \pi }{ 2 } } \ln ( \sin x ) \mathrm{ d } x \\ & = \int_{ \frac{ \pi }{ 2 } }^{ \pi } \ln ( \sin x ) \mathrm{ d } x \\ & = \int_{ 0 }^{ \frac{ \pi }{ 2 } } \ln ( \cos x ) \mathrm{ d } x \\ \end{aligned}\]

$$

那么:

\[ \begin{aligned} I & = \frac{ 1 }{ 2 } \int_0^\pi \ln ( \sin x ) \mathrm{ d } x \\ & = \int_0^{ \frac{ \pi }{ 2 } } \ln ( \sin 2 t ) \mathrm{ d } t \\ & = \int_0^{ \frac{ \pi }{ 2 } } \left ( \ln 2 + \ln ( \sin t ) + \ln ( \cos t ) \right ) \mathrm{ d } t \\ & = \frac{ \pi }{ 2 } \ln 2 + 2 I \end{aligned} \]

所以\(I = - \frac{ \pi }{ 2 } \ln 2\).

Example11

讨论\(\int_0^1 \frac{ \ln x }{ x^{ \alpha } } , \alpha > 0\)的收敛性.

考虑\(x \in ( 0 , 1 ]\)的时候,\(\frac{ \ln x }{ x^{ \alpha } } \leq 0\),因此其收敛性当然等价于绝对收敛性.取\(x \to 0\)的部分,而考虑:

\(0 < \alpha < 1\),任取一个足够小的\(\delta > 0\)使得\(0 < \alpha + \delta < 1\),都可以取足够逼近的\(x \to 0\)使得\(| \frac{ \ln x }{ x^{ \alpha } } | < \frac{ 1 }{ x^{ \alpha + \delta } }\).于是此时绝对收敛.反之,当\(\alpha \geq 1\)的时候,\(| \frac{ \ln x }{ x^\alpha } | > \frac{ 1 }{ x }\),此时发散.

Example12

讨论\(p , q > 0\),\(\int_2^{ + \infty } \frac{ \mathrm{ d } x }{ x^p \ln^q x }\)的收敛性.

\(p > 1\)的时候,显然\(\frac{ 1 }{ x^p \ln^q x } < \frac{ 1 }{ x^p }\),因此当然绝对收敛.

\(p < 1\)的时候,同Example11,只需放掉\(\ln x\)就行,因此是发散的.

\(p = 1\)的时候,估计出了点问题,此时做换元\(t = \ln x\),则原式变为:

$$ \[\begin{aligned} & \int_{ \ln 2 }^{ + \infty } e^{ - t } e^{ t } \frac{ 1 }{ t^q } \mathrm{ d } t \\ = & \int_{ \ln 2 }^{ + \infty } \frac{ 1 }{ t^q } \mathrm{ d } t \\ \end{aligned}\]

$$

所以当\(q > 1\)的时候收敛,当\(q \leq 1\)的时候发散.

Example13

讨论\(I = \int_0^{ \frac{ \pi }{ 2 } } \frac{ \sin x }{ x^p } \mathrm{ d } x\)的收敛性.

\(f = \frac{ \sin x }{ x }\),容易见到\(f\)\(( 0 , \frac{ \pi }{ 2 } )\)上是单调递减的,那就应当有:

\[ \frac{ 2 }{ \pi } \frac{ 1 }{ x^{ p - 1 } } \leq \frac{ \sin x }{ x^p } = \frac{ \sin x }{ x } \frac{ 1 }{ x^{ p - 1 } } \leq \frac{ 1 }{ x^{ p - 1 } } \]

因此其收敛性等价于\(\int_{ 0 }^{ \frac{ \pi }{ 2 } } \frac{ 1 }{ x^{ p - 1 } }\)的收敛性,当\(p < 2\)时收敛.

Example14

\(f \in C^2 [ a , + \infty )\),若\(\int_a^{ + \infty } f^2 ( x ) \mathrm{ d } x < + \infty , \int_a^{ + \infty } ( f ' ' )^2 ( x ) \mathrm{ d } x < + \infty\),求证\(\int_a^{ + \infty } ( f ' )^2 ( x ) \mathrm{ d } x < + \infty\).

此时考虑做分部积分,当然有:

$$ \[\begin{aligned} \int_a^x f ( t ) f ' ' ( t ) \mathrm{ d } t & = f ( x ) f ' ( x ) - f ( a ) f ' ( a ) - \int_a^x ( f ' ( t ) )^2 \mathrm{ d } t \\ f ( x ) f ' ( x ) & = f ( a ) f ' ( a ) + \int_a^x f ( t ) f ' ' ( t ) \mathrm{ d } t + \int_a^x ( f ' ( t ) )^2 \mathrm{ d } t \\ \end{aligned}\]

$$

此时回忆到柯西不等式:

\[ ( \int_a^x f ( t ) f ' ' ( t ) \mathrm{ d } t ) \leq ( \int_a^x f^2 ( t ) \mathrm{ d } t ) ( \int_a^x ( f ' ' ( t ) )^2 \mathrm{ d } t ) \]

因此这一项被控制住了,于是我们知道\(f ( x ) f ' ( x )\)\(\int_a^x ( f ' ( t ) )^2 \mathrm{ d } t\)收敛性相同.

接下来反证原结论,假设后者并不收敛而是趋近\(+ \infty\).那\(f ( x ) f ' ( x ) \to + \infty\),对其做积分,则:

\[ \int_a^{ + \infty } f ( x ) f ' ( x ) \mathrm{ d } x = \int_a^{ + \infty } f ( x ) \mathrm{ d } f ( x ) = f^2 ( x ) - f^2 ( a ) \]

因此\(f^2 ( x ) \to + \infty\),这当然与\(\int_a^{ + \infty } f^2 ( x ) \mathrm{ d } x < + \infty\)相违背.

Example15

判断\(\int_1^{ + \infty } \tan \left ( \cfrac{ \sin x }{ x } \right ) \mathrm{ d } x\)的收敛性.

考虑\(\int_1^{ + \infty } \frac{ \sin x }{ x } \mathrm{ d } x\)当然是收敛的,而对\(\tan \frac{ \sin x }{ x }\)做泰勒展开应该和\(\frac{ \sin x }{ x }\)同阶,于是:

$$ \[\begin{aligned} & \int_1^{ + \infty } \tan \left ( \cfrac{ \sin x }{ x } \right ) \mathrm{ d } x \\ = & \int_1^{ + \infty } \frac{ \sin x }{ x } \mathrm{ d } x + \int_1^{ + \infty } \left ( \tan \left ( \cfrac{ \sin x }{ x } \right ) - \frac{ \sin x }{ x } \right ) \mathrm{ d } x \\ \end{aligned}\]

$$

前半部分当然收敛,后半部分取绝对值放缩后是\(O ( \frac{ 1 }{ x^2 } )\)的,当然也收敛.

Example16

讨论\(\int_1^{ + \infty } \frac{ \sin x }{ x^p } \arctan x \mathrm{ d } x , p > 0\)的收敛性.

\(\int_1^{ + \infty } \frac{ \sin x }{ x^p } \mathrm{ d } x\)收敛,而\(\arctan x\)单调有界,立刻知道收敛.

Example17

讨论\(\int_2^{ + \infty } \frac{ \cos \sqrt{ x } }{ x^p \ln x } \mathrm{ d } x\)的收敛性.

当然先做换元\(t = \sqrt{ x }\),那么原式变成:

$$ \[\begin{aligned} & \int_{ \sqrt{ 2 } }^{ + \infty } \frac{ 2 t \cos t \mathrm{ d } t }{ t^{ 2 p } \ln t^2 } \\ = & \int_{ \sqrt{ 2 } }^{ + \infty } \frac{ \cos t \mathrm{ d } t }{ t^{ 2 p - 1 } \ln t } \\ \end{aligned}\]

$$

\(2 p - 1 > 1 , p > 1\)的时候当然绝对收敛,而\(0 \leq 2 p - 1 \leq 1\)的时候用DA判准知道收敛,\(2 p - 1 < 0\)的时候当然发散.

Example18(磨光核函数)

构造一个\(C^{ \infty }\)的函数\(g ( x )\),满足当\(x \leq 0\)的时候,\(g ( x ) = 0\);而当\(x \geq 1\)的时候,\(g ( x ) = 1\).也就是你要造一个函数把两段直线焊接起来.

考虑\(h ( x ) = \begin{cases}e^{ - \frac{ 1 }{ x^2 } } & x \ne 0 \\ 0 & x = 0\end{cases}\).这个\(h ( x )\)容易检验是\(C^{ \infty }\)的,只需看\(0\)点处的可导性即可.

\(H ( x ) = \int_{ - \infty }^x h ( t ) h ( 1 - t ) \mathrm{ d } t\).容易见到这函数在\(0\)处和\(1\)处都无穷阶可导.稍微乘下常数就可以搞定.

Example19

\(\int_0^{ + \infty } f ( x ) \mathrm{ d } x\)收敛,\(xf ( x )\)单调,求证:\(\lim_{ x \to \inf } xf ( x ) \ln x = 0\).

首先容易证明\(xf ( x )\)单调递减趋于\(0\).那么:

\[ \begin{aligned} & \int_{ x_0 }^{ x_0^2 } f ( x ) \mathrm{ d } x \\ = & \int_{ x_0 }^{ x_0^2 } f ( x ) \frac{ x }{ x } \mathrm{ d } x \\ = & \int_{ x_0 }^{ x_0^2 } xf ( x ) \mathrm{ d } \ln x \\ \geq & x_0^2 f ( x_0^2 ) \ln x_0 \\ = & \frac{ 1 }{ 2 } x_0^2 f ( x_0^2 ) \ln x_0^2 \end{aligned} \]

\(x_0 \to \inf\)用柯西准则证毕.

Example20

求证:当\(\int_a^b | f | < \infty\)的时候,黎曼引理仍然成立.

回忆到黎曼引理要求\(f \in R [ a , b ]\),但这里的确可以推广,原因是瑕积分肯定只有有限个瑕点(有无限个瑕点能立刻证明发散),只需要用足够小的区间把这有限个瑕点盖住,用柯西准则就可以证明这部分很小,而外面的部分当然是正常的黎曼引理.

RS积分

\(\alpha ( x ) : [ a , b ] \to \mathbb{ R }\)是一个单调不减的函数,对于有界函数\(f ( x ) : [ a , b ] \to \mathbb{ R }\),考虑一个分划\(P : a = x_0 < \cdots < x_n = b\),定义\(\Delta \alpha_k = \alpha ( x_k ) - \alpha ( x_{ k - 1 } ) \geq 0\),并定义\(M_k = \sup_{ [ x_{ k - 1 } , x_k ] } f ( x ) , m_k = \inf_{ [ x_{ k - 1 } , x_k ] } f ( x )\).在此基础上定义上和\(U ( P , f , \alpha ) = \sum_{ k = 1 }^n M_k \Delta \alpha_k\),同理定义下和\(L ( P , f , \alpha ) = \sum_{ k = 1 }^n m_k \Delta \alpha_k\).定义上积分\(\overline{ \int_{ a }^b } f ( x ) \mathrm{ d } \alpha = \inf_P{ U ( P , f , \alpha ) }\),同理定义下积分\(\underline{ \int_{ a }^b } f ( x ) \mathrm{ d } \alpha = \inf_P{ L ( P , f , \alpha ) }\).那么如果有以下\(\overline{ \int_{ a }^b } f ( x ) \mathrm{ d } \alpha = \underline{ \int_{ a }^b } f ( x ) \mathrm{ d } \alpha\),称\(f\)\([ a , b ]\)上关于\(\alpha\)RS可积,记作\(f \in{ R }_\alpha [ a , b ]\),而将此值称作\(f\)关于\(\alpha\)的RS积分,记作\(\int_a^b f ( x ) \mathrm{ d } \alpha\).

类比黎曼积分那套理论,应当有以下显而易见的性质:

  1. 分划\(P^*\)如果是\(P\)的加密,那么\(L ( P , f , \alpha ) \leq L ( P^* , f , \alpha ) , U ( P , f , \alpha ) \geq U ( P^* , f , \alpha )\).

  2. \(L ( P_1 , f , \alpha ) \leq U ( P_2 , f , \alpha )\).

  3. \(\underline{ \int_{ a }^b } f ( x ) \mathrm{ d } \alpha \leq \overline{ \int_{ a }^b } f ( x ) \mathrm{ d } \alpha\).

  4. \(f \in{ R }_\alpha\),其充要条件是\(\forall \epsilon > 0\),存在分划\(P\)使得\(0 \leq U ( P , f , \alpha ) - L ( P , f , \alpha ) < \epsilon\).

接下来考虑证明一些性质:

  1. \(f_1 , f_2 \in{ R }_\alpha [ a , b ]\),则\(f_1 + f_2 \in{ R }_\alpha [ a , b ]\),并且\(\int_a^b ( f_1 + f_2 ) \mathrm{ d } \alpha = \int_a^b f_1 \mathrm{ d } \alpha + \int_a^b f_2 \mathrm{ d } \alpha\).

  2. \(f \in{ R }_\alpha [ a , b ]\),则\(cf \in{ R }_\alpha [ a , b ]\),并且\(\int_a^b ( cf ) \mathrm{ d } \alpha = c \int_a^b f \mathrm{ d } \alpha\).

  3. \(f_1 , f_2 \in{ R }_\alpha [ a , b ] , f_1 \leq f_2\),则\(\int_a^b f_1 \mathrm{ d } \alpha \leq \int_a^b f_2 \mathrm{ d } \alpha\).

  4. \(f \in{ R }_\alpha [ a , b ] , c \in [ a , b ]\),那么\(f \in{ R }_\alpha [ a , c ] , f \in{ R }_\alpha [ c , b ]\),且\(\int_a^b f \mathrm{ d } \alpha = \int_a^c f \mathrm{ d } \alpha + \int_c^b f \mathrm{ d } \alpha\).

  5. \(f \in{ R }_\alpha [ a , b ] , | f | \leq M\),则\(| \int_a^b f \mathrm{ d } \alpha | \leq M \left ( \alpha ( b ) - \alpha ( a ) \right )\).

  6. \(f \in{ R }_{ \alpha_1 } [ a , b ]\)并且\(f \in{ R }_{ \alpha_2 } [ a , b ]\),则\(f \in{ R }_{ \alpha_1 + \alpha_2 } [ a , b ]\),并且\(\int_a^b f \mathrm{ d } ( \alpha_1 + \alpha_2 ) = \int_a^b f \mathrm{ d } \alpha_1 + \int_a^b f \mathrm{ d } \alpha_2\).

  7. \(f \in{ R }_\alpha [ a , b ] , c > 0\).则\(f \in{ R }_{ c \alpha } [ a , b ]\),并且\(\int_a^b f \mathrm{ d } ( c \alpha ) = c \int_a^b f \mathrm{ d } \alpha\).

  8. \(f \in{ R }_\alpha [ a , b ] , m \leq f \leq M , g \in C [ m , M ]\).则\(g ( f ( x ) ) \in{ R }_\alpha [ a , b ]\).

  9. \(f \in{ R }_\alpha [ a , b ]\),则\(| f | \in{ R }_\alpha [ a , b ]\),且\(| \int_a^b f \mathrm{ d } \alpha | \leq \int_a^b | f | \mathrm{ d } \alpha\).

  10. \(f_1 , f_2 \in{ R }_\alpha [ a , b ]\),则\(f_1 f_2 \in{ R }_\alpha [ a , b ]\).

  11. 如果极限\(\lim_{ \lambda ( P ) \to 0 } ( \sum f ( t_k ) \Delta \alpha_k ) , t_k \in [ x_{ k - 1 } , x_k ]\)存在,则\(f \in{ R }_\alpha [ a , b ]\)并且其RS积分就是上述极限.然而,逆命题未必成立.

对于(1),考虑对于分划\(P_1 , P_2\)而言:

\[ \begin{aligned} L ( P_1 , f_1 , \alpha ) + L ( P_2 , f_2 , \alpha ) & \leq L ( P_1 \cup P_2 , f_1 , \alpha ) + L ( P_1 \cup P_2 , f_2 , \alpha ) \\ & \leq L ( P_1 \cup P_2 , f_1 + f_2 , \alpha ) \\ & \leq U ( P_1 \cup P_2 , f_1 + f_2 , \alpha ) \\ & \leq U ( P_1 \cup P_2 , f_1 , \alpha ) + U ( P_1 \cup P_2 , f_2 , \alpha ) \leq U ( P_1 , f_1 , \alpha ) + U ( P_2 , f_2 , \alpha ) \end{aligned} \]

对此式子两边同取上下确界可以证明\(\forall \epsilon > 0 , U ( P_1 \cup P_2 , f_1 + f_2 , \alpha ) - L ( P_1 \cup P_2 , f_1 + f_2 , \alpha ) < \epsilon\),即可得证(1).

对于(2),显然\(U ( P , cf , \alpha ) = cU ( P , f , \alpha )\),下和同理,于是立即得证.

对于(3),由(1),显然\(f_2 \geq f_1\)时,\(\int_a^b ( f_2 - f_1 ) \mathrm{ d } \alpha \geq 0\),于是\(\int_a^b f_2 \mathrm{ d } \alpha \geq \int_a^b f_1 \mathrm{ d } \alpha\).

对于(4),考虑既然\(f \in R_\alpha [ a , b ]\),那么\(\forall \epsilon > 0\),都应该\(\exists P\)使得\(U_{ [ a , b ] } ( P , f , \alpha ) - L_{ [ a , b ] } ( P , f , \alpha ) < \epsilon\),而令\(P ' = P \cup \{ c \}\),也就是将\(c\)强行作为一个分点,上式仍然成立,而可以将\(P '\)拆分为两个部分,不妨记作\(P_1 , P_2\),应该有:

\[ \begin{aligned} & U_{ [ a , b ] } ( P ' , f , \alpha ) - L_{ [ a , b ] } ( P ' , f , \alpha ) \\ = & U_{ [ a , c ] } ( P_1 , f , \alpha ) - L_{ [ a , c ] } ( P_1 , f , \alpha ) + U_{ [ c , b ] } ( P_2 , f , \alpha ) - L_{ [ c , b ] } ( P_2 , f , \alpha ) < \epsilon \end{aligned} \]

此二项均为正,因此分别\(< \epsilon\),那也就说明了\(f \in R_\alpha [ a , c ]\)\(f \in R_\alpha [ c , b ]\),并且仍然是钦定\(c\)为分点就可以见到\(\int_a^b f \mathrm{ d } \alpha = \int_a^c f \mathrm{ d } \alpha + \int_c^b f \mathrm{ d } \alpha\).

对于(5),由(3)可以得知:

\[ - \int_a^b M \mathrm{ d } \alpha \leq \int_a^b f \mathrm{ d } \alpha \leq \int_a^b M \mathrm{ d } \alpha \]

而由定义立刻见到\(\int_a^b M \mathrm{ d } \alpha = M ( \alpha ( b ) - \alpha ( a ) )\).

对于(6),考虑\(\Delta ( \alpha_1 + \alpha_2 )_k = \Delta \alpha_1 + \Delta \alpha_2\),因此\(U ( P , f , \alpha_1 + \alpha_2 ) = U ( P , f , \alpha_1 ) + U ( P , f , \alpha_2 )\).因此证明与(4)无异.

对于(7),只需考虑\(\Delta ( c \alpha ) = c \Delta \alpha\),于是\(U ( P , f , c \alpha ) = cU ( P , f , \alpha )\),于是证明与(2)无异.

考虑(8)的证明,由于\(g\)是闭区间上的连续函数,立刻知道其一致连续.也就是\(\forall \epsilon > 0 , \exists 0 < \delta < \epsilon\),使得\(| s - t | < \delta\)时一定有\(| g ( s ) - g ( t ) | < \epsilon\).接下来考虑由于\(f \in R_\alpha [ a , b ]\),应当可以取一组划分\(P : a = x_0 < \cdots < x_n = b\),使得\(U ( P , f , \alpha ) - L ( P , f , \alpha ) < \delta^2\).考虑将划分分为两类:\(A = \{ 1 \leq k \leq n \mid M_k - m_k < \delta \}\)\(B = \{ 1 \leq k \leq n \mid M_k - m_k \geq \delta \}\).这个思路就会和根号分治很像.那接下来考虑定义\(M_k^* = \sup_{ [ x_{ k - 1 } , x_k ] } g ( f ( x ) ) , m_k^* = \inf_{ [ x_{ k - 1 } , x_k ] } g ( f ( x ) )\).

那这就会使得当\(k \in A\)的时候,由于\(g\)的一致连续性,立刻可以知道\(M_k^* - m_k^* \leq \epsilon\).而当\(k \in B\)的时候,考虑:

\[ \begin{aligned} \delta \sum_{ k \in B } \Delta \alpha_k & \leq \sum_{ k \in B } ( M_k - m_k ) \Delta \alpha_k \\ & = U ( P , f , \alpha ) - L ( P , f , \alpha ) < \delta^2 \end{aligned} \]

于是\(\sum_{ k \in B } \Delta \alpha_k < \delta\).如此一来:

\[ \begin{aligned} & U ( P , g \circ f , \alpha ) - L ( P , g \circ f , \alpha ) \\ = & \sum_{ k \in A } ( M_k^* - m_k^* ) \Delta \alpha_k + \sum_{ k \in B } ( M_k^* - m_k^* ) \Delta \alpha_k \\ < & \epsilon ( \alpha ( b ) - \alpha ( a ) ) + 2 ( \sup | g | ) \delta \\ < & \epsilon \left ( \alpha ( b ) - \alpha ( a ) + 2 \sup | g | \right ) \end{aligned} \]

这样就证毕了.

考虑(9)的证明,首先由(8)知道\(| f | \in{ R }_\alpha [ a , b ]\).而我们可以说存在\(c = \pm 1\),使得\(| \int_a^b f \mathrm{ d } \alpha | = c ( \int_a^b f \mathrm{ d } \alpha )\).而\(cf ( x ) \leq | f ( x ) |\),由(3)的保序性得证.

考虑(10)的证明,嵌套函数\(g = x^2\)并利用(9),则我们可以知道如果\(f \in{ R }_\alpha [ a , b ]\),那么\(f^2 \in{ R }_\alpha [ a , b ]\).此时观察到\(4 f_1 f_2 = ( f_1 + f_2 )^2 - ( f_1 - f_2 )^2\),立即得证.

(11)的证明比较显然.(11)直接的逆命题的话有个反例是考虑\(f ( x ) = \begin{cases}1 & x \geq 0 \\ 0 & x < 0\end{cases} , \alpha ( x ) = \begin{cases}1 & x > 0 \\ 0 & x \leq 0\end{cases}\).此时会发现\(x = 0\)这个点取不取在分划里是重要的,只要不取在分划里,怎么加密也没有用.

接下来当然应当研究一下连续性对RS可积的意义.我们声明:

  1. 如果\(f \in C [ a , b ]\),则\(f \in{ R }_\alpha [ a , b ]\)且对\(\forall \epsilon > 0 , \exists \delta > 0\),并且只要\(\lambda ( P ) < \delta\),那么\(| \sum f ( t_k ) \Delta \alpha_k - \int_a^b f \mathrm{ d } \alpha | < \epsilon\),其中\(t_k \in [ x_{ k - 1 } , x_k ]\).

  2. (1)中的条件如果改成\(f \in R_\alpha [ a , b ] , \alpha \in C [ a , b ]\),结论仍然成立.

  3. 如果\(f\)单调,但是\(\alpha\)连续,则我们也能证明\(f_\alpha \in{ R }_\alpha [ a , b ]\).

  4. 作为(3)的推论,如果\(f\)是有界变差函数,\(\alpha\)连续,也能证明\(f_\alpha \in{ R }_\alpha [ a , b ]\).

  5. 如果\([ a , b ]\)上的有界函数\(f\)只有有限个间断点,并且\(f\)\(\alpha\)的间断点集交集为空,则\(f \in R_\alpha [ a , b ]\).同时,(1)中的性质仍然成立.

(1)的证明,考虑\(\forall \epsilon > 0\),取\(\gamma > 0\),使得\(\left ( \alpha ( b ) - \alpha ( a ) \right ) \gamma < \epsilon\).此时,\(f\)是闭区间上的连续函数,那它就一定是一致连续的函数.那么\(\exists \delta > 0\),当\(| x - y | < \delta\)的时候,有\(| f ( x ) - f ( y ) | < \gamma\).此时只需考虑\(U ( P , f , \alpha ) - L ( P , f , \alpha ) < \epsilon\)就做完了.

(2)的证明,考虑既然\(f \in R_{ \alpha } [ a , b ]\),因此一定存在一组分划\(P^*\)使得\(U ( P^* , f , \alpha ) < \int_a^b f \mathrm{ d } \alpha + \epsilon\).

那么接下来对于任意一组分划\(P : a = x_0 < \cdots < x_m = b\),将其分为两组:一组是\(A = \{ k \mid \exists i , x_i^* \in ( x_{ k - 1 } , x_k ) \}\),\(B = \{ 1 , 2 , \cdots , m \} \setminus A\).也即\(B\)中的每个区间都被包含在\(P^*\)的分划中.既然如此,在\(B\)上的和的部分当然就要\(\leq U ( P^* , f , \alpha ) < \int_a^b f \mathrm{ d } \alpha + \epsilon\).只要我们能证明\(A\)能被控制住即可.

而由于\(\alpha\)连续,其在\([ a , b ]\)上绝对连续,可以取足够小的分划使得\(\Delta \alpha\)足够小.既然如此,\(\sum_{ k \in A } f ( t_k ) \Delta \alpha_k \leq nM \max \{ \Delta \alpha_k \}\),其中\(M\)\(f\)\([ a , b ]\)上的上界,这个立刻可以被\(\max \{ \Delta \alpha_k \}\)控制住.

(3)的证明,不妨设\(f\)单调不降,此时考虑取足够大的\(n\)使得\(\frac{ \alpha ( b ) - \alpha ( a ) }{ n } ( f ( b ) - f ( a ) ) < \epsilon\).那么由于\(\alpha\)连续,所以其有介值性,可以通过选取划分使得\(\Delta \alpha_k \equiv \frac{ \alpha ( b ) - \alpha ( a ) }{ n } ( f ( b ) - f ( a ) )\),那还是考虑\(U ( P , f , \alpha ) - L ( P , f , \alpha ) < \epsilon\)即可.

(5)的证明相当平凡,只需用闭区间上的连续函数是一致连续处理间断点即可,在此略过.

于上述基础上进一步拓展,可以拓展到\(\alpha\)是有界变差的情况.原因是有界变差函数可以表示为两个不降函数的差,不妨设\(\alpha ( x ) = \beta ( x ) - \gamma ( x )\),则我们定义\(\int_a^b f \mathrm{ d } \alpha = \int_a^b f \mathrm{ d } \beta - \int_a^b f \mathrm{ d } \gamma\).

这个还要证明是良定的,原因是如果一个有界变差函数能表示成两种情形,有\(\beta_1 ( x ) - \gamma_1 ( x ) = \beta_2 ( x ) - \gamma_2 ( x )\),那么\(\beta_1 ( x ) + \gamma_2 ( x ) = \beta_2 ( x ) + \gamma_1 ( x )\),这两边都是不降函数,那根据\(\alpha\)部分可以加减的性质就完事了.

既然如此,对拓展的版本进一步寻找性质,不妨设\(V ( x ) = V_a^x \alpha\).

  1. \(f \in C [ a , b ]\)\(\alpha\)是有界变差,或\(f , \alpha\)都是有界变差且\(f\)连续时,\(| \int_a^b f \mathrm{ d } \alpha | \leq \int_a^b f \mathrm{ d } V\)

  2. 作为(1)的推论,上述条件时,\(| \int_a^b f \mathrm{ d } \alpha | \leq \sup | f | \times V_a^b \alpha\)

  3. (分部积分):当\(\alpha , f\)都是有界变差,并且它们有一个是连续的时候,\(\int_a^b f \mathrm{ d } \alpha = f \alpha \mid_a^b - \int_a^b \alpha \mathrm{ d } f\).应当见到其实该定理只需要\(\alpha , f\)有一个是连续就行.

  4. (第一积分中值定理):\(f \in C [ a , b ]\)\(\alpha\)不降,则\(\int_a^b f \mathrm{ d } \alpha = f ( \xi ) \left ( \alpha ( b ) - \alpha ( a ) \right )\).

  5. (第二积分中值定理):\(f\)\([ a , b ]\)上单调,\(\alpha\)是连续有界变差.则\(\int_a^b f \mathrm{ d } \alpha = f ( a ) \left ( \alpha ( \xi ) - \alpha ( a ) \right ) + f ( b ) \left ( \alpha ( b ) - \alpha ( \xi ) \right )\).

  6. (变量替换公式):如果\(f , g \in C [ a , b ]\)并且\(g\)严格增,取\(h = g^{ - 1 }\),\(c = g ( a ) , d = g ( b )\),那么\(\int_a^b f ( x ) \mathrm{ d } x = \int_c^d f ( h ( y ) ) \mathrm{ d } h ( y )\).

  7. (和黎曼可积的关系):\(f \in R [ a , b ]\),\(\alpha\)可导并且\(\alpha ' \in R [ a , b ]\),则\(f \in R_\alpha [ a , b ]\),且\(\int_a^b f \mathrm{ d } \alpha = \int_a^b f \alpha ' \mathrm{ d } x\)

考虑(1)的证明,由于此时已经可以使用求和来逼近,那不妨考虑:

\[ \begin{aligned} | S ( P , f , \alpha ) | & = | \sum f ( t_k ) \Delta \alpha_k | \\ & \leq | \sum f ( t_k ) | \cdot | \Delta \alpha_k | \\ & \leq | \sum f ( t_k ) | \Delta V_k \end{aligned} \]

于是证毕.(2)自是(1)的推论.

(3)的话,当然是Abel求和,考虑:

\[ \begin{aligned} S ( P , f , \alpha ) & = \sum_{ k = 1 }^n f ( t_k ) ( \alpha ( x_k ) - \alpha ( x_{ k - 1 } ) ) \\ & = f ( b ) \alpha ( b ) - f ( a ) \alpha ( a ) - \sum_{ k = 1 }^{ n + 1 } \alpha ( x_{ k - 1 } ) ( f ( t_k ) - f ( t_{ k - 1 } ) ) \\ & = f \alpha |_a^b - S ( Q , \alpha , f ) \end{aligned} \]

容易见到\(| P | \to 0\)会导致\(| Q | \to 0\),便是显然.

考虑(4),由于\(f\)是连续的,直接取\(f\)的上下界并介值定理一下即是显然.

考虑(5),用分部积分公式,立刻有:

\[ \begin{aligned} \int_a^b f \mathrm{ d } \alpha & = f ( b ) \alpha ( b ) - f ( a ) \alpha ( a ) - \int_a^b \alpha \mathrm{ d } f \\ & = f ( b ) \alpha ( b ) - f ( a ) \alpha ( a ) - \alpha ( \xi ) ( f ( b ) - f ( a ) ) \end{aligned} \]

整理一下即可.

考虑(6),由于连续性,因此对\(x\)做的划分同样通过一个\(h\)成为了新的一组划分,而且由于闭区间上的连续函数是一致连续的,这个划分当然也趋近于\(0\),立即见到成立.

对于(7),首先用介值定理得到\(\Delta \alpha_k = \alpha ' ( \xi_k ) \Delta x_k\),那当然有:

\[ \begin{aligned} S ( P , f , \alpha ) & = \sum f ( t_k ) \Delta \alpha_k \\ & = \sum f ( t_k ) \alpha ' ( t_k ) \Delta x_k + \sum f ( t_k ) ( \alpha ' ( \xi_k ) - \alpha ' ( t_k ) ) \Delta x_k \end{aligned} \]

而后面那一项绝对值不超过\(| \sup f | \sum \omega_{ \alpha ' }\),当然趋近于\(0\).

级数

对于数列\(\{ a_n \}\),定义\(S_n = \sum_{ k = 1 }^n a_k\).如果\(\lim_{ n \to \infty } S_n\)存在,则称级数\(\sum_{ k = 1 }^{ \infty } a_n\)收敛,记作\(S = \sum_{ k }^{ \infty } a_n\),否则如若上述极限不存在,称其发散.

容易见到以下性质显然成立,然而逆命题并不总是成立:

  1. \(\sum^{ + \infty } a_n = A , \sum^{ + \infty } b_n = B\),则\(\sum^{ + \infty } ( a_n + b_n ) = A + B\).

  2. \(\sum^{ + \infty } a_n = A\),则\(\sum^{ + \infty } c a_n = cA\).

  3. 结合律:\(\sum^{ + \infty } a_n = A\),若\(\{ n_k \}\)是递增正整数序列且\(n_0 = 1\),设\(C_k = \sum_{ n = n_{ k - 1 } }^{ n_k - 1 } a_n\),则\(\sum_k^{ + \infty } C_k = A\).

(1)(2)显然,(3)当然是因为原数列收敛立刻能推出其子列收敛.

如果\(\sum | a_n | < \infty\),则称此级数绝对收敛.考虑\(a_n = | a_n | - ( | a_n | - a_n )\),前后两者都是正项数列而且\(| a_n | - a_n \leq 2 | a_n |\),所以绝对收敛当然能推出收敛,而反之不可.将收敛但不绝对收敛的级数称作条件收敛.绝对收敛的两个级数之和当然也绝对收敛,乘一个系数后也绝对收敛.

我们有柯西收敛原理:\(\sum a_n\)收敛的充要条件是\(\forall \epsilon > 0\),\(\exists N > 0 , \forall m > n \geq N\),\(| \sum_{ k = n }^m a_k | < \epsilon\).用柯西准则立刻见到如若\(\lim_{ n \to \infty } S_n\)收敛则必有\(\lim_{ n \to \infty } a_n = 0\).但反命题当然不成立.这是相当重要的,正是因为\(\lim_{ n \to \infty } a_n = 0\),所以我们才总能使用泰勒展开等手段进行估计和放缩.

再还有Abel-Dirichlet判别法,设\(a_n\)单调,\(B_n = \sum_{ k = 1 }^n b_k\),\(B_n\)有界,\(| B_n | \leq M\):

  1. 引理:\(| \sum_{ k = 1 }^n a_k b_k | \leq M ( | a_1 | + 2 | a_n | ) \leq 2 M ( | a_1 | + | a_n | )\).

  2. Dirichlet判别法:若\(a_n \to 0\),\(B_n\)有界,则\(\sum a_k b_k\)收敛.

  3. Abel判别法:若\(B_n\)收敛,\(a_n\)有界,则\(\sum a_k b_k\)收敛.

(1)的话当然只需使用Abel变换,有:

\[ \begin{aligned} \sum_{ k = 1 }^n a_k b_k & = \sum_{ k = 1 }^n a_k ( B_k - B_{ k - 1 } ) \\ & = a_n B_n + \sum_{ k = 1 }^{ n - 1 } ( a_k - a_{ k + 1 } ) B_k \end{aligned} \]

则:

\[ \begin{aligned} & | \sum_{ k = 1 }^n a_k b_k | \\ \leq & | a_n B_n | + \sum_{ k = 1 }^{ n - 1 } | a_k - a_{ k + 1 } | \cdot | B_k | \\ \leq & M ( | a_1 - a_n | + | a_n | ) \\ \leq & M ( | a_1 | + 2 | a_n | ) \end{aligned} \]

(2)(3)的话用柯西判准,考虑任意一段求和\(| B_{ n + p } - B_{ n - 1 } | \leq 2 M\),于是:

\[ | \sum_{ k = n }^{ n + p } a_k b_k | \leq 2 M ( | a_n | + 2 | a_{ n + p } | ) \]

则属显然.

DA判别法的一个推论是,对于\(\sum b_k\)\(\sum c_k\)来说,如果\(\frac{ b_k }{ c_k }\)单调有界且不趋于\(0\),那么它们敛散性相同.

Example1

\(\sum \frac{ \sin ( nx ) }{ n }\)的收敛性.

首先当\(x = 2 k \pi\)的时候当然收敛,否则使用DA判别法,考虑证明\(\sum \sin ( nx )\)有界.

用积化和差,考虑:

\[ \begin{aligned} | \sum_{ k = 1 }^n \sin ( kx ) | & = \left | \frac{ \sum 2 \sin \frac{ x }{ 2 } \sin ( kx ) }{ 2 \sin ( \frac{ x }{ 2 } ) } \right | \\ & = \left | \frac{ \sum \cos ( k - \frac{ 1 }{ 2 } ) x - \cos ( k + \frac{ 1 }{ 2 } ) x }{ 2 \sin ( \frac{ x }{ 2 } ) } \right | \\ & \leq \frac{ 1 }{ | \sin \frac{ x }{ 2 } | } \end{aligned} \]

这就完事.

能不能进一步把上面的这个级数求出来呢?考虑欧拉公式,令\(z = e^{ ix }\),知道\(e^{ inx } = \cos ( nx ) + i \sin ( nx )\),所以\(\sum \frac{ z^n }{ n } = - \ln ( 1 - z )\)的虚部就是所求.

而:

\[ \begin{aligned} - \ln ( 1 - z ) & = - \ln ( 1 - \cos x - i \sin x ) \\ & = - \ln \left ( 2 ( \sin \frac{ x }{ 2 } ) ( \sin \frac{ x }{ 2 } - i \cos \frac{ x }{ 2 } ) \right ) \\ & = - \ln \left ( 2 ( \sin \frac{ x }{ 2 } ) e^{ \frac{ x - \pi }{ 2 } i } \right ) \\ & = - \ln ( 2 \sin \frac{ x }{ 2 } ) + \frac{ \pi - x }{ 2 } i \end{aligned} \]

这就顺便解决了\(\sum \frac{ \cos ( nx ) }{ n }\)的情况.

Example2

判断\(\sum \frac{ ( - 1 )^n }{ n^p + ( - 1 )^n } , p > 0\)的收敛性.

观察到:

\[ \begin{aligned} & \frac{ ( - 1 )^n }{ n^p + ( - 1 )^n } \\ = & \frac{ ( - 1 )^n }{ n^p } \frac{ 1 }{ 1 + \frac{ ( - 1 )^n }{ n^p } } \\ = & \frac{ ( - 1 )^n }{ n^p } \frac{ 1 - \frac{ ( - 1 )^n }{ n^p } }{ 1 - \frac{ 1 }{ n^{ 2 p } } } \\ = & \frac{ ( - 1 )^n }{ n^p - \frac{ 1 }{ n^p } } - \frac{ 1 }{ n^{ 2 p } - 1 } \end{aligned} \]

前半部分当然收敛,于是\(p \leq \frac{ 1 }{ 2 }\)的时候发散,\(\frac{ 1 }{ 2 } < p \leq 1\)的时候条件收敛.

Example3

\(\sum \frac{ \sin ( \frac{ n \pi }{ 4 } ) }{ n^p + \sin ( \frac{ n \pi }{ 4 } ) }\)的敛散性.

考虑:

\[ \begin{aligned} & \frac{ \sin ( \frac{ n \pi }{ 4 } ) }{ n^p + \sin ( \frac{ n \pi }{ 4 } ) } \\ = & \frac{ \sin ( \frac{ n \pi }{ 4 } ) }{ n^p } \frac{ 1 }{ 1 + \frac{ \sin ( \frac{ n \pi }{ 4 } ) }{ n^p } } \\ = & \frac{ \sin ( \frac{ n \pi }{ 4 } ) }{ n^p } \left ( 1 - \frac{ \sin ( \frac{ n \pi }{ 4 } ) }{ n^p } + o ( \frac{ 1 }{ n^p } ) \right ) \\ = & \frac{ \sin ( \frac{ n \pi }{ 4 } ) }{ n^p } - \frac{ \sin^2 ( \frac{ n \pi }{ 4 } ) }{ n^{ 2 p } } + o ( \frac{ 1 }{ n^{ 2 p } } ) \end{aligned} \]

见到应该是\(p \leq \frac{ 1 }{ 2 }\)发散,\(\frac{ 1 }{ 2 } < p \leq 1\)的时候条件收敛,\(p > 1\)的时候绝对收敛.

正项级数

  1. \(a_n \geq 0\)的时候,\(S_n\)有界\(\Leftrightarrow\)S_n

  2. \(0 \leq a_n \leq b_n\),若\(\sum^{ + \infty } b_n < \infty\),则\(\sum^{ + \infty } a_n < \infty\).

  3. \(a_n , b_n > 0\),则若\(\varlimsup_{ n \to \infty } \frac{ a_n }{ b_n } < \infty\),则\(\sum^{ + \infty } b_n < \infty \Rightarrow \sum^{ + \infty } a_n < \infty\).

  4. \(a_n , b_n > 0\),则若\(\varliminf_{ n \to \infty } \frac{ a_n }{ b_n } > 0\),则\(\sum^{ + \infty } b_n = \infty \Rightarrow \sum^{ + \infty } a_n = \infty\).

  5. \(a_n\)单调递减趋近于\(0\).则\(\sum^{ + \infty }_n a_n < \infty \Leftrightarrow \sum_{ k }^{ + \infty } 2^k a_{ 2^k } < \infty\).

  6. \(\sum_{ k = 1 }^{ + \infty } \frac{ 1 }{ n^p }\),当\(p \leq 1\)的时候发散,而当\(p > 1\)的时候收敛.

  7. \(\sum_{ k = 2 }^{ + \infty } \frac{ 1 }{ n \ln^p n }\),当\(p \leq 1\)的时候发散,而当\(p > 1\)的时候收敛.

  8. 设单调递减连续正函数\(f ( x )\)满足\(a_n = f ( n )\),则\(\sum_{ k = 1 }^{ + \infty } a_k < \infty \Leftrightarrow \int_1^{ + \infty } f ( x ) \mathrm{ d } x < \infty\).

  9. 比值判别法:对于\(a_n > 0\),如果\(\varlimsup_{ n \to \infty } \frac{ a_{ n + 1 } }{ a_n } < 1\),则\(\sum a_n < \infty\).

  10. 比值判别法:对于\(a_n > 0\),如果\(\varliminf_{ n \to \infty } \frac{ a_{ n + 1 } }{ a_n } > 1\),则\(\sum a_n = \infty\).

  11. 根值判别法:对于\(a_n > 0\),设\(l = \varlimsup_{ n \to \infty } ( a_n )^{ \frac{ 1 }{ n } }\),如果\(l < 1\),则\(\sum a_n < \infty\);若\(l > 1\),则\(\sum a_n = \infty\).

  12. 对于\(a_n > 0\),如果\(\varliminf_{ n \to \infty } n \ln \frac{ a_n }{ a_{ n + 1 } } > 1\),则\(\sum a_n < \infty\).

  13. 对于\(a_n > 0\),如果\(\varlimsup_{ n \to \infty } n \ln \frac{ a_n }{ a_{ n + 1 } } < 1\),则\(\sum a_n = \infty\).

  14. 拉贝判别法:对于\(a_n > 0\),若\(\varliminf_{ n \to \infty } n ( \frac{ a_n }{ a_{ n + 1 } } - 1 ) > 1\),则\(\sum a_n < \infty\).

  15. 拉贝判别法:对于\(a_n > 0\),若\(\varlimsup_{ n \to \infty } n ( \frac{ a_n }{ a_{ n + 1 } } - 1 ) < 1\),则\(\sum a_n = \infty\).

(1)当然是单调收敛准则.(2)只是(1)的推论.

(3)(4)只需套用定义即可.

(5)的话,不妨设\(S_n = \sum_{ k = 1 }^n a_k\)\(T_n = \sum_{ k = 1 }^n 2^k a_{ 2^k }\)考虑当\(2^k \leq n\)的时候,有:

\[ \begin{aligned} S_n & \geq \sum_{ j = 1 }^{ 2^k } a_j \\ & = a_1 + \sum_{ j = 0 }^{ k - 1 } \sum_{ i = 2^j + 1 }^{ 2^{ j + 1 } } a_i \\ & \geq \frac{ 1 }{ 2 } T_k \end{aligned} \]

\(n < 2^{ k + 1 }\)的时候,则有:

\[ \begin{aligned} S_n & \leq \sum_{ j = 1 }^{ 2^k } a_j \\ & = \sum_{ j = 0 }^{ k - 1 } \sum_{ i = 2^j }^{ 2^{ j + 1 } - 1 } a_i \\ & \leq T_k \end{aligned} \]

(6)的话,首先\(p \leq 1\)的时候\(\frac{ 1 }{ n^p } \geq \frac{ 1 }{ n }\)于是显然,而当\(p > 1\)的时候,考虑用(5),观察\(\sum 2^k \frac{ 1 }{ 2^{ pk } } = \sum 2^{ ( 1 - p ) k }\),当然收敛.

(7)的话亦然考虑(5),等价于\(\sum 2^k \frac{ 1 }{ 2^k k^p \ln^p 2 } = \sum \frac{ 1 }{ k^p \ln^p 2 }\),等价于(6)了.这个结论还可以推广到\(\sum \frac{ 1 }{ n \ln n ( \ln \ln n )^p }\),总之都是类似的做法,结论也类似.

(8)的证明只需考虑:

\[ a_{ n + 1 } = f ( n + 1 ) \leq \int_n^{ n + 1 } f ( t ) \mathrm{ d } t \leq f ( n ) = a_n \]

立刻证毕.

而且这个估计还可以更精细,事实上我们可以证明下列极限总是存在:

\[ \lim_{ n \to \infty } ( \sum_{ k = m }^n f ( k ) - \int_m^n f ( x ) \mathrm{ d } x ) = \alpha \]

而且还满足\(0 \leq \alpha \leq f ( m )\).

考虑固定\(m\),设\(g ( n ) = \sum_{ k = m }^n f ( k ) - \int_m^n f ( x ) \mathrm{ d } x\),用单调收敛准则,我们先证明它单调递减且有下界,注意到:

\[ g ( n ) - g ( n + 1 ) = - f ( n + 1 ) + \int_{ n }^{ n + 1 } f ( x ) \mathrm{ d } x \geq 0 \]

这就证明了其单调递减,而又有:

\[ g ( n ) = \sum_{ k = m }^{ n - 1 } \left ( f ( k ) - \int_{ k }^{ k + 1 } f ( x ) \mathrm{ d } x \right ) + f ( n ) \geq f ( n ) \geq 0 \]

因此有下界.同时注意到\(g ( m ) = f ( m )\),因此总有\(0 \leq \alpha \leq f ( m )\)成立.

不仅如此,如果\(f ( n )\)还满足\(\lim_{ x \to \infty } f ( x ) = 0\),我们还可以把这个极限收敛的速度求出来.我们有:

\[ | \sum_{ k = m }^n f ( k ) - \int_m^n f ( x ) \mathrm{ d } x - \alpha | \leq f ( n ) \]

干脆令\(l > n\),考虑LHS应该是:

\[ \begin{aligned} & \sum_{ k = m }^n f ( k ) - \int_m^n f ( x ) \mathrm{ d } x - \alpha \\ = & \sum_{ k = m }^n f ( k ) - \int_m^n f ( x ) \mathrm{ d } x - \left ( \lim_{ l \to \infty } ( \sum_{ k = m }^l f ( k ) - \int_m^l f ( x ) \mathrm{ d } x ) \right ) \\ = & \lim_{ l \to \infty } \left ( \int_n^l f ( x ) \mathrm{ d } x - \sum_{ k = n + 1 }^l f ( k ) \right ) \\ = & \lim_{ l \to \infty } \left ( \sum_{ k = n + 1 }^l ( \int_{ k - 1 }^k f ( k ) \mathrm{ d } x - f ( k ) ) \right ) \\ \leq & \lim_{ l \to \infty } \left ( \sum_{ k = n + 1 }^l ( f ( k - 1 ) - f ( k ) ) \right ) \\ \leq & f ( n ) \end{aligned} \]

而上式换个方向放缩就可以知道\(\geq 0\),这就搞定.

(9)(10)类似(3)(4),用等比数列控制住即可.

(11)的话,如若\(l = \varlimsup_{ n \to \infty } ( a_n )^{ \frac{ 1 }{ n } }\).

\(l < 1\)的时候,取\(\epsilon > 0\)使得\(l + \epsilon < 1\),则\(\exists N_0 > 0\),\(\forall n \geq N_0\),\(( a_n )^{ \frac{ 1 }{ n } } < l + \epsilon\),意味着\(a_n < ( l + \epsilon )^n\),立刻见到其收敛.

\(l > 1\)的时候,取\(\epsilon > 0\)使得\(l - \epsilon > 1\),则存在原数列的一个无穷子列\(\{ n_k \}\),使得\(a_{ n_k } > ( l - \epsilon )^{ n_k } \to \infty\),当然发散.

而注意到根据Stolz定理:

\[ \varliminf \frac{ a_{ n + 1 } }{ a_n } \leq \varliminf \sqrt[n]{ a_n } \leq \varlimsup \sqrt[n]{ a_n } \leq \varlimsup \frac{ a_{ n + 1 } }{ a_n } \]

这就意味着根值判别法理论上严格强于比值判别法.

(12)(13)的证明,考虑当\(l = \varliminf_{ n \to \infty } n \ln \frac{ a_n }{ a_{ n + 1 } } > 1\)的时候,取\(\epsilon > 0 , p = l - \epsilon > 1\),那么就有\(\exists N_0 > 0 , \forall n \geq N_0\),都有:

\[ \begin{aligned} n \ln \frac{ a_n }{ a_{ n + 1 } } & > p \\ \frac{ a_n }{ a_{ n + 1 } } & > e^{ \frac{ p }{ n } } > \left ( ( 1 + \frac{ 1 }{ n } )^n \right )^{ \frac{ p }{ n } } \\ \frac{ a_{ n + 1 } }{ a_n } & < \cfrac{ \frac{ 1 }{ ( n + 1 )^p } }{ \frac{ 1 }{ n^p } } \end{aligned} \]

\(b_n = \frac{ 1 }{ n^p }\),由上见到\(a_n < \frac{ a_{ N_0 } }{ b_{ N_0 } } b_n\),这就控制住了.(13)同理.控制\(e\)的时候改用不等式\(e < ( 1 + \frac{ 1 }{ n - 1 } )^n\)即可.

(14)(15)仍然类似,设\(b_n = n ( \frac{ a_n }{ a_{ n + 1 } } - 1 )\).

\(l = \varliminf_{ n \to \infty } b_n > 1\)的时候,取\(\epsilon > 0\),\(l - \epsilon > 1\),则\(\exists N_0 > 0 , \forall n \geq N_0\),\(b_n > l - \epsilon = l '\).而:

\[ \begin{aligned} \frac{ a_n }{ a_{ n + 1 } } & = 1 + \frac{ b_n }{ n } \\ \ln \frac{ a_n }{ a_{ n + 1 } } & = \ln ( 1 + \frac{ b_n }{ n } ) > \ln ( 1 + \frac{ l ' }{ n } ) \\ \varliminf n \ln \frac{ a_n }{ a_{ n + 1 } } & \geq \varliminf \ln ( 1 + \frac{ l ' }{ n } )^{ n } = l ' > 1 \end{aligned} \]

这就做完了.(15)同理.

Example1

斐波那契数列\(f_0 = 0 , f_1 = 1\),求\(\sum \frac{ 1 }{ f_k }\)的收敛性.

考虑\(f_{ n - 1 } \leq 2 f_{ n - 2 }\),所以\(f_n = f_{ n - 1 } + f_{ n - 2 } \geq \frac{ 3 }{ 2 } f_{ n - 1 } \geq ( \frac{ 3 }{ 2 } )^{ n - 1 }\).这就做完了.

Example2

假设\(0 < a_n\)单调递增且有界,求证:\(\sum ( 1 - \frac{ a_k }{ a_{ k + 1 } } ) < \infty\).

考虑:

\[ \begin{aligned} & \sum ( 1 - \frac{ a_k }{ a_{ k + 1 } } ) \\ = & \sum{ a_k } ( \frac{ 1 }{ a_k } - \frac{ 1 }{ a_{ k + 1 } } ) \\ \leq & \sup{ a } \sum ( \frac{ 1 }{ a_k } - \frac{ 1 }{ a_{ k + 1 } } ) \\ \leq & \frac{ \sup{ a } }{ a_1 } \end{aligned} \]

Example3

\(\sum \frac{ 1 }{ n^p - n^q } , p > q > 0\)的收敛性.

直接考虑\(\lim_{ n \to \infty } \cfrac{ \frac{ 1 }{ n^p - n^q } }{ \frac{ 1 }{ n^p } } = 1\),所以\(p \leq 1\)的时候发散,\(p > 1\)的时候收敛.

Example4

\(\sum \sin \frac{ 1 }{ n^2 }\)的收敛性.

直接考虑\(\lim_{ n \to \infty } \cfrac{ \sin \frac{ 1 }{ n^2 } }{ \frac{ 1 }{ n^2 } } = 1\),所以收敛.

Example5

\(a_n = ( 1 - \sqrt[3]{ \frac{ n - 1 }{ n + 1 } } )^p , p > 0\),讨论\(\sum a_n\)的敛散性.

考虑:

\[ \begin{aligned} \sqrt[3]{ \frac{ n - 1 }{ n + 1 } } & = ( 1 - \frac{ 1 }{ n } )^{ \frac{ 1 }{ 3 } } ( 1 + \frac{ 1 }{ n } )^{ - \frac{ 1 }{ 3 } } \\ & = ( 1 - \frac{ 1 }{ 3 n } + O ( \frac{ 1 }{ n^2 } ) ) ( 1 - \frac{ 1 }{ 3 n } + O ( \frac{ 1 }{ n^2 } ) ) \\ & = 1 - \frac{ 2 }{ 3 n } + O ( \frac{ 1 }{ n^2 } ) \end{aligned} \]

所以\(a_n\)\(\frac{ 1 }{ n^p }\)同敛散.

Example6

\(S_n = \sum_{ k = 1 }^n \frac{ 1 }{ \sqrt{ k } } - 2 \sqrt{ n }\)的敛散性.

考虑:

\[ \begin{aligned} a_{ n + 1 } & = S_{ n + 1 } - S_n \\ & = \frac{ 1 }{ \sqrt{ n + 1 } } - 2 \sqrt{ n + 1 } + 2 \sqrt{ n } \\ & = \frac{ 1 }{ \sqrt{ n + 1 } } - \frac{ 2 }{ \sqrt{ n + 1 } + \sqrt{ n } } \\ & = \frac{ \sqrt{ n } - \sqrt{ n + 1 } }{ \sqrt{ n + 1 } ( \sqrt{ n + 1 } + \sqrt{ n } ) } \\ & = \frac{ - 1 }{ \sqrt{ n + 1 } ( \sqrt{ n + 1 } + \sqrt{ n } )^2 } = O ( - n^{ - \frac{ 3 }{ 2 } } ) \end{aligned} \]

所以收敛.

Example7

\(a_n = \frac{ 1 }{ \sqrt{ n } } - \sqrt{ \ln ( 1 + \frac{ 1 }{ n } ) }\)的级数和收敛性.

注意到:

\[ \begin{aligned} a_n & = \frac{ 1 }{ \sqrt{ n } } - \sqrt{ \ln ( 1 + \frac{ 1 }{ n } ) } \\ & = \frac{ 1 }{ \sqrt{ n } } - \sqrt{ \frac{ 1 }{ n } - \frac{ 1 }{ 2 n^2 } + o ( \frac{ 1 }{ n^2 } ) } \\ & = \frac{ 1 }{ \sqrt{ n } } - \frac{ 1 }{ \sqrt{ n } } \left ( 1 - \frac{ 1 }{ 2 n } + o ( \frac{ 1 }{ n } ) \right )^{ \frac{ 1 }{ 2 } } \\ & = \frac{ 1 }{ \sqrt{ n } } - \frac{ 1 }{ \sqrt{ n } } \left ( 1 - \frac{ 1 }{ 4 n } + o ( \frac{ 1 }{ n } ) \right ) \\ & = O ( n^{ - \frac{ 3 }{ 2 } } ) \end{aligned} \]

所以收敛.

Example8

\(\zeta ( a ) = \sum_{ k = 1 }^{ \infty } \frac{ 1 }{ k^a }\),求\(\lim_{ \sigma \to 0 + 0 } \sigma \zeta ( 1 + \sigma )\)\(\lim_{ \sigma \to 0 + 0 } \left ( \zeta ( 1 + \sigma ) - \frac{ 1 }{ \sigma } \right )\).

\(f ( x ) = \frac{ 1 }{ x^{ 1 + \sigma } }\),设\(F ( x ) = \int_1^x f ( t ) \mathrm{ d } t\)考虑:

\[ \begin{aligned} \sum_{ k = n + 1 }^{ \infty } a_k & \leq F ( + \infty ) - F ( n ) \leq \sum_{ k = n }^{ \infty } a_k \\ F ( + \infty ) - F ( n + 1 ) & \leq \sum_{ k = n + 1 }^{ \infty } a_k \leq F ( + \infty ) - F ( n ) \\ \frac{ 1 }{ \sigma } \frac{ 1 }{ ( n + 1 )^\sigma } & \leq \sum_{ k = n + 1 }^{ \infty } a_k \leq \frac{ 1 }{ \sigma } \frac{ 1 }{ n^\sigma } \\ \frac{ 1 }{ ( n + 1 )^\sigma } & \leq \sigma \sum_{ k = n + 1 }^{ \infty } a_k \leq \frac{ 1 }{ n^\sigma } \end{aligned} \]

\(n = 0\)\(n = 1\)得到\(1 \leq \sigma \zeta ( 1 + \sigma ) \leq \sigma + 1\),于是\(\lim_{ \sigma \to 0 + 0 } \sigma \zeta ( 1 + \sigma ) = 1\).

而同理,见到:

\[ \zeta ( 1 + \sigma ) = 1 + \frac{ 1 }{ 2^{ 1 + \sigma } } + \cdots + \frac{ 1 }{ n^{ 1 + \sigma } } + \sum_{ k = n + 1 }^{ \infty } \frac{ 1 }{ k^{ 1 + \sigma } } \]

而:

$$ \[\begin{aligned} & 1 + \frac{ 1 }{ 2^{ 1 + \sigma } } + \cdots + \frac{ 1 }{ n^{ 1 + \sigma } } + \frac{ 1 }{ \sigma } \frac{ 1 }{ ( n + 1 )^\sigma } \\ \leq & \zeta ( 1 + \sigma ) \leq \\ 1 + \frac{ 1 }{ 2^{ 1 + \sigma } } + \cdots + \frac{ 1 }{ n^{ 1 + \sigma } } + \frac{ 1 }{ \sigma } \frac{ 1 }{ n^\sigma } \\ \end{aligned}\]

$$

用上述不等式:

$$ \[\begin{aligned} & 1 + \frac{ 1 }{ 2^{ 1 + \sigma } } + \cdots + \frac{ 1 }{ n^{ 1 + \sigma } } + \frac{ 1 }{ \sigma } \left ( \frac{ 1 }{ ( n + 1 )^\sigma } - 1 \right ) \\ \leq & \zeta ( 1 + \sigma ) - \frac{ 1 }{ \sigma } \leq \\ 1 + \frac{ 1 }{ 2^{ 1 + \sigma } } + \cdots + \frac{ 1 }{ n^{ 1 + \sigma } } + \frac{ 1 }{ \sigma } \left ( \frac{ 1 }{ n^\sigma } - 1 \right ) \\ \end{aligned}\]

$$

两边对\(\sigma \to 0 + 0\)取极限,见到:

\[ \begin{aligned} & 1 + \frac{ 1 }{ 2 } + \cdots + \frac{ 1 }{ n } - \ln ( n + 1 ) \\ \leq & \varliminf_{ \sigma \to 0 + 0 } ( \zeta ( 1 + \sigma ) - \frac{ 1 }{ \sigma } ) \leq \varlimsup_{ \sigma \to 0 + 0 } ( \zeta ( 1 + \sigma ) - \frac{ 1 }{ \sigma } ) \leq \\ 1 + \frac{ 1 }{ 2 } + \cdots + \frac{ 1 }{ n } - \ln ( n ) \end{aligned} \]

两边对\(n\)取极限得到\(\lim_{ \sigma \to 0 + 0 } \zeta ( 1 + \sigma ) - \frac{ 1 }{ \sigma } = \gamma\).

Example9

\(a_n > 0\),证明:若\(\varlimsup_{ n \to \infty } a_n^{ \frac{ 1 }{ \ln n } } < \frac{ 1 }{ e }\)则收敛.若\(\varliminf_{ n \to \infty } a_n^{ \frac{ 1 }{ \ln n } } > \frac{ 1 }{ e }\)则发散.

只证前者,则存在\(p > 1\)使得\(\varlimsup_{ n \to \infty } a_n^{ \frac{ 1 }{ \ln n } } < \frac{ 1 }{ e^p }\),两边取\(\ln\)就做完了.

Example10

\(a_n > 0\),证明:若\(\varliminf_{ n \to \infty } \cfrac{ \ln \frac{ 1 }{ a_n } }{ \ln n } > 1\)则收敛.若\(\varlimsup_{ n \to \infty } \cfrac{ \ln \frac{ 1 }{ a_n } }{ \ln n } < 1\)则发散.

只证前者,考虑前者等价于\(\varlimsup_{ n \to \infty } \ln a_n^{ \frac{ 1 }{ \ln n } } < - 1\),转化为Example9.

Example11

数列\(\{ a_n \}\)恒正,数列\(b_n = \frac{ a_n }{ a_{ n + 1 } } - 1 - \frac{ 1 }{ n }\)的部分和有界,求证\(\sum a_n\)发散.

考虑:

\[ \begin{aligned} \frac{ a_n }{ a_{ n + 1 } } & = 1 + \frac{ 1 }{ n } + b_n \leq e^{ \frac{ 1 }{ n } + b_n } \\ \frac{ a_1 }{ a_{ n + 1 } } & \leq e^{ \ln n + \gamma + M } = cn \\ a_n & \geq \frac{ ca_1 }{ n } \end{aligned} \]

这就搞定.

交错级数

考虑\(\sum ( - 1 )^{ n - 1 } a_n\),其中\(a_n > 0\).

Leibniz定理:如果\(a_n\)单调下降趋近于\(0\),则交错级数收敛.

考虑\(S_{ 2 n } = ( a_1 - a_2 ) + ( a_3 - a_4 ) + \cdots\)\(S_{ 2 n + 1 } = a_1 - ( a_2 - a_3 ) - ( a_4 - a_5 ) - \cdots\),所以见到\(S_{ 2 n }\)单调上升,\(S_{ 2 n + 1 }\)单调下降.并且显然\(S_{ 2 n } < S_{ 2 n + 1 }\).而且\(S_{ 2 n + 1 } - S_{ 2 n } = a_{ 2 n + 1 } \to 0\),所以二者均收敛且极限相同极限相同.

当然,这也只是DA判别法的一个特例.

Leibniz定理还可以如此理解:由于后面的项正负抵消,我们发现:

\[ | \sum_{ k = n }^\infty ( - 1 )^k a_k | \leq a_n \to 0 \]

也就是后面的交错都可以被首项控制住.

Example1

考虑\(\sum ( - 1 )^{ n } \frac{ \ln^2 n }{ n }\)的收敛性.

\(f ( x ) = \frac{ \ln^2 x }{ x }\),则\(f ' = \frac{ 2 \ln x - \ln^2 x }{ x^2 }\),显然当\(x\)足够大的时候\(f ' ( x ) < 0\)\(f ( + \infty ) = 0\),所以原式收敛.

Example2

\(a_n > 0\),求证:若\(\varliminf n ( \frac{ a_n }{ a_{ n + 1 } } - 1 ) > 0\),则\(\sum ( - 1 )^n a_n\)收敛.

考虑\(n\)足够大的时候\(\exists \epsilon > 0\),使得\(n ( \frac{ a_n }{ a_{ n + 1 } } - 1 ) > \epsilon\),也就是\(\frac{ a_{ n + 1 } }{ a_n } < \frac{ n }{ n + \epsilon } < 1\),这就能证明\(a_n\)单调递减.下面只需要证明\(\lim a_n = 0\)即可.

而考虑取定\(N > 0\),对于\(n \geq N\),有\(\frac{ a_n }{ a_N } = \prod_{ k = N }^{ n - 1 } \frac{ a_{ k + 1 } }{ a_{ k } }\),\(a_N\)是定死的,下面只需要证明后面那个乘积趋近于\(0\).

注意到:

$$ \[\begin{aligned} & \prod_{ k = N }^{ n - 1 } \frac{ a_{ k + 1 } }{ a_{ k } } \\ < & \prod_{ k = N }^{ n - 1 } \frac{ n }{ n + \epsilon } \\ = & \prod_{ k = N }^{ n - 1 } \frac{ 1 }{ 1 + \frac{ \epsilon }{ n } } \\ \end{aligned}\]

$$

然而注意到:

\[ \begin{aligned} & \prod_{ k = N }^{ n - 1 } ( 1 + \frac{ \epsilon }{ n } ) \\ \geq & 1 + \frac{ \epsilon }{ N } + \cdots + \frac{ \epsilon }{ n - 1 } \to \infty \end{aligned} \]

这就完事.

Example3

\(f ( x ) = \sum_{ n = 1 }^\infty \frac{ ( - 1 )^{ n - 1 } }{ n^x } , x \in ( 0 , \infty )\),求\(\sup f\)\(\inf f\).

首先显然能搞出\(f ( x ) \in C^\infty ( 0 , + \infty )\),原因是能证明其和其若干阶导数都内闭一致收敛(用DA判法).

首先交错级数的绝对值要\(\leq\)首项,所以先猜\(\sup f = 1\).考虑:

\[ f ( x ) = 1 - \sum_{ n = 1 }^\infty \left ( \frac{ 1 }{ ( 2 n )^x } - \frac{ 1 }{ ( 2 n + 1 )^x } \right ) \]

容易见到只要让\(x \to \infty\)那就逐项趋近于\(0\).

还有一个问题是\(\inf f\).考虑:

$$ \[\begin{aligned} & \sum_{ n = 1 }^\infty \frac{ 1 }{ ( 2 n )^x } - \frac{ 1 }{ ( 2 n + 1 )^x } \\ = & \sum_{ n = 1 }^\infty \int_{ 2 n }^{ 2 n + 1 } \frac{ x \mathrm{ d } t }{ t^{ x + 1 } } \\ \end{aligned}\]

$$

这里注意到我们积分的那几段都是\([ 2 n , 2 n + 1 ]\),我们可以把奇数段补上,因为\(x > 0\),所以补的那一段更大,自然有:

\[ \begin{aligned} & \sum_{ n = 1 }^\infty \int_{ 2 n }^{ 2 n + 1 } \frac{ x \mathrm{ d } t }{ t^{ x + 1 } } \\ \leq & \frac{ 1 }{ 2 } \int_1^{ + \infty } \frac{ \mathrm{ d } t }{ t^{ x + 1 } } = \frac{ 1 }{ 2 } \end{aligned} \]

\(f ( x ) = 1 - \sum_{ n = 1 }^\infty \left ( \frac{ 1 }{ ( 2 n )^x } - \frac{ 1 }{ ( 2 n + 1 )^x } \right )\),所以\(f ( x ) \geq \frac{ 1 }{ 2 }\).

接下来来证明其能取到,考虑:

\[ \begin{aligned} & \sum_{ n = 1 }^\infty \frac{ 1 }{ ( 2 n )^x } - \frac{ 1 }{ ( 2 n + 1 )^x } \\ = & \sum_{ n = 1 }^\infty \frac{ 1 }{ ( 2 n )^x } \left ( 1 - \frac{ 1 }{ ( 1 + \frac{ 1 }{ 2 n } )^x } \right ) \\ = & \sum_{ n = 1 }^\infty \frac{ 1 }{ ( 2 n )^x } \left ( \frac{ x }{ 2 n } + O ( \frac{ x }{ n^2 } ) \right ) \\ = & \frac{ x }{ 2^{ x + 1 } } \zeta ( x + 1 ) + xO ( 1 ) \\ \to & \frac{ 1 }{ 2 } \end{aligned} \]

原因是\(\lim_{ x \to 0 + 0 } x \zeta ( x + 1 ) \to 1\),这个结论我们之前搞定过.

积分判别法

\(\omega_n = \sup_{ [ n , n + 1 ] } f - \inf_{ [ n , n + 1 ] } f \geq 0\).我们声称若\(\sum \omega_n < \infty\),则\(\int_1^{ \infty } f ( x ) \mathrm{ d } x\)\(\sum f ( n )\)收敛性相同.

考虑:

$$ \[\begin{aligned} & \sum_{ k = 1 }^n f_k - \int_1^{ n + 1 } f ( x ) \mathrm{ d } x \\ = & \sum_{ k = 1 }^n \int_k^{ k + 1 } ( f ( k ) - f ( x ) ) \mathrm{ d } x \\ \end{aligned}\]

$$

考虑证明右式绝对收敛,有:

\[ \begin{aligned} & \sum_{ k = 1 }^n \int_k^{ k + 1 } | f ( k ) - f ( x ) | \mathrm{ d } x \\ \leq & \sum_{ k = 1 }^n \int_k^{ k + 1 } \omega_k \mathrm{ d } x \\ = & \sum_{ k = 1 }^{ n + 1 } \omega_k \end{aligned} \]

这就证毕.

问题又来到如何搞定\(\sum \omega_n < \infty\)的条件,其实只要有界变差就行了对吧,我们断言:如果\(f\)可导,\(f '\)可积且\(\int_1^{ \infty } | f ' | \mathrm{ d } x < \infty\)\(\sum \omega_n < \infty\).

对于\(\omega_n\),不妨\([ n , n + 1 ]\)的上界在\(x_1\)处取到,下界在\(x_2\)处取到,于是:

$$ \[\begin{aligned} \omega_n & = f ( x_1 ) - f ( x_2 ) \\ & = | \int_{ x_1 }^{ x_2 } f ' \mathrm{ d } x | \\ & \leq | \int_{ x_1 }^{ x_2 } | f ' | \mathrm{ d } x | \\ & \leq \int_{ n }^{ n + 1 } | f ' | \mathrm{ d } x \\ \end{aligned}\]

$$

于是\(\sum \omega \leq \int_1^{ + \infty } | f ' | \mathrm{ d } x\).

Example1

\(\sum \frac{ \sin ( n^\alpha x ) }{ n^\beta }\)的收敛性,其中\(\beta > \alpha > 0 , \alpha + \beta > 1\).

用积分判别法,考虑取\(f ( t ) = \frac{ \sin ( t^\alpha x ) }{ t^\beta }\),考虑:

\[ f ' ( t ) = \frac{ x \alpha t^{ \alpha - 1 + \beta } \cos ( t^\alpha x ) - \beta t^{ \beta - 1 } \sin ( t^\alpha x ) }{ t^{ 2 \beta } } \]

逐项观察,都是\(O ( \frac{ 1 }{ t^{ \beta - \alpha + 1 } } )\)级别,这样\(\int | f ' | \mathrm{ d } t\)就收敛了.

那就只需要看积分的收敛性,取\(s = t^\alpha\)考察:

$$ \[\begin{aligned} \int_1^{ \infty } f ( t ) \mathrm{ d } t & = \int_1^{ \infty } \frac{ \sin ( t^\alpha x ) }{ t^\beta } \mathrm{ d } t \\ & = \int_1^{ \infty } \frac{ \sin ( s x ) \frac{ 1 }{ \alpha } s^{ \frac{ 1 }{ \alpha } - 1 } }{ s^\frac{ \beta }{ \alpha } } \mathrm{ d } s \\ & = \int_1^{ \infty } \frac{ \sin ( s x ) }{ \alpha s^\frac{ \beta + \alpha - 1 }{ \alpha } } \mathrm{ d } s \\ \end{aligned}\]

$$

后者用DA判法知道收敛.

级数的交换顺序

定义\(\mathbb{ N }_+\)的一个重排\(f : \mathbb{ N }_+ \to \mathbb{ N }_+\),当且仅当\(f ( 1 ) , f ( 2 ) , \cdots\)这个数列中,每个正整数都恰好出现一次.

我们声称正项级数满足:\(\sum a_n = \sum a_{ f ( n ) }\).

如何证明呢?

\(\sum a_n < \infty\)的时候,考虑设\(A_n = \sum_{ k = 1 }^n a_k , B_n = \sum_{ k = 1 }^n a_{ f ( k ) }\).考虑取\(N_n = \max_{ 1 \leq k \leq n } f ( k )\),那就有:

\[ B_n = \sum_{ k = 1 }^n a_{ f ( k ) } \leq A_{ N_n } \leq \sum_{ 1 }^{ \infty } a_n \]

于是\(B_n\)当然是收敛的,并且\(\sum a_{ f ( n ) } \leq \sum a_n\),而如果\(a_{ f ( n ) }\)\(a_n\)的重排,那么反之,\(a_n\)\(a_{ f ( n ) }\)的重排,于是\(\sum a_{ f ( n ) } \geq \sum a_n\),这就证明了二者相同.

既如此,如果\(\sum a_n\)发散的时候,就可以反证法证明\(\sum a_{ f ( n ) }\)不可能收敛.这样就完成了证明.

下面我们证明,如果\(\sum a_n\)绝对收敛,换言之\(\sum | a_n | < \infty\),那么仍有\(\sum a_n = \sum a_{ f ( n ) }\).

考虑取\(a_n^+ = \frac{ | a_n | + a_n }{ 2 } , a_n^- = \frac{ | a_n | - a_n }{ 2 }\).那考虑\(0 \leq a_n^+ \leq | a_n | , 0 \leq a_n^- \leq | a_n |\),所以它们当然都绝对收敛,那当然有:

\[ \begin{aligned} \sum a_n & = \sum ( a_n^+ - a_n^- ) \\ & = ( \sum a_n^+ ) - ( \sum a_n^- ) \end{aligned} \]

而后者当然可以随意重排.

那么对于条件收敛呢?我们有黎曼重排定理:如果\(\sum a_n\)条件收敛,则\(\forall B \leq A\),其中\(A , B \in \mathbb{ R } \cup \{ \pm \infty \}\),则存在重排\(f\),令\(S_n = \sum_{ k = 1 }^n a_{ f ( k ) }\),有:

\[ \varliminf S_n = B , \varlimsup S_n = A \]

为证明此,考虑设\(I_+ = \{ n \in \mathbb{ N }_+ \mid a_n \geq 0 \} = \{ n_1 < n_2 \cdots \}\),\(I_-\)类似设出.

容易见到首先\(\lim a_n \to 0\),并且\(\sum_{ n \in I_+ } a_n = + \infty , \sum_{ n \in I_- } a_n = - \infty\).

考虑先从\(I_+\)里取数,然后不断加加加加加直到超过\(A\),由于正的部分相加是正无穷,这当然能做到,然后就继续从\(I_-\)里取数开始回退,退退退退到\(B\)之下,再重复上述过程.由于\(a_n \to 0\),这玩意当然会满足条件.

那么如果\(A\)是正无穷呢?那没关系,我就每次加数的时候变化\(A\),第一次个循环令\(A = 1\),第二次令\(A = 2\),以此类推.由此见上述命题的合理性.而且具体的论证过程只需要对这上面写抽象语言就行.

可是,难道一般的级数就真的不能交换顺序了嘛?事实上使用柯西准则,我们可以证明如果重排是局部的,或者说\(\exists M > 0 , \forall n , | n - f ( n ) | \leq M < \infty\),换言之交换的距离有上界,那交换后敛散性不变.

这个怎么证明呢?首先如果原级数收敛的话,用柯西准则,因为通项趋于\(0\),所以往外扩张适当有界长度(实际上就是\(M\))应当无影响.如果原级数发散的话,如果通项还是不趋于\(0\)那当然还是完蛋,否则的话还可以用上面的证明.这就证毕了.

Example

\(a_n > 0\),当\(\sum \frac{ 1 }{ a_n } < \infty\)的时候,求证\(\sum \frac{ n }{ \sum_{ k = 1 }^n a_k } < \infty\).

首先考虑\(\{ a_n \}\)单增的情况,如果不单增的话,可以直接对其进行排序.

考虑\(\frac{ 2 n }{ \sum_{ k = 1 }^{ 2 n } a_k } < \frac{ 2 n }{ na_n } = \frac{ 2 }{ a_n }\),同理\(\frac{ 2 n - 1 }{ \sum_{ k = 1 }^{ 2 n } a_k } < \frac{ 2 n - 1 }{ na_n } < \frac{ 2 }{ a_n }\),于是证毕.

级数的乘法

考虑\(( \sum a_j ) ( \sum b_k ) = \sum a_j b_k\),首要的问题在于如何指定后者的求和顺序.

柯西策略是,考虑取\(c_n = \sum_{ j + k = n + 1 } a_j b_k\),然后取原式顺序为\(\sum c_n\).此好处是可以求解生成函数乘积,\(( \sum a_j x^j ) ( \sum b_k x^k )\).

矩形策略是,考虑取\(c_n = \sum_{ \max ( j , k ) = n } a_j b_k\),然后取原式顺序为\(\sum c_n\).此好处是它的求和天然是\(( \sum_{ j = 1 }^n a_j ) ( \sum_{ k = 1 }^n b_k )\)的极限.所以此方法天然有如果\(\sum a_j = A , \sum b_k = B\),则\(\sum c = AB\).

接下来我们证明,如果\(\sum a\)\(\sum b\)都绝对收敛,那它们的乘积任意排列都是相等的.换言之只要双重指标集合\(\{ ( j_i , k_i ) \} = \{ ( j , k ) \}\)那就都收敛于同一值.

证明策略类似,取\(N_n = \max_{ 1 \leq i \leq n } ( j_i , k_i )\),那么当然有:

\[ \sum_{ i = 1 }^n | a_{ j_i } b_{ k_i } | \leq ( \sum_{ j = 1 }^{ N_n } | a_{ j } | ) ( \sum_{ k = 1 }^{ N_n } | b_{ k } | ) \]

那当然就绝对收敛,再类似之前的可以证明其与顺序无关,这个时候用矩形策略就可以知道最终就收敛于\(( \sum a ) ( \sum b )\).

如果是条件收敛,矩形和当然没问题,仍然收敛,难点当然在于柯西和何时收敛?我们声称:如果\(\sum a_n\)收敛,\(\sum | b_n | < \infty\),也就是一个收敛一个绝对收敛,我们就能推出柯西和是收敛的而且就等于矩形和.

考虑设矩形法的\(u_k = \sum_{ \max ( i , j ) = k } a_i b_j\),柯西法的\(c_k = \sum_{ i + j = k + 1 } a_i b_j\),考虑求:

\[ \begin{aligned} & | \sum_{ k = 1 }^n u_k - c_k | \\ = & | \sum_{ i_j > n + 1 , i \leq n , j \leq n } a_i b_j | \\ \leq & \sum_{ i = 2 }^n | b_i | | \sum_{ j = n - i + 2 }^n a_j | \\ = & \sum_{ i = 2 }^N | b_i | | \sum_{ j = n - i + 2 }^n a_j | + \sum_{ i = N + 1 }^n | b_i | | \sum_{ j = n - i + 2 }^n a_j | \end{aligned} \]

接下来用柯西收敛原理,先取\(N\),只要\(N\)足够大,由于\(| \sum_{ j = n - i + 2 }^n a_j |\)当然是有界的,因为\(\sum a\)收敛,只要\(N\)足够大,不管\(n\)如何,\(\sum_{ i = N + 1 }^n | b_i |\)用柯西收敛原理就足够小.这样后半项就解决了.

前半项同理,在\(N\)取定的时候\(\sum_{ i = 2 }^N | b_i |\)就取定有界了.而只要在此基础上使得\(n\)尽可能大,\(| \sum_{ j = n - i + 2 }^n a_j |\)用柯西收敛原理就控制住了,于是整体就很小.那就证明了此时柯西和恰好就是矩形和.

一般的柯西和没有这么好的结论,但其实证明可以类似上面,具体地,我们取\(A_n = \sum_{ k = 1 }^n a_k , B_n = \sum_{ k = 1 }^n b_k\)并且\(\lim A , \lim B\)都存在,取柯西和\(c_n = \sum_{ k = 1 }^n a_k b_{ n - k + 1 }\),我们断言\(C_n = \sum_{ k = 1 }^n c_k\)收敛当且仅当极限\(\lim_{ n \to \infty } \sum_{ k = 1 }^n a_k \sum_{ j = n - k + 1 }^n b_j\)存在.

原因是:

\[ \begin{aligned} & \sum_{ k = 1 }^n a_k \sum_{ j = n - k + 1 }^n b_j \\ = & \sum_{ k = 1 }^n a_k ( B_n - B_{ n - k } ) \\ = & B_n A_n - ( \sum_{ k = 1 }^{ n - 1 } a_k B_{ n - k } ) \\ = & B_n A_n - C_{ n - 1 } \end{aligned} \]

这就证毕,而且当然见到只有上述极限为\(0\)的时候,柯西和才会有\(\lim C = ( \lim A ) ( \lim B )\).

无穷乘积

对于数列\(\{ a_n \}\),设\(A_n = \prod_{ k = 1 }^n a_k\),若\(\lim_{ n \to \infty } A_n\)存在且非零,则称\(\prod_{ k = 1 }^{ + \infty } a_k\)收敛.为什么这里要求非零呢?因为我们希望类似无穷和,这里去掉前有限项后,敛散性不变.这就要求我们最好判掉零的情况.如若其极限为\(0\),则仍称其发散,但有的时候发散到零也会有一些性质,到时我们会单独讨论.

既然如此,不妨设\(a_n \ne 0\).有以下性质:

  1. \(\prod a_n\)收敛,则\(\lim a_n = 1\).既然如此,\(a_n\)从某一项开始就满足\(a_n > 0\).之后不妨干脆设\(a_n > 0\).

  2. \(A_n\)有非\(0\)极限当且仅当\(\ln A_n\)有极限.

  3. 柯西收敛准则:\(A_n\)有非零极限的必要条件是\(\forall \epsilon > 0 , \exists N , \forall N \leq n \leq m\),\(| 1 - \prod_{ k = n }^m a_k | < \epsilon\).特别地,如果\(\forall a_n \ne 0\),则上式为充要条件.

(1)(2)显然.

(3)的话也比较显然.

总之,既然\(\lim a_n \to 1\),不妨干脆设其为\(1 + a_n\),其中\(\lim a_n = 0\),从而原本要研究的\(\prod ( 1 + a_n )\)可以转为研究\(\sum \ln ( 1 + a_n )\).

  1. \(a_n\)定号的时候,\(\sum \ln ( 1 + a_n )\)\(\sum a_n\)的敛散性相同.

  2. \(a_n\)不定号的时候,若\(\sum a_n^2 < \infty\),则\(\sum \ln ( 1 + a_n )\)\(\sum a_n\)的敛散性相同.同理如若\(\sum a_n^2\)发散,则上述两个级数至少一个发散.

  3. \(\sum | \ln ( 1 + a_n ) |\)\(\sum | a_n |\)的敛散性相同.

(1)是因为\(\lim \frac{ \ln ( 1 + a_n ) }{ a_n } = 1\).

(2)是因为\(a_n - \ln ( 1 + a_n )\)可以被\(a_n^2\)控制住,原因是\(a_n \to 0\),换言之存在\(c_1 , c_2\)使得\(c_1 x^2 < a_n - \ln ( 1 + a_n ) < c_2 x^2\),只需要对\(0\)附近做个简单放缩.既然它们的差收敛,那它们当然敛散性相同.

(3)还是因为\(\lim \frac{ | \ln ( 1 + x ) | }{ | x | } = 1\).

Example1

\(| x | < 1\)的时候,求\(\prod_{ k = 1 } ( 1 + x^{ 2^{ k - 1 } } )\)的极限.

容易见到\(A_n = \prod_{ k = 1 }^n ( 1 + x^{ 2^{ k - 1 } } ) = \frac{ 1 - x^{ 2^n } }{ 1 - x }\),这样自然就收敛了.

Example2

\(\prod_{ k = 1 } \cos \frac{ \varphi }{ 2^k }\).

\(\varphi \ne 0\)的时候,考虑\(A_n = \prod_{ k = 1 }^n \cos \frac{ \varphi }{ 2^k } = \frac{ \sin \varphi }{ 2^n \sin \frac{ \varphi }{ 2^n } }\).虽然这里当\(\varphi = 2^k \pi\)的时候会有若干项分母为\(0\),但由于我们可以干脆去掉这前几项,而只看后几项分母均不为\(0\),当然收敛于\(\frac{ \sin \varphi }{ \varphi }\).

\(\varphi = 0\)的时候每一项都是\(1\),乘起来仍然收敛.

Example3

考虑\(\Gamma ( x ) = \frac{ 1 }{ x } \prod_{ n = 1 }^{ \infty } \frac{ ( 1 + \frac{ 1 }{ n } )^x }{ 1 + \frac{ x }{ n } }\)敛散性,其中\(x \ne 0 , - 1 , - 2 , \cdots\).

直接泰勒展开,见到:

\[ \begin{aligned} & \frac{ ( 1 + \frac{ 1 }{ n } )^x }{ 1 + \frac{ x }{ n } } \\ = & ( 1 + \frac{ x }{ n } + \frac{ x ( x - 1 ) }{ 2 n^2 } + o ( \frac{ 1 }{ n^2 } ) ) ( 1 - \frac{ x }{ n } + \frac{ x^2 }{ n^2 } + o ( \frac{ 1 }{ n^2 } ) ) \\ = & 1 + \frac{ x ( x - 1 ) }{ 2 n^2 } + o ( \frac{ 1 }{ n^2 } ) \end{aligned} \]

这就绝对收敛了.

而我们观察\(A_n\),有:

$$ \[\begin{aligned} A_n & = \frac{ 1 }{ x } \prod_{ k = 1 }^{ n } \frac{ ( \frac{ k + 1 }{ k } )^x }{ 1 + \frac{ x }{ k } } \\ & = \frac{ ( n + 1 )^x }{ x ( 1 + \frac{ x }{ 1 } ) \cdots ( 1 + \frac{ x }{ n } ) } \\ & = ( \frac{ n + 1 }{ n } )^x \frac{ n ! n^x }{ x^{ \overline{ n + 1 } } } \\ \end{aligned}\]

$$

于是见到:

\[ \frac{ \Gamma ( x + 1 ) }{ \Gamma ( x ) } = \lim_{ n \to \infty } \frac{ ( n + 1 ) x }{ x + 1 + n } = x \]

所以\(\Gamma ( x + 1 ) = x \Gamma ( x )\),而且\(\Gamma ( 1 ) = 1\),所以\(\Gamma ( n ) = n !\),这实际上是阶乘函数的一个推广.

而此时有\(\Gamma ( x + 1 ) = x \Gamma ( x ) = \prod_{ n = 1 }^\infty \frac{ ( 1 + \frac{ 1 }{ n } )^x }{ 1 + \frac{ x }{ n } }\).

而观察这个级数:

\[ \begin{aligned} & \prod_{ n = 1 }^\infty \frac{ e^{ \frac{ 1 }{ n } } }{ 1 + \frac{ 1 }{ n } } \\ = & \frac{ e^{ 1 + \frac{ 1 }{ 2 } + \cdots + \frac{ 1 }{ n } } }{ n + 1 } \\ = & \frac{ e^{ \ln n + \gamma + c_n } }{ n + 1 } \to e^\gamma \end{aligned} \]

其中\(\gamma\)是欧拉常数,误差项\(c_n = H_n - \ln n - \gamma \to 0\).

从而观察到:

\[ \begin{aligned} & e^{ \gamma x } \Gamma ( x + 1 ) \\ = & \prod_{ n = 1 }^\infty \frac{ e^{ \frac{ x }{ n } } }{ 1 + \frac{ x }{ n } } \end{aligned} \]

从而\(\frac{ 1 }{ \Gamma ( x + 1 ) } = e^{ \gamma x } \prod_{ n = 1 }^\infty ( 1 + \frac{ x }{ n } ) e^{ - \frac{ x }{ n } }\).

在此基础上,如若设\(b_n = \frac{ n ! n^x }{ x^{ \overline{ n + 1 } } }\).容易见到\(\lim b_n = \lim A_n = \Gamma ( x )\),而观察到:

\[ \begin{aligned} \frac{ b_{ n + 1 } }{ b_n } & = \frac{ ( 1 + \frac{ 1 }{ n } )^{ x + 1 } }{ 1 + \frac{ x + 1 }{ n } } \\ & = 1 + \frac{ x ( x + 1 ) }{ 2 n^2 } + o ( \frac{ 1 }{ n^2 } ) \\ & \to 1 \end{aligned} \]

而且如若\(x ( x + 1 ) > 0\),并且取\(n\)足够大,则上式大于\(1\),反之上式小于\(1\).因此当\(n\)足够大的时候\(b_n\)单调有界(原因是其极限存在).

因此还可以得到结论:\(\sum \frac{ n ! a_n }{ x^{ \overline{ n + 1 } } }\)\(\sum \frac{ a_n }{ n^x }\)敛散性相同,其中\(x \ne 0 , - 1 , - 2 , \cdots\).原因只是因为这俩的比值恰好是\(b_n\)单调有界,根据DA判别法知道二者同敛散.

Example4

\(\sum_{ n = 1 }^\infty \frac{ ( nx )^n }{ n ! }\)的收敛性.

考虑:

\[ \frac{ a_{ n + 1 } }{ a_n } = ( \frac{ n + 1 }{ n } )^n x \to ex \]

根据比值判法,当\(| x | < \frac{ 1 }{ e }\)的时候绝对收敛,而当\(| x | > \frac{ 1 }{ e }\)的时候发散,问题只在于\(| x | = \frac{ 1 }{ e }\)的时候如何.

\(x = \frac{ 1 }{ e }\)的时候,使用拉贝判法:

\[ \begin{aligned} n ( \frac{ a_n }{ a_{ n + 1 } } - 1 ) & = n ( ( 1 - \frac{ 1 }{ n + 1 } )^n e - 1 ) \\ & = n ( e^{ n \ln ( 1 - \frac{ 1 }{ n + 1 } ) + 1 } - 1 ) \\ & = n ( e^{ n ( - \frac{ 1 }{ n + 1 } - \frac{ 1 }{ 2 ( n + 1 )^2 } + o ( \frac{ 1 }{ n^2 } ) ) + 1 } - 1 ) \\ & = n ( e^{ \frac{ 1 }{ n + 1 } - \frac{ n }{ 2 ( n + 1 )^2 } + o ( \frac{ 1 }{ n } ) } - 1 ) \\ & = n ( \frac{ 1 }{ n + 1 } - \frac{ n }{ 2 ( n + 1 )^2 } + o ( \frac{ 1 }{ n } ) ) \\ & \to \frac{ 1 }{ 2 } < 1 \end{aligned} \]

所以发散.

\(x = - \frac{ 1 }{ e }\)的时候,使用DA判法:应当见到\(a_n = ( - 1 )^n | a_n |\),此时\(| a_n |\)单调递减且趋于\(0\),用DA判法知道其收敛.

所以条件收敛.

Example5

求证\(\sum a_n ( x^2 - 1 ) ( x^2 - 2^2 ) \cdots ( x^2 - n^2 )\)\(\forall x \notin \mathbb{ Z }\),其都有相同的敛散性.就是对于一个确定的\(\{ a_n \}\),对所有的\(x\),要么都收敛,要么都发散.

考虑设\(f_n ( x ) = ( x^2 - 1 ) ( x^2 - 2^2 ) \cdots ( x^2 - n^2 )\),观察到:

\[ \frac{ f_n ( x ) }{ f_n ( x_0 ) } = \frac{ ( x^2 - 1 ) ( x^2 - 2^2 ) \cdots ( x^2 - n^2 ) }{ ( x_0^2 - 1 ) ( x_0^2 - 2^2 ) \cdots ( x_0^2 - n^2 ) } \]

这当然是个无穷乘积,观察到\(\frac{ x^2 - n^2 }{ x_0^2 - n^2 } = 1 + \frac{ x^2 - x_0^2 }{ x_0^2 - n^2 } = 1 + O ( \frac{ 1 }{ n^2 } )\),所以\(\lim_{ n \to \infty } \frac{ f_n ( x ) }{ f_n ( x_0 ) }\)存在且非零.

而且,当\(n\)足够大的时候,或者更进一步说\(| n | > \max ( | x | , | x_0 | )\)的时候\(\frac{ f_n ( x ) }{ f_n ( x_0 ) }\)当然就定号了,而且\(\frac{ x^2 - n^2 }{ x_0^2 - n^2 } = 1 + \frac{ x^2 - x_0^2 }{ x_0^2 - n^2 }\),其与\(1\)比较只取决于\(x^2 - x_0^2\),这就意味着\(\frac{ f_n ( x ) }{ f_n ( x_0 ) }\)\(n\)足够大的时候是单调有界非零的,于是DA判法知道同敛散.

Example6

求证\(\sin x = x \prod_{ k = 1 }^{ \infty } ( 1 - \frac{ x^2 }{ k^2 \pi^2 } )\).

先看\(\sin x = 0\)的根,假设其根为\(u + iv\),考虑:

\[ \begin{aligned} \sin x & = \frac{ e^{ ix } - e^{ - ix } }{ 2 i } = 0 \\ e^{ 2 ix } & = 1 \\ e^{ 2 iu - 2 v } & = 1 \\ | e^{ 2 iu - 2 v } | & = 1 \\ e^{ - 2 v } & = 1 \\ v & = 0 \end{aligned} \]

所以其只有实根,用多项式理论知道如若\(\sin x\)的根只有\(2 k \pi\),应该有:

\[ \sin x = cx \prod_{ k = 1 }^{ \infty } ( 1 - \frac{ x^2 }{ k^2 \pi^2 } ) \]

容易见到这个无穷乘积的确收敛,而\(x \to 0\)的时候\(\frac{ \sin x }{ x } = 1\),所以\(c = 1\).

那么考虑\(\sin x\)的泰勒展开,有:

\[ \begin{aligned} 1 - \frac{ x^2 }{ 6 } + \cdots & = \prod_{ k = 1 } ( 1 - \frac{ x^2 }{ k^2 \pi^2 } ) \\ & = 1 - ( \frac{ 1 }{ \pi^2 } \sum_k \frac{ 1 }{ k^2 } ) x^2 + \cdots \end{aligned} \]

这就能知道\(\sum_{ k = 1 }^\infty \frac{ 1 }{ k^2 } = \frac{ \pi^2 }{ 6 }\).

然而上述的多项式理论还是太过粗糙,下面提供一种更加严谨的证明:

我们有欧拉公式:

$$ \[\begin{aligned} ( \cos x + i \sin x )^{ 2 n + 1 } & = \cos ( 2 n + 1 ) x + i \sin ( 2 n + 1 ) x \\ \end{aligned}\]

$$

然而左侧可以使用二项式定理展开,有:

\[ ( \cos x + i \sin x )^{ 2 n + 1 } = \sum \binom{ 2 n + 1 }{ k } \cos^k x ( i \sin x )^{ 2 n + 1 - k } \]

容易见到为了贡献虚部,\(k\)必须是偶数,那此时\(\cos^k x = ( 1 - \sin^2 x )^{ \frac{ k }{ 2 } }\),总之,我们发现应该存在一个\(n\)次多项式\(P_n\),使得:

$$ \[\begin{aligned} \sin ( 2 n + 1 ) x & = ( \sin x ) P_n ( \sin^2 x ) \\ \end{aligned}\]

$$

这个多项式的根应该怎么取呢?考虑当\(\varphi_k = \frac{ k \pi }{ 2 n + 1 } , 1 \leq k \leq n\)的时候,左侧为\(0\),而右侧\(\sin \varphi_k\)不该为\(0\),更进一步地,\(\sin^2 \varphi_k\)两两不同,这就知道它们确实是\(P_n\)\(n\)个根.同时见到\(P ( 0 ) = \lim_{ x \to 0 } P_n ( \sin^2 x ) = 2 n + 1\),从而我们已经能唯一确定这个有限项多项式\(P_n ( x ) = ( 2 n + 1 ) \prod_{ k = 1 }^n ( 1 - \frac{ x }{ \sin^2 \varphi_k } )\).

接下来,将原本上式中的\(x\)换成\(\frac{ x }{ 2 n + 1 }\),我们就能得到:

\[ \sin x = ( 2 n + 1 ) \sin ( \frac{ x }{ 2 n + 1 } ) \prod_{ k = 1 }^n ( 1 - \frac{ \sin^2 \frac{ x }{ 2 n + 1 } }{ \sin^2 \varphi_k } ) \]

这里已经十分接近我们想要的答案了,但是这个项数和\(n\)一起增大,策略当然是大小步极限,考虑取:

$$ \[\begin{aligned} U_m & = ( 2 n + 1 ) \sin \frac{ x }{ 2 n + 1 } \prod_{ k = 1 }^m ( 1 - \frac{ \sin^2 \frac{ x }{ 2 n + 1 } }{ \sin^2 \varphi_k } ) \\ V_m & = \prod_{ k = m + 1 }^n ( 1 - \frac{ \sin^2 \frac{ x }{ 2 n + 1 } }{ \sin^2 \varphi_k } ) \\ \end{aligned}\]

$$

取定\(m\),当然总能取足够大的\(n\)使得\(U_m \to x \prod_{ k = 1 }^m ( 1 - \frac{ x^2 }{ k^2 \pi^2 } )\).

而用柯西准则,当\(m\)足够大的时候,如果能证明\(V_m \to 1\)就完事了.我们考虑:

$$ \[\begin{aligned} 1 & \geq V_m \geq \prod_{ k = m + 1 }^\infty ( 1 - \frac{ \sin^2 \frac{ x }{ 2 n + 1 } }{ \sin^2 \varphi_k } ) \\ \end{aligned}\]

$$

而回忆到当\(\sin^2 x \leq x^2\)恒成立,在\(x \in [ 0 , \frac{ \pi }{ 2 } ]\)的时候,\(\sin x \geq \frac{ 2 }{ \pi } x\)也成立,所以:

$$ \[\begin{aligned} V_m & \geq \prod_{ k = m + 1 }^\infty ( 1 - \frac{ \sin^2 \frac{ x }{ 2 n + 1 } }{ \sin^2 \varphi_k } ) \\ & \geq \prod_{ k = m + 1 }^\infty ( 1 - \frac{ x^2 }{ 4 k^2 } ) \\ \end{aligned}\]

$$

此时回忆到\(\prod_{ k = 1 }^\infty ( 1 - \frac{ x^2 }{ 4 k^2 } )\)是收敛的,所以由柯西准则,当\(m\)足够大的时候,\(\prod_{ k = m + 1 }^\infty ( 1 - \frac{ x^2 }{ 4 k^2 } )\)趋近于\(1\),这就证毕了.

函数项数列

也就是每一项都是一个函数的数列,假设定义域在\(I \subseteq \mathbb{ R }\)上,写作\(\{ f_n ( x ) \}\).此时对于一个固定的\(x_0 \in I\),则\(\{ f_n ( x_0 ) \}\)就是一个普通的数列.当然不一定\(I\)中的每一个\(x_0\)都收敛,我们将收敛点的集合称为函数项级数的收敛域,其它的点称为发散点,发散点组成的集合称为发散域.

对于收敛域,直接记\(f ( x ) = \lim_{ n \to \infty } f_n ( x )\),我们将这里的\(f ( x )\)就是这个函数列的极限函数.既然有了极限就可以定义级数,也就是可以定义\(S_n = \sum_{ k = 1 }^n f_k ( x )\),然后取其极限拿到\(\sum_{ k = 1 }^\infty f_n ( x ) = S ( x )\).

我们要解决的问题大概有以下三个:

  1. 如果\(f_n\)均是连续的,那么要求什么条件,可以满足\(f\)连续.也就是两层极限什么时候可以交换顺序.

  2. 如果\(f_n\)均是黎曼可积的,那么要求什么条件,可以满足\(f\)黎曼可积并且\(\lim \int f_n = \int f\),也就是极限和积分什么时候可以交换顺序.

  3. 如果\(f_n\)均可导,那么什么时候\(f\)也可导,并且\(\lim f_n ' = f '\),也就是极限和导数什么时候可以交换顺序.

如果不加条件,上述三条全都是不满足的,下述Example会给出若干例子.

Example1

\(f_n ( x ) = x^n , x \in [ 0 , 1 ]\),求其极限函数.

显然\(f ( x ) = \begin{cases}1 & x = 1 \\ 0 & \text{ otherwise }\end{cases}\),由此可以见到,连续函数的极限函数不一定连续.

Example2

\(f_n ( x ) = \begin{cases}1 & ( n ! ) x \in \mathbb{ Z } \\ 0 & \text{ otherwise }\end{cases}\),求其极限函数.

显然是迪利克雷函数.

\(f_n ( x )\)只有有限个间断点,容易见到其黎曼可积,然而迪利克雷函数并不黎曼可积.可积函数的极限函数不一定可积.

Example3

\(f_n ( x ) = nx ( 1 - x^2 )^n , x \in [ 0 , 1 ]\),求其极限函数.

容易见到\(\lim f_n ( x ) = 0\),也就是这个函数处处收敛到\(0\).

然而,对其求积分:

\[ \begin{aligned} \int_0^1 f_n ( x ) \mathrm{ d } x & = \int_0^1 nx ( 1 - x^2 )^n \mathrm{ d } x \\ & = - \frac{ n }{ 2 } \int_0^1 ( 1 - x^2 )^n \mathrm{ d } ( 1 - x^2 ) \\ & = - \frac{ n }{ 2 ( n + 1 ) } ( 1 - x^2 )^{ n + 1 } |_0^1 \\ & = \frac{ n }{ 2 ( n + 1 ) } \to \frac{ 1 }{ 2 } \end{aligned} \]

由此见到,极限函数的积分不一定等于积分的极限.极限和积分不一定可交换.

Example4

考虑\(f_n ( x ) = \begin{cases}2 n^2 x \\ x \in [ 0 , \frac{ 1 }{ 2 n } ] \\ 2 n^2 ( x - \frac{ 1 }{ n } ) & x \in ( \frac{ 1 }{ 2 n } , \frac{ 1 }{ n } ] \\ 0 & \text{ otherwise }\end{cases}\),也就是这个函数在\(\frac{ 1 }{ 2 n }\)处高度为\(n\),底长为\(\frac{ 1 }{ n }\)的一个小三角形.求其极限函数.

对于每一个点,这个函数当然逐点收敛于\(0\).然而也可以见到,这个函数的积分对于每一个\(n\)来说都是\(\frac{ 1 }{ 2 }\).

再次说明了极限函数的积分不一定等于积分的极限.极限和积分不一定可交换.

Example5

考虑\(f_n ( x ) = \frac{ \sin ( nx ) }{ \sqrt{ n } }\),求其极限函数.

当然逐点收敛于\(0\),然而观察到\(f_n ' ( x ) = \sqrt{ n } \cos nx\),\(f ' ( x ) = 0\).因此,光滑函数列的导数的极限又不一定等于极限的导数.

一致收敛

我们称一列函数\(\{ f_n ( x ) \}\)一致收敛\(f ( x )\),当且仅当\(\forall \epsilon > 0\),\(\exists N = N ( \epsilon )\),使得当\(n \geq N\)的时候,\(| f ( x ) - f_n ( x ) | < \epsilon , \forall x \in I\).注意这里的\(N\)不取决于\(x\)的选取,这就是和极限不同的地方,一致收敛要求整个函数都在逐步地贴向最终的函数.此时,记\(f_n ( x ) \rightrightarrows f ( x )\).还可以定义内闭一致收敛的概念,也就是对于一个\(I\)的任意的子紧集(在\(\mathbb{ R }\)上表现为有界闭集)都一致收敛.

一致收敛的等价定义当然是,取\(M_n = \sup_{ x \in I } | f_n ( x ) - f ( x ) |\),那么一致收敛等价于\(\lim M_n = 0\).

一致收敛强大的地方在于,对于收敛来说,是取定了\(x\)再挪动\(n\),因此\(n\)可以控制\(x\).然而,一致收敛要求先取定\(n\)再挪动\(x\).这种天然的交换能力赋予了一致收敛的强大.另外还容易见到,当\(I\)的点集是有限的时候,一定一致收敛.

我们还可以定义一致有界的概念,当存在一个上界\(M\),使得\(\forall n , | f_n | \leq M\)恒成立.显然,如果一个函数列一致有界,则极限函数肯定有界.

另外,我们可以见到,如果\(f_n \rightrightarrows f\),那么如果\(f\)有界,则\(f_n\)一致有界.反之,如果\(f_n\)有界,则\(f_n\)一致有界.

考虑前者,是因为:

\[ | f_n | \leq | f_n - f | + | f | \]

这俩当然是有界的.

对于后者,考虑反证,假设\(f\)无界(因为如果有界则前者即可推出),那么:

\[ | f | \leq | f - f_n | + | f_n | \]

由于\(| f - f_n |\)必然需要有界,因此前者无界,后者无论对于哪个\(n\)来说,必然也得无界.

我们有以下性质:

  1. \(f_n \rightrightarrows f , g_n \rightrightarrows g , x \in I\),则\(c_1 f_n + c_2 g_n \rightrightarrows c_1 f + c_2 g , x \in I\).

  2. \(f_n \rightrightarrows f , g_n \rightrightarrows g , x \in I\),而且\(f , g\)有界,则\(f_n g_n \rightrightarrows fg , x \in I\).

  3. 如果\(x \in I\)的时候\(f_n \rightrightarrows f\),\(x \in J\)的时候也\(f_n \rightrightarrows f\),则当\(x \in I \cup J\)的时候也有\(f_n \rightrightarrows f\).

对于(1),考虑令\(M_{ n } = \sup | f_n - f | , K_n = \sup | g_n - g |\),则:

\[ \begin{aligned} & | ( c_1 f_n + c_2 g_n ) - ( c_1 f + c_2 g ) | \\ \leq & | c_1 | M_n + | c_2 | K_n \to 0 \end{aligned} \]

立刻证毕.

对于(2),经典的做法:

\[ \begin{aligned} & | f_n g_n - fg | \\ = & | f_n ( g_n - g ) + g ( f_n - f ) | \\ \leq & | f_n | \cdot | g_n - g | + | g | \cdot | f_n - f | \end{aligned} \]

\(| f_n |\)一致有界,\(| g_n |\)一致有界得到\(| g |\)有界,所以上式就被控制住了.

对于(3),只需要把两部分的\(\sup\)分开算就可以见到仍能被控制住.

这里也有柯西准则:对于一列函数\(\{ f_n \}\),其一致收敛的充要条件是,\(\forall \epsilon > 0 , \exists N , \forall n , m \geq N , | f_n ( x ) - f_m ( x ) | < \epsilon\).

必要性显然,只证充分性,对于此时固定一个确定的\(x\),那么\(\{ f_n ( x ) \}\)就是一个柯西列且存在极限.逐点取极限就可以拿到\(f ( x ) = \lim_{ n \to \infty } f_n ( x )\).而\(| f_n ( x ) - f_m ( x ) | < \epsilon\)中只需要让\(m \to \infty\)就拿到了\(| f_n ( x ) - f ( x ) | \leq \epsilon\),这恰好是一致收敛的定义.

Example1

求证:\(f_n ( x ) = \frac{ x }{ 1 + n^2 x^2 }\)一致收敛.

当然处处收敛于\(0\)了,考虑用均值不等式,有\(| f_n ( x ) | \leq \frac{ | x | }{ 2 n | x | } = \frac{ 1 }{ 2 n }\),这就搞定.

Example2

求证:\(f_n ( x ) = x^n , x \in [ 0 , 1 )\)并不一致收敛.

当然处处收敛到\(0\),但是\(\sup f_n ( x ) = 1\),所以并不一致收敛.

Example3

\(f_n ( x ) = \frac{ 1 }{ n } , g_n ( x ) = x , x \in ( 0 , + \infty )\),容易见到\(f_n \rightrightarrows 0 , g_n \rightrightarrows x\).而且\(f_n ( x )\)当然一致有界.然而,\(f_n g_n \not \rightrightarrows 0\).

Example4

\(g \in C [ 0 , 1 ] , g ( 1 ) = 0\),求证:\(f_n ( x ) = g ( x ) x^n \rightrightarrows 0\).

由于\(g\)在闭区间上连续,则其必然在闭区间上一致连续.因此\(\forall \epsilon > 0\),取\(\delta \in ( 0 , 1 )\),使得\(x \in [ \delta , 1 ]\)的时候,\(| g ( x ) | < \epsilon\),而取\(M = \sup_{ [ 0 , 1 ] } | g |\),那么\(| f_n ( x ) | \leq M \delta^n + \epsilon\),注意这里的\(\delta\)不取决于\(n\)的选取这就搞定.

Example5

\(f_n ( x ) = n \left ( \sqrt{ x + \frac{ 1 }{ n } } - \sqrt{ x } \right ) , x \in ( 0 , + \infty )\),判断其收敛性.

容易发现\(f_n ( x ) = \frac{ 1 }{ \sqrt{ x + \frac{ 1 }{ n } } + \sqrt{ x } } \to \frac{ 1 }{ 2 \sqrt{ x } }\),因此其收敛.问题在于判断其是否一致收敛.

观察到:

\[ \begin{aligned} & | f_n ( x ) - \frac{ 1 }{ 2 \sqrt{ x } } | \\ = & \frac{ \sqrt{ x + \frac{ 1 }{ n } } - \sqrt{ x } }{ 2 \sqrt{ x } \left ( \sqrt{ x + \frac{ 1 }{ n } } + \sqrt{ x } \right ) } \\ = & \frac{ 1 }{ 2 n \sqrt{ x } \left ( \sqrt{ x + \frac{ 1 }{ n } } + \sqrt{ x } \right )^2 } \end{aligned} \]

一个策略是直接对此式子求导,但也可以采取另一种分析策略,考虑:

\[ \begin{aligned} \sqrt{ x + \frac{ 1 }{ n } } & = \sqrt{ x } \left ( 1 + \frac{ 1 }{ nx } \right )^{ \frac{ 1 }{ 2 } } \\ & = \sqrt{ x } \left ( 1 + \frac{ 1 }{ 2 nx } + O ( \frac{ 1 }{ n^2 } ) \right ) \end{aligned} \]

所以当\(x\)足够小的时候可能会出问题,直接取\(x = \frac{ 1 }{ n }\),误差为:

\[ \frac{ 1 }{ 2 \sqrt{ n } \left ( \frac{ 1 + \sqrt{ 2 } }{ \sqrt{ n } } \right )^2 } = O ( \sqrt{ n } ) \]

这就证明了并非一致收敛.

Example6

\([ 0 , 1 ]\)上的\(f_n ( x )\)满足\(\exists L > 0 , \forall x \ne y , | f_n ( x ) - f_n ( y ) | \leq L | x - y |\).并且\(\forall x \in [ 0 , 1 ] , f_n ( x ) \to f ( x )\).求证:\(f_n ( x ) \rightrightarrows f ( x )\).也就是:一致李氏连续的收敛函数列一定一致收敛.

李氏连续意味着我们可以用控制自变量的方式控制因变量.回忆到定义在有限集上的收敛函数列一定是一致收敛的.因此我们选择在数轴上打足够密的点来控制.

具体地,\(\forall \epsilon > 0\),我们将\([ 0 , 1 ]\)拆为长度不超过\(\frac{ \epsilon }{ 3 L }\)的小区间.假设分点是\(x_1 , \cdots , x_K\).这当然对于一个\(\epsilon\)来说是有限个点,我们可以让它们同时趋近于一致收敛,用柯西准则,也就是拿到一个\(N\),使得\(\forall n , m \geq N\),\(| f_n ( x_i ) - f_m ( x_i ) | < \frac{ \epsilon }{ 3 }\).

现在\(\forall x \in [ 0 , 1 ] , \exists x_i , | x - x_i | < \frac{ \epsilon }{ 3 L }\).于是:

\[ \begin{aligned} & | f_n ( x ) - f_m ( x ) | \\ \leq & | f_n ( x ) - f_n ( x_i ) | + | f_n ( x_i ) - f_m ( x_i ) | + | f_m ( x_i ) - f_m ( x ) | \\ < & \epsilon \end{aligned} \]

这就搞定.

函数项级数

函数项级数上也有柯西准则,也就是函数项级数的一致收敛性等价于\(\forall \epsilon , \exists N , \forall n , m \geq N , | \sum_{ k = n }^m f_k ( x ) | < \epsilon , \forall x \in I\).

还可以在这里定义绝对收敛:也就是\(\sum | f_n ( x ) |\)收敛.当然仍有绝对收敛推收敛.如果\(\sum | f_n ( x ) |\)还一致收敛,则称原级数绝对一致收敛.注意,这里的绝对一致收敛是定义在\(| f_n |\)的基础上.也就是说,一个函数既绝对收敛,又一致收敛,但它可能并不绝对一致收敛.然而反之是成立的,如果一个函数绝对一致收敛,可以推出它一致收敛,原因是\(\sum | f_n | \geq | \sum f_n |\),用柯西准则就可以得知.

另外,用柯西准则可以见到如果\(\sum f_n \rightrightarrows f\),那么\(f_n ( x ) \rightrightarrows 0\).

Example1

考虑函数项级数\(\sum ( - x )^n ( 1 - x ) , x \in [ 0 , 1 ]\).

直接考虑其余项,\(R_n ( x ) = \sum_{ k = n + 1 }^\infty ( - x )^k ( 1 - x ) = \frac{ ( - x )^{ n + 1 } ( 1 - x ) }{ 1 + x }\).此时考虑:

\[ \begin{aligned} | R_n | & \leq x^{ n + 1 } ( 1 - x ) \\ & = \frac{ 1 }{ n + 1 } ( n + 1 ) ( 1 - x ) x^{ n + 1 } \\ & \leq \frac{ 1 }{ n + 1 } ( \frac{ n + 1 }{ n + 2 } )^{ n + 2 } \\ & \leq \frac{ 1 }{ n + 1 } \to 0 \end{aligned} \]

所以该级数一致收敛.

那么是否绝对收敛呢?考虑:

\[ \begin{aligned} & \sum_{ k = 1 }^n | ( - x )^n ( 1 - x ) | \\ = & \sum_{ k = 1 }^n ( x^k - x^{ k + 1 } ) \\ = & x - x^{ n + 1 } \end{aligned} \]

所以当然也绝对收敛到\(\begin{cases}x & x \in [ 0 , 1 ) \\ 0 & x = 1\end{cases}\).

可是,它并不是绝对一致收敛的.考虑\(\sup_{ [ 0 , 1 ) } | S ( x ) - S_n ( x ) | = \sup_{ [ 0 , 1 ) } | x^{ n + 1 } | = 1\).

Example2

\(\sum \left ( \cos \frac{ \pi x }{ n } \right )^{ n^3 }\)的收敛域.

不妨设\(u_n ( x ) = \left ( \cos \frac{ \pi x }{ n } \right )^{ n^3 }\),考虑:

\[ \begin{aligned} \sqrt[n]{ u_n ( x ) } & = \left ( \cos \frac{ \pi x }{ n } \right )^{ n^2 } \\ & = \left ( 1 - \frac{ \pi^2 x^2 }{ 2 n^2 } + O ( \frac{ 1 }{ n^4 } ) \right )^{ n^2 } \\ & = \exp ( n^2 \ln \left ( 1 - \frac{ \pi^2 x^2 }{ 2 n^2 } + O ( \frac{ 1 }{ n^4 } ) \right ) ) \\ & = \exp ( n^2 \left ( - \frac{ \pi^2 x^2 }{ 2 n^2 } + O ( \frac{ 1 }{ n^4 } ) \right ) ) \\ & = \exp ( - \frac{ \pi^2 x^2 }{ 2 } + O ( \frac{ 1 }{ n^2 } ) ) \\ & \to e^{ - \frac{ \pi^2 x^2 }{ 2 } } \end{aligned} \]

所以最后模拟成了一个等比数列,那收敛域就是\(\mathbb{ R } \setminus \{ 0 \}\).

M判别法

\(| f_n ( x ) | \leq a_n , x \in I\),如果\(\sum a_n < \infty\),则\(\sum f_n ( x )\)绝对一致收敛.

证明的话,考虑用一般级数可以拿到\(\forall \epsilon > 0 , \exists N , \forall n , m \geq N , \sum_{ k = n }^m | a_n | < \epsilon\),但又有\(\forall x \in I , \sum_{ k = n }^m | f_n ( x ) | \leq \sum_{ k = n }^m a_k\),这就知道其绝对一致收敛.

DA判别法

假设\(\{ a_n ( x ) \} , \{ b_n ( x ) \}\)是两个函数列.对于任意固定的\(x \in I\),\(\{ a_n ( x ) \}\)是一个单调数列.注意这里其实不要求大家都递增或递减,只要对于每一个点都是单调的.而取\(B_n ( x ) = \sum_{ k = 1 }^n b_k ( x )\).则当:

  1. Dirichlet判别法:当\(a_n ( x ) \rightrightarrows 0\),\(B_n ( x )\)一致有界时,则\(\sum a_n b_n\)一致收敛.

  2. Able判别法:当\(\{ a_n ( x ) \}\)一致有界,\(B_n ( x )\)一致收敛时,则\(\sum a_n b_n\)一致收敛.

证明和级数部分完全一样,只需要对于任意的\(x\)都这么搞即可:

\[ \begin{aligned} & | \sum_{ k = n + 1 }^{ n + p } a_k ( x ) b_k ( x ) | \\ = & | \sum_{ k = n + 1 }^{ n + p } a_k ( x ) ( B_{ k } ( x ) - B_{ k - 1 } ( x ) ) | \\ = & | a_{ n + p } B_{ n + p } ( x ) + \sum_{ k = n + 1 }^{ n + p - 1 } ( a_k ( x ) - a_{ k + 1 } ( x ) ) B_k ( x ) | \\ \leq & M ( a_{ n + 1 } ( x ) + 2 a_{ n + p } ( x ) ) \end{aligned} \]

其中\(M = \sup_{ 1 \leq i \leq p } \{ | \sum_{ k = n + 1 }^{ n + i } b_k ( x ) | \}\).

Example1

\(b_n\)单调下降趋近于\(0\)的时候,求证:\(\sum_{ k = 1 }^\infty b_n \sin ( nx ) , x \in \mathbb{ R }\)一致收敛的充要条件是\(b_n = o ( \frac{ 1 }{ n } )\).

先证必要性,设\(S_{ n , p } = \sum_{ k = n }^p b_k \sin ( kx )\).由柯西原理,\(\forall \epsilon > 0 , \exists N , \forall n , p \geq N , | S_{ n , p } | < \epsilon\).此时取\(p = 2 n - 1 , x = \frac{ \pi }{ 4 n }\),此时当\(n \leq k \leq p\)的时候,\(\sin ( k \pi ) > \sin \frac{ \pi }{ 4 }\),立刻有:

\[ \begin{aligned} \epsilon & > | S_{ n , p } ( x ) | \\ & > nb_{ 2 n } \sin \frac{ \pi }{ 4 } = \frac{ \sqrt{ 2 } }{ 2 } n b_{ 2 n } \end{aligned} \]

这就搞定了\(b_{ 2 n } = o ( \frac{ 1 }{ n } )\),又因为\(b_n\)是单调下降的,那当然搞定了.

再证充分性,只要证明在\([ 0 , \pi ]\)上一致收敛,由于\(\sin ( nx )\)是奇函数,那么在\([ - \pi , 0 ]\)上当然也一致收敛,那就搞定了.

\(\mu_n = \max_{ m \geq n }{ mb_m }\),注意到\(\mu_n\)单调下降趋近于\(0\).下面开始讨论:

\(x \in [ 0 , \frac{ \pi }{ p } ]\)的时候,此时\(S_{ n , p }\)中的每一项都同号.自然有:

\[ \begin{aligned} \sum_{ k = n }^p b_k \sin ( kx ) & \leq \sum_{ k = n }^p b_k kx \\ & \leq \frac{ \pi }{ p } \sum_{ k = n }^p b_k k \\ & \leq \frac{ \pi }{ p } ( p - n ) \mu_n \\ & \leq \pi \mu_n \end{aligned} \]

这就完事.

\(x \in [ \frac{ \pi }{ n } , \pi ]\)的时候,和差化积公式给出:

\[ \begin{aligned} & | \sum_{ k = 1 }^n \sin ( kx ) | \\ = & \left | \frac{ \cos ( k - \frac{ 1 }{ 2 } ) x - \cos ( k + \frac{ 1 }{ 2 } ) }{ 2 \sin \frac{ x }{ 2 } } \right | \\ \leq & \frac{ 1 }{ | \sin \frac{ x }{ 2 } | } \\ < & n \end{aligned} \]

原因是当\(\frac{ x }{ 2 } \leq \frac{ \pi }{ 2 }\)的时候,\(\sin \frac{ x }{ 2 } \geq \frac{ 2 }{ \pi } \frac{ x }{ 2 } \geq n\).

回忆到Abel变换给出\(| S_{ n , p } | \leq n ( 2 b_n + b_p ) < 3 nb_n \to 0\).这就搞定.

\(x \in ( \frac{ \pi }{ p } , \frac{ \pi }{ n } )\)的时候,取\(m = \lfloor \frac{ \pi }{ x } \rfloor \leq \frac{ \pi }{ x }\).那我们就有:\(\frac{ \pi }{ m + 1 } \leq x \leq \frac{ \pi }{ m }\).

\(k \in [ n , m ]\)的时候,\(kx \leq \pi\),那\(\sin ( kx ) \leq kx\)就成立,那么和上面一样:

\[ | S_{ n , m } | \leq \pi \mu_n \]

\(k \in [ m + 1 , p ]\)的时候,此时\(\frac{ 1 }{ | \sin \frac{ x }{ 2 } | } \geq \frac{ 1 }{ m + 1 }\),因此:

\[ | S_{ m + 1 , p } | \leq ( m + 1 ) ( 2 b_{ m + 1 } + b_p ) < 3 \mu_{ m + 1 } \]

则:

\[ | S_{ n , p } | \leq | S_{ n , m } | + | S_{ m + 1 , p } | < \pi \mu_n + 3 \mu_{ m + 1 } \]

这就搞定.

连续性

我们还可以定义等度连续的概念:我们说\(f_n\)等度连续,当\(\forall \epsilon > 0 , \exists \delta > 0\),使得\(\forall x , y\),若\(| x - y | < \delta\),则\(\forall n , | f_n ( x ) - f_n ( y ) | < \epsilon\).其实就是某种一致(函数列)的一致(定义域上)连续.

我们可以证明:如果\(f_n ( x ) \in C [ a , b ]\),而且其等度连续,则如果\(\lim_{ n \to \infty } f_n ( x ) = f ( x ) , x \in [ a , b ]\),则\(f_n \rightrightarrows f , x \in [ a , b ]\).

证明与前述Example6证明一致李氏连续类似,事实上Example6是这个的一个推论.我们取定\(\delta\),使得\(| x - y | < \delta\)时一定有\(\forall n , | f_n ( x ) - f_n ( y ) | < \frac{ \epsilon }{ 3 }\),此时再令\(n \to \infty\),就有\(| f ( x ) - f ( y ) | \leq \frac{ \epsilon }{ 3 }\),再取一个分划\(\Delta : a = x_0 < \cdots < x_m = b\)并要求\(\lambda ( \Delta ) < \delta\).

自然有:

\[ \begin{aligned} | f_n ( x ) - f ( x ) | & \leq | f_n ( x ) - f_n ( x_i ) | + | f_n ( x_i ) - f ( x_i ) | + | f ( x_i ) - f ( x ) | \\ & \leq \epsilon \end{aligned} \]

原因仍是有限点集上的收敛一定是一致收敛.

下面要探索的就是一致连续是否保持了原函数项级数的作用.

先看一个引理:当\(x_0 \in [ a , b ]\)的时候,如若当\(x \in [ a , b ] \setminus \{ x_0 \}\),\(f_n ( x ) \rightrightarrows f ( x )\),已知\(\lim_{ x \to x_0 } f_n ( x ) = \alpha_n\)存在.则\(\lim_{ n \to \infty } \alpha_n\)存在而且\(\lim_{ x \to x_0 } f ( x ) = \lim_{ n \to \infty } \alpha_n\).换言之,\(\lim_{ x \to x_0 } \lim_{ n \to \infty } f_n ( x ) = \lim_{ n \to \infty } \lim_{ x \to x_0 } f_n ( x )\).

证明的话,首先要证明\(\lim_{ n \to \infty } \alpha_n\)存在,考虑\(\forall \epsilon > 0 , \exists N , \forall n , m \geq N\),有\(| f_n ( x ) - f_m ( x ) | < \frac{ \epsilon }{ 3 }\),取极限知道\(| \alpha_n - \alpha_m | \leq \frac{ \epsilon }{ 3 }\),这说明\(\{ \alpha_n \}\)是柯西列,当然收敛.不妨设\(\alpha = \lim_{ n \to \infty } \alpha_n\).

此时有:

\[ | f ( x ) - \alpha | \leq | f ( x ) - f_N ( x ) | + | f_N ( x ) - \alpha_N | + | \alpha_N - \alpha | \]

两边一取极限使得\(x \to x_0\),立刻见到\(| f ( x ) - \alpha | < \epsilon\).这已经能看出一致连续的强大了.正是因为一致连续可以先固定\(N\),我们才可以在这里对\(x \to x_0\)取极限.所以这里有一个天然的可交换性.

这个引理的一个推论是:如果\(f_n \rightrightarrows f , x \in [ a , b ]\),则对于\(x_0 \in [ a , b ]\),如果\(f_n ( x )\)\(x_0\)处连续,则\(f\)也在\(x_0\)处连续.原因是既然连续,则\(\alpha_n = \lim_{ x \to x_0 } f_n ( x ) = f_n ( x_0 )\),所以\(\lim_{ x \to x_0 } f ( x ) = \lim_{ n \to \infty } f_n ( x_0 ) = f ( x_0 )\).这就说明在\(x_0\)处连续.更有推论:如果\(f_n \in C [ a , b ] , f_n \rightrightarrows f\),则\(f \in C [ a , b ]\).从而还可以见到,如果一串连续函数收敛到一个不连续函数,那这肯定也不是一致收敛的.

那么反过来,如果连续函数列收敛到连续函数,能不能推出一致收敛呢?我们事实上有迪尼定理:如果\(f_n ( x ) \in C [ a , b ]\),当\(n < m\)的时候,\(\forall x \in [ a , b ] , f_n ( x ) \leq f_m ( x )\),此时如若\(f_n \rightarrow f\),而且\(f \in C [ a , b ]\),则\(f_n \rightrightarrows f\).也就是只要有一定的单调性,我们就可以说一致连续是连续函数列收敛到连续函数的充要条件.

\(R_n ( x ) = f ( x ) - f_n ( x ) \geq 0\),注意到\(\lim_{ n \to \infty } R ( x ) = 0\)而且\(R_n ( x )\)连续且逐点随\(n\)单调递减,则必有\(R_n \to 0\).如果我们能证明\(R_n ( x ) \rightrightarrows 0\),那就万事大吉.不妨设\(M_n = \max_{ x \in [ a , b ] } R_n ( x ) = R_n ( x_n )\),那么只要证明\(M_n \to 0\)就可以搞定一致收敛.然而\(M_n\)本身是单调下降的.反证,如果\(\lim_{ n \to \infty } M_n = c > 0\),此时观察\(x_n \in [ a , b ]\),既然如此,\(\{ x_n \}\)必定有收敛子列,任取一个收敛子列\(\{ x_{ n_k } \}\)并假设其收敛到\(x_0\),接下来看:

\[ \begin{aligned} & \lim_{ m \to \infty } R_m ( x_0 ) \\ = & \lim_{ m \to \infty } \lim_{ x_{ n_k } \to x_0 } R_m ( x_{ n_k } ) \\ \geq & \lim_{ m \to \infty } \lim_{ n_k > m , x_{ n_k } \to x_0 } R_{ n_k } ( x_{ n_k } ) \\ = & \lim_{ x_{ n_k } \to x_0 } R_{ n_k } ( x_{ n_k } ) > 0 \end{aligned} \]

可这就出事了.于是矛盾,反证成立.

迪尼定理的一个推论是如果\(f_n ( x ) \geq 0\),那么此时\(S_n ( x ) = \sum_k^n f ( x )\)就是逐点单调的了.因此我们可以看到此时\(\sum f_n\)一致收敛性也就等价于其连续性.

Example1

考虑\(f_n \geq 0\),而且\(\forall n , f_n\)单增的时候,如若\(\sum f_n ( x ) \leq M , \forall x \in [ a , b )\).求证此时\(\lim_{ x \to b - 0 } \sum_{ n = 1 }^\infty f_n ( x ) = \sum_{ n = 1 }^\infty f_n ( b - 0 )\).

\(S_n = \sum_k^n f_k ( x )\),取定\(m\),此时\(\forall x \in [ a , b )\),\(S ( x ) \geq S_m ( x )\).令\(x \to b - 0\),自然有\(\sum_{ n = 1 }^m f_n ( b - 0 ) \leq \lim_{ x \to b - 0 } S ( x )\).直接令\(S ( b - 0 ) = \lim_{ x \to b - 0 } S ( x )\),这个极限存在,原因是\(S ( x )\)是单调的.从而取极限得到\(\sum_{ n = 1 }^\infty f_n ( b - 0 ) \leq S ( b - 0 )\).

接下来另一个方向,考虑:

\[ \begin{aligned} \sum_{ n = 1 }^m f_n ( x ) & \leq \sum_{ n = 1 }^m f_n ( b - 0 ) \leq \sum_{ n = 1 }^\infty f_n ( b - 0 ) \\ S ( x ) & \leq \sum_{ n = 1 }^\infty f_n ( b - 0 ) \\ S ( b - 0 ) & \leq \sum_{ n = 1 }^\infty f_n ( b - 0 ) \end{aligned} \]

这就搞定.

Example2

\(f_n\)\([ a , b ]\)上可微而且\(f_n ' \in R [ a , b ]\),若\(\forall x \in [ a , b ] , \forall n , | \sum_{ k = 1 }^n f_k ' ( x ) | \leq M\),\(\sum f_n ( x )\)\([ a , b ]\)上收敛.求证其在\([ a , b ]\)上一致收敛.

容易观察到\(\sum f_n ( x )\)一致李氏连续,用之前等度连续的结论就可以做掉.

可积性

如果\(f_n \in R [ a , b ] , f_n \rightrightarrows f\),则我们声明\(f \in R [ a , b ]\)\(\int_a^b f \mathrm{ d } x = \lim_{ n \to \infty } \int_a^b f_n \mathrm{ d } x\).

考虑证明,首先\(f_n\)是有界的,又因为一致收敛,所以能推出\(f\)也是有界的.

一个想法是使用勒贝格定理.直接取\(K_n\)\(f_n\)的间断点集,立刻得到\(K_n\)是零测集.接下来令\(K = \bigcup K_n\),那\(K\)还是零测集(可数个零测集的并),此时对于\(\forall x \in [ a , b ] \setminus K\),\(\forall n , f_n\)都在\(x\)处连续,那\(f\)肯定也在\(x\)处连续,所以\(f\)的间断点集就一定被包含于零测集\(K\),所以黎曼可积.

接下来的问题是是否积分相等,取\(M_n = \sup_{ [ a , b ] } | f - f_n |\),注意到:

\[ \begin{aligned} & | \int_a^b f \mathrm{ d } x - \int_a^b f_n \mathrm{ d } x | \\ \leq & \int_a^b | f - f_n | \mathrm{ d } x \\ \leq & \int_a^b M_n \mathrm{ d } x \\ = & M_n ( b - a ) \to 0 \end{aligned} \]

这就搞定.然而注意到这里需要依赖于\(b - a\)的有界性.

另一个策略是直接用分划达布和证明\(f \in R [ a , b ]\).不妨设\(| f_n | \leq M , | f | \leq M\).则\(\forall \epsilon > 0 , \exists n\),\(| f_n ( x ) - f ( x ) | < \epsilon\).由于\(f_n ( x ) \in R [ a , b ]\),可以取定分划\(\Delta : a = x_0 < \cdots < x_p = b\),使得\(\sum ( M_i - m_i ) \Delta x_i < \epsilon\).

于此,我们取\(\bar{ M }_i = \sup_{ [ x_{ i - 1 } , x_i ] } f ( x ) , \bar{ m }_i\)同理.观察到\(\forall x \in [ x_{ i - 1 } , x_i ] , f ( x ) \leq f_n ( x ) + \epsilon \leq M_i + \epsilon\),所以一定有\(\bar{ M }_i \leq M_i + \epsilon\).对于\(\bar{ m }_i\)同理.此时:

\[ \begin{aligned} & \sum ( \bar{ M }_i - \bar{ m }_i ) \Delta x_i \\ \leq & \sum ( M_i - m_i ) \Delta x_i + 2 \epsilon ( b - a ) \\ \leq & \epsilon ( 1 + 2 ( b - a ) ) \end{aligned} \]

这就搞定.

事实上这个结论可以更强,可以放弃一致收敛的条件.我们有控制收敛定理:假设\(f_n \in R [ a , b ]\),而且它们一致有界,\(\forall n , \forall x \in [ a , b ] , | f_n | \leq M\).并且\(f ( x ) = \lim_{ n \to \infty } f_n ( x ) \in R [ a , b ]\),则\(\int_a^b f ( x ) \mathrm{ d } x = \lim_{ n \to \infty } \int_a^b f_n ( x ) \mathrm{ d } x\).

为证明此,先引入一些相关的定义:

定义阶梯函数为分段常值函数,假设\(f \in R [ a , b ]\),则我们可以用阶梯函数逼近\(f\),具体而言,假设\(g\)是阶梯函数,并且\(g \leq f\),那么我们可以将\(g\)类似达布下和而分划够细,以使得\(\int_a^b f \mathrm{ d } x = \sup_{ g \leq f , \text{ g is a step function } } \{ \int_a^b g ( x ) \mathrm{ d } x \}\).

定义初等集:有限个不交区间的并,可以见到其测度\(m ( E )\)就是所有不交区间的长度之和.

定义闭初等集:有限个不交闭区间的并.

定义有界闭初等集列:\(A_n\)是闭初等集.容易见到,如果\(A_n \ne \emptyset\),而且\(A_{ n + 1 } \subseteq A_n\),则\(\bigcap_{ n = 1 }^\infty A_n \ne \emptyset\),证明的话只需类似区间套定理,每个\(A_n\)内取一个点,这个点列是有界的,那它就一定有收敛子列,收敛到的那个点一定被含在每一个\(A_n\)中.这就搞定.

不妨设\(A_n\)是有界非空集列,满足\(A_{ n + 1 } \subseteq A_n , A_n \ne \emptyset , \bigcap_{ n = 1 }^\infty A_n = \emptyset\).此时定义\(\alpha_n = \sup \{ m ( E ) \mid E \subseteq A_n , \text{ E is a closed elementary set } \}\).我们下面证明\(\lim_{ n \to \infty } \alpha_n = 0\).

首先显然\(\alpha_n\)单调递减.如若其不以\(0\)为极限,则一定有正下界\(\alpha_n > \delta > 0\).我们可以取\(A_n\)的闭初等子集\(E_n \subseteq A_n\)满足\(m ( E_n ) > \alpha_n - \frac{ \delta }{ 2^n }\).

接下来定义\(H_n = \bigcap_{ k = 1 }^n E_k\),这当然是初等集,此时见到\(H_{ n + 1 } \subseteq H_n\).接下来对\(A_n \setminus H_n\)的任意初等子集\(E\),显然:

\[ \begin{aligned} E & = E \setminus H_n \\ & = E \setminus ( \bigcap_{ k = 1 }^n E_k ) \\ & = \bigcup_{ k = 1 }^n ( E \setminus E_k ) \end{aligned} \]

\(E \subseteq A_n \subseteq A_k\),所以\(E_k\)\(E \setminus E_k\)都是\(A_k\)的初等子集.所以:

\[ \begin{aligned} m ( E \setminus E_k ) + m ( E_k ) & \leq \alpha_k \\ m ( E \setminus E_k ) & \leq \frac{ \delta }{ 2^k } \end{aligned} \]

所以\(m ( E ) \leq \delta\).如果\(H_n = \emptyset\),那么\(m ( E ) = \alpha_n\),这就不符.所以\(H_n \ne \emptyset\),所以\(\bigcap_{ n = 1 }^\infty H_n \ne \emptyset\),所以\(\bigcap A_n \ne \emptyset\).矛盾,这就证明了原本的结论.

接下来考虑\(f ( x ) - f_n ( x )\),当没有一致连续的条件时,可能出现问题的地方在于有的地方两者不一定靠的足够近,想办法让这种地方所占的长度尽可能小就行.

对于\(\forall \epsilon > 0 , A_n = \{ x \in [ a , b ] \mid \exists j \geq n , | f_j ( x ) - f ( x ) | \geq \epsilon \}\).容易见到\(A_{ n + 1 } \subseteq A_n\),由于\(f_n \to f\),所以\(\bigcap_{ n = 1 }^\infty A_n = \emptyset\).引理告诉我们\(\alpha_n \to 0\).既然如此,存在\(N\),使得\(\forall n \geq N\),\(A_n\)的任意初等子集\(E\)都有\(m ( E ) < \epsilon\).取\(F = [ a , b ] \setminus E\).这其实更像是取\([ a , b ]\)的一个分划,因此如果我们在上面取阶梯函数的话,完全可以让阶梯函数所需的那个分划和这个分划并起来,从而完全由上述结果取到阶梯函数,此外我们的\(A_n \setminus E\)的部分由于落在\(F\)里而需要被\(\epsilon\)控制.

此时取阶梯函数\(S ( x )\)满足\(0 \leq S ( x ) \leq | f ( x ) - f_n ( x ) |\).这个时候看\(S ( x )\)的积分:

\[ \begin{aligned} \int_a^b S ( x ) \mathrm{ d } x & = \int_E S ( x ) \mathrm{ d } x + \int_F S ( x ) \mathrm{ d } x \\ & \leq 2 M \epsilon + \epsilon ( b - a ) \end{aligned} \]

这个对任意\(S ( x )\)都成立,由于我们之前说的阶梯函数的上界可以逼近原函数,所以这就意味着:

\[ \begin{aligned} & | \int_a^b f_n ( x ) - f ( x ) \mathrm{ d } x | \\ \leq & \int_a^b | f_n ( x ) - f ( x ) | \mathrm{ d } x \\ \leq & 2 M \epsilon + \epsilon ( b - a ) \end{aligned} \]

这就搞定.不过细心的读者也许会注意到一些问题,首先是这里用内测度逼近疑似有点神秘,然而如果用勒贝格测度的定义直接跑其实一眼就能看出来上面的结论.

还有另一个结论:假设\(f_n \in R [ a , b ] , | f_n | \leq M\),已知\(\lim_{ n \to \infty } f_n ( x ) = f ( x )\)存在(注意这里并不要求\(f ( x ) \in R [ a , b ]\)),我们就可以证明\(\lim_{ n \to \infty } \int_a^b f_n ( x ) \mathrm{ d } x\)存在.

考虑\(| \int_a^b f_n \mathrm{ d } x | \leq M ( b - a )\)有界,所以其可以取上下极限操作.令\(\overline{ F } = \varlimsup_{ n \to \infty } \int_a^b f_n \mathrm{ d } x , \underline{ F } = \varliminf_{ n \to \infty } \int_a^b f_n \mathrm{ d } x\).既然如此,就一定存在两列\(\{ n_k \}\)\(\{ m_k \}\),使得\(\overline{ F } = \lim_{ k \to \infty } \int_a^b f_{ n_k } \mathrm{ d } x , \underline{ F } = \lim_{ k \to \infty } \int_a^b f_{ m_k } \mathrm{ d } x\).然而:

\[ \begin{aligned} \overline{ F } - \underline{ F } & = \lim_{ k \to \infty } \int_a^b ( f_{ n_k } - f_{ m_k } ) \mathrm{ d } x \\ & = \int_a^b \lim_{ k \to \infty } ( f_{ n_k } - f_{ m_k } ) \mathrm{ d } x = 0 \end{aligned} \]

这你就可以见到,我们其实可以把这个极限干脆定义成\(f\)的积分.这实际上就是勒贝格积分.

Example1

求证:\(\int_0^1 \frac{ 1 }{ x^x } \mathrm{ d } x = \sum_{ n = 1 }^\infty \frac{ 1 }{ n^n }\).

展开:

\[ \begin{aligned} \frac{ 1 }{ x^x } & = e^{ - x \ln x } \\ & = \sum_{ n \geq 0 } \frac{ ( - x \ln x )^n }{ n ! } \end{aligned} \]

容易证明这个函数项级数是一致收敛的,那我们就可以逐项积分,而且积分内可以做多少次分部积分都无所谓(反正是有限逼近无限).

那么:

\[ \begin{aligned} & \int_0^1 \frac{ 1 }{ x^x } \mathrm{ d } x \\ = & \int_0^1 \sum_{ n \geq 0 } \frac{ ( - x \ln x )^n }{ n ! } \mathrm{ d } x \\ = & \sum_{ n \geq 0 } \int_0^1 \frac{ ( - x \ln x )^n }{ n ! } \mathrm{ d } x \end{aligned} \]

\(x = e^{ - t }\),换元:

\[ \begin{aligned} & \sum_{ n \geq 0 } \int_0^1 \frac{ ( - x \ln x )^n }{ n ! } \mathrm{ d } x \\ = & - \sum_{ n \geq 0 } \frac{ 1 }{ n ! } \int_0^{ + \infty } e^{ - ( n + 1 ) t } t^n \mathrm{ d } t \end{aligned} \]

而考虑:

\[ \begin{aligned} & \int_0^{ + \infty } e^{ - ( n + 1 ) t } t^n \mathrm{ d } t \\ = & \frac{ - 1 }{ n + 1 } \int_0^{ + \infty } t^n \mathrm{ d } e^{ - ( n + 1 ) t } \\ = & \frac{ - 1 }{ n + 1 } \left ( e^{ - ( n + 1 ) t } t^{ n } |_0^{ + \infty } - n \int_0^{ + \infty } e^{ - ( n + 1 ) t } t^{ n - 1 } \right ) \\ = & \frac{ n }{ n + 1 } \int_0^{ + \infty } e^{ - ( n + 1 ) t } t^{ n - 1 } \\ = & \cdots \\ = & \frac{ n ! }{ ( n + 1 )^{ n } } \int_0^{ + \infty } e^{ - ( n + 1 ) t } \mathrm{ d } t \\ = & - \frac{ n ! }{ ( n + 1 )^{ n + 1 } } \end{aligned} \]

和上面结合一下就证毕.

Example2

设函数列\(\{ f_n ( x ) \}\)任意内闭可积,并且\(\{ f_n ( x ) \}\)\(\mathbb{ R }\)上一致收敛到\(f ( x )\),再设存在函数\(g ( x )\)满足:

\[ | f_n ( x ) | \leq g ( x ) \]

并且\(\int_{ - \infty }^{ + \infty } g ( x ) \mathrm{ d } x < + \infty\).求证下列积分收敛而且:

\[ \int_{ - \infty }^{ + \infty } f ( x ) \mathrm{ d } x = \lim_{ n \to \infty } \int_{ - \infty }^{ + \infty } f_n ( x ) \mathrm{ d } x \]

首先要证明\(\int_{ - \infty }^{ + \infty } f ( x ) \mathrm{ d } x\)收敛.只需观察到\(| f_n | \leq g\)两遍取极限就可以拿到\(| f | \leq g\),所以绝对收敛.

接下来考虑如何证明相等,这里的问题在于虽然\(f ( x ) \rightrightarrows f\),但是由于区间长度无限长,因此这个控制会被放大.于此我们的策略是考虑将区间分成三段:\([ - \infty , - A ] , [ - A , A ] , [ A , + \infty ]\),对于中间的部分用一致收敛控制住,对于前后的部分用柯西准则控制住.

具体而言,\(| f ( x ) - f_n ( x ) | \leq 2 g ( x )\)取足够大的\(A\)使得\(\int_{ A }^{ + \infty } g ( x ) \mathrm{ d } x \leq \frac{ \epsilon }{ 6 }\)以及\(\int_{ - \infty }^{ - A } g ( x ) \mathrm{ d } x \leq \frac{ \epsilon }{ 6 }\),接下来考虑取足够大的\(n\)使得在\([ - A , A ]\)上,\(| f_n ( x ) - f ( x ) | < \frac{ \epsilon }{ 6 A }\):

\[ \begin{aligned} & | \int_{ - \infty }^{ + \infty } f_n ( x ) - f ( x ) \mathrm{ d } x | \\ \leq & | \int_{ - A }^{ + A } f_n ( x ) - f ( x ) \mathrm{ d } x | + | \int_{ - \infty }^{ - A } f_n ( x ) - f ( x ) \mathrm{ d } x | + | \int_{ + A }^{ + \infty } f_n ( x ) - f ( x ) \mathrm{ d } x | \\ \leq & 2 A \frac{ \epsilon }{ 6 A } + \frac{ \epsilon }{ 6 } \times 4 \\ = & \epsilon \end{aligned} \]

这就搞定了.

可微性

先看一个平凡的命题:假设\(f_n \in C^1 [ a , b ] , x_0 \in [ a , b ]\),已知\(\{ f_n ( x_0 ) \}\)收敛,而且\(f_n ' \rightrightarrows g\).则\(f_n \rightrightarrows f\),其中\(f \in C^1 [ a , b ]\),并且恰好满足\(f ' = g\).

考虑\(g ( x ) = \lim_{ n \to \infty } f_n ' ( x ) , x \in [ a , b ]\)当然能得到\(g ( x )\)是连续函数.

接下来考虑NL公式给出:

$$ \[\begin{aligned} f_n ( x ) & = f_n ( x_0 ) + \int_{ x_0 }^x f '_n ( t ) \mathrm{ d } t \\ \lim_{ n \to \infty } f_n ( x ) & = \lim_{ n \to \infty } f_n ( x_0 ) + \lim_{ n \to \infty } \int_{ x_0 }^x f '_n ( t ) \mathrm{ d } t \\ \lim_{ n \to \infty } f_n ( x ) & = \lim_{ n \to \infty } f_n ( x_0 ) + \int_{ x_0 }^x \lim_{ n \to \infty } f '_n ( t ) \mathrm{ d } t \\ f ( x ) & = \lim_{ n \to \infty } f_n ( x_0 ) + \int_{ x_0 }^x g ( t ) \mathrm{ d } t \\ \end{aligned}\]

$$

这就见到\(f_n \to f , f \in C^1 [ a , b ]\)而且\(f ' = g\).现在的问题是能否推出一致收敛\(f_n \rightrightarrows f\).有:

\[ \begin{aligned} & | f_n ( x ) - f ( x ) | \\ = & | f_n ( x_0 ) + \int_{ x_0 }^x f_n ' ( t ) \mathrm{ d } t - f ( x_0 ) - \int_{ x_0 }^x g ( t ) | \\ \leq & | f_n ( x_0 ) - f ( x_0 ) | + | \int_{ x_0 }^x f_n ' ( t ) \mathrm{ d } t - \int_{ x_0 }^x g ( t ) | \\ \leq & | f_n ( x_0 ) - f ( x_0 ) | + ( b - a ) \sup | f_n ' - g | \end{aligned} \]

这就完事.

上述结果能不能加强呢?事实上有一个更一般的结果:假设对于一串连续函数\(f_n ( x ) \in C [ a , b ]\),已知\(\exists x_0 \in [ a , b ]\),\(\lim_{ n \to \infty } f_n ( x_0 )\)存在.若对于\(\forall \epsilon > 0\),\(\exists N > 0 , \forall n , m \geq N\),函数\(g ( x ) = f_n ( x ) - f_m ( x )\)的李氏常数\(< \epsilon\).则我们可以推出\(\{ f_n ( x ) \}\)一致收敛,设\(f_n ( x ) \rightrightarrows f ( x )\),若对于某个\(x \in [ a , b ]\),如果\(f_n ' ( x )\)恒存在,而且\(\lim_{ n \to \infty } f_n ' ( x )\)存在,则\(f ' ( x )\)存在而且\(f ' ( x ) = \lim_{ n \to \infty } f_n ' ( x )\).

这个结论的正确性比较直观,就是用李氏连续的性质限制整个函数的波动.这个结论当然要严格强于原本的结论,因为闭区间上的可导函数自然是李氏连续函数,如若\(f_n ' ( x )\)一致连续,当然能推出上述的李氏连续性质,立刻得到原本结论.

下面考虑证明:\(\forall \epsilon > 0 , \exists N , \forall n , m \geq N\),都有\(| f_n ( x_0 ) - f_m ( x_0 ) | < \frac{ \epsilon }{ 2 }\),并且\(f_n ( x ) - f_m ( x )\)的李氏常数\(< \frac{ \epsilon }{ 2 ( b - a ) }\).注意到此时:

\[ \begin{aligned} & | f_n ( x ) - f_m ( x ) | \\ \leq & | f_n ( x ) - f_m ( x ) - ( f_n ( x_0 ) - f_m ( x_0 ) ) | + | f_n ( x_0 ) - f_m ( x_0 ) | \\ < & \frac{ \epsilon }{ 2 ( b - a ) } | x - x_0 | + \frac{ \epsilon }{ 2 } \leq \epsilon \end{aligned} \]

这就证明了\(f_n\)一致收敛,不妨设\(f_n \rightrightarrows f\).

接下来对于某个\(x \in [ a , b ]\),定义\(\varphi_n ( t ) = \frac{ f_n ( t ) - f_n ( x ) }{ t - x } , t \in [ a , b ] \setminus \{ x \}\),并补定义\(\varphi ( t ) = \frac{ f ( t ) - f ( x ) }{ t - x } , t \in [ a , b ] \setminus \{ x \}\).显然\(\varphi_n ( t ) \in C [ a , b ] \setminus \{ x \}\)

首先注意到:

\[ \begin{aligned} & | \varphi_n ( t ) - \varphi_m ( t ) | \\ = & \frac{ 1 }{ | t - x | } | f_n ( t ) - f_m ( t ) - ( f_n ( x ) - f_m ( x ) ) | \\ \leq & \frac{ 1 }{ | t - x | } \frac{ \epsilon }{ 2 ( b - a ) } | t - x | \\ = & \frac{ \epsilon }{ 2 ( b - a ) } \end{aligned} \]

于是\(\varphi_n ( t )\)一致收敛,而且容易见到\(\varphi_n \rightrightarrows \varphi\).从而:

\[ \begin{aligned} f ' ( x ) & = \lim_{ t \to x } \varphi ( t ) \\ & = \lim_{ t \to x } \lim_{ n \to \infty } \varphi_n ( t ) \\ & = \lim_{ n \to \infty } \lim_{ t \to x } \varphi_n ( t ) \\ & = \lim_{ n \to \infty } f_n ' ( x ) \end{aligned} \]

这就搞定了.

容易发现上述的推论是可导函数列的收敛性质(并不需要\(C^1\)).而且我们还可以推出一个推论:那就是导函数一致收敛到的函数也是导函数.

Example1

假设\(\{ q_n \}\)\([ 0 , 1 ]\)中的全体有理数排成的数列.定义\(f ( x ) = \sum_{ n = 1 }^\infty \frac{ | x - q_n | }{ 3^n } , x \in [ 0 , 1 ]\).

首先用大M判别法,注意到\(\frac{ | x - q_n | }{ 3^n } \leq \frac{ 1 }{ 3^n }\),而每一项都是连续的,所以总的\(f ( x )\)是连续函数,而且这个定义也是收敛的.而且对于\(x_0 \in [ 0 , 1 ] \setminus \mathbb{ Q }\),\(f_n ' ( x_0 )\)当然都是存在的,而且见到\(f_n ' ( x_0 ) = \sum_{ k = 1 }^n \frac{ \text{ sgn } ( x_0 - q_k ) }{ 3^k }\),并且这个导数还足够小.因此立刻见到当\(n , m\)足够大的时候,立刻见到\(f_n - f_m\)的李氏常数可以尽可能小.

于是套用上面的结论可以知道\(f ( x )\)\([ 0 , 1 ] \setminus \mathbb{ Q }\)处可导.那么其在\(\mathbb{ Q } \cap [ 0 , 1 ]\)上可导么?如若\(x \in \mathbb{ Q }\),不妨设\(x = q_n\),则考虑\(f ( x ) = \frac{ | x - q_n | }{ 3^n } + \sum_{ k \ne n } \frac{ | x - q_k | }{ 3^k }\),前半部分在\(q_n\)处不可导可后半部分在\(q_n\)处可导,于是总和当然不可导.

Example2

\(f ( x ) = \sum_{ n = 1 }^\infty \frac{ \sin ( nx ) }{ n^3 }\),求其导函数.

观察到\(\sum_{ n = 1 }^\infty | ( \frac{ \sin ( nx ) }{ n^3 } ) ' | \leq \sum \frac{ 1 }{ n^2 } < \infty\),所以其导函数也绝对一致收敛.立刻能推出\(f \in C^1 ( - \infty , + \infty )\),而且导函数就是逐项求导的\(f ' ( x ) = \sum_{ n = 1 }^\infty \frac{ \cos ( nx ) }{ n^2 }\).

部分应用

Borel引理

对任何一个实数列\(\{ a_n \}\),都存在一个函数\(f ( x ) \in C^{ \infty } ( \mathbb{ R } )\),满足\(f^{ ( n ) } ( 0 ) = a_n\).

考虑造一个\(g ( x ) = \begin{cases}1 & 0 \leq x \leq \frac{ 1 }{ 2 } \\ 0 & x \geq 1\end{cases}\),其中中间少了一段用磨光核连起来.考虑造一个单调递增无界正数列\(\{ \lambda_n \}\),并取:

\[ f ( x ) = \sum_{ n = 0 }^\infty \frac{ a_n x^n }{ n ! } g ( \lambda_n | x | ) \]

这个的好处是什么呢?我们发现当\(\lambda_n | x | \geq 1\),\(| x | \geq \frac{ 1 }{ \lambda_n }\)的时候\(g ( \lambda_n | x | ) = 0\),又因为\(\lambda_n\)单调递增趋近于无穷,所以除了\(0\)以外的所有点上都是有限和,因此全都收敛而且全都可导,所以\(f \in C^{ \infty } ( \mathbb{ R } \setminus \{ 0 \} )\).

考虑\(f_n ( x ) = \frac{ a_n x^n }{ n ! } g ( \lambda_n | x | )\),这个当然是\(C^{ \infty }\)的.并且当然有\(f_n^{ ( n ) } ( 0 ) = a_n\).现在如果我们能搞定这个导数级数的收敛性就搞定了\(0\)处的可导性了对吧.取\(M_k = \max_{ 0 \leq l \leq k } | g^{ ( l ) } |\),当\(k \leq n\)的时候考虑:

$$ \[\begin{aligned} | f_n^{ ( k ) } ( x ) | & \leq \frac{ | a_n | }{ n ! } \sum_{ m = 0 }^k \left | \binom{ k }{ m } n^{ \underline{ k - m } } x^{ n - k + m } g^{ ( m ) } ( \lambda_n | x | ) \lambda_n^m \right | \\ & \leq \frac{ | a_n | }{ n ! } \sum_{ m = 0 }^k \left | \binom{ k }{ m } n^{ \underline{ k - m } } x^{ n - k + m } M_k \lambda_n^m \right | \\ \end{aligned}\]

$$

注意这里的\(x\)一定很小,\(| x | < \frac{ 1 }{ \lambda_n }\)的时候上式才有意义,开始放缩:

\[ \begin{aligned} | f_n^{ ( k ) } ( x ) | & \leq \frac{ | a_n | }{ n ! } \sum_{ m = 0 }^k \left | \frac{ k ! }{ m ! ( k - m ) ! } n^{ \underline{ k - m } } M_k \frac{ 1 }{ \lambda_n^{ n - k } } \right | \\ & \leq \frac{ | a_n | }{ n ! } \sum_{ m = 0 }^k \left | \frac{ k ! }{ m ! ( k - m ) ! } n^{ \underline{ k - m } } M_k \frac{ 1 }{ \lambda_n^{ n - k } } \right | \\ & = \frac{ | a_n | }{ n ! } \sum_{ m = 0 }^k \left | \frac{ k ! }{ m ! ( k - m ) ! } \frac{ n ! }{ ( n - k + m ) ! } M_k \frac{ 1 }{ \lambda_n^{ n - k } } \right | \\ & \leq | a_n | M_k \frac{ 1 }{ \lambda_n^{ n - k } } k ! \end{aligned} \]

显然只需取足够小的\(\lambda_n\)就用大M判别法控制住了.

维尔斯特拉斯函数

考虑造一个处处连续处处不可导的函数,首先它应该在任何一个区间上都没有单调性(因为单调函数几乎处处可导).

首先造一个连续的\(2\)周期函数\(h ( x ) = \begin{cases}x & 0 \leq x \leq 1 \\ 2 - x & 1 \leq x \leq 2 \\ h ( x - 2 ) & \text{ otherwise }\end{cases}\).或者我们干脆定义\(h ( x ) = \sin ( \frac{ \pi }{ 2 } 4^n x )\),这样这个函数更光滑一点,但对论证几乎没有区别.

考虑造\(f ( x ) = \sum_{ n = 0 }^{ \infty } ( \frac{ 3 }{ 4 } )^n h ( 4^n x )\),注意到:

\[ f ( x ) \leq \sum ( \frac{ 3 }{ 4 } )^n < \infty \]

根据大M判别法,所以这个函数的确绝对一致收敛.那这个函数就确实继承了连续性.

首先有引理:如果\(f ' ( x_0 )\)存在,而且\(\alpha_n \leq x_0 \leq \beta_n , 0 < \beta_n - \alpha_n \to 0\),则\(\lim_{ n \to \infty } \frac{ f ( \beta_n ) - f ( \alpha_n ) }{ \beta_n - \alpha_n } \to f ' ( x_0 )\).取\(\lambda_n = \frac{ \beta_n - x_0 }{ \beta_n - \alpha_n }\),容易见到\(0 \leq \lambda_n \leq 1\),见到:

\[ \begin{aligned} & \frac{ f ( \beta_n ) - f ( \alpha_n ) }{ \beta_n - \alpha_n } - f ' ( x_0 ) \\ = & \lambda_n ( \frac{ f ( \beta_n ) - f ( x_0 ) }{ \beta_n - x_0 } - f ' ( x_0 ) ) + ( 1 - \lambda_n ) ( \frac{ \alpha_n - f ( x_0 ) }{ \alpha_n - x_0 } - f ' ( x_0 ) ) \end{aligned} \]

容易见到趋近于\(0\).不过要简单判断一下\(\alpha_n = x_0\)的情况.

既然如此,\(\forall x \in \mathbb{ R }\),考虑定义\(\alpha_m = \frac{ \lfloor 4^m x \rfloor }{ 4^m } , \beta_m = \alpha_m + \frac{ 1 }{ 4^m }\),容易见到\(\alpha_m \leq x < \beta_m\).并且当\(n \leq m\)的时候,\(( 4^n \alpha_m , 4^n \beta_m )\)上不存在整数.

见到:

\[ 4^n ( \beta_m - \alpha_m ) = \begin{cases} \in 4 \mathbb{ N } & n > m \\ 1 & n = m \\ < 1 & \text{ otherwise } \end{cases} \]

于是:

\[ | h ( 4^n \beta_m ) - h ( 4^n \alpha_m ) | = \begin{cases} 0 & n > m \\ | 4^n \beta_m - 4^n \alpha_m | = 4^{ n - m } & n \leq m \end{cases} \]

\(n < m\)的地方往负了放,自然有:

\[ \begin{aligned} | f ( \beta_m ) - f ( \alpha_m ) | & = \sum_{ n = 0 }^m ( \frac{ 3 }{ 4 } )^n ( h ( 4^n \beta_m ) - h ( 4^n \alpha_m ) ) \\ & \geq ( \frac{ 3 }{ 4 } )^m - \sum_{ n = 0 }^{ m - 1 } ( \frac{ 3 }{ 4 } )^n 4^{ n - m } \\ & = ( \frac{ 3 }{ 4 } )^m - \frac{ 1 }{ 4^m } \frac{ 3^m - 1 }{ 2 } \\ & = \frac{ 1 }{ 4^m } \frac{ 3^m + 1 }{ 2 } \end{aligned} \]

所以:

\[ \frac{ | f ( \beta_m ) - f ( \alpha_m ) | }{ \beta_m - \alpha_m } \geq \frac{ 3^m + 1 }{ 2 } \]

然而如若这点导数存在,那么这里的导数就是\(\lim_{ m \to \infty } \frac{ 3^m + 1 }{ 2 } = \infty\),这就矛盾了.因此这个函数处处不可导.

连续曲线充满平面

存在充满\([ 0 , 1 ] \times [ 0 , 1 ]\)的连续曲线.连续曲线在这里定义为\(( x ( t ) , y ( t ) ) , t \in [ 0 , 1 ]\)满足\(x ( t ) , y ( t ) \in C [ 0 , 1 ]\),任意\(( a , b ) \in [ 0 , 1 ] \times [ 0 , 1 ]\),都存在\(t\)使得\(a = x ( t ) , b = y ( t )\).

搞一个连续函数\(g ( t )\)满足:

$$ g ( t ) = \[\begin{cases} 0 & t \in [ 0 , \frac{ 1 }{ 3 } ] \cup [ \frac{ 5 }{ 3 } , 2 ] \\ 3 t - 1 & t \in [ \frac{ 1 }{ 3 } , \frac{ 2 }{ 3 } ] \\ 1 & t \in [ \frac{ 2 }{ 3 } , \frac{ 4 }{ 3 } ] \\ 3 t + 5 & t \in [ \frac{ 4 }{ 3 } , \frac{ 5 }{ 3 } ] \\ \end{cases}\]

$$

并且满足\(g ( t + 2 ) = g ( t )\),也就是一个周期梯形函数.

接下来定义:

\[ \begin{aligned} x ( t ) & = \sum_{ n = 1 }^\infty \frac{ 1 }{ 2^n } g ( 3^{ 2 n - 2 } t ) \\ y ( t ) & = \sum_{ n = 1 }^\infty \frac{ 1 }{ 2^n } g ( 3^{ 2 n - 1 } t ) \end{aligned} \]

容易发现\(0 \leq x ( t ) , y ( t ) \leq \sum_{ n = 1 }^\infty \frac{ 1 }{ 2^n } = 1\),所以的确绝对一致收敛,继承了连续性而且确实在\([ 0 , 1 ] \times [ 0 , 1 ]\)中.

接下来\(\forall ( a , b ) \in [ 0 , 1 ] \times [ 0 , 1 ]\),我们尝试找到一个\(t\)使得\(a = x ( t ) , b = y ( t )\).考虑取二者的二进制表示\(a = \sum_{ n = 1 }^\infty \frac{ a_n }{ 2^n } , b = \sum_{ n = 1 }^\infty \frac{ b_n }{ 2^n }\),其中\(a_n , b_n \in \{ 0 , 1 \}\).取一个新的数列\(c_{ 2 n - 1 } = a_n , c_{ 2 n } = b_n\).取\(0 \leq c = 2 \sum_{ n = 1 }^\infty \frac{ c_n }{ 3^n } \leq 1\),下面我们证明\(x ( c ) = a , x ( c ) = b\).

考虑\(3^k c = 2 \sum_{ n = 1 }^k \frac{ c_n }{ 3^{ n - k } } + 2 \sum_{ n = k + 1 }^\infty \frac{ c_n }{ 3^{ n - k } }\).其中前半部分是个偶整数,因此在带入函数\(g\)后会消失,观察后半部分,容易见到:如果\(c_{ k + 1 } = 0\),则后半部分\(\leq \frac{ 1 }{ 3 }\);如果\(c_{ k + 1 } = 1\),则后半部分\(\geq \frac{ 2 }{ 3 }\),因此\(g ( 3^k c ) = c_{ k + 1 }\).带入原式定义就看到\(x ( c ) = a , y ( c ) = b\).

甚至说,这里的\(c\)其实就在康托尔三分集中,所以事实上这个曲线上的零测集就足以覆盖整个平面.

幂级数

我们把形如\(f ( x ) = \sum_{ n = 0 }^{ \infty } a_n ( x - x_0 )^n\)的函数项级数称作幂级数,由于可以做自变量平移,不妨假设\(x_0 = 0\)\(f ( x ) = \sum_{ n = 0 }^{ \infty } a_n x^n\).

一个最先遇到的问题当然是幂级数的收敛范围,首先\(x = 0\)肯定收敛.其次我们可以发现如果\(f ( r )\)收敛,那么\(\forall x \in \mathbb{ R } , | x | < | r |\)都有\(f ( x )\)收敛,原因是:

\[ \sum | a_n x^n | = \sum | a_n r^n | \cdot | \frac{ x }{ r } |^n \]

由于\(\sum a_n r^n\)收敛,所以其通项\(\lim_{ n \to \infty } a_n r^n = 0\),那至少是有界的,而\(| \frac{ x }{ r } |^n\)又是个无穷递降等比数列,那就肯定收敛.既然如此,取\(R = \sup \{ | x | , x \in \mathbb{ R } | f ( x ) \text{ is converge } \}\).由上面的结论我们知道\(\forall x \in ( - R , R )\)都有\(f ( x )\)收敛,另外\(\forall x , | x | > R\)都有\(f ( x )\)发散.既然如此,我们将\(( - R , R )\)称作幂级数的收敛区间,容易见到收敛域和收敛区间最多只可能差两个点,换言之设收敛域为\(E\),则自然有\(( - R , R ) \subseteq E \subseteq [ - R , R ]\).

\(\rho = \varlimsup_{ n \to + \infty } \sqrt[n]{ | a_n | }\),则\(R = \rho^{ - 1 }\)(这里要做一些约定:不妨设\(\inf^{ - 1 } = 0\)\(0^{ - 1 } = \inf\)).原因是\(\varlimsup_{ n \to + \infty } \sqrt[n]{ | a_n x^n | } = | x | \rho\),用根值判别法就显然了.

这里还有一个更弱的比值判别法的版本:如若\(a_n \ne 0\),\(\rho = \lim_{ n \to \infty } \left | \frac{ a_{ n + 1 } }{ a_n } \right |\)存在,则\(R = \rho^{ - 1 }\).原因是Stolz定理给出:

\[ \varliminf \frac{ | a_{ n + 1 } | }{ | a_n | } \leq \varliminf \sqrt[n]{ | a_n | } \leq \varlimsup \sqrt[n]{ | a_n | } \leq \varlimsup \frac{ | a_{ n + 1 } | }{ | a_n | } \]

下面我们证明,在收敛区间的内部\(( - R , R )\)内,\(\sum a_n x^n\)是内闭绝对一致收敛的.而如果其在端点处也收敛,例如在\(x = R\)时收敛的话,则其在\([ 0 , R ]\)上一致收敛.

前者的话,只需用大M判别法即可,任取\([ - r , r ] \subseteq ( - R , R )\)然后看\(| a_n x^n | \leq | a_n r^n |\).

而对于后者的话,考虑\(\sum a_n x^n = \sum a_n R^n ( \frac{ x }{ R } )^n\),而\(( \frac{ x }{ R } )^n\)是单调一致有界,而\(\sum a_n R^n\)收敛,用DA判法则搞定.

上述结论的一个显然推论是幂级数是收敛域上的连续函数(因为在收敛域上都是一致连续的).

Example1

假设\(R = 1\),既然有一致连续性,若\(\sum a_n\)收敛,则极限存在有\(\lim_{ x \to 1 - 0 } f ( x ) = f ( 1 ) = \sum a_n\).然而这个结论反过来不成立,例如\(f ( x ) = \sum ( - x )^n = \frac{ 1 }{ 1 + x }\),容易见到极限为\(\frac{ 1 }{ 2 }\)可是\(f ( 1 )\)并不收敛.

上述结论能不能加点条件使得反之成立呢?我们下面证明若\(a_n = o ( \frac{ 1 }{ n } )\),若\(\lim_{ x \to 1 - 0 } f ( x ) = S\)存在,则\(\sum a_n = S\).

考虑取\(\sigma_n = \frac{ 1 }{ n } \sum_{ k = 0 }^n k | a_k |\),由Stolz定理知道\(\lim \sigma_n = \lim n | a_n | = 0\).取\(S_n = \sum_{ k = 1 }^n a_k\),我们要证明的就是当\(n \to \inf\)的时候\(| S - S_n |\)尽可能小.当\(x \in ( - 1 , 1 )\)的时候,注意到:

$$ \[\begin{aligned} S_n - S & = f ( x ) - S - \sum_{ k = n + 1 }^\infty a_k x^k + \sum_{ k = 0 }^n a_k ( 1 - x^k ) \\ & = f ( x ) - S - \sum_{ k = n + 1 }^\infty a_k x^k + \sum_{ k = 0 }^n a_k ( 1 - x ) ( 1 + x + \cdots + x^{ k - 1 } ) \\ & \leq f ( x ) - S - \sum_{ k = n + 1 }^\infty a_k x^k + ( 1 - x ) \sum_{ k = 0 }^n ka_k \\ \end{aligned}\]

$$

\(\forall \epsilon > 0\),取足够大的\(n\)使得\(\sigma_n < \frac{ \epsilon }{ 3 }\)而且使得\(| na_n | < \frac{ \epsilon }{ 3 }\)总成立,那么:

\[ | S_n - S | \leq | f ( x ) - S | + ( 1 - x ) n \sigma_n + \frac{ \epsilon }{ 3 n } \frac{ x^{ n + 1 } }{ 1 - x } \]

\(x = 1 - \frac{ 1 }{ n }\),即可得证.

如果加点单调性也可以.设\(a_n > 0\),如果\(f ( x ) = \sum_n a_n x^n\)满足\(f ( 1 - )\)存在,则\(\sum a_n = f ( 1 - )\).

这个结论与之前的一致收敛那里的单调性质完全相似.首先由\(\sum_n a_n \leq f ( 1 - )\)得到这个级数收敛,然后又可以放到\(\sum a_n x^n \leq \sum_n a_n\),让左边趋近一下得到\(f ( 1 - ) \leq \sum_n a_n\).

柯西和

\(\sum a_n = A , \sum b_n = B\),设\(c_n = \sum_{ k = 0 }^n a_{ n - k } b_k\),我们下面证明若\(\sum c_n\)收敛,则\(\sum c_n = AB\).

考虑设\(f ( x ) = \sum a_n x^n , g ( x ) = \sum b_n x^n\),则其收敛半径肯定\(\geq 1\),既然如此在任何内闭区间\([ - r , r ] \subseteq ( - 1 , 1 )\),\(f , g\)都在\([ - r , r ]\)上绝对一致收敛,既然如此我们就可以把这个乘积随便打乱顺序,得到\(f ( x ) g ( x ) = \sum c_n x^n , \forall x \in [ - r , r ]\).而我们又有\(\sum c_n\)收敛,既然如此\(\sum c_n = h ( 1 ) = \lim_{ x \to 1 - 0 } h ( x ) = ( \lim_{ x \to 1 - 0 } f ( x ) ) ( \lim_{ x \to 1 - 0 } g ( x ) ) = AB\),则搞定.

其中\(\sum c_n\)收敛这个条件是必须的,如果去掉后结论不成立,有如下反例:

\(a_n = b_n\)考虑对\(( 1 + x )^{ - \frac{ 1 }{ 2 } }\)做泰勒展开,得到\(f ( x ) = g ( x ) = \sum a_n x^n = \frac{ 1 }{ \sqrt{ 1 + x } }\)此时\(f ( 1 ) , g ( 1 )\)都收敛,原因是\(a_n = ( - 1 )^n \frac{ ( 2 n - 1 ) ! ! }{ 2^n n ! }\),用DA判法知道其收敛.然而\(f ( x ) g ( x ) = \frac{ 1 }{ 1 + x }\),\(c_n = ( - 1 )^n\),因此\(\sum c_n\)不收敛,这就完蛋了.

逐项微积分

既然幂级数在收敛域上一致收敛,那当然可以逐项积分.而且注意到\(\varlimsup \sqrt[n + 1]{ \frac{ | a_n | }{ n + 1 } } = \varlimsup \sqrt[n]{ | a_n | }\),原因是\(\lim \sqrt[n]{ n } = 1\),因此收敛半径不变,然而积分后,端点处有可能被包含入收敛域,原因是DA判法,原本的\(a_n x^n\)之和如果有界,配了一个多的下降\(\frac{ 1 }{ n }\)就会收敛,例如\(\sum \frac{ x^n }{ n }\).

同理,对于逐项求导也可以发现收敛半径不变.所以幂级数可以在收敛域上逐项积分任意多次,也可以在收敛区间内逐项求导任意多次.

Example1

\(\sum_{ n = 0 }^\infty \frac{ ( - 1 )^n }{ 3 n + 1 }\).

考虑:

$$ \[\begin{aligned} f ( x ) & = \sum_{ n = 0 }^\infty \frac{ ( - 1 )^n }{ 3 n + 1 } x^{ 3 n + 1 } \\ & = \sum_{ n = 0 }^\infty \int_0^x ( - 1 )^n t^{ 3 n } \mathrm{ d } t \\ \end{aligned}\]

$$

我们想让这里的求和和积分交换顺序对吧!那首先得规定\(x \in ( - 1 , 1 )\)而取不到\(1\),有:

\[ \begin{aligned} f ( x ) & = \sum_{ n = 0 }^\infty \int_0^x ( - 1 )^n t^{ 3 n } \mathrm{ d } t \\ & = \int_0^x \sum_{ n = 0 }^\infty ( - t )^{ 3 n } \mathrm{ d } t \\ & = \int_0^x \frac{ \mathrm{ d } t }{ 1 + t^3 } \end{aligned} \]

后面那个可以积出来,而且\(f ( x )\)\(( - 1 , 1 )\)上取值就是如此.而发现\(f ( x )\)\(1\)处收敛,因此拿这个积出来的结果极限逼近一下就行.

泰勒级数

对于一个\(f \in C^\infty\),考虑泰勒展开有:

\[ f ( x ) = \sum_{ k = 0 }^n \frac{ f^{ ( k ) } ( x_0 ) }{ k ! } ( x - x_0 )^k + r_n ( x ) \]

其中依照拉格朗日余项,\(r_n ( x ) = \frac{ f^{ ( n + 1 ) } ( \xi ) }{ ( n + 1 ) ! } ( x - x_0 )^{ n + 1 }\),若存在\(\delta > 0\),当\(x \in ( x_0 - \delta , x_0 + \delta )\)的时候,\(\lim_{ n \to \infty } r_n = 0\),则称该函数在\(x_0\)处解析,也就是可以用泰勒级数逼近它.

我们有一个命题:如果\(f ( x )\)\(x_0\)处解析,则其在\(x_0\)附近的一个小邻域上解析(证明可以参考Example15).因此解析的概念以拓宽到区间上,如果其在一个开区间\(I\)上解析,则称其\(\in C^\omega ( I )\).

而且我们还可以见到,如果\(f^{ ( n ) } ( x )\)一致有界(或者至少与\(n\)无关),则由于\(( x - x_0 )^n\)会被\(\frac{ 1 }{ ( n + 1 ) ! }\)控制住,所以其在\(\mathbb{ R }\)上都是解析的.所以\(\sin x , \cos x\)都是解析的,另外\(e^x , \ln x\)的导数大小与\(n\)无关,所以也解析.

\(f , g\)\(x_0\)处解析的时候,应当有\(f \pm g , fg , \frac{ f }{ g }\)都是解析的.而且如果\(f\)\(g ( x_0 )\)处解析,则\(f ( g ( x ) )\)也在\(x_0\)处解析.这个太难算了,我们承认这个事实好了,反正就是硬算.

Example1(广义二项式定理)

\(f ( x ) = ( 1 + x )^\alpha\)\(0\)处的解析性.

也就是要证明\(f ( x ) = ( 1 + x )^\alpha = \sum_{ n = 0 }^\infty \frac{ \alpha^{ \underline{ n } } }{ n ! } x^n\).

用比值法,观察到:

\[ \begin{aligned} & | \frac{ \binom{ \alpha }{ n } }{ \binom{ \alpha }{ n + 1 } } | \\ = & | \frac{ n + 1 }{ \alpha - n } | \to 1 \end{aligned} \]

所以右端收敛半径为\(1\).既然如此先搞定右端那个幂级数,设\(g ( x ) = \sum_{ n = 0 }^\infty \binom{ \alpha }{ n } x^n , x \in ( - 1 , 1 )\).观察到:

\[ \begin{aligned} g ' ( x ) & = \sum_{ n = 1 }^\infty n \binom{ \alpha }{ n } x^{ n - 1 } \\ ( 1 + x ) g ' ( x ) & = \sum_{ n = 1 }^\infty n \binom{ \alpha }{ n } x^{ n - 1 } + \sum_{ n = 1 }^\infty n \binom{ \alpha }{ n } x^{ n } \\ & = \alpha + \sum_{ n = 1 }^\infty \left ( n \binom{ \alpha }{ n } + ( n + 1 ) \binom{ \alpha }{ n + 1 } \right ) x^n \\ & = \alpha + \alpha \sum_{ n = 1 }^\infty \binom{ \alpha }{ n } x^n \\ & = \alpha g \end{aligned} \]

此时见到:

\[ \begin{aligned} & \left ( \frac{ g }{ ( 1 + x )^\alpha } \right ) ' \\ = & - \alpha ( 1 + x )^{ - \alpha - 1 } g + ( 1 + x )^{ - \alpha } g ' \\ = & ( 1 + x )^{ - \alpha - 1 } ( - \alpha g + ( 1 + x ) g ' ) \equiv 0 \end{aligned} \]

所以\(\frac{ g }{ ( 1 + x )^\alpha }\)是一常数,演算\(x = 0\)的部分就可以知道当\(x \in ( - 1 , 1 )\)的时候它俩相等.

最后再补一下端点,

\(\alpha > 0 , x = \pm 1\)的时候,下面直接证明它绝对收敛,也就是证明\(\sum | \binom{ \alpha }{ n } | < \inf\).,考虑拉贝判法:

\[ \begin{aligned} & n \left ( \frac{ | \binom{ \alpha }{ n } | }{ | \binom{ \alpha }{ n + 1 } | } - 1 \right ) \\ = & n ( \frac{ n + 1 }{ n - \alpha } - 1 ) \to 1 + \alpha > 0 \end{aligned} \]

所以此时收敛域是\([ - 1 , 1 ]\).

\(- 1 < \alpha < 0\)的时候,估一下发现:

\[ \begin{aligned} | \binom{ \alpha }{ n } | & = | ( 1 - \frac{ \alpha + 1 }{ 1 } ) \cdots ( 1 - \frac{ \alpha + 1 }{ n } ) | \\ & = e^{ \sum_k \ln | 1 - \frac{ 1 + \alpha }{ k } | } \\ & \approx e^{ - \sum_k \frac{ 1 + \alpha }{ k } } \\ & \approx \frac{ 1 }{ n^{ 1 + \alpha } } \end{aligned} \]

而且此时\(\binom{ \alpha }{ n }\)本身是个交错级数,所以在\(- 1\)处不收敛而在\(1\)处收敛.同理当\(\alpha \leq - 1\)的时候,\(| \binom{ \alpha }{ n } |\)并不趋向于\(0\)所以两端都不收敛.

Example2(反三角函数)

考虑由Example1,当\(| x | < 1\)的时候:

\[ ( 1 - x^2 )^{ - \frac{ 1 }{ 2 } } = 1 + \sum_{ n = 1 }^\infty \frac{ ( 2 n - 1 ) ! ! }{ ( 2 n ) ! ! } x^{ 2 n } \]

两遍逐项积分,有:

\[ \arcsin x = x + \sum_{ n = 1 }^\infty \frac{ ( 2 n - 1 ) ! ! }{ ( 2 n ) ! ! } \frac{ x^{ 2 n + 1 } }{ 2 n + 1 } \]

继续用拉贝判别法,注意到:

\[ n \left ( \frac{ a_n }{ a_{ n + 1 } } - 1 \right ) \to \frac{ 3 }{ 2 } \]

所以收敛.而且还可以发现这一下积分使得端点处也搞定了,所以上式对\([ - 1 , 1 ]\)都成立.

Example3(平方倒数和)

还可再整点活,令\(x = \sin t\)带入上式,得到:

$$ \[\begin{aligned} t & = \sin t + \sum_{ n = 1 }^\infty \frac{ ( 2 n - 1 ) ! ! }{ ( 2 n ) ! ! } \frac{ \sin^{ 2 n + 1 } t }{ 2 n + 1 } \\ \end{aligned}\]

$$

两遍在\([ 0 , \frac{ \pi }{ 2 } ]\)上积分,得到:

\[ \begin{aligned} \frac{ \pi^2 }{ 8 } & = 1 + \sum_{ n = 1 }^\infty \frac{ ( 2 n - 1 ) ! ! }{ ( 2 n ) ! ! ( 2 n + 1 ) } \frac{ ( 2 n ) ! ! }{ ( 2 n + 1 ) ! ! } \\ & = 1 + \sum_{ n = 1 }^\infty \frac{ 1 }{ ( 2 n + 1 )^2 } \\ & = \sum_{ n = 1 }^\infty \frac{ 1 }{ ( 2 n - 1 )^2 } \end{aligned} \]

所以奇数的平方和是\(\frac{ \pi^2 }{ 8 }\),那么:

\[ \begin{aligned} \sum_{ n = 1 }^\infty \frac{ 1 }{ n^2 } & = \frac{ \pi^2 }{ 8 } + \frac{ 1 }{ 4 } \sum_{ n = 1 }^\infty \frac{ 1 }{ n^2 } \\ \sum_{ n = 1 }^\infty \frac{ 1 }{ n^2 } & = \frac{ \pi^2 }{ 6 } \end{aligned} \]

Example4

\(c > 0\)的时候,求证存在多项式列\(\{ P_n ( x ) \} \rightrightarrows | x | , x \in [ - c , c ]\).

考虑:

\[ \begin{aligned} | x | & = ( x^2 )^{ \frac{ 1 }{ 2 } } \\ & = ( c^2 - ( c^2 - x^2 ) )^{ \frac{ 1 }{ 2 } } \\ & = c ( 1 - \left ( 1 - \frac{ x^2 }{ c^2 } \right ) )^{ \frac{ 1 }{ 2 } } \end{aligned} \]

由于\(1 - \frac{ x^2 }{ c^2 } \in [ 0 , 1 ] , \frac{ 1 }{ 2 } > 0\),只需要对此用广义二项式定理即可.

Example5

\(\int_0^\pi \frac{ \ln ( 1 + a \cos x ) }{ \cos x } \mathrm{ d } x\).

对着上面那个\(\ln\)做泰勒级数,自然有:

$$ \[\begin{aligned} & \int_0^\pi \frac{ \ln ( 1 + a \cos x ) }{ \cos x } \mathrm{ d } x \\ = & \int_0^\pi a + \sum_{ n = 1 }^\infty ( - 1 )^n \frac{ a^{ n + 1 } \cos^n x }{ n + 1 } \\ \end{aligned}\]

$$

而回忆到\(\int_0^\pi \cos^m x \mathrm{ d } x\)\(m\)是奇数的时候当然为\(0\),偶数的时候转化为\(\sin x\),答案是\(\frac{ ( m - 1 ) ! ! }{ m ! ! } \pi\).

所以原式变成:

\[ \begin{aligned} & \int_0^\pi a + \sum_{ n = 1 }^\infty ( - 1 )^n \frac{ a^{ n + 1 } \cos^n x }{ n + 1 } \\ = & \pi ( a + \sum_{ m = 1 }^\infty \frac{ ( 2 m - 1 ) ! ! }{ ( 2 m ) ! ! } \frac{ a^{ 2 m + 1 } }{ 2 m + 1 } ) \\ = & \pi \arcsin a \end{aligned} \]

Example6

\(S = \sum_{ n = 0 }^\infty \frac{ ( - 1 )^n ( n + 1 )^3 }{ n ! }\).

见到:

$$ \[\begin{aligned} & \sum_{ n = 0 }^\infty \frac{ ( - 1 )^n ( n + 1 )^3 }{ n ! } e^{ ( n + 1 ) x } \\ = & \sum_{ n = 0 }^\infty \frac{ ( - 1 )^n }{ n ! } ( e^{ ( n + 1 ) x } ) ' ' ' \\ \end{aligned}\]

$$

\(f ( x ) = \sum_{ n = 0 }^\infty \frac{ ( - 1 )^n }{ n ! } e^{ ( n + 1 ) x }\),则:

\[ \begin{aligned} f ( x ) & = \sum_{ n = 0 }^\infty \frac{ ( - 1 )^n }{ n ! } e^{ ( n + 1 ) x } \\ & = e^x \sum_{ n = 0 }^\infty \frac{ ( - e^x )^n }{ n ! } \\ & = e^{ x - e^x } \end{aligned} \]

则:

\[ \begin{aligned} f ' & = ( 1 - e^x ) f \\ f ' ' & = ( 1 - 3 e^x + e^{ 2 x } ) f \\ f ' ' ' & = ( - 3 e^x + 2 e^{ 2 x } ) f + ( 1 - e^x ) ( 1 - 3 e^x + e^{ 2 x } ) f \\ f ' ' ' ( 0 ) & = - f ( 0 ) = - \frac{ 1 }{ e } \end{aligned} \]

这就搞定.

Example7

\(\sum_{ n = 1 }^\infty \frac{ \cos ( nx ) }{ n }\).

\(t \in ( - 1 , 1 ]\),设:

$$ \[\begin{aligned} f ( t ) & = \sum_{ n = 1 }^\infty \frac{ \cos ( nx ) }{ n } t^n \\ f ' & = \sum_{ n = 1 }^\infty \cos ( nx ) t^{ n - 1 } \\ & = \Re \sum_{ n = 1 }^\infty t^{ n - 1 } e^{ inx } \\ & = \Re \frac{ e^{ ix } }{ 1 - te^{ ix } } \\ & = \Re \frac{ \cos x + i \sin x }{ 1 - t \cos x - it \sin x } \\ & = \Re \frac{ ( \cos x + i \sin x ) ( 1 - t \cos x + it \sin x ) }{ ( 1 - t \cos x )^2 + t^2 \sin^2 x } \\ & = \frac{ \cos x ( 1 - t \cos x ) - t \sin^2 x }{ ( 1 - t \cos x )^2 + t^2 \sin^2 x } \\ & = \frac{ \cos x - t }{ 1 - 2 t \cos x + t^2 } \\ \end{aligned}\]

$$

此时应当有:

\[ \begin{aligned} f ( t ) & = f ( 0 ) + \int_0^t f ' ( t ) \mathrm{ d } t \\ & = - \frac{ 1 }{ 2 } \ln ( 1 - 2 t \cos x + t^2 ) \end{aligned} \]

\(f ( 1 ) = - \ln 2 - \ln | \sin \frac{ x }{ 2 } |\),这就求出了原式.

Example8

考虑\(\zeta ( x ) = \sum_{ n = 1 }^\infty \frac{ 1 }{ n^x }\),有定理说:

\[ \zeta ( x ) = \frac{ 1 }{ x - 1 } + \sum_{ n = 0 }^\infty \frac{ ( - 1 )^n \gamma_n }{ n ! } ( x - 1 )^n \]

其中后半部分是整个复平面上的解析函数,并有:

\[ \gamma_n = \lim_{ m \to \infty } \left ( \sum_{ k = 1 }^m \frac{ ( \ln k )^n }{ k } - \frac{ ( \ln m )^{ n + 1 } }{ n + 1 } \right ) \]

Example9

\(S ( x ) = 1 + \sum_{ n = 1 }^\infty \frac{ ( 2 n - 1 ) ! ! }{ ( 2 n ) ! ! } x^n\),其中\(| x | < 1\).

容易见到其收敛半径是\(1\),考虑:

\[ \begin{aligned} S ' ( x ) & = \frac{ 1 }{ 2 } + \sum_{ n = 1 }^\infty \frac{ ( 2 n + 1 ) ! ! }{ ( 2 n + 2 ) ! ! } ( n + 1 ) x^n \\ 2 S ' ( x ) & = 1 + \sum_{ n = 1 }^\infty \frac{ ( 2 n + 1 ) ! ! }{ ( 2 n ) ! ! } x^{ n } \\ 2 xS ' ( x ) & = \sum_{ n = 1 }^\infty \frac{ ( 2 n - 1 ) ! ! }{ ( 2 n - 2 ) ! ! } x^n \\ 2 xS ' ( x ) & = \sum_{ n = 1 }^\infty \frac{ ( 2 n - 1 ) ! ! }{ ( 2 n ) ! ! } 2 nx^n \\ 2 S ' ( x ) - 2 xS ' ( x ) & = S ( x ) \\ \frac{ \mathrm{ d } x }{ 2 ( 1 - x ) } & = \frac{ \mathrm{ d } S ( x ) }{ S ( x ) } \\ - \frac{ 1 }{ 2 } \ln ( 1 - x ) & = \ln S ( x ) \\ S ( x ) & = \frac{ 1 }{ \sqrt{ 1 - x } } \end{aligned} \]

Example10

\(| x | < 1\),求\(S ( x ) = \sum_{ n = 0 }^\infty \frac{ ( - 1 )^n x^n }{ 2 n + 1 }\).

容易见到收敛半径为\(1\),令\(x = t^2\),有:

$$ \[\begin{aligned} S ( t^2 ) = \sum_{ n = 0 }^\infty ( - 1 )^n \frac{ 1 }{ t } \int_0^t u^{ 2 n } \mathrm{ d } u \\ = \frac{ 1 }{ t } \int_0^t \sum_{ n = 0 }^\infty ( - 1 )^n u^{ 2 n } \mathrm{ d } u \\ = \frac{ 1 }{ t } \int_0^t \frac{ \mathrm{ d } u }{ 1 + u^2 } \\ = \frac{ \arctan t }{ t } \\ \end{aligned}\]

$$

所以\(S ( x ) = \frac{ \arctan \sqrt{ x } }{ \sqrt{ x } }\).

Example11

\(\sum_{ n = 2 }^\infty \frac{ ( - 1 )^n }{ n^2 + n - 2 }\).

注意到:

\[ \begin{aligned} S ( x ) = \sum_{ n = 2 }^\infty \frac{ ( - 1 )^n x^{ n - 1 } }{ n^2 + n - 2 } \\ = \sum_{ n = 2 }^\infty \frac{ ( - 1 )^n x^{ n - 1 } }{ 3 } \left ( \frac{ 1 }{ n - 1 } - \frac{ 1 }{ n + 2 } \right ) \\ = \frac{ 1 }{ 3 } \sum_{ n = 2 }^\infty \frac{ ( - 1 )^n x^{ n - 1 } }{ n - 1 } - \frac{ 1 }{ 3 x^3 } \sum_{ n = 2 }^\infty \frac{ ( - 1 )^n x^{ n + 2 } }{ n + 2 } \\ = \frac{ 1 }{ 3 } \ln ( 1 + x ) - \frac{ 1 }{ 3 x^3 } \left ( - \ln ( 1 + x ) + x - \frac{ x^2 }{ 2 } + \frac{ x^3 }{ 3 } \right ) \end{aligned} \]

而注意到带入\(x = 1\)的时候\(S ( x )\)收敛,这就搞定了,带入\(x = 1\)就行.

Example12

\(\sum_{ n = 1 }^\infty \frac{ n }{ ( n + 1 ) ! }\).

\(S ( x ) = \sum_{ n = 0 }^\infty \frac{ ( n + 1 ) x^n }{ ( n + 2 ) ! }\),显然收敛,直接逐项积分.

\[ \begin{aligned} \int_0^x S ( t ) \mathrm{ d } t & = \sum_{ n = 0 }^\infty \frac{ x^{ n + 1 } }{ ( n + 2 ) ! } \\ & = \sum_{ n = 1 }^\infty \frac{ x^{ n } }{ ( n + 1 ) ! } \\ x ( \int_0^x S ( t ) \mathrm{ d } t + 1 ) & = e^x - 1 \\ S ( x ) & = \left ( \frac{ e^x - 1 }{ x } \right ) ' = \frac{ xe^x - e^x + 1 }{ x^2 } \end{aligned} \]

这就搞定了.

Example13

\(\int_0^\infty \frac{ x \mathrm{ d } x }{ e^{ 2 \pi x } - 1 }\).

注意到:

\[ \begin{aligned} \int_0^\infty \frac{ x \mathrm{ d } x }{ e^{ 2 \pi x } - 1 } \\ = \int_0^\infty \frac{ xe^{ - 2 \pi x } \mathrm{ d } x }{ 1 - e^{ - 2 \pi x } } \\ = \int_0^{ \infty } xe^{ - 2 \pi x } \sum_{ n = 0 }^\infty e^{ - 2 \pi n x } \mathrm{ d } x \\ = \sum_{ n = 0 }^\infty \int_0^{ + \infty } xe^{ - 2 \pi ( n + 1 ) x } \mathrm{ d } x \\ = \sum_{ n = 0 }^\infty \frac{ 1 }{ - 2 \pi ( n + 1 ) } \int_0^{ + \infty } x \mathrm{ d } e^{ - 2 \pi ( n + 1 ) x } \\ = \sum_{ n = 0 }^\infty \frac{ 1 }{ 2 \pi ( n + 1 ) } \int_0^{ + \infty } e^{ - 2 \pi ( n + 1 ) x } \mathrm{ d } x \\ = \sum_{ n = 0 }^\infty \frac{ 1 }{ 4 \pi^2 ( n + 1 )^2 } \\ = \frac{ 1 }{ 24 } \end{aligned} \]

其中中间的交换积分号和求和号是源于所有的部分和都可以小于等于\(g ( x )\),并且\(\int_0^{ \infty } g\)收敛.

Example14

\(\int_0^1 \frac{ \ln ( 1 + x ) }{ x } \mathrm{ d } x\).

直接展开对吧,注意到:

\[ \begin{aligned} & \int_0^1 \frac{ \ln ( 1 + x ) }{ x } \mathrm{ d } x \\ = & \int_0^1 \sum_{ n = 1 }^\infty \frac{ ( - 1 )^{ n - 1 } x^{ n - 1 } }{ n } \\ = & \sum_{ n = 1 }^\infty \int_0^1 \frac{ ( - 1 )^{ n - 1 } x^{ n - 1 } }{ n } \mathrm{ d } x \\ = & \sum_{ n = 1 }^\infty \frac{ ( - 1 )^{ n - 1 } }{ n^2 } \\ = & \sum_{ n = 1 }^\infty \frac{ 1 }{ ( 2 n - 1 )^2 } - \sum_{ n = 1 }^\infty \frac{ 1 }{ ( 2 n )^2 } \\ = & \sum_{ n = 1 }^\infty \frac{ 1 }{ n^2 } - 2 \sum_{ n = 1 }^\infty \frac{ 1 }{ ( 2 n )^2 } \\ = & \frac{ 1 }{ 2 } \sum_{ n = 1 }^\infty \frac{ 1 }{ n^2 } \\ = & \frac{ \pi^2 }{ 12 } \end{aligned} \]

Example15

\(I\)是开区间,\(f \in C^\infty ( I )\),求证\(f \in C^\omega ( I )\)当且仅当\(\forall x_0 \in I , \exists M , B , r > 0\),使得\(\forall | x - x_0 | < r , | f^{ ( n ) } ( x ) | \leq MB^n n !\).就是说对于区间内任何一个点,在它的小邻域处,任意阶导数都可以被和\(n\)有关的一个速率控制住.

充分性比较简单,考虑取\(S ( x ) = \sum \frac{ f^{ ( n ) } ( x_0 ) }{ n ! } ( x - x_0 )^n\)对其取\(| \sqrt[n]{ \frac{ f^{ ( n ) } ( x_0 ) }{ n ! } } | \leq \sqrt[n]{ MB^n } = \sqrt[n]{ M } B < + \infty\),所以总之收敛半径不为\(0\).那就总能取一个足够小的\(r < \frac{ 1 }{ B }\).此时用泰勒展开的拉格朗日余项:

\[ \begin{aligned} \left | f ( x ) - \sum_{ k = 0 }^n \frac{ f^{ ( k ) } ( x_0 ) }{ k ! } ( x - x_0 )^k \right | & = \left | \frac{ f^{ ( n + 1 ) } ( \xi ) }{ ( n + 1 ) ! } ( x - x_0 )^{ n + 1 } \right | \\ & \leq | B^{ n + 1 } ( x - x_0 )^{ n + 1 } M | \\ & \leq | ( Br )^{ n + 1 } M | \to 0 \end{aligned} \]

这就搞定.

接下来是必要性.考虑\(\varlimsup_{ n \to \infty } \sqrt[n]{ | \frac{ f^{ ( n ) } ( x_0 ) | }{ n ! } } = \frac{ 1 }{ R } > 0\),那就可以取\(0 < r < M < R\),存在一个\(N\),使得\(\forall n \geq N\)都有\(| f^{ ( n ) } ( x_0 ) | \leq n ! ( \frac{ 1 }{ M } )^n\).

接下来想要把这个性质挪到\(x_0\)周围小邻域上对吧.于此我们考虑先逼近后逐项求导:

\[ \begin{aligned} | f^{ ( n ) } ( x ) | & = | \sum_{ k = 0 }^\infty \frac{ f^{ ( n + k ) } ( x_0 ) }{ k ! } ( x - x_0 )^k | \\ & \leq \sum_{ k = 0 }^\infty \frac{ | f^{ ( n + k ) } ( x_0 ) | }{ k ! } | x - x_0 |^k \\ & \leq \sum_{ k = 0 }^\infty \frac{ ( n + k ) ! }{ k ! M^{ n + k } } r^k \\ & = \frac{ n ! }{ M^n } \sum_{ k = 0 }^\infty \frac{ ( n + k )^{ \underline{ k } } }{ k ! } ( \frac{ r }{ M } )^k \\ & = \frac{ n ! }{ M^n } \sum_{ k = 0 }^\infty \frac{ ( - n - 1 )^{ \underline{ k } } }{ k ! } ( \frac{ - r }{ M } )^k \\ & = \frac{ n ! }{ M^n } ( 1 - \frac{ r }{ M } )^{ - n - 1 } \\ & = Mn ! ( M - r )^{ - ( n + 1 ) } \end{aligned} \]

这就搞定了.

Example16

若非常数\(f\)\(( a , b )\)的每一点都解析,则其零点集在\(( a , b )\)内无聚点.

考虑如果一个点\(c \in ( a , b )\)\(f\)的聚点的话,那么\(c\)一定是\(f\)的任意阶导数的聚点.由于任意阶导数都是连续的,因此\(c\)处的任意阶导数都是\(0\).又因为\(f\)解析,所以\(c\)周围的一个小邻域必然全部为\(0\).既如此取最长的小邻域为\(( \alpha , \beta )\),下面我们证明\(( \alpha , \beta ) = ( a , b )\),不妨假设\(a \ne \alpha\),由于连续性得知\(f\)\([ \alpha , \beta )\)上取值为\(0\),然而这意味着\(\alpha\)必然也是零点集的聚点,因此它还可以继续往左延申一个小邻域,这就与\(a\)是最靠左的矛盾了.

不过这个做法不能推广到复平面上,原因是平面上的介值定理难搞一点啊.

提供另一种证明方法,考虑\(f\)\(( a , b )\)上的零点的聚点\(x_0\),如果\(x_0\)的任意阶导数都是\(0\)的话,那还是按照上面一样往外面扩就行了对吧.反之,设\(f ( x_0 ) = f^{ ( 1 ) } ( x_0 ) = \cdots = f^{ ( N - 1 ) } ( x_0 ) = 0 , f^{ ( N ) } ( x_0 ) \ne 0\),此时考虑\(f ( x ) = ( x - x_0 )^{ N + 1 } \sum_{ n = 0 }^\infty \frac{ f^{ ( N + n + 1 ) } }{ ( N + n + 1 ) ! } ( x - x_0 )^n\),不妨设\(g ( x ) = \sum_{ n = 0 }^\infty \frac{ f^{ ( N + n + 1 ) } }{ ( N + n + 1 ) ! } ( x - x_0 )^n\),容易发现\(g ( x_0 ) \ne 0\),既然如此,\(g\)肯定在\(x_0\)的一个小邻域(要与解析的那个邻域取交)上非\(0\),设为\(( x_0 - \delta , x_0 + \delta )\)上非零,可这样\(f ( x )\)\(( x_0 - \delta , x_0 ) \cup ( x_0 , x_0 + \delta )\)上必然非零,这与\(x_0\)是零点聚点矛盾了.

多项式逼近

如果对于函数\(f ( x ) : [ a , b ] \to \mathbb{ R }\),存在一个多项式列可以一致收敛到\(f ( x )\),则称其可以被多项式一致逼近.容易见到一个必要条件是\(f ( x ) \in C [ a , b ]\).

事实上我们有维尔斯特拉斯定理:有界闭区间上的连续函数可由多项式一致连续逼近.首先不妨假设\([ a , b ] = [ 0 , 1 ]\).下面给出两种证明:

其一是构造性证明,我们有Bernstein多项式:

\[ B_n ( f ) = \sum_{ p = 0 }^n \binom{ n }{ p } f ( \frac{ p }{ n } ) x^p ( 1 - x )^{ n - p } \]

这个多项式有很多性质,首先随便放缩一下就知道这个多项式在\([ 0 , 1 ]\)上有界,更具体地有\(\min f \leq B_n \leq \max f\),原因是:

\[ \begin{aligned} B_n ( f ) & \leq \sum_p \binom{ n }{ p } f ( \frac{ p }{ n } ) x^p ( 1 - x )^{ n - p } \\ & \leq ( \max f ) \sum_p \binom{ n }{ p } x^p ( 1 - x )^{ n - p } \\ & = \max f \end{aligned} \]

另一边同理.

其次有\(\deg ( B_n ) \leq n\).以及这个甚至是\(f\)的线性映射,或言\(B_n ( \alpha f + \beta g ) = \alpha B_n ( f ) + \beta B_n ( g )\).

\(r_p ( x ) = \binom{ n }{ p } x^p ( 1 - x )^{ n - p }\),注意到:

  1. \(\sum_p r_p ( x ) = 1\).

  2. \(\sum_p pr_p ( x ) = nx\).

  3. \(\sum_p p ( p - 1 ) r_p ( x ) = n ( n - 1 ) x^2\).

  4. \(\sum_p p^2 r_p ( x ) = n ( n - 1 ) x^2 + nx\).

  5. \(\sum_{ p = 0 }^n ( p - nx )^2 r_p ( x ) \leq \frac{ n }{ 4 }\).

前四条类似,以(3)为例,证明的话考虑对\(( x + y )^n = \sum_p \binom{ n }{ p } x^p y^{ n - p }\)两边对\(x\)求两次导数:

\[ n ( n - 1 ) x^2 ( x + y )^{ n - 2 } = \sum_p^n \binom{ n }{ p } p ( p - 1 ) x^p y^{ n - p } \]

带入\(y = 1 - x\)即可.

(5)的话也只需要计算,观察到:

\[ \begin{aligned} & \sum_{ p = 0 }^n ( p - nx )^2 r_p ( x ) \\ = & \sum_p p^2 r_p - 2 nx \sum_p pr_p + n^2 x^2 \sum r_p \\ = & n ( n - 1 ) x^2 + nx - 2 n^2 x^2 + n^2 x^2 \\ = & nx ( 1 - x ) \leq \frac{ n }{ 4 } \end{aligned} \]

我们见到:

$$ \[\begin{aligned} | B_n ( f ) - f | & = \left | \sum_{ p = 0 }^n \binom{ n }{ p } f ( \frac{ p }{ n } ) x^p ( 1 - x )^{ n - p } - \sum_{ p = 0 }^n \binom{ n }{ p } f ( x ) x^p ( 1 - x )^{ n - p } \right | \\ & \leq \sum_{ p = 0 }^n \binom{ n }{ p } | f ( \frac{ p }{ n } ) - f ( x ) | x^p ( 1 - x )^{ n - p } \\ \end{aligned}\]

$$

既然\(f ( x )\)闭区间上连续则有一致连续,\(\forall \epsilon > 0\),取\(\delta > 0\),使得只要\(| x - x ' | < \delta , | f ( x ) - f ( x ' ) | < \frac{ \epsilon }{ 2 }\),那有:

\[ \begin{aligned} | B_n ( f ) - f | & \leq \sum_{ p = 0 }^n \binom{ n }{ p } | f ( \frac{ p }{ n } ) - f ( x ) | x^p ( 1 - x )^{ n - p } \\ & = \sum_{ | \frac{ p }{ n } - x | < \delta }^n \binom{ n }{ p } | f ( \frac{ p }{ n } ) - f ( x ) | x^p ( 1 - x )^{ n - p } + \sum_{ | \frac{ p }{ n } - x | \geq \delta }^n \binom{ n }{ p } | f ( \frac{ p }{ n } ) - f ( x ) | x^p ( 1 - x )^{ n - p } \\ & \leq \frac{ \epsilon }{ 2 } + \frac{ 2 \max | f | }{ n^2 \delta^2 } \sum_{ p = 0 }^n ( p - nx )^2 r_p ( x ) \\ & \leq \frac{ \epsilon }{ 2 } + \frac{ \max | f | }{ 2 n \delta^2 } \end{aligned} \]

倒数第二步是由于当\(| \frac{ p }{ n } - x | \geq \delta\),所以\(\frac{ ( p - nx )^2 }{ n^2 \delta^2 } \geq 1\).

最后一步是因为当\(\epsilon\)确定的时候,\(\delta\)就已经确定了,然而\(n\)可以足够大,这就控制住了.

再给另一个存在性证明.回忆到\([ a , b ]\)上的连续函数组成的集合\(C [ a , b ]\)是一个完备线性空间.称\(A \subseteq C [ a , b ]\)是一个代数当且仅当\(\forall f , g \in A\),\(\forall c \in \mathbb{ R }\),\(f + g , fg , cf \in A\).容易见到如果\(P\)是一个有限项多项式,\(f \in A\),则\(P ( f ) \in A\).

在此基础上定义\(\bar{ A }\)\(A\)闭包,定义为:

\[ \bar{ A } = \{ f \in C [ a , b ] | \exists \{ f_n \} \in A , f_n \rightrightarrows f \} \]

容易见到\(A \subseteq \bar{ A }\).而且容易见到\(\bar{ A }\)肯定也是一个代数.而见到\(\overline{ ( \bar{ A } ) } = \bar{ A }\),原因是柯西列导出的已经是闭的了,无法再往外拓展.

回忆到绝对值函数可以由多项式函数逼近,所以如果\(f \in \bar{ A }\),则\(| f | \in \bar{ A }\).更进一步,如果\(f , g \in \bar{ A }\),由于\(\max ( f , g ) = \frac{ f + g }{ 2 } + \frac{ | f - g | }{ 2 }\),所以\(\max ( f , g ) \in \bar{ A }\),同理\(\min ( f , g ) \in \bar{ A }\).

我们有一个定理说:设\(A \subseteq C [ a , b ]\)是一个代数,并且\(f ( x ) = c \in A\).并且\(\forall x , y \in [ a , b ] , x \ne y , \exists f \in A , f ( x ) \ne f ( y )\)\(\bar{ A } = C [ a , b ]\).容易见到这个定理强于维尔斯特拉斯定理.这个定理叫Stone-Weierstrass定理.

下面我们来证明这个结论.

先搞一个引理:\(\forall x_1 , x_2 \in [ a , b ] , x_1 \ne x_2 , \forall \alpha , \beta \in \mathbb{ R }\),则\(\exists h \in A , h ( x_1 ) = \alpha , h ( x_2 ) = \beta\).

证明的话,考虑由已知\(\exists \varphi \in A , \varphi ( x_1 ) \ne \varphi ( x_2 )\).此时把这个函数给挪一下,取\(h ( x ) = \alpha + ( \beta - \alpha ) \frac{ \varphi ( x ) - \varphi ( x_1 ) }{ \varphi ( x_2 ) - \varphi ( x_1 ) }\).(其实这个应该是双传递性,但是我目前没看出如何用双传递性来解释证明过程.)

接下来考虑证明原定理,来证明\(\forall f \in C [ a , b ] , \forall n , \exists g_n \in \bar{ A } , | f ( x ) - g_n ( x ) | < \frac{ 1 }{ n }\),由于我们刚才的引理,\(\forall x , y \in [ a , b ] , \exists h_{ x , y } ( z ) \in A , h_{ x , y } ( x ) = f ( x ) , h_{ x , y } ( y ) = f ( y )\).这个函数由\(x , y\)所确定.

固定\(x\)不动,对\(\forall y \in [ a , b ]\),\(\exists \delta = \delta ( y )\),由于一致连续性,当\(z \in I_y = ( y - \delta , y + \delta )\)的时候,\(h_{ x , y } ( z ) < f ( z ) + \frac{ 1 }{ n }\).而这里的\(I_y\)构成了一个开覆盖(边界上可能需要挪一下,但反正能做到),用有限覆盖定理拿到有限个区间\(I_{ y_1 , } , \cdots , I_{ y_m }\)覆盖了\([ a , b ]\).此时取\(h_x ( z ) = \min \{ h_{ x , y_1 } , \cdots , h_{ x , y_m } \}\),见到\(h_x ( z ) < f ( z ) + \frac{ 1 }{ n } , \forall z \in [ a , b ]\).而且\(h_x ( x ) = f ( x )\).

既然\(h_x ( x ) = f ( x )\),考虑\(\exists \delta , I_x = ( x - \delta , x + \delta )\)使得\(h_x ( z ) > f ( z ) - \frac{ 1 }{ n } , \forall z \in I_x\).对此再做有限覆盖得到\(h_{ x_1 } , \cdots , h_{ x_l }\),取\(g_n = \max \{ h_{ x_1 } , \cdots , h_{ x_l } \}\).显然:

\[ f ( z ) - \frac{ 1 }{ n } < g_n ( z ) < f ( z ) + \frac{ 1 }{ n } \]

搞定了.

那么,这个多项式能不能再来点限制呢?比如说我不许在多项式里出现\(x^2\)项可以吗?也可以.考虑\(f \in C [ a , b ]\),则\(f ( x^{ \frac{ 1 }{ 3 } } ) \in C [ a^{ \frac{ 1 }{ 3 } } , b^{ \frac{ 1 }{ 3 } } ]\),所以存在一个多项式\(P ( x ) \rightrightarrows f ( x^{ \frac{ 1 }{ 3 } } )\),意味着\(P ( x^3 ) \rightrightarrows f ( x ) , x \in [ a , b ]\).而\(P ( x^3 )\)当然没有\(x^2\)项.

也就是说这些多项式很多都是浪费的.那么有没有一个非常厉害的结论能告诉我什么样的多项式可以呢?考虑在\([ 0 , 1 ]\)上,\(\mathrm{ Span } \{ 1 , x^{ \lambda_1 } , \cdots \}\)张成的多项式,其中\(0 < \lambda_1 < \lambda_2 < \cdots\),其中\(\lambda_n \to \infty\).注意这里不要求\(\lambda_i\)是整数,如果其闭包能张成\(C [ 0 , 1 ]\),当且仅当\(\sum \frac{ 1 }{ \lambda_i } = + \infty\).这被称为Muntz定理,(其一个更强的推广是去掉\(\lambda_n \to \infty\)的结论,取而代之的是需要满足\(\sum \frac{ \lambda_i }{ 1 + \lambda_i^2 } = + \infty\))

这个定理的必要性我们目前难以证明,先证明其充分性.

考虑\(\forall m \in \mathbb{ N }_+ \setminus \{ \lambda_i \}\),都可以定义一个函数列,其中\(Q_0 ( x ) = x^m , Q_n ( x ) = ( \lambda_n - m ) x^{ \lambda_n } \int_x^1 Q_{ n - 1 } ( t ) t^{ - 1 - \lambda_n } \mathrm{ d } t\).我们先证明\(Q_n\)一定长成\(x^m - \sum_{ i = 1 }^n a_{ n , i } x^{ \lambda_i }\)的形式.

数学归纳证明此结论,设\(Q_n = x^m - \sum_{ i = 1 }^n a_{ n , i } x^{ \lambda_i }\),来看\(Q_{ n + 1 }\):

$$ \[\begin{aligned} Q_{ n + 1 } ( x ) & = ( \lambda_{ n + 1 } - m ) x^{ \lambda_{ n + 1 } } \int_x^1 Q_{ n } ( t ) t^{ - 1 - \lambda_{ n + 1 } } \mathrm{ d } t \\ & = ( \lambda_{ n + 1 } - m ) x^{ \lambda_{ n + 1 } } \int_x^1 ( t^m - \sum_{ i = 1 }^n a_{ n , i } t^{ \lambda_i } ) t^{ - 1 - \lambda_{ n + 1 } } \mathrm{ d } t \\ \end{aligned}\]

$$

后面那部分直接积出来就是了,然后前面有一个\(\lambda_{ n + 1 }\),这样就搞定了.

下面定义一个函数的模长\(\Vert Q \Vert = \max_{ [ 0 , 1 ] } | Q ( x ) |\),此时:

\[ \begin{aligned} | Q_n ( x ) | & \leq | \lambda_n - m | x^{ \lambda_n } \Vert Q_{ n - 1 } \Vert \int_x^1 t^{ - 1 - \lambda_n } \mathrm{ d } t \\ & = | \lambda_n - m | x^{ \lambda_n } \cdot \Vert Q_{ n - 1 } \Vert \frac{ x^{ - \lambda_n } - 1 }{ \lambda_n } \\ & = | 1 - \frac{ m }{ \lambda_n } | \cdot \Vert Q_{ n - 1 } \Vert ( 1 - x^{ \lambda_n } ) \\ & \leq | 1 - \frac{ m }{ \lambda_n } | \cdot \Vert Q_{ n - 1 } \Vert \\ & \leq \prod_{ i = 1 }^n | 1 - \frac{ m }{ \lambda_i } | \end{aligned} \]

然而回忆到\(\sum \frac{ 1 }{ \lambda_i }\)发散.所以后面那个连乘积必然发散,但是容易见到\(m\)取死后,其从\(\lambda_i > m\)的时候就是单调递减的,那又发散必然知道其趋近于\(0\).所以\(\lim \Vert Q_n \Vert = 0\).那又回忆到\(Q_n = x^m - \sum_{ i = 1 }^n a_{ n , i } x^{ \lambda_i }\),这已经说明\(x^m\)可以被\(\{ x^{ \lambda_i } \}\)一致逼近,原命题充分性搞定.

现在来看固定在\(\lambda_i \in \mathbb{ N }_+\)的情形,能否给出一个充要条件呢?我们下面证明对于互异的\(\{ \lambda_i \} \in \mathbb{ N }_+\),\(C [ a , b ] = \overline{ \mathrm{ span } } \{ x^{ \lambda_i } , 1 \}\)的充要条件是:

  1. 如果\(0 \notin ( a , b )\),当\(\sum \frac{ 1 }{ \lambda_i } = + \infty\).

  2. 如果\(a < 0 < b\),要求\(\sum_{ \lambda_i \in \mathrm{ even } } \frac{ 1 }{ \lambda_i } = + \infty , \sum_{ \lambda_i \in \mathrm{ odd } } \frac{ 1 }{ \lambda_i } = + \infty\).

先证这个命题的充分性,对于\(0 \notin ( a , b )\),不妨设\(0 \leq a < b = 1\),容易发现此时的确满足\(\lim \lambda_n = + \infty\)而且\(\sum_i \frac{ 1 }{ \lambda_i } = + \infty\),这就搞定了.

对于\(a < 0 < b\),我们只要证明在\(C [ - 1 , 1 ]\)上的函数都可以被一致逼近即可对吧.考虑\(g_1 ( x ) = \frac{ f ( x ) + f ( - x ) }{ 2 }\)是其偶函数部分,自然可以被偶次的部分逼近(原因是只需要逼近\([ 0 , 1 ]\)上就可以延拓).反之亦然同理,\(g_2 ( x ) = \frac{ f ( x ) - f ( - x ) }{ 2 }\)也可以被奇数次的部分逼近并且延拓,这也就搞定.

回忆到如果一个函数如果在一个无穷区间上可以被有限次多项式一致逼近,用柯西准则做那个函数列就可以证明这个函数一定是一个多项式.下面我们来推广这个结论.

\(V\)是一个内积空间,其中\(g , f_1 , \cdots , f_n \in V\)是其中的\(n\)个向量,设\(E = \mathrm{ Span } \{ f_1 , \cdots , f_n \}\),回忆到\(g\)\(E\)的距离定义为:

\[ d = \min_{ p \in E } \Vert g - p \Vert = \sqrt{ \cfrac{ G ( g , f_1 , \cdots , f_n ) }{ G ( f_1 , \cdots , f_n ) } } \]

其中\(G ( f_1 , \cdots , f_n ) = \det | ( f_i | f_j ) |\).

而考虑取两列数列\(\{ \alpha_i \} , \{ \beta_j \}\),回忆到李文威考试题给出过:

\[ \det ( \frac{ 1 }{ \alpha_i + \beta_j } ) = \cfrac{ \prod_{ 1 \leq i < j \leq n } ( \alpha_j - \alpha_i ) ( \beta_j - \beta_i ) }{ \prod_{ 1 \leq i , j \leq n } ( \alpha_i + \beta_j ) } \]

又回忆到\(C [ 0 , 1 ]\)也是一个内积空间,可以定义\(( f | g ) = \int_0^1 fg \mathrm{ d } x\).容易见到\(( x^a | x^b ) = \frac{ 1 }{ a + b + 1 }\).现在我们就可以用上面的行列式硬算了.考虑取\(E = \mathrm{ span } \{ x^{ \lambda_1 } , \cdots , x^{ \lambda_n } \}\),取\(d = ( x^{ \lambda } , E )\),容易见到:

\[ d ( x^\lambda , E ) = \frac{ 1 }{ \sqrt{ 2 \lambda + 1 } } \prod_{ i = 1 }^n \left | \frac{ \lambda - \lambda_i }{ \lambda + \lambda_i + 1 } \right | \]

下面我们引进一个引理:

对于数列\(\{ \lambda_i \} > 0\)且单增,如果\(c = \inf_{ i \geq 1 } \{ \lambda_{ i + 1 } - \lambda_i \} > 0\),如果\(\sum_{ i = 1 }^\infty \frac{ 1 }{ \lambda_i } < \infty\),则\(\lim_{ m \to \infty } \frac{ 1 }{ \lambda_m } \sum_{ i = 1 , i \ne m }^\infty \ln \left | \frac{ \lambda_i + \lambda_m }{ \lambda_i - \lambda_m } \right | = 0\).

这个定理的详细证明较为麻烦,而且与主线无关,将在下述Example3处讲解.

考虑取\(P ( x ) \in \mathrm{ Span }_{ i \ne m } \{ x^{ \lambda_i } \}\),由于子空间只有有限项非零,所以\(\exists n\)使得\(P ( x ) \in E = \mathrm{ Span }_{ i \ne m , i \leq n } \{ x^{ \lambda_i } \}\),此时观察到:

$$ \[\begin{aligned} & d ( x^{ \lambda_m } , P ( x ) ) \\ \geq & d ( x^\lambda_m , E ) \\ = & \frac{ 1 }{ \sqrt{ 2 \lambda_m + 1 } } \prod_{ i = 1 , i \ne m }^n \left | \frac{ \lambda_m - \lambda_i }{ \lambda_m + \lambda_i + 1 } \right | \\ \geq & \frac{ 1 }{ \sqrt{ 2 \lambda_m + 1 } } \prod_{ i = 1 , i \ne m }^{ \infty } \left | \frac{ \lambda_m - \lambda_i }{ \lambda_m + \lambda_i + 1 } \right | \\ \end{aligned}\]

$$

由上述引理,我们知道最后那一项取\(\ln\)后是一个\(o ( \lambda_m )\)的东西,不妨将后面那一项记作\(e^{ - l_m \lambda_m }\),其中\(l_m > 0 , \lim_{ m \to \infty } l_m = 0\).

为了简化说明引进\(\lambda_0 = 0\),

再来一个引理:对\(\forall \epsilon > 0\),\(\exists C_\epsilon > 0\),满足\(\forall P ( x ) \in \mathrm{ Span }_{ i \geq 0 } \{ x^{ \lambda_i } \} , \lambda_0 = 0\),不妨设\(P ( x ) = \sum_{ i = 0 }^n a_i x^{ \lambda_i }\),我们有\(| a_m | \leq C_\epsilon ( 1 + \epsilon )^{ \lambda_m } \Vert P \Vert\).

注意到:

\[ \begin{aligned} \frac{ P ( x ) }{ a_m } & = x^{ \lambda_i } + \sum_{ i \leq n , i \ne m }^n \frac{ a_i }{ a_m } x^{ \lambda_m } \\ \frac{ \Vert P ( x ) \Vert }{ | a_m | } & \geq d ( x^{ \lambda_m } , E ) \geq e^{ - l_m \lambda_m } \\ | a_m | & \leq e^{ l_m \lambda_m } \Vert P ( x ) \Vert \end{aligned} \]

而当\(m\)充分大的时候,当然有\(e^{ l_m } \leq 1 + \epsilon\),这就证毕了.

万事俱备,下面我们来证明必要性:办法是使用反证法,假设\(f \in C [ 0 , 1 ]\),当\(\lambda_0 = 0 , \sum_{ i = 1 }^\infty \frac{ 1 }{ \lambda_i } < \infty\)时,并且\(P_n ( x ) = \sum_{ i = 0 }^n a_{ i , n } x^{ \lambda_i } \rightrightarrows f ( x )\).则当然也有\(\Vert P_n \Vert \to \Vert f \Vert\),那\(\Vert P_n \Vert\)就有界了,既然如此,\(a_{ i , n } \leq C_\epsilon ( 1 + \epsilon )^{ \lambda_i }\),也就是说所有的\(a_{ i , n }\)都是有界的.

我们想要求出一个子列\(\{ n_k \}\),使得\(\forall i , \lim_{ k \to \infty } a_{ i , n_k }\)收敛于某个数\(a_i\),方法是对角线法则,对于第一行其肯定存在收敛子列,取其第一个数为\(n_1\),对于第二行,在第一行对应下来的元素中肯定也有收敛子列,取其第一个元素作为\(n_2\),依次类推.这样我们就得到了一个新的函数列\(P_{ n_k } \to g ( x ) = \sum_{ i = 0 }^\infty a_i x^{ \lambda_i }\).此时考虑\(\varlimsup \sqrt[\lambda_i]{ | a_i | } \leq 1 + \epsilon\),因此\(g ( x )\)收敛半径\(\geq 1\).然而,\(P_{ n_k } \to f ( x )\),因此\(f ( x ) = g ( x )\).然而\(g ( x )\)的收敛半径\(\geq 1\),因此一般的函数当然不能被一致逼近.

另一个问题是如果\(a < 0 < b\)该怎么办,接下来假设\(\sum_{ \lambda_i \in \mathrm{ even } } \frac{ 1 }{ \lambda_i } < \infty\).放缩一下边界,我们下面来证明此时不能逼近\(C [ - 1 , 1 ]\)上的偶函数.

假设\(f \in C [ - 1 , 1 ]\)并且是偶函数,对于一列函数列,可以拆成偶函数\(g_n\)和奇函数\(h_n\)部分,前者只包含偶数次后者只包含奇数次.此时有\(g_n + h_n \rightrightarrows f\),由于是偶函数,换号得到\(g_n - h_n \rightrightarrows f\),这就必然得到\(g_n \rightrightarrows f\),但\(g_n\)并不能逼近所有的,这就矛盾了.

Example1

\(f ( x )\)在无穷区间上可以用多项式一致逼近,求证\(f\)为多项式.

考虑多项式列\(\{ P_n \}\)上有柯西准则,所以当\(N\)足够大的时候,\(\forall n , m \geq N\),\(\sup | P_n - P_m |\)足够小,然而由于无穷区间,如果\(\deg ( P_n - P_m ) > 0\)就完蛋了,所以从某一项开始,这个多项式列的两两之间一定之差一个常数.不妨干脆设\(P_n = P + c_n\)的形式,既然\(P_n\)收敛,那么\(c_n\)肯定收敛,设其收敛于\(c\),则\(f ( x ) = P + c\).

Example2

\(f \in C [ a , b ]\),\(\{ p_n \} \rightrightarrows f\),并且\(\{ p_n \}\)为次数一致有界的多项式列,求证\(f\)为多项式.

设次数上界为\(n\),一个想法是说我这些多项式是有限多个的,你直接拿切比雪夫多项式作为基,既然现在都是有限和的情况了,那在线性空间上收敛当然是在每一个基对应的系数都收敛,这就意味着\(f\)肯定是多项式.

Example3(Lemma)

对于数列\(\{ \lambda_i \} > 0\)且单增,如果\(c = \inf_{ i \geq 1 } \{ \lambda_{ i + 1 } - \lambda_i \} > 0\),如果\(\sum_{ i = 1 }^\infty \frac{ 1 }{ \lambda_i } < \infty\),则\(\lim_{ m \to \infty } \frac{ 1 }{ \lambda_m } \sum_{ i = 1 , i \ne m }^\infty \ln \left | \frac{ \lambda_i + \lambda_m }{ \lambda_i - \lambda_m } \right | = 0\).

考虑证明,由于每一项都是正的,因此我们分别证明后面的无穷和部分在\([ 1 , m - 1 ]\)\([ m + 1 , + \infty )\)上均为\(0\).

思路呼之欲出,将\(\lambda_i\)按照与\(\lambda_m\)的比例分为两段:任意取定常数\(\epsilon > 0\),下面开始分析.

设当\(i \geq N_1\)的时候有\(\lambda_i \geq ( 1 - \epsilon ) \lambda_m\)成立,考虑:

\[ \begin{aligned} & \frac{ 1 }{ \lambda_m } \sum_{ i = 1 }^{ N_1 - 1 } \ln ( 1 + \frac{ 2 \lambda_i }{ \lambda_m - \lambda_i } ) \\ \leq & \frac{ 1 }{ \lambda_m } \sum_{ i = 1 }^{ N_1 - 1 } \frac{ 2 \lambda_i }{ \lambda_m - \lambda_i } \\ = & \sum_{ i = 1 }^{ N_1 - 1 } \frac{ 2 \lambda_i }{ ( \lambda_m - \lambda_i ) \lambda_m } \\ = & 2 \sum_{ i = 1 }^{ N_1 - 1 } ( \frac{ 1 }{ \lambda_m - \lambda_i } - \frac{ 1 }{ \lambda_m } ) \\ \leq & 2 \sum_{ i = 1 }^{ N_1 - 1 } \frac{ 1 }{ \epsilon \lambda_m } - \frac{ 1 }{ \lambda_m } \\ = & \frac{ N_1 - 1 }{ \lambda_m } ( \frac{ 2 }{ \epsilon } - 1 ) \\ \leq & \frac{ m }{ \lambda_m } ( \frac{ 2 }{ \epsilon } - 1 ) \end{aligned} \]

然而注意到\(\{ \frac{ 1 }{ \lambda_m } \}\)单调递减,用柯西准则得到:

\[ \sum_{ k = m + 1 }^{ 3 m } \frac{ 1 }{ \lambda_k } \geq \frac{ m }{ \lambda_{ 2 m } } \]

所以得到\(\lim_{ m \to + \infty } \frac{ m }{ \lambda_m } \to 0\).

然后考虑设\(i > N_2\)时有\(( 1 + \epsilon ) \lambda_m \leq \lambda_i\),设\(( 1 + \epsilon ) = \frac{ 1 }{ 1 - \epsilon_2 }\),则\(\lambda_m \leq ( 1 - \epsilon_2 ) \lambda_i\)留神到:

$$ \[\begin{aligned} & \frac{ 1 }{ \lambda_m } \sum_{ i = N_2 + 1 }^{ + \infty } \ln ( 1 + \frac{ 2 \lambda_m }{ \lambda_i - \lambda_m } ) \\ \leq & \frac{ 1 }{ \lambda_m } \sum_{ i = N_2 + 1 }^{ + \infty } \frac{ 2 \lambda_m }{ \lambda_i - \lambda_m } \\ = & \sum_{ i = N_2 + 1 }^{ + \infty } \frac{ 2 }{ \lambda_i - \lambda_m } \\ \leq & \sum_{ i = N_2 + 1 }^{ + \infty } \frac{ 4 }{ \epsilon_2 \lambda_i } \\ \leq & \sum_{ i = m }^{ + \infty } \frac{ 4 }{ \epsilon_2 \lambda_i } \\ \end{aligned}\]

$$

由柯西准则就可以知道其趋近于\(0\).

由上面的分析见到如果预先取定\(\epsilon\),再移动\(m\),开头结尾两端都可以尽可能小对吧.最后我们要做的就是中间很靠近\(\lambda_m\)的两段了,考虑:

$$ \[\begin{aligned} & \frac{ 1 }{ \lambda_m } \sum_{ i = N_1 }^{ m - 1 } \ln ( \frac{ 2 \lambda_m }{ \lambda_m - \lambda_i } - 1 ) \\ \leq & \frac{ 1 }{ \lambda_m } \sum_{ i = N_1 }^{ m - 1 } \ln ( \frac{ 2 \lambda_m }{ c ( m - i ) } - 1 ) \\ \end{aligned}\]

$$

不妨设\(M = m - N_1\),上式变为:

$$ \[\begin{aligned} & \frac{ 1 }{ \lambda_m } \sum_{ i = N_1 }^{ m - 1 } \ln ( \frac{ 2 \lambda_m }{ c ( m - i ) } - 1 ) \\ = & \frac{ 1 }{ \lambda_m } \sum_{ i = 1 }^{ N } \ln ( \frac{ 2 \lambda_m }{ ic } - 1 ) \\ \leq & \frac{ 1 }{ \lambda_m } \sum_{ i = 1 }^{ N } \ln ( \frac{ 2 \lambda_m }{ ic } ) \\ \end{aligned}\]

$$

\[ \begin{aligned} & \frac{ 1 }{ \lambda_m } \sum_{ i = m + 1 }^{ N_2 } \ln ( 1 + \frac{ 2 \lambda_m }{ \lambda_i - \lambda_m } ) \\ \leq & \frac{ 1 }{ \lambda_m } \sum_{ i = m + 1 }^{ N_2 } \ln ( 1 + \frac{ 2 \lambda_m }{ c ( i - m ) } ) \\ \leq & \frac{ 1 }{ \lambda_m } \sum_{ i = m + 1 }^{ N_2 } \ln ( \frac{ 2 \lambda_m + cm }{ c ( i - m ) } ) \end{aligned} \]

然而\(\frac{ m }{ \lambda_m } \to 0\),于是后面的主要项仍是\(\ln ( \frac{ \lambda_m }{ ic } )\)形状,而考虑\(\max ( N_2 - m , m - N_1 ) \leq \frac{ \epsilon \lambda_m }{ c }\),接下来只要证明:

\[ \frac{ 1 }{ \lambda_m } \sum_{ i = 1 }^{ \frac{ \epsilon \lambda_m }{ c } } \ln ( \frac{ \lambda_m }{ ic } ) \to 0 \]

就做完了对吧,发现:

\[ \begin{aligned} \frac{ 1 }{ \lambda_m } \sum_{ i = 1 }^{ \frac{ \epsilon \lambda_m }{ c } } \ln ( \frac{ \lambda_m }{ ic } ) & = \frac{ 1 }{ \lambda_m } \sum_{ i = 1 }^{ \frac{ \epsilon \lambda_m }{ c } } \ln ( \lambda_m ) - \frac{ 1 }{ \lambda_m } \sum_{ i = 1 }^{ \frac{ \epsilon \lambda_m }{ c } } \ln ( ic ) \\ & = \frac{ \epsilon }{ c } \ln ( \frac{ \lambda_m }{ c } ) - \frac{ 1 }{ \lambda_m } \sum_{ i = 2 }^{ \frac{ \epsilon \lambda_m }{ c } } \ln ( i ) \\ & = \frac{ \epsilon }{ c } \ln ( \frac{ \lambda_m }{ c } ) - \frac{ 1 }{ \lambda_m } \sum_{ i = 2 }^{ \lfloor \frac{ \epsilon \lambda_m }{ c } \rfloor } \int_{ i - 1 }^{ i } \ln ( i ) \mathrm{ d t } \\ & \leq \frac{ \epsilon }{ c } \ln ( \frac{ \lambda_m }{ c } ) - \frac{ 1 }{ \lambda_m } \int_{ 1 }^{ \frac{ \epsilon \lambda_m }{ c } - 1 } \ln t \mathrm{ d t } \\ & = \frac{ \epsilon }{ c } \ln ( \frac{ \lambda_m }{ c } ) - \frac{ 1 }{ \lambda_m } \int_{ 1 }^{ \frac{ \epsilon \lambda_m }{ c } } \ln t \mathrm{ d t } + \frac{ 1 }{ \lambda_m } \int_{ \frac{ \epsilon \lambda_m }{ c } - 1 }^{ \frac{ \epsilon \lambda_m }{ c } } \ln t \mathrm{ d } t \\ & \leq \frac{ \epsilon }{ c } \ln ( \frac{ \lambda_m }{ c } ) - \frac{ 1 }{ \lambda_m } \int_{ 1 }^{ \frac{ \epsilon \lambda_m }{ c } } \ln t \mathrm{ d t } + \frac{ \ln ( \frac{ \epsilon \lambda_m }{ c } ) }{ \lambda_m } \\ & = \frac{ \epsilon }{ c } \ln ( \frac{ \lambda_m }{ c } ) + \frac{ \ln ( \frac{ \epsilon \lambda_m }{ c } ) }{ \lambda_m } - \frac{ 1 }{ \lambda_m } ( \frac{ \epsilon \lambda_m }{ c } \ln ( \frac{ \epsilon \lambda_m }{ c } ) - 1 ) \\ & = \frac{ \epsilon }{ c } \ln \epsilon + \frac{ 1 + \ln ( \frac{ \epsilon \lambda_m }{ c } ) }{ \lambda_m } \end{aligned} \]

由于\(\epsilon\)\(m\)之前决定,因此\(\lambda_m \to \infty\)的时候可以让后者趋近于\(0\),此时再让\(\epsilon \to 0\)可以让前者为\(0\),这就搞定了.

Example4(黎曼引理)

求证:\(f \in C [ a , b ]\),\(\lim_{ n \to \infty } \int_a^b f ( x ) \sin ( nx ) \mathrm{ d } x = 0\).

\(f \in C^1 [ a , b ]\)的时候,由于:

\[ \begin{aligned} & \int_a^b f ( x ) \sin ( nx ) \mathrm{ d } x \\ = & - \frac{ 1 }{ n } \int_a^b f \mathrm{ d } \cos ( nx ) \\ = & - \frac{ 1 }{ n } f \cos ( nx ) |_a^b + \frac{ 1 }{ n } \int_a^b \cos ( nx ) f ' \mathrm{ d } x \end{aligned} \]

两边取绝对值然后让\(n \to \infty\)就搞定.

既然如此,考虑当\(f \in C [ a , b ]\)的时候,用多项式逼近\(f\),有\(| f - P | < \epsilon\),当然:

\[ \begin{aligned} & \varlimsup_{ n \to \infty } | \int_a^b f \sin ( nx ) \mathrm{ d } x | \\ \leq & \varlimsup_{ n \to \infty } | \int_a^b | f - P | \sin ( nx ) \mathrm{ d } x | \\ \leq & \epsilon ( b - a ) \end{aligned} \]

Example5

\(f \in C [ a , b ]\),如果\(\forall n \in \mathbb{ N }\),\(\int_a^b f x^n \mathrm{ d } x = 0\),求证\(f \equiv 0\).

也就是任意多项式\(P\)都有\(\int_a^b fP \mathrm{ d } x = 0\).取\(P\)使得\(| P - f | < \epsilon\),于是:

\[ \begin{aligned} | \int_a^b f^2 \mathrm{ d } x | & = | \int_a^b fP \mathrm{ d } x + \int_a^b f ( f - P ) \mathrm{ d } x | \\ & = | \int_a^b f ( f - P ) \mathrm{ d } x | \\ & \leq \epsilon \int_a^b | f | \mathrm{ d } x \end{aligned} \]

所以\(\int_a^b f^2 \mathrm{ d } x = 0\)所以\(f \equiv 0\).

傅里叶级数

定义三角系为形如\(\{ 1 , \cos ( nx ) , \sin ( nx ) \}\)的集合,它们张成的线性空间中,也就是有限的线性组合\(\sum_{ k = 0 }^n a_k \cos ( kx ) + b_k \sin ( kx )\)称为\(n\)三角多项式.当\(n \to \infty\)的时候则称其为三角级数.容易见到\(f ( x ) \equiv f ( x + 2 \pi )\).

下面我们来证明三角系两两正交,只需检查:

  1. \(m \ne n\)的时候,\(\int_{ - \pi }^{ \pi } \cos ( mx ) \cos ( nx ) \mathrm{ d } x\).

  2. \(m \ne n\)的时候,\(\int_{ - \pi }^{ \pi } \sin ( mx ) \sin ( nx ) \mathrm{ d } x\).

  3. \(\forall n , m \in \mathbb{ Z }\),\(\int_{ - \pi }^{ \pi } \sin ( nx ) \cos ( mx ) \mathrm{ d } x = 0\).

  4. \(\int_{ - \pi }^{ \pi } \cos^2 ( nx ) \mathrm{ d x } = \int_{ - \pi }^{ \pi } \sin^2 ( nx ) \mathrm{ d x } = \pi\).

不妨设\(\frac{ a_0 }{ 2 } + \sum_{ 1 }^\infty a_k \cos ( kx ) + b_k \sin ( kx ) \rightrightarrows f ( x )\),假如\(f ( x )\)的确一致收敛到某个函数,我们实际上可以用\(f ( x )\)去反推系数,两边乘一些东西再积分应该见到:

  1. \(a_0 = \frac{ 1 }{ \pi } \int_{ - \pi }^{ \pi } f ( x ) \mathrm{ d } x\).

  2. \(a_k = \frac{ 1 }{ \pi } \int_{ - \pi }^{ \pi } f ( x ) \cos ( kx ) \mathrm{ d } x\).

  3. \(b_k = \frac{ 1 }{ \pi } \int_{ - \pi }^{ \pi } f ( x ) \sin ( kx ) \mathrm{ d } x\).

应该是显然见到的.

\(f\)\([ - \pi , \pi ]\)上绝对可积,也就是\(\int_{ - \pi }^\pi | f | \mathrm{ d } x < \infty\),那我们就可以按照上述方法拿到一个三角级数的系数,这个三角级数被称为\(f ( x )\)傅里叶级数或者傅里叶展开.注意我们这里其实还并没有说这个三角级数的确收敛到\(f ( x )\),而只能说我们可以如此由\(f ( x )\)构造出一个傅里叶级数.我们有时也将这样的函数记作\(f ( x ) \in F [ - \pi , \pi ]\),不妨干脆将\(f ( x )\)依照\(f ( x ) \equiv f ( x + 2 \pi )\)的条件延拓\(f ( x )\)定义(或者干脆要求\(f ( x )\)是以\(2 \pi\)为周期的函数),应当见到以下结论:

  1. \(\lim_{ n \to \infty } a_n = \lim_{ n \to \infty } b_n = 0\).

  2. \(a_n ( \alpha f + \beta g ) = \alpha a_n ( f ) + \beta a_n ( g )\).

  3. \(b_n ( \alpha f + \beta g ) = \alpha b_n ( f ) + \beta b_n ( g )\).

  4. 如果\(f ( x )\)是奇函数,则\(a_n ( f ) \equiv 0\).

  5. 如果\(f ( x )\)是偶函数,则\(b_n ( f ) \equiv 0\).

  6. \(f_h ( x ) = f ( x + h )\),则\(a_n ( f_h ) = a_n ( f ) \cos ( nh ) + b_n ( f ) \sin ( nh )\).

  7. \(f_h ( x ) = f ( x + h )\),则\(b_n ( f_h ) = b_n ( f ) \cos ( nh ) - a_n ( f ) \sin ( nh )\).

  8. 如果\(f ( x ) \equiv f ( x + \pi )\),则\(a_{ 2 n - 1 } ( f ) = b_{ 2 n - 1 } ( f )\).

  9. \(\alpha \in ( 0 , 1 ]\),若\(| f ( x ) - f ( y ) | \leq L | x - y |^\alpha , \forall x , y \in [ - \pi , \pi ]\),则\(a_n = b_n = O ( \frac{ 1 }{ n^\alpha } )\).

  10. \(f\)可导,\(f '\)绝对可积,则\(a_n = b_n = o ( \frac{ 1 }{ n } )\).

  11. \(f\)可导,\(f '\)绝对可积,则\(a_n ( f ) = - \frac{ b_n ( f ' ) }{ n }\).

  12. \(f\)可导,\(f '\)绝对可积,则\(b_n ( f ) = \frac{ a_n ( f ' ) }{ n }\).

  13. \(f\)可以导\(m\)次,而且\(f^{ ( m ) }\)绝对可积,则\(a_n = b_n = o ( \frac{ 1 }{ n^m } )\).

  14. \(f \in C ( \mathbb{ R } ) , f ( x + 2 \pi ) \equiv f ( x )\),则\(\forall \epsilon > 0\),则存在一列三角多项式一致逼近\(f\).

  15. \(f \in C ( \mathbb{ R } ) , f ( x + 2 \pi ) \equiv f ( x )\),若\(\forall n \geq 0 , a_n \equiv b_n \equiv 0\),则\(f \equiv 0\).

(1)是由于黎曼引理,我们前面已经用若干种方法反复证过了.

(2)(3)是积分线性的显然结果,(4)(5)只需带入定义即可发现.

(6)(7)的话当然是因为和差角公式.(8)的话根据(6)和(7)由于\(a_n ( f ) = a_n ( f_\pi ) = a_n ( f ) ( - 1 )^n\),这就搞定.

(9)的话,考虑:

\[ \begin{aligned} a_n & = \frac{ 1 }{ \pi } \int_{ - \pi }^{ \pi } f ( x ) \cos ( nx ) \mathrm{ d } x \\ & = \frac{ 1 }{ \pi } \int_{ - \pi - \frac{ \pi }{ n } }^{ \pi - \frac{ \pi }{ n } } f ( x + \frac{ \pi }{ n } ) \cos ( nt + \pi ) \mathrm{ d } x \\ & = - \frac{ 1 }{ \pi } \int_{ - \pi }^{ \pi } f ( x + \frac{ \pi }{ n } ) \cos ( nt ) \mathrm{ d } x \\ a_n & = \frac{ 1 }{ 2 \pi } \int_{ - \pi }^{ \pi } ( f ( x ) - f ( x + \frac{ \pi }{ n } ) ) \cos ( nx ) \mathrm{ d } x \\ | a_n | & \leq \frac{ 1 }{ 2 \pi } \int_{ - \pi }^{ \pi } L ( \frac{ \pi }{ n } )^\alpha \\ & = O ( 1 ) \frac{ 1 }{ n^\alpha } \end{aligned} \]

这就搞定.

至于(10)的话,\(a_n = b_n = O ( \frac{ 1 }{ n } )\)当然只是(9)的推论.那怎么证明是\(o ( \frac{ 1 }{ n } )\)的呢?考虑:

\[ \begin{aligned} a_n & = \frac{ 1 }{ \pi } \int_{ - \pi }^{ \pi } f \cos ( nx ) \mathrm{ d } x \\ & = \frac{ 1 }{ n \pi } \int_{ - \pi }^{ \pi } f \mathrm{ d } \sin ( nx ) \\ & = - \frac{ 1 }{ n \pi } \int_{ - \pi }^{ \pi } \sin ( nx ) f ' \mathrm{ d } x \\ & = o ( \frac{ 1 }{ n } ) \end{aligned} \]

上述过程也自然拿到了(11)和(12).

(13)的话也只需要由(11)和(12)拿到:

\[ | a_n ( f ) | + | b_n ( f ) | \leq \frac{ | a_n ( f^{ ( m ) } ) | + | b_n ( f^{ ( m ) } ) | }{ n^m } \]

其实还有一个推论是如果\(f\)\(2 \pi\)周期的解析函数,则\(| a_n ( f ) | , | b_n ( f ) | \leq Me^{ - nc }\).而且甚至说这个条件是充要的,如果趋向于零的速度确实为此,则\(f\)也的确是解析函数.可惜的是这个结论需要用到复分析的结果,不得不在此略过.

(14)的话,乍一看像是Stone-Weierstrass定理的另一则应用,直接观察Stone-Weierstrass定理的证明发现的确可以照搬到三角多项式上(因为难点只在\(f ( - \pi ) = f ( \pi )\),但原证明中分离的性质只用于贴合函数上的两个点),然而如果想要直接封装原定理拿过来的话的确难以处理\(f ( x ) \equiv f ( x + 2 \pi )\)的性质(其实可以从复平面绕过去).下面提供另一则证明:

先看当\(f ( x )\)是偶函数的时候,观察\(x \in [ 0 , \pi ]\),取\(y = \cos x\),见到\(f ( \arccos y ) \in C [ - 1 , 1 ]\).此时存在一个多项式\(P ( y ) = P ( \cos x )\)一致逼近\(f ( x )\),而\(P ( \cos x )\)当然是三角多项式.

考虑取\(g ( x ) = f ( x ) + f ( - x )\),则如上知道\(\forall \epsilon > 0\),存在三角多项式\(T_1 ( x )\)使得\(\forall x \in \mathbb{ R } , | g ( x ) - T_1 ( x ) | < \frac{ \epsilon }{ 2 }\).

再取\(\varphi ( x ) = ( f ( x ) - f ( - x ) ) \sin x\)当然也是偶函数,存在三角多项式\(T_2 ( x )\)使得\(\forall x \in \mathbb{ R } , | \varphi ( x ) - T_2 ( x ) | < \frac{ \epsilon }{ 2 }\).

既然如此,考虑取\(T_3 ( x ) = T_1 \sin^2 x + T_2 \sin x\),由上见到\(| 2 f ( x ) \sin^2 x - T_3 ( x ) | < \epsilon\),也就是说对于任何\(f ( x )\)都能找到如此一个\(T_3 ( x )\)满足条件.

既然如此,考虑对\(f ( x - \frac{ \pi }{ 2 } )\)做上述操作,也就是存在三角多项式\(T_4 ( x )\)满足:

\[ \begin{aligned} | 2 f ( x - \frac{ \pi }{ 2 } ) \sin^2 x - T_4 ( x ) | < \epsilon \\ | 2 f ( x ) \cos^2 x - T_4 ( x + \frac{ \pi }{ 2 } ) | < \epsilon \end{aligned} \]

既然如此,得到:\(| 2 f ( x ) - T_3 ( x ) - T_4 ( x + \frac{ \pi }{ 2 } ) | < 2 \epsilon\),这就搞定了.

对于(15),考虑找一列三角多项式一致逼近\(f ( x )\),由于\(f ( x )\)的傅里叶级数总是\(0\),所以对于三角多项式\(T_n\)来说一定有\(\int_{ - \pi }^{ \pi } f ( x ) T_n ( x ) \mathrm{ d } x \equiv 0\),既然如此考虑:

\[ \begin{aligned} \int_{ - \pi }^{ \pi } f^2 \mathrm{ d } x & = \int_{ - \pi }^\pi f ( f - T_n ) \mathrm{ d } x \\ & \leq \int_{ - \pi }^\pi | f | \cdot | f - T_n | \mathrm{ d } x \\ & \leq \epsilon \int_{ - \pi }^\pi | f | \mathrm{ d } x & \to 0 \end{aligned} \]

因此\(f \equiv 0\).这意味着连续函数的傅里叶展开是唯一的.

(15)的一则类似结果是,你可以从中看出\(\{ 1 , \sin ( nx ) , \cos ( nx ) \}\)三角系是缺一不可的,而不像多项式那样可以去掉很多.例如如果我们在其中去掉\(\sin x\)的话,那么\(\sin x\)本身就无法逼近,原因是反证法,如果能逼近,考虑一列三角多项式\(\{ T_n \}\)并且其中不含\(\sin x\),然而,由于三角系中两两正交,因此\(\forall T_n ,\)都有\(\int_{ - \pi }^{ \pi } T_n \sin x \mathrm{ d } x \equiv 0\),因此从(15)的证明过程就可以见到必然有\(\sin x \equiv 0\),这当然就出事了.

Example1

\(x \in [ - \pi , \pi ]\),考虑一列\(\{ b_n \}\)单调下降趋近于\(0\),那么根据DA判法当然有\(S ( x ) = \sum_{ n = 1 }^\infty b_n \sin ( nx )\)是逐点收敛的,假设收敛于\(f ( x )\).如果\(f ( x )\)的确是\([ - \pi , \pi ]\)上的绝对可积函数.求证:此时上述\(S ( x )\)的确是\(f ( x )\)的傅里叶级数.

容易见到\(f ( x )\)是奇函数,其傅里叶级数中的\(a_n \equiv 0\).此时不妨只看\(x \in [ 0 , \pi ]\)上的结果.

难点当然在于\(S ( x ) \to f\)并不一定是一致逼近,但应该观察到的是:

\[ | \sin ( mx ) \sum_{ k = 1 }^n \sin ( kx ) | \leq \left | \frac{ \sin ( mx ) }{ \sin \frac{ x }{ 2 } } \right | \leq \left | \frac{ mx }{ \frac{ x }{ \pi } } \right | = | m \pi | \]

所以这个一致有界,前面的\(| b_n |\)单调趋近于\(0\),DA判法告诉我们\(\sin ( mx ) S ( x )\)一致收敛,那逐项积分就证完了\(\int_{ - \pi }^{ \pi } g ( x ) \sin ( mx ) \mathrm{ d } x = \pi b_m\).

Example2

\(f ( x ) = \frac{ 1 - r^2 }{ 1 - 2 r \cos x + r^2 } , | r | < 1\)的傅里叶级数.

考虑在复数上做此操作,留神到:

\[ \begin{aligned} \frac{ 1 }{ 1 - z } & = \frac{ 1 - \bar{ z } }{ ( 1 - z ) ( 1 - \bar{ z } ) } \\ & = \frac{ 1 - \bar{ z } }{ 1 - 2 \Re z + | z |^2 } \\ & = \frac{ 1 - r \cos x + ir \sin x }{ 1 - 2 r \cos x + r^2 } \end{aligned} \]

所以\(2 \Re ( \frac{ 1 }{ 1 - z } ) - 1 = f ( x )\),然而:

$$ \[\begin{aligned} \frac{ 1 }{ 1 - z } & = \sum_{ n \geq 0 } z^n = \sum_{ n \geq 0 } r^n e^{ inx } \\ \Re ( \frac{ 1 }{ 1 - z } ) & = 1 + \sum_{ n \geq 1 } r^n \cos ( nx ) \\ \end{aligned}\]

$$

所以\(f ( x ) = 1 + \sum_{ n \geq 1 } 2 r^n \cos ( nx )\).

与原函数的收敛关系

做完以上操作后,我们来考虑这个傅里叶级数到底是否逼近于\(f ( x )\)本身,设\(S_n ( x ) = \frac{ a_0 }{ 2 } + \sum_{ k = 1 }^n ( a_k \cos ( kx ) + b_k \sin ( kx ) )\).此时考虑:

$$ \[\begin{aligned} S_n ( x_0 ) & = \frac{ a_0 }{ 2 } + \sum_{ k = 1 }^n \int_{ - \pi }^\pi f ( x ) ( \cos kx \cdot \cos kx_0 + \sin kx \cdot \sin kx_0 ) \mathrm{ d } x \\ & = \frac{ 1 }{ 2 \pi } \int_{ - \pi }^\pi f ( x ) \mathrm{ d } x + \sum_{ k = 1 }^n \int_{ - \pi }^\pi f ( x ) \cos k ( x - x_0 ) \mathrm{ d } x \\ & = \frac{ 1 }{ \pi } \int_{ - \pi }^\pi f ( x ) \left ( \frac{ 1 }{ 2 } + \sum_{ k = 1 }^n \cos k ( x - x_0 ) \right ) \mathrm{ d } x \\ & = \frac{ 1 }{ \pi } \int_{ - \pi }^\pi f ( x ) \frac{ \sin ( n + \frac{ 1 }{ 2 } ) ( x - x_0 ) }{ 2 \sin \frac{ x - x_0 }{ 2 } } \mathrm{ d } x \\ \end{aligned}\]

$$

不妨令迪利克雷核\(D_n ( x ) = \frac{ \sin ( n + \frac{ 1 }{ 2 } ) x }{ 2 \sin \frac{ x }{ 2 } } , \varphi ( x_0 , x ) = \frac{ f ( x_0 + x ) + f ( x_0 - x ) }{ 2 }\),应当见到\(\frac{ 1 }{ \pi } \int_{ - \pi }^\pi D_n ( x ) \mathrm{ d } x = 1\),则:

\[ \begin{aligned} S_n ( x_0 ) & = \frac{ 1 }{ \pi } \int_{ - \pi }^\pi f ( x ) D_{ n } ( x - x_0 ) \mathrm{ d } x \\ & = \frac{ 1 }{ \pi } \int_{ - \pi }^\pi f ( t + x_0 ) D_{ n } ( t ) \mathrm{ d } t \\ & = \frac{ 1 }{ \pi } \int_0^\pi ( f ( x_0 + t ) + f ( x_0 - t ) ) D_n ( t ) \mathrm{ d } t \\ & = \frac{ 2 }{ \pi } \int_0^\pi \varphi ( x_0 , t ) D_n ( t ) \mathrm{ d } t \end{aligned} \]

问题在于最后如何判断这个积分的收敛性,事实上可以找到若干个逼近的充分条件:

  1. 分段可导时候的情况

下面我们来证明:当\(f\)是Holder连续的时候,\(\lim_{ n \to \infty } S_n ( x ) \to f ( x )\).

我们有如下黎曼局部化引理:对\(\forall 0 < \delta < \pi\),都有\(\lim_{ n \to \infty } \left ( S_n ( x_0 ) - \frac{ 2 }{ \pi } \int_0^\delta \varphi ( x_0 , t ) \frac{ \sin ( n + \frac{ 1 }{ 2 } ) t }{ t } \mathrm{ d } t \right ) = 0\).

如何证明此呢?考虑:

$$ \[\begin{aligned} \frac{ \pi }{ 2 } S_n ( x_0 ) & = \int_0^\delta \varphi ( x_0 , t ) D_n ( t ) \mathrm{ d } t + \int_\delta^\pi \varphi ( x_0 , t ) D_n ( t ) \mathrm{ d } t \\ & = \int_0^\delta \varphi ( x_0 , t ) \frac{ \sin ( n + \frac{ 1 }{ 2 } ) t }{ t } \mathrm{ d } t + \int_0^\delta \varphi ( x_0 , t ) \frac{ t - 2 \sin \frac{ t }{ 2 } }{ 2 t \sin \frac{ t }{ 2 } } \sin ( n + \frac{ 1 }{ 2 } ) t \mathrm{ d } t \\ & + \int_\delta^\pi \frac{ \varphi ( x_0 , t ) }{ 2 \sin \frac{ t }{ 2 } } \sin ( n + \frac{ 1 }{ 2 } ) t \mathrm{ d } t \\ \end{aligned}\]

$$

留神到\(\frac{ t - 2 \sin \frac{ t }{ 2 } }{ 2 t \sin \frac{ t }{ 2 } }\)极限存在,因此其的确有界,对后面两项用黎曼引理就知道趋近于\(0\).

接下来我们还有一个引理:当\(\varphi \in R [ 0 , \delta ]\)的时候,如果\(\varphi ( 0 + )\)存在,并且\(\int_0^\delta \frac{ | \varphi ( t ) - \varphi ( 0 + ) | }{ t } < \infty\),则\(\lim_{ \lambda \to \infty } \int_0^\delta \varphi ( t ) \frac{ \sin \lambda t }{ t } \mathrm{ d } t = \frac{ \pi }{ 2 } \varphi ( 0 + )\).

于此证明,根据黎曼引理:

\[ \begin{aligned} \lim_{ \lambda \to \infty } \int_0^\delta \frac{ \varphi ( t ) - \varphi ( 0 + ) }{ t } \sin \lambda t \mathrm{ d } t & = 0 \\ \lim_{ \lambda \to \infty } \int_0^\delta \frac{ \varphi ( t ) }{ t } \sin \lambda t \mathrm{ d } t & = \lim_{ \lambda \to \infty } \int_0^\delta \frac{ \varphi ( 0 + ) }{ t } \sin \lambda t \mathrm{ d } t \\ & = \varphi ( 0 + ) \lim_{ \lambda \to \infty } \int_0^{ \lambda \delta } \frac{ \sin t }{ t } \mathrm{ d } t \\ & = \frac{ \pi }{ 2 } \varphi ( 0 + ) \end{aligned} \]

既然如此,当\(f\)是霍尔德连续,也就是\(\exists \alpha \in ( 0 , 1 ] , \exists C > 0\),使得\(| f ( x_0 + t ) - f ( x_0 ) | \leq C | t |^\alpha\),此时见到\(| \varphi ( x_0 , t ) - \varphi ( x_0 , 0 + ) | = O ( | t |^\alpha )\),用上述引理知道此时\(S_n ( x_0 ) \to f ( x_0 )\).

上述结论还可以得到一个更神秘的结论,我们上述引理只用到了在\(x_0\)附近的结果,那如果\(f\)\(x_0\)附近不连续呢?

假设\(f ( x_0 \pm 0 )\)均存在,我们可以定义广义导数,定义右广义导数为\(D_+ f ( x_0 ) = \lim_{ h \to 0 + } \frac{ f ( x_0 + h ) - f ( x_0 + 0 ) }{ h }\),同理定义左广义导数.

\(D_\pm f ( x_0 )\)存在的时候,考虑此时\(\frac{ | \varphi ( t ) - \varphi ( 0 + ) | }{ t }\)没有瑕点,那上述结论当然也就满足.

如果我们定义分段可导为除了若干个断点处的左右广义导数不相同,其余所有点的左右广义导数都存在.那上述结论也就满足.

  1. 分段单调时候的情况

我们有Jordan引理:设\(\varphi\)\([ 0 , \delta ]\)上单调,则\(\lim_{ \lambda \to \infty } \int_0^\delta \frac{ \varphi ( x ) }{ x } \sin ( \lambda x ) \mathrm{ d } x = \frac{ \pi }{ 2 } \varphi ( 0 + )\).

对Jordan引理的证明,不妨设\(\varphi\)单调递增,对\(\forall \epsilon > 0 , \exists 0 < \delta ' < \delta\),使得\(\forall t \in ( 0 , \delta ' ) , 0 \leq \varphi ( t ) - \varphi ( 0 + ) < \epsilon\).

不妨设\(| \int_0^t \frac{ \sin x }{ x } | \leq M , \forall t > 0\),考虑根据积分第二中值定理:

\[ \begin{aligned} & | \int_0^{ \delta ' } ( \varphi ( t ) - \varphi ( 0 + ) ) \frac{ \sin ( \lambda t ) }{ t } \mathrm{ d } t | \\ = & | ( \varphi ( \delta ' ) - \varphi ( 0 + ) ) \int_\xi^{ \delta ' } \frac{ \sin ( \lambda t ) }{ t } \mathrm{ d } t | \\ \leq & 2 M \epsilon \end{aligned} \]

而在\([ \delta ' , \delta ]\)上可以直接用黎曼引理这就搞定了.

如果\(\varphi\)是有限个单调函数的和,上述结论当然也成立了.所以该结论对有界变差函数是成立的.

因此,当\(f \in [ - \pi , \pi ]\)上逐段单调的时候,\(\varphi\)逐段是两个单调函数的差,那此时当然也有\(\lim_{ n \to \infty } S_n ( x ) = \frac{ f ( x + 0 ) + f ( x - 0 ) }{ 2 }\).

Example1

\(f ( x ) = \begin{cases}- 1 & x \in ( - \pi , 0 ) \\ 0 & x = 0 \lor x = - \pi \lor x = \pi \\ 1 & x \in ( 0 , \pi )\end{cases}\).

见到这的确是一个奇函数,直接求它的傅里叶级数,见到是:

\[ \frac{ 4 }{ \pi } \sum_{ n = 0 }^\infty \frac{ \sin ( 2 n + 1 ) x }{ 2 n + 1 } = \frac{ f ( x + 0 ) + f ( x - 0 ) }{ 2 } = f ( x ) \]

我们竟然得到了一个一个神秘级数,很牛.

而且这个三角级数在\(( 0 , \pi )\)上处处收敛到\(1\),这个性质在幂级数的时候是无法想象的,我们之前证明过了开区间上的非常值幂级数的零点集一定没有聚点.

Example2

\(f ( x ) = \begin{cases}\pi + x & x \in [ - \pi , 0 ) \\ \pi - x & x \in [ 0 , \pi )\end{cases}\),也就是一个锯齿状的小函数,当然分段单调了.由于是一个偶函数,积分得到\(a_n = \frac{ 2 }{ \pi } \int_0^\pi ( \pi - x ) \cos ( nx ) \mathrm{ d } x = \frac{ 2 }{ n^2 \pi } ( 1 - ( - 1 )^n )\).

这当然是个连续函数,那此时有:

\[ f ( x ) = \frac{ \pi }{ 2 } + \frac{ 4 }{ \pi } ( \sum_{ k = 0 }^\infty \frac{ \cos ( 2 k + 1 ) x }{ ( 2 k + 1 )^2 } ) \]

两边带入\(x = 0\)就知道\(\sum_{ k = 0 }^\infty \frac{ 1 }{ ( 2 k + 1 )^2 } = \frac{ \pi^2 }{ 8 }\).

还没完,用大M判别法容易检验这个式子两边是绝对一致收敛的,那我们两边逐项积分得到:

$$ \[\begin{aligned} \int_0^x f ( t ) \mathrm{ d } t & = \frac{ \pi }{ 2 } x + \frac{ 4 }{ \pi } \sum_{ k = 0 }^\infty \int_0^x \frac{ \cos ( 2 k + 1 ) t }{ ( 2 k + 1 )^2 } \mathrm{ d } t \\ & = \frac{ \pi }{ 2 } x + \frac{ 4 }{ \pi } \sum_{ k = 0 }^\infty \frac{ \sin ( 2 k + 1 ) t }{ ( 2 k + 1 )^3 } \\ \end{aligned}\]

$$

把左边的\(f\)积出来,设其为\(g ( x ) = \begin{cases}\pi x + \frac{ x^2 }{ 2 } & x \in [ - \pi , 0 ) \\ \pi x - \frac{ x^2 }{ 2 } & x \in [ 0 , \pi )\end{cases}\).那它的傅里叶展开就等于右边的东西(因为一致收敛).带入\(x = \frac{ \pi }{ 2 }\),可以得到\(\frac{ \pi^3 }{ 32 } = \sum_{ k = 0 }^\infty \frac{ ( - 1 )^k }{ ( 2 k + 1 )^3 }\).

那接下来还可以两边再积分对吧!过程我也懒得写了,总之能推出\(\sum_{ k = 0 }^\infty \frac{ 1 }{ ( 2 k + 1 )^4 } = \frac{ \pi^4 }{ 96 }\),可以得到\(\sum_{ k = 1 }^\infty \frac{ 1 }{ k^4 } = \frac{ \pi^4 }{ 90 }\).

所以总之,我们可以用上面的策略得到所有的\(\zeta ( 2 n )\).

Example3

考虑对\(\cos ( ax )\)\([ - \pi , \pi ]\)截取出来并延拓,然后对其作傅里叶展开,得到:

\[ \begin{aligned} \cos ( ax ) & = \frac{ \sin ( a \pi ) }{ a \pi } + \sum_{ n = 1 }^\infty \frac{ ( - 1 )^n 2 a }{ a^2 - n^2 } \frac{ \sin ( a \pi ) }{ \pi } \cos ( nx ) \\ \frac{ 1 }{ \sin ( a \pi ) } & = \frac{ 1 }{ a \pi } + \sum_{ n = 1 }^\infty \frac{ ( - 1 )^n 2 a \pi }{ ( a \pi )^2 - ( n \pi )^2 } \end{aligned} \]

\(z = a \pi\),得到:

\[ \frac{ 1 }{ \sin z } = \frac{ 1 }{ z } + \sum_{ n = 1 }^\infty ( - 1 )^n ( \frac{ 1 }{ z - n \pi } + \frac{ 1 }{ z + n \pi } ) \]

Example4

假设\(\int_{ - \infty }^{ + \infty } | f | \mathrm{ d } x < \infty\),且存在\(x_0 , \delta\),\(f ( x_0 \pm 0 )\)存在,使得以下二者其一成立:

  1. \(f\)\(( x_0 - \delta , x_0 + \delta )\)上是有界变差的.

  2. 积分\(\int_0^\delta \frac{ | f ( x_0 \pm t ) - f ( x_0 \pm 0 ) | }{ t } < \infty\).

则:

\[ \lim_{ \alpha \to \infty } \frac{ 1 }{ \pi } \int_{ - \infty }^{ + \infty } f ( x_0 + t ) \frac{ \sin ( \alpha t ) }{ t } \mathrm{ d } t = \frac{ 1 }{ 2 } ( f ( x_0 + 0 ) + f ( x_0 - 0 ) ) \]

只需要证明:

\[ \lim_{ \alpha \to \infty } \int_{ 0 }^\infty ( f ( x_0 + t ) - f ( x_0 + 0 ) ) \frac{ \sin ( \alpha t ) }{ t } \mathrm{ d } t = 0 \]

首先\([ 0 , + \infty )\)上,对于\([ 0 , \delta ]\)只需要正常做就行了.可是\(\frac{ f ( x_0 + t ) - f ( x_0 + 0 ) }{ t }\)\(( \delta , + \infty )\)上未必可积,这就有点难绷.开动脑筋,想起来既然这里有一个\(\mathbb{ R }\)上的绝对可积,那当然得用一用我们的柯西准则,考虑将后面拆成\(( \delta , M )\)\([ M , + \infty )\).如果我们能把后面的\([ M , + \infty )\)搞定,那中间那一段用黎曼引理就搞定了.

后面怎么做呢,简单放缩:

\[ \begin{aligned} & | \int_{ M }^\infty ( f ( x_0 + t ) - f ( x_0 + 0 ) ) \frac{ \sin ( \alpha t ) }{ t } \mathrm{ d } t | \\ \leq & | \int_{ M }^\infty f ( x_0 + t ) \frac{ \sin ( \alpha t ) }{ t } \mathrm{ d } t | + | \int_{ M }^\infty f ( x_0 + 0 ) \frac{ \sin ( \alpha t ) }{ t } \mathrm{ d } t | \\ \leq & \int_{ M }^\infty | f ( x_0 + t ) | \mathrm{ d } t + | f ( x_0 + 0 ) \int_{ M }^\infty \frac{ \sin ( \alpha t ) }{ t } \mathrm{ d } t | \\ \to & 0 \end{aligned} \]

这就搞定了.

一致收敛到原函数的情形

那此时该函数肯定连续,然而连续函数未必总能一致逼近,Example1给出了一个反例.

那么应该加如何条件呢?先证明一个加强版的黎曼引理:

\(g ( x )\)\([ A , B ]\)上的绝对可积函数,取\(S_p = \sup_{ a , b \in [ A , B ] } | \int_a^b g ( t ) \sin pt \mathrm{ d } t | + \sup_{ a , b \in [ A , B ] } | \int_a^b g ( t ) \cos pt \mathrm{ d } t |\),我们要证明\(\lim_{ p \to \infty } S_p = 0\).这个还并不显然,因为\(a , b\)是可以在\(p\)之后决定的.实际上这里就是为了拿到一个一致控制性,我们想让我们的黎曼引理是能一致控制住整个区间的,这样我们才能得到一致收敛的条件.

首先考虑\(\forall \epsilon > 0\),当\(g ( x ) \in R [ a , b ]\)的时候,可以先用连续函数逼近,再将连续函数变为多项式逼近.而当\(g ( x )\)有瑕点的时候,可以将瑕点逼掉.所以总能找到一个多项式\(f ( x )\)满足\(\int_A^B | g ( x ) - f ( x ) | \mathrm{ d } x < \frac{ \epsilon }{ 2 }\).然后考虑:

\[ \begin{aligned} \int_a^b f \sin ( pt ) \mathrm{ d } t & = \frac{ 1 }{ p } f \cos ( pt ) |_a^b + \frac{ 1 }{ p } \int_a^b \cos ( pt ) f ' \mathrm{ d } t \\ & \to 0 \end{aligned} \]

由此还可以再推出一个引理,\(\lim_{ p \to \infty } \sup_{ A \leq x_0 \pm a , x_0 \pm b \leq B } | \int_a^b g ( x_0 \pm t ) \cos ( pt ) \mathrm{ d } t | = 0\).原因是换元后用和差角公式拆开就行.

进一步推广,考虑\(\gamma ( t )\)\([ a , b ]\)上的有界变差函数,我们证明:\(\lim_{ p \to \infty } \sup_{ A \leq x_0 \pm a , x_0 \pm b \leq B } | \int_a^b g ( x_0 \pm t ) \gamma ( t ) \cos ( pt ) \mathrm{ d } t | = 0\).

不妨设\(\gamma ( t )\)单调递增,然后用积分第二中值定理就可以发现:

\[ \begin{aligned} & \int_a^b g ( x_0 \pm t ) \gamma ( t ) \sin ( pt ) \mathrm{ d } t \\ = & \gamma ( a ) \int_a^\xi g ( x_0 \pm t ) \sin ( pt ) \mathrm{ d } t + \gamma ( b ) \int_\xi^b g ( x_0 \pm t ) \sin ( pt ) \mathrm{ d } t \\ \to & 0 \end{aligned} \]

接下来设\(\varphi ( t ) = f ( x + t ) + f ( x - t ) - 2 f ( x )\),假设\(f\)\([ - \pi , \pi ]\)上的绝对可积函数,而且\(f\)限制在子区间\([ a , b ]\)上是连续的.我们有迪尼定理:若\(\forall \epsilon > 0 , \exists \delta > 0 , \sup_{ x \in [ a , b ] } \int_0^\delta \frac{ | \varphi ( t ) | }{ t } \mathrm{ d } t < \epsilon\),则其傅里叶级数\(S_n ( x )\)在区间\([ a , b ]\)上一致逼近\(f\).

考虑:

$$ \[\begin{aligned} S_n ( x ) - f ( x ) & = \frac{ 1 }{ \pi } \int_0^\pi \varphi ( t ) \frac{ \sin ( n + \frac{ 1 }{ 2 } ) t }{ 2 \sin \frac{ t }{ 2 } } \mathrm{ d } t \\ & = \frac{ 1 }{ \pi } ( \int_0^\delta + \int_\delta^\pi ) \varphi ( t ) \frac{ \sin ( n + \frac{ 1 }{ 2 } ) t }{ 2 \sin \frac{ t }{ 2 } } \mathrm{ d } t \\ \end{aligned}\]

$$

考虑前者:

\[ \begin{aligned} \int_0^\delta & \leq \frac{ 1 }{ \pi } \int_0^\delta \frac{ | \varphi ( t ) | }{ t } \frac{ \frac{ t }{ 2 } }{ \sin \frac{ t }{ 2 } } \mathrm{ d } t \\ & \leq \frac{ 1 }{ 2 } \int_0^\delta \frac{ | \varphi ( t ) | }{ t } \mathrm{ d } t \\ & < \frac{ \epsilon }{ 2 } \end{aligned} \]

至于后者,只需上述引理就搞定.

于是最后我们可以得到,如果\(f\)是Holder连续的时候,那对于任意的\([ a , b ]\),都一定有\(S_n \rightrightarrows f ( x )\).

而如果当\(f\)是有界变差的时候,此时考虑\(f\)几乎处处可导,而在其可导的地方当然由上面的结果就一致收敛了,所以可以知道这个函数列几乎处处一致收敛到\(f\).

然而容易检验如果一个连续函数列几乎处处一致收敛到一个连续函数,那当然它们就是一致收敛的关系.考虑反证,\(\forall \epsilon > 0\),设可导点集为\(A\),则\(\exists n , \sup_{ x \in A } ( f ( x ) - f_n ( x ) ) < \epsilon\).

假设不一致收敛,此时\(\exists x_0\)使得\(f ( x_0 ) - f_n ( x_0 ) > 4 \epsilon\).然而由于\(n\)已经定死,所以现在\(f\)\(f_n\)都是一致连续的,往旁边区间绕一下就行了.不管这个区间多小,由于\([ - \pi , \pi ] \setminus A\)是零测的,所以总有与\(A\)的交.

从上面也可以看到,只要一个连续函数几乎处处可导,那它的傅里叶级数就可以一致逼近它.

Example1

设:

\[ \begin{aligned} Q_{ m , n } & & = \sum_{ k = 1 }^n \frac{ \sin ( m + n - k ) x }{ k } - \sum_{ k = 1 }^n \frac{ \sin ( m + n + k ) x }{ k } \\ & & = - 2 \cos ( m + n ) x \sum_{ v = 1 } \frac{ \sin ( vx ) }{ v } \end{aligned} \]

容易检查这个函数是有界的,只需:

\[ \begin{aligned} \sum_{ v = 1 }^n \frac{ \sin vx }{ v } & & = \int_0^x \sum_{ v = 1 }^n \cos vt \mathrm{ d } t \\ & & = \int_0^x ( - \frac{ 1 }{ 2 } + \frac{ \sin ( n + \frac{ 1 }{ 2 } ) t }{ 2 \sin \frac{ t }{ 2 } } ) \\ & & = - \frac{ x }{ 2 } + \int_0^x ( \frac{ 1 }{ 2 \sin \frac{ t }{ 2 } } - \frac{ 1 }{ t } ) + \int_0^{ ( n + \frac{ 1 }{ 2 } ) x } \frac{ \sin t }{ t } \mathrm{ d } t \end{aligned} \]

这样用黎曼引理立刻见到其有界,存在常数\(C\)使得\(| \sum_{ v = 1 }^n \frac{ \sin vx }{ v } | \leq C\),那\(| Q_{ n , m } | \leq 2 C\)也有界.

定义\(m_k = n_k = 2^{ k^3 }\),取函数\(\varphi ( x ) = \sum_{ k = 1 }^\infty \frac{ 1 }{ k^2 } Q_{ m_k , n_k } ( x )\),既然\(Q_{ m_k , n_k }\)有界,根据大M判别法,这个东西当然一致收敛而且\(2 \pi\)周期连续.

既然如此,考察\(\varphi ( x )\)是奇函数,它的傅里叶展开的确就是上述形式(原因是连续函数有唯一傅里叶展开).

接下来考虑其波动考虑由于我们的\(m_k = n_k = 2^{ k^3 }\),所以其实这里很稀疏的,留神到:

\[ \begin{aligned} S_{ 2 n_k - 1 } ( x ) - S_{ n_k - 1 } ( x ) & = \frac{ 1 }{ k^2 } \left ( \sum_{ l = 1 }^{ n_k } \frac{ \sin ( 2 n_k - l ) x }{ l } \right ) \end{aligned} \]

接下来带入\(x = \frac{ \pi }{ 4 n_k }\),见到:

\[ \begin{aligned} ( S_{ 2 n_k - 1 } - S_{ n_k - 1 } ) ( \frac{ \pi }{ 4 n_k } ) & > \frac{ \sqrt{ 2 } }{ 2 } \frac{ 1 }{ k^2 } ( \sum_{ l = 1 }^{ n_k } \frac{ 1 }{ l } ) \\ & > \frac{ \sqrt{ 2 } }{ 2 } \frac{ 1 }{ k^2 } \ln n_k \\ & > \frac{ \sqrt{ 2 } \ln 2 }{ 2 } k \\ & \to \infty \end{aligned} \]

因此见到不一致收敛,很厉害!

Cesaro收敛

接下来我们引入Cesaro收敛的概念,回忆到Stolz定理给出若取定\(\sigma_n = \frac{ a_1 + \cdots + a_n }{ n }\),回忆到如果\(a_n \to a\),则\(\sigma_n \to a\),然而反之未必成立.因此,\(\sigma_n\)如果收敛的话,这是一个比\(a_n\)收敛弱的条件.

在傅里叶级数这里也引入这个概念,我们不再研究\(S_n ( x )\)的收敛性,而考虑\(\sigma_n ( x ) = \frac{ S_0 ( x ) + \cdots + S_n ( x ) }{ n + 1 }\)的收敛性.考虑:

$$ \[\begin{aligned} \sigma_n ( x ) & = \frac{ S_0 ( x ) + \cdots + S_n ( x ) }{ n + 1 } \\ & = \frac{ 1 }{ ( n + 1 ) \pi } \int_{ - \pi }^\pi f ( x + t ) \frac{ \sum_{ k = 0 }^n \sin ( k + \frac{ 1 }{ 2 } ) t }{ 2 \sin \frac{ t }{ 2 } } \mathrm{ d } t \\ & = \frac{ 1 }{ ( n + 1 ) \pi } \int_{ - \pi }^\pi f ( x + t ) \frac{ 1 - \cos ( n + 1 ) t }{ 2 \sin^2 \frac{ t }{ 2 } } \mathrm{ d } t \\ & = \frac{ 1 }{ ( n + 1 ) \pi } \int_{ - \pi }^\pi f ( x + t ) \frac{ \sin^2 ( \frac{ n + 1 }{ 2 } t ) }{ 2 \sin^2 \frac{ t }{ 2 } } \mathrm{ d } t \\ \end{aligned}\]

$$

设费叶核\(\phi_n ( t ) = \frac{ \sin^2 \frac{ n + 1 }{ 2 } t }{ 2 ( n + 1 ) \sin^2 \frac{ t }{ 2 } }\).容易见到\(\phi_n ( t ) = \phi_n ( - t )\),\(\phi ( 0 ) = \frac{ n + 1 }{ 2 }\),而且\(\frac{ 1 }{ \pi } \int_{ - \pi }^\pi \phi_n ( t ) \mathrm{ d } t = 1\),原因是\(\phi_n ( t )\)原本是个三角多项式,因此这里的积分只和其常数项有关,而常数项为\(\frac{ 1 }{ 2 }\).

现在我们说,当\(f ( x ) \equiv f ( x + 2 \pi )\),\(f\)\([ - \pi , \pi ]\)上绝对可积,并且\(f ( x_0 \pm 0 )\)极限存在,则\(\lim_{ n \to \infty } \sigma_n ( x_n ) = \frac{ f ( x_0 + 0 ) + f ( x_0 - 0 ) }{ 2 }\).进一步,如果\(f \in C ( \mathbb{ R } )\),则\(\sigma_n ( x ) \rightrightarrows f ( x )\).

考虑设\(I_n = \sigma_n ( x ) - \frac{ f ( x + 0 ) + f ( x - 0 ) }{ 2 }\),有:

\[ I_n = \frac{ 1 }{ \pi } \int_{ - \pi }^\pi \phi_n ( t ) ( f ( x + t ) + f ( x - t ) - f ( x + 0 ) - f ( x - 0 ) ) \mathrm{ d } t \]

此时考虑\(f ( x \pm 0 )\)存在意味着\(\forall \epsilon > 0 , \exists \delta > 0\),使得当\(0 < t \leq \delta\)的时候,总有\(| f ( x \pm t ) - f ( x \pm 0 ) | < \frac{ \epsilon }{ 2 \pi }\),于是我们上面的\(I_n\)就可以拆成\(\int_0^\delta + \int_\delta^\pi\)两部分.

对于前者:

\[ \frac{ 1 }{ \pi } | \int_0^\delta | \leq \frac{ \epsilon }{ 2 \pi } \int_0^\pi \phi_n ( t ) \mathrm{ d } t < \frac{ \epsilon }{ 2 } \]

对于后者只要能控制\(\max_{ [ \delta , \pi ] } \phi_n ( t )\)就行,而这是显然的,因为当\(t \geq \delta\)的时候,分母就有下界了,让\(n \to \infty\)的时候当然趋近于\(0\).所以\(\lim_{ n \to \infty } I_n = 0\).

接下来的疑问是当\(f\)连续时为何一致收敛,这当然是因为\(f\)是一致连续的,那我上述唯一涉及\(x\)的地方,也就是当\(f ( x \pm t ) \to f ( x )\)的部分就可以被控制住,这就搞定了.

Cesaro收敛的另一个好处在于,当\(f ( x + 0 )\)\(f ( x - 0 )\)存在的时候,由于如果逐点收敛一定就能导出Cesaro收敛,因此,如果傅里叶级数在某一点处收敛,则它必然也在这一点处Cesaro收敛且收敛于同一个\(\frac{ f ( x + 0 ) + f ( x - 0 ) }{ 2 }\),换言之如果收敛则一定收敛于此.

平均收敛

考虑如果一列函数\(f_n\),如果\(\int | f_n - f | \to 0\)则我们称这列函数平均收敛\(f\).一个平均收敛的函数列可以处处点不收敛,一个逐点收敛的函数也可能并不平均收敛(因为积分不一定收敛).

考虑定义平方可积函数\(f\)为几乎处处连续而且只有有限个瑕点的\(f\)并且满足\(\int_{ - \pi }^\pi f^2 \mathrm{ d } x < \infty\).容易见到闭区间上的平方可积要强于绝对可积,原因正是柯西不等式:

\[ \int_{ - \pi }^\pi | f | \mathrm{ d } x \leq \sqrt{ ( \int_{ - \pi }^\pi f^2 \mathrm{ d } x ) ( \int_{ - \pi }^\pi 1 \mathrm{ d } x ) } \]

从而看到如果\(\int ( f_n - f )^2 \mathrm{ d } x \to 0\)则当然有\(\int | f_n - f | \mathrm{ d } x \to 0\),因此我们往往计算前者.

假设\(f\)是平方绝对可积的,考虑定义\(\mathcal{ F }_n\)\(n\)阶三角多项式组成的集合,设\(S_n\)\(f\)的傅里叶展开的前\(n\)项,我们有:

  1. \(\int_{ - \pi }^\pi ( f - S_n )^2 \mathrm{ d } x = \min_{ T_n \in \mathcal{ F }_n } \int_{ - \pi }^\pi ( f - T_n )^2 \mathrm{ d } x\).

  2. Bessel不等式:\(\frac{ a_0^2 }{ 2 } + \sum_{ n = 1 }^\infty ( a_n^2 + b_n^2 ) \leq \frac{ 1 }{ \pi } \int_{ - \pi }^\pi f^2 \mathrm{ d } x\).

  3. Parseval等式:\(\frac{ a_0^2 }{ 2 } + \sum_{ n = 1 }^\infty ( a_n^2 + b_n^2 ) = \frac{ 1 }{ \pi } \int_{ - \pi }^\pi f^2 \mathrm{ d } x\).

  4. 广义Parseval等式:设\(f , g\)都平方可积,则\(\frac{ 1 }{ \pi } \int_{ - \pi }^\pi fg \mathrm{ d } x = \frac{ a_0 ( f ) a_0 ( g ) }{ 2 } + \sum_{ n = 1 }^\infty ( a_n ( f ) a_n ( g ) + b_n ( f ) b_n ( g ) )\).

先看(1)和(2),假设\(T_n = \frac{ A_0 }{ 2 } + \sum_{ k = 1 }^n A_k \cos ( kx ) + B_k \sin ( kx )\),考虑:

$$ \[\begin{aligned} & \int_{ - \pi }^\pi ( f - T_n )^2 \mathrm{ d } x \\ = & \int_{ - \pi }^\pi f^2 \mathrm{ d } x + \pi \left ( \frac{ A_0^2 }{ 2 } + \sum_{ k = 1 }^n ( A_k^2 + B_k^2 ) \right ) - 2 \pi ( A_0 \frac{ a_0 }{ 2 } + \sum_{ k = 1 }^n a_k A_k + b_k B_k ) \\ = & \int_{ - \pi }^\pi f^2 \mathrm{ d } x + \pi \left ( \frac{ ( A_0 - a_0 )^2 }{ 2 } + \sum_{ k = 1 }^n ( a_k - A_k )^2 + ( b_k - B_k )^2 \right ) - \pi \left ( \frac{ a_0^2 }{ 2 } + \sum_{ k = 1 }^n a_k^2 + b_k^2 \right ) \\ \geq & \int_{ - \pi }^\pi f^2 \mathrm{ d } x - \pi \left ( \frac{ a_0^2 }{ 2 } + \sum_{ k = 1 }^n a_k^2 + b_k^2 \right ) \\ \end{aligned}\]

$$

等号成立当且仅当\(A_k = a_k , B_k = b_k\),这样上述两者就都证毕.

再看(3),由(1)和(2),只需要证明对于平方可积函数总存在一列三角多项式\(T_n\)使得\(\lim_{ n \to \infty } \int_{ - \pi }^\pi ( f - T_n )^2 \mathrm{ d } x = 0\)即可.

\(f\)是黎曼可积的时候这里较为平凡,只需要先用连续函数\(g\)逼近\(f\),再用三角多项式逼近\(g\)即可.最终因为有\(( T - f )^2 \leq 2 ( T - g )^2 + 2 ( f - g )^2\)就行.顺便一提这个不等式还可以证明平方可积的函数的和差也一定是平方可积.

接下来要把瑕点给处理掉,由于平方可积,所以瑕点那里的积分会足够小,直接把那一段抹平成\(0\)就行.抹平了后的函数可以被逼近,而抹平带来的影响又很小,这就搞定了.

再看(4),对\(( f + g )\)\(( f - g )\)分别做Parseval等式,然后用它们一作差就能证明此结论.

关于Bessel不等式和Parseval等式,一个更好的理解是它体现了正交基上的操作,Bessel不等式说对于一组正交基我们总有\(\Vert u \Vert^2 \leq \sum_k ( u | e_k )^2\)成立.

Example1

求证:函数\(f , g\)\([ - \pi , \pi ]\)上黎曼可积,则它们的傅里叶级数相同的充分必要条件是\(\int_{ - \pi }^\pi | f - g | \mathrm{ d } x = 0\).

先证明充分性,比较显然:

\[ \begin{aligned} & | \int_{ - \pi }^\pi ( f - g ) \sin ( nx ) \mathrm{ d } x | \\ \leq & \int_{ - \pi }^\pi | f - g | \mathrm{ d } x \end{aligned} \]

再证必要性,也很显然,考虑如果傅里叶级数相同,则Parseval等式必有\(\int f^2 \mathrm{ d } x = \int g^2 \mathrm{ d } x = \int fg \mathrm{ d } x\),这说明\(\int ( f - g )^2 \mathrm{ d } x = 0\),立刻推出\(\int | f - g | \mathrm{ d } x = 0\).

Example2

求证:当\(b_n\)单调递减趋近于\(0\)的时候,如果\(\sum \frac{ b_n }{ n } < \infty\),则\(f ( x ) = \sum b_n \sin ( nx )\)\([ - \pi , \pi ]\)上绝对可积.

不妨设\(x \in [ - \pi , \pi ]\),首先考虑:

\[ \begin{aligned} & | \sum_{ k = n + 1 }^{ n + m } \sin ( kx ) | \\ = & | \frac{ \cos ( n + m + \frac{ 1 }{ 2 } ) - \cos ( n + \frac{ 1 }{ 2 } ) }{ 2 \sin \frac{ x }{ 2 } } | \\ \leq & \frac{ 1 }{ | \sin \frac{ x }{ 2 } | } \end{aligned} \]

此时考虑设\(S_m = \sum_{ k = n + 1 }^{ m } \sin ( kx )\),取\(x \in [ \frac{ \pi }{ n + 1 } , \frac{ \pi }{ n } ]\),用Abel变换立刻有:

\[ \begin{aligned} & | \sum_{ k = n + 1 }^{ n + m } b_k \sin ( kx ) | \\ = & | \sum_{ k = n + 1 }^{ n + m } b_k ( S_{ k } - S_{ k - 1 } ) | \\ = & | \sum_{ k = n + 1 }^{ n + m - 1 } ( b_{ k } - b_{ k + 1 } ) S_{ k } - b_{ n + 1 } S_{ n } + b_{ n + m } S_{ n + m } | \\ = & | \sum_{ k = n + 1 }^{ n + m - 1 } ( b_{ k } - b_{ k + 1 } ) S_{ k } + b_{ n + m } S_{ n + m } | \\ \leq & \frac{ b_n }{ | \sin \frac{ x }{ 2 } | } \\ \leq & \frac{ \pi }{ x } b_{ n + 1 } \\ \leq & ( n + 1 ) b_n \end{aligned} \]

这里已经和\(m\)没有关系了,既然如此考虑取\(B_n = \sum_{ k = 1 }^n b_k\),自然有:

$$ \[\begin{aligned} \int_0^\pi | f | \mathrm{ d x } & = \sum_{ n = 1 }^\infty \int_{ \frac{ \pi }{ n + 1 } }^{ \frac{ \pi }{ n } } | f | \mathrm{ d } x \\ & \leq \sum_{ n = 1 }^\infty \int_{ \frac{ \pi }{ n + 1 } }^{ \frac{ \pi }{ n } } ( B_n + ( n + 1 ) b_n ) \mathrm{ d } x \\ & = \sum_{ n = 1 }^\infty \frac{ \pi }{ n ( n + 1 ) } ( B_n + ( n + 1 ) b_n ) \\ \end{aligned}\]

$$

此时只需检验\(\sum \frac{ B_n }{ n ( n + 1 ) }\)收敛就行了对吧.这个比较平凡:

\[ \begin{aligned} \sum_{ n = 1 }^\infty \frac{ B_n }{ n ( n + 1 ) } & = \sum_{ n = 1 }^\infty \frac{ 1 }{ n ( n + 1 ) } \sum_{ k = 1 } b_k \\ & = \sum_{ k = 1 }^\infty b_k \sum_{ n = k }^\infty \frac{ 1 }{ n ( n + 1 ) } \\ & = \sum_{ k = 1 }^\infty \frac{ b_k }{ k } \\ & < \infty \end{aligned} \]

这就搞定了.

逐项积分

\(f\)绝对可积,其傅里叶级数为\(\frac{ a_0 }{ 2 } + \sum a_n \cos ( nx ) + b_n \sin ( nx )\),考虑取\(F ( x ) = \int_0^x ( f ( t ) - \frac{ a_0 }{ 2 } ) \mathrm{ d } t\),容易检查\(F ( x )\)是有界变差的,原因是\(\sum | F ( x_i ) - F ( x_{ i - 1 } ) | = \sum | \int_{ x_{ i - 1 } }^{ x_i } f ( t ) \mathrm{ d } t | \leq \int | f |\).

既然如此,它就会被它的傅里叶级数一致逼近,不妨记作\(F ( x ) = \frac{ A_0 }{ 2 } + \sum_{ n = 1 }^\infty A_n \cos ( nx ) + B_n \sin ( nx )\).

接下来考虑把这些系数都求出来,先令\(x = 0\)求出\(\frac{ A_0 }{ 2 } + \sum_{ n = 1 }^\infty A_n = 0\),当\(n \geq 1\)的时候,留神到:

\[ \begin{aligned} A_n & = \frac{ 1 }{ \pi } \int_{ - \pi }^\pi F ( x ) \cos ( nx ) \mathrm{ d } x \\ & = \frac{ 1 }{ \pi } F ( x ) \frac{ \sin ( nx ) }{ n } |_{ - \pi }^\pi - \frac{ 1 }{ n \pi } \int_{ - \pi }^\pi f ( x ) \sin ( nx ) \mathrm{ d } x \\ & = - \frac{ b_n }{ n } \end{aligned} \]

注意这里用的分部积分是广义分部积分,我们曾经搞过.

同理\(B_n = \frac{ a_n }{ n }\),补一个\(x\)的傅里叶级数进去,于是我们见到:

\[ \int_0^x f ( t ) \mathrm{ d } t = \frac{ a_0 }{ 2 } x + \sum_{ n = 1 }^\infty a_n \int_0^x \cos ( nt ) \mathrm{ d } t + b_n \int_0^x \sin ( nt ) \mathrm{ d } t \]

也就是一个函数和傅里叶级数逐项积分后总相等.

逐项微分

\(f\)可导而且是\(2 \pi\)周期的,并且\(\int_{ - \pi }^\pi | f ' | \mathrm{ d } x < \infty\),那由逐项积分那里的结论,自然有\(a_0 ( f ' ) = 0 , a_n ( f ' ) = nb_n ( f ) , b_n ( f ' ) = - na_n ( f )\),也就是当:\(f = \frac{ a_0 }{ 2 } + \sum a_n \cos ( nx ) + b_n \sin ( nx )\),则\(f ' \sim \sum - na_n \sin ( nx ) + nb_n \cos ( nx )\).

收敛速度的估计

最后来分析一下它的收敛能力,不妨假设\(f\)\(2 \pi\)周期逐段可导函数,并且\(\int_{ - \pi }^{ \pi } ( f ' )^2 \mathrm{ d } x < \infty\),则\(\max | f ( x ) - S_n ( x ) | = o ( \frac{ 1 }{ \sqrt{ n } } )\),原因是由Parseval等式,有:

\[ \frac{ 1 }{ \pi } \int_{ - \pi }^\pi ( f ' )^2 \mathrm{ d } x = \frac{ a_0 ( f ' )^2 }{ 2 } + \sum_{ n = 1 }^\infty ( a_n ( f ' )^2 + b_n ( f ' )^2 ) \]

也就是后面这个级数收敛对吧,那柯西准则给出:

\[ \sum_{ k = n + 1 }^\infty ( a_k ( f ' )^2 + b_k ( f ' )^2 ) = o ( 1 ) \]

现在来看误差项:

\[ \begin{aligned} | f ( x ) - S_n ( x ) | & \leq | \sum_{ k = n + 1 }^\infty a_k ( f ) \cos ( kx ) + b_k ( f ) \sin ( kx ) | \\ & \leq \sum_{ k = n + 1 }^\infty | a_k ( f ) | + | b_k ( f ) | \\ & = \sum_{ k = n + 1 }^\infty \frac{ | a_k ( f ' ) | + | b_k ( f ' ) | }{ k } \\ & \leq \sqrt{ \sum_{ k = n + 1 }^\infty | a_k ( f ' )^2 | + | b_k ( f ' )^2 | } \sqrt{ \sum_{ k = n + 1 }^\infty \frac{ 1 }{ k^2 } } \\ & = o ( 1 ) \frac{ 1 }{ \sqrt{ n } } \end{aligned} \]

复数形式

考虑:

\[ \begin{aligned} f ( x ) & \sim \frac{ a_0 }{ 2 } + \sum a_n \cos ( nx ) + b_n \sin ( nx ) \\ & = \frac{ a_0 }{ 2 } + \sum a_n \frac{ e^{ inx } + e^{ - inx } }{ 2 } + \sum b_n \frac{ e^{ inx } - e^{ - inx } }{ 2 i } \\ & = \sum_{ n = - \infty }^\infty c_n e^{ inx } \end{aligned} \]

此时有\(c_n = \frac{ 1 }{ 2 \pi } \int_{ - \pi }^\pi f ( x ) e^{ - inx } \mathrm{ d } x\).

三角级数的唯一性问题

接下来来解决点看上去很平凡的问题,如果:

\[ \frac{ a_0 }{ 2 } + \sum_{ n = 1 }^\infty a_n \cos ( nx ) + b_n \sin ( nx ) = \frac{ \tilde{ a_0 } }{ 2 } + \sum_{ n = 1 }^\infty \tilde{ a_n } \cos ( nx ) + \tilde{ b_n } \sin ( nx ) \]

而且左右两端都收敛到某个函数.能否导出\(a_n = \tilde{ a_n } , b_n = \tilde{ b_n }\).注意这里并不能两遍乘个\(\cos ( nx )\)然后积分,因为未必可积.

我们下面可以证明,如果上面这种相等除了至多可数个点以外都成立,那就是同一个三角级数.当然只需要证明当:

\[ \frac{ a_0 }{ 2 } + \sum_{ n = 1 }^\infty a_n \cos ( nx ) + b_n \sin ( nx ) = 0 \]

至多除了一个可数集合\(E = \{ x_1 , x_2 , \cdots \}\)以外成立的时候有\(a_n = b_n = 0\)即可.

先来证明一个引理:此时\(\lim_{ n \to \infty } a_n = \lim_{ n \to \infty } b_n = 0\).这还并不显然,因为这个三角级数并不一定是傅里叶级数.

首先级数收敛,通项趋近于\(0\),首先设\(\rho_n = \sqrt{ a_n^2 + b_n^2 }\),则\(a_n \cos ( nx ) + b_n \sin ( nx ) = \rho_n \sin ( nx + \varphi_n )\).现在只需要证明\(\lim_{ n \to \infty } \rho_n = 0\).

反证,如果没有上述结论,则总存在一个无穷子列\(\{ \rho_{ n_k } \}_k\)大于某一个正常数\(c\),设其指标集合为\(F = \{ n_1 < n_2 < \cdots \}\).

现在考虑\([ 0 , 2 \pi ]\)上,找一个区间\(I_1 = [ l_1 , r_1 ]\)使得其不含有\(x_1\),由于\(F\)通项肯定趋近无穷大,总能找到一个\(m_1 \in F\),使得\(| [ m_1 l_1 , m_1 r_1 ] | = m_1 | I_1 | > 2 \pi\).既然它的区间长度足够大,那其中总有一个子区间\(J_1 \subseteq I_1\),使得\(\sin ( m_1 x + \varphi_{ m_1 } ) > \frac{ 1 }{ 2 }\)\(J_1\)上成立.那我当然可以再找一个子区间\(I_2 \subseteq J_1\)使得\(I_2\)中不含有\(x_2\),重复以上操作,这就是一个闭区间套.最后套出来了一个点\(w \notin E\),此时\(\sin ( m_k w + \varphi_{ m_k } ) > \frac{ 1 }{ 2 }\),自然有\(\varphi_{ m_k } \sin ( m_k w + \varphi_{ m_k } ) > \frac{ c }{ 2 }\),这立刻导出矛盾.

再来一个引理:假设\(F ( x ) \in C ( a , b )\),可数集合\(E \subseteq ( a , b )\).定义其二阶差分\(\Delta_h^2 F ( x ) = F ( x + 2 h ) + F ( x - 2 h ) - 2 F ( x )\).已知其广义二阶导数\(\delta^2 F = \varlimsup_{ h \to + 0 } \frac{ \Delta_h^2 F ( x ) }{ 4 h^2 } \geq 0 , \forall x \notin E\),而\(\varlimsup_{ h \to + 0 } \frac{ \Delta_h^2 F ( x ) }{ h } \geq 0 , \forall x \in E\).则结论是\(F ( x )\)是一个下凸函数.

这个结论的自然之处在于如果\(F ' ' ( x )\)存在,那\(F ( x + 2 h ) = F ( x ) + F ' ( x ) 2 h + \frac{ F ' ' ( x ) }{ 2 } ( 2 h )^2 + o ( h^2 )\)并且\(F ( x - 2 h ) = F ( x ) - F ' ( x ) 2 h + \frac{ F ' ' ( x ) }{ 2 } ( 2 h )^2 + o ( h^2 )\),所以上面那个\(\delta^2 F = F ' ' ( x )\),那如果它非负当然是下凸函数.

那如果\(F ' ' ( x )\)不存在呢?反证,假设\(F\)不凸,则一定存在一个子区间\(( \alpha , \beta ) \subseteq ( a , b )\),使得在这个区间上,\(F ( x )\)函数在\(( \alpha , \beta )\)这条弦之上(因为连续性,至少有三个点是违背三弦定理的,作一条弦后,函数有一些部分在上面有一些部分在下面,取某个恒在上面的子区间即可).

总之,我们找到了一个子区间\(( \alpha , \beta )\)使得:

\[ F ( x ) - \left ( \frac{ F ( \beta ) - F ( \alpha ) }{ \beta - \alpha } ( x - \alpha ) + F ( \alpha ) \right ) > 0 \]

接下来要推矛盾,分成两种情况:

第一种情况是\(\delta^2 F > 0\)的情形,考虑辅助函数\(G_\mu ( x ) = F ( x ) - ( \mu ( x - a ) + F ( \alpha ) )\),其中\(\mu = \frac{ F ( \beta ) - F ( \alpha ) }{ \beta - \alpha } + \epsilon\),也就是比原本那条弦的斜率稍微大了一点点,那只要\(\epsilon\)落在某个足够小的区间内,\(G_\mu ( x )\)仍然有大于零的部分.直接取\(G_\mu ( x_0 ( \mu ) ) = \max_{ [ \alpha , \beta ] } G_\mu\),此时观察到\(G_\mu\)\(F\)只差一个一次函数,它们作二阶差分后就相等了,然而,由于\(G_\mu ( x_0 ( \mu ) )\)取的是最大值,当\(h\)取足够小的时候,它的二阶差分一定小于等于\(0\),因此能导出\(x_0 ( \mu ) \in E\),并且同理能导出\(\varlimsup_{ h \to + 0 } \frac{ \Delta_h^2 F ( x_0 ( \mu ) ) }{ h } = 0\).从而导出:

\[ \varlimsup_{ h \to + 0 } \frac{ G_\mu ( x_0 ( \mu ) - 2 h ) - G_\mu ( x_0 ( \mu ) ) }{ h } = \varlimsup_{ h \to + 0 } \frac{ G_\mu ( x_0 ( \mu ) + 2 h ) - G_\mu ( x_0 ( \mu ) ) }{ h } = 0 \]

欸,你怎么变一阶差分了,那我的一次函数不就有用了么,必定有:

\[ \varlimsup_{ h \to + 0 } \frac{ F ( x_0 ( \mu ) - 2 h ) - F ( x_0 ( \mu ) ) }{ h } = 2 \mu \]

所以\(\mu \to x_0 ( \mu )\)为单射,这与\(x_0 ( \mu ) \in E\)矛盾.

那么等于\(0\)的情况呼之欲出了对吧,此时任意的\(n\)都可以做到\(F ( x ) + \frac{ x^2 }{ n }\)是凸的,随便搞个反证法就可以知道\(F ( x )\)必定是凸的.

最后来设\(F ( x ) = \frac{ a_0 }{ 4 } x^2 - \sum_{ n = 1 }^\infty \frac{ a_n \cos ( nx ) + b_n \sin ( nx ) }{ n^2 }\),由于\(a_n \to 0 , b_n \to 0\),所以这玩意用大M判别法知道绝对一致收敛,那就是一个连续函数.

此时计算:

$$ \[\begin{aligned} \Delta_h^2 F ( x ) & = \frac{ a_0 }{ 4 } ( ( x + 2 h )^2 + ( x - 2 h )^2 - 2 x^2 ) \\ & - \sum_{ n = 1 }^\infty \frac{ 1 }{ n^2 } ( a_n ( \cos ( n ( x + 2 h ) ) + \cos ( n ( x - 2 h ) ) - 2 \cos ( nx ) ) \\ & + b_n ( \sin ( n ( x + 2 h ) ) + \sin ( n ( x - 2 h ) ) - 2 \sin ( nx ) ) ) \\ \end{aligned}\]

$$

而此时对后面的部分用和差化积,留神到:

\[ \begin{aligned} & \cos ( n ( x + 2 h ) ) + \cos ( n ( x - 2 h ) ) - 2 \cos ( nx ) \\ = & 2 \cos ( nx ) \cos ( 2 nh ) - 2 \cos ( nx ) \\ = & 2 \cos ( nx ) ( \cos ( 2 nh ) - 1 ) \\ = & - 4 \cos ( nx ) \sin^2 ( nh ) \end{aligned} \]

于是:

\[ \frac{ \Delta_h^2 F ( x ) }{ 4 h^2 } = \frac{ a_0 }{ 2 } + \sum_{ n = 1 }^\infty ( a_n \cos ( nx ) + b_n \sin ( nx ) ) ( \frac{ \sin ( nh ) }{ nh } )^2 \]

乍一看已经要完事了对吧!很可惜并没有,因为这个\(n \to \infty\)了,我们还需要证明下面这个引理:当\(\sum_{ n = 1 }^\infty a_n = s\)收敛的时候,那么\(\lim_{ h \to 0 + } \sum_{ n = 1 }^\infty a_n ( \frac{ \sin ( nh ) }{ nh } )^2 = s\).

最难过的是这里的\(a_n\)不定号,我们可能第一反应是前部分可以让\(n \to \infty\)而后半部分可以直接抛掉,可在不定号的时候这一切都难以实现了.对于不定号项的求和,我们也许唯一的武器只有Abel变换.设\(a_0 = 0 , b_n ( h ) = ( \frac{ \sin ( nh ) }{ nh } )^2 , b_0 ( h ) = 1 , S_n = \sum_{ k = 1 }^n a_k\).立刻得到:

\[ \begin{aligned} \sum_{ n = 0 }^\infty a_n b_n ( h ) & = \sum_{ n = 1 }^\infty ( S_n - S_{ n - 1 } ) b_n ( h ) \\ & = \sum_{ n = 0 }^\infty S_n ( b_n ( h ) - b_{ n + 1 } ( h ) ) \end{aligned} \]

既然\(S_n\)收敛,不妨设\(| S_n | < M\),下面来估计:

$$ \[\begin{aligned} | b_{ n + 1 } ( h ) - b_{ n } ( h ) | & = | \int_{ nh }^{ ( n + 1 ) h } ( \frac{ \sin^2 t }{ t^2 } ) ' \mathrm{ d } t | \\ & \leq \int_{ nh }^{ ( n + 1 ) h } | \frac{ 2 \sin t ( \cos t - \frac{ \sin t }{ t } ) }{ t^2 } | \mathrm{ d } t \\ \sum | b_{ n + 1 } ( h ) - b_{ n } ( h ) | & \leq \int_{ 0 }^{ + \infty } | \frac{ 2 \sin t ( \cos t - \frac{ \sin t }{ t } ) }{ t^2 } | \mathrm{ d } t \\ \end{aligned}\]

$$

盯着这个积分,发现其在\(0\)附近极限存在(泰勒展开就能看到),而在无穷处其实就是\(O ( \frac{ 1 }{ t^2 } )\),所以这个积分存在,当然有\(\sum | b_{ n + 1 } ( h ) - b_{ n } ( h ) | \leq + \infty\),其实上面的过程就是在证明这个函数是有界变差的对吧!准备工作业已就绪,不妨设\(\varphi_n = b_n ( h ) - b_{ n + 1 } ( h )\),请看:

\[ \begin{aligned} & | \sum_{ n = 0 }^\infty a_n b_n ( h ) - s | \\ = & | \sum_{ n = 0 }^\infty ( s_n \varphi_n ( h ) - s \varphi_n ( h ) ) | \\ \leq & \sum_{ n = 0 }^N | S_n - s | \cdot | \varphi_n ( h ) | + \sum_{ n = N + 1 }^\infty | S_n - s | \cdot | \varphi_n ( h ) | \end{aligned} \]

只要取定足够大的\(N\)就可以使得\(| S_n - s | \to 0\),而在此时只要让\(h \to 0\)就可以让前半部分定死的\(\varphi_n ( h ) \to 0\),于是就搞定了.

从而我们可以看到上述引理的确成立了,进一步地两个上极限都等于\(0\),所以\(F ( x )\)的确是下凸函数,然而正是因为等于\(0\),所以\(- F ( x )\)也是下凸函数,所以\(F ( x )\)既是上凸,又是下凸,那它必然是一个一次函数.那\(a_0 = 0\)就是必然的了.既然\(a_0 = 0\),\(F ( x )\)就是一个\(2 \pi\)周期函数,所以它必然是常值函数.然而一个三角级数一致收敛到一个常值函数,这个三角级数本身必然是常值函数,所以\(a_n = b_n = 0\),这就搞定了.

傅里叶级数的最佳逼近性

下面我们想证明:傅里叶级数是最佳逼近,如果一个三角级数处处收敛到了一个黎曼可积函数,则这个三角级数就是这个函数的傅里叶级数.(事实上这个结论在绝对可积时也是对的,甚至可以有有限个点不收敛到它)

不妨设\(f \in R [ - \pi , \pi ]\),有界\(m \leq f \leq M\).三角级数\(\frac{ a_0 }{ 2 } + \sum a_n \cos ( nx ) + b_n \sin ( nx )\)逐点逼近于它本身.我们上面引入的也就是\(\delta^2 F ( x_0 ) = f ( x_0 )\).

来引入一个引理:如果\(\forall x_0 \in ( a , b ) , \delta^2 F = \lim_{ h \to + 0 } \frac{ \Delta_h^2 F }{ 4 h^2 } \in [ m , M ]\),则不加极限的情况,\(\forall x_0 \in ( a + h , b - h ) , h > 0 , \frac{ \Delta_h^2 F }{ 4 h^2 } \in [ m , M ]\).

我想这应该是平凡的,方向呼之欲出:使用介值定理.不过这里是二次函数,那我们就取定\(F ( x_0 ) , F ( x_0 \pm 2 h )\)三个点,过这三个点做一个二次函数.事实上这个二次函数就是\(\varphi ( x ) = F ( x_0 ) + ( x - x_0 ) \frac{ F ( x_0 + 2 h ) - F ( x_0 - 2 h ) }{ 4 h } + \frac{ ( x - x_0 )^2 }{ 2 } \frac{ \Delta_h^2 F ( x_0 ) }{ 4 h^2 }\).取\(g ( x ) = F ( x ) - \varphi ( x )\),则\(g ( x )\)会在\(x_0 , x_0 \pm 2 h\)取值为\(0\),并且其在\(( x_0 - 2 h , x_0 + 2 h )\)上肯定有一个最大值\(x_1\)和一个最小值\(x_2\),在前者的广义二阶导数\(\leq 0\)而后者\(\geq 0\),得到:

\[ \begin{aligned} \delta^2 F ( x_1 ) - \frac{ \Delta_h^2 F ( x_0 ) }{ 4 h^2 } & \leq 0 \leq \delta^2 F ( x_2 ) - \frac{ \Delta_h^2 F ( x_0 ) }{ 4 h^2 } \\ m & \leq \frac{ \Delta_h^2 F ( x_0 ) }{ 4 h^2 } \leq M \end{aligned} \]

现在我们就知道如何做了,回忆到:

\[ \frac{ \Delta_h^2 F ( x ) }{ 4 h^2 } = \frac{ a_0 }{ 2 } + \sum_{ n = 1 }^\infty ( a_n \cos ( nx ) + b_n \sin ( nx ) ) ( \frac{ \sin ( nh ) }{ nh } )^2 \]

当我不取\(h \to 0\)的时候这个两边可是一致收敛的.那右边肯定是前边的傅里叶级数,立刻有:

$$ \[\begin{aligned} a_n ( \frac{ \sin ( nh ) }{ nh } )^2 & = \frac{ 1 }{ \pi } \int_{ - \pi }^\pi \frac{ \Delta_h^2 F ( x ) }{ 4 h^2 } \cos ( nx ) \mathrm{ d } x \\ b_n ( \frac{ \sin ( nh ) }{ nh } )^2 & = \frac{ 1 }{ \pi } \int_{ - \pi }^\pi \frac{ \Delta_h^2 F ( x ) }{ 4 h^2 } \sin ( nx ) \mathrm{ d } x \\ \end{aligned}\]

$$

那我们自然有:

$$ \[\begin{aligned} a_n & = \lim_{ h \to + 0 } a_n ( \frac{ \sin ( nh ) }{ nh } )^2 \\ & = \lim_{ h \to + 0 } \frac{ 1 }{ \pi } \int_{ - \pi }^\pi \frac{ \Delta_h^2 F ( x ) }{ 4 h^2 } \cos ( nx ) \mathrm{ d } x \\ \end{aligned}\]

$$

然而此时\(\frac{ \Delta_h^2 F ( x ) }{ 4 h^2 } \in [ m , M ]\),后面积分那个东西有界.欸,取\(h = \frac{ 1 }{ n } \to 0\)可以拿到一个一致有界的函数列,这不是我们控制收敛定理么,交换顺序!

$$ \[\begin{aligned} a_n & = \lim_{ h \to + 0 } \frac{ 1 }{ \pi } \int_{ - \pi }^\pi \frac{ \Delta_h^2 F ( x ) }{ 4 h^2 } \cos ( nx ) \mathrm{ d } x \\ & = \frac{ 1 }{ \pi } \int_{ - \pi }^\pi \lim_{ h \to + 0 } \frac{ \Delta_h^2 F ( x ) }{ 4 h^2 } \cos ( nx ) \mathrm{ d } x \\ & = \frac{ 1 }{ \pi } \int_{ - \pi }^\pi f ( x ) \cos ( nx ) \mathrm{ d } x \\ \end{aligned}\]

$$

这就证毕了.

傅里叶级数不逐点收敛到自身的连续周期函数

定义\(C ( T )\)\(2 \pi\)周期连续函数组成的线性空间.此时定义\(\Vert f - g \Vert = \sup | f - g |\),其实也就是Banach空间对吧.有了范数定义距离,有了距离就可以有开闭集的概念.Baire纲定理告诉我们此时可数个开稠集的交集仍然是稠密集(不过未必是开集).

现在考虑\(f ( x )\)的傅里叶级数,取\(S_n ( f , x ) = \frac{ a_0 }{ 2 } + \sum_{ k = 1 }^n a_k \cos ( kx ) + b_k \sin ( kx )\),迪利克雷核的结论告诉我们\(S_n ( f , x ) = \frac{ 1 }{ \pi } \int_{ - \pi }^\pi f ( t ) D_n ( x - t ) \mathrm{ d } t\),其中\(D_n ( w ) = \frac{ \sin ( n + \frac{ 1 }{ 2 } ) w }{ 2 \sin \frac{ w }{ 2 } }\).

接下来定义\(\varphi_f ( x ) = \sup_{ n \geq 1 } | S_n ( f , x ) |\),取\(E_m ( x ) = \{ f \in C ( T ) | \varphi_f ( x ) > m \}\).下面我们来证明:\(E_m ( x )\)\(C ( T )\)的开稠子集.

是开集应该是自然的结论,因为当\(n , x\)定死的时候,\(S_n ( f , x )\)从定义看是连续地依赖于\(f\).如果\(f \in E_m ( x )\),则\(\exists n , | S_n ( f , x ) | > m\),那它周围当然有一个小邻域,使得其中的\(g\)都满足\(| S_n ( g , x ) | > m\)了,所以这肯定是开集.

接下来得证明它是稠集,定义\(g_n ( t ) = \begin{cases}1 & D_n ( t ) \geq 1 \\ - 1 & D_n ( t ) \leq - 1 \\ D_n ( t ) & \text{ otherwise }\end{cases}\).此时发现:

$$ \[\begin{aligned} & \frac{ 1 }{ \pi } \int_{ - \pi }^\pi g_n ( t ) D_n ( t ) \mathrm{ d } t \\ = & O ( 1 ) + \frac{ 1 }{ \pi } \int_{ - \pi }^\pi | D_n ( t ) | \mathrm{ d } t \\ \end{aligned}\]

$$

原因是\(| D_n ( t ) | \geq 1\)的部分二者相等,而不同的部分在有限区间上积分不会太大.

然而:

\[ \begin{aligned} & \frac{ 1 }{ \pi } \int_{ - \pi }^\pi | D_n ( t ) | \mathrm{ d } t \\ = & \frac{ 2 }{ \pi } \int_0^\pi | D_n ( t ) | \mathrm{ d } t \\ = & \frac{ 1 }{ \pi } \int_0^\pi | \frac{ \sin ( n + \frac{ 1 }{ 2 } ) t }{ 2 \sin \frac{ t }{ 2 } } | \mathrm{ d } t \\ > & \frac{ 1 }{ \pi } \int_0^\pi | \frac{ \sin ( n + \frac{ 1 }{ 2 } ) t }{ t } | \mathrm{ d } t \\ > & \frac{ 1 }{ \pi } \int_0^{ ( n + \frac{ 1 }{ 2 } ) \pi } \frac{ | \sin t | }{ t } \mathrm{ d } t \\ > & \frac{ 1 }{ \pi } \sum_{ k = 2 }^n \int_{ ( k - 1 ) \pi }^{ k \pi } \frac{ | \sin t | }{ t } \mathrm{ d } t \\ = & \sum_{ k = 2 }^n O ( 1 ) \frac{ 1 }{ k } \\ = & O ( \ln n ) \end{aligned} \]

接下来考虑取\(h_n = \frac{ g_n }{ \sqrt{ ln n } } \to 0\),则\(S_n ( h_n , x ) = O ( \sqrt{ \ln n } )\).此时设\(U_{ \epsilon } ( f ) = \{ g \in C ( T ) | \Vert f - g \Vert < \epsilon \}\),回忆到三角多项式可以一致逼近任何连续周期函数,所以存在三角多项式(有限项)\(T \in U_{ \frac{ \epsilon }{ 2 } } ( f )\).

\(r_n ( x ) = T + h_n\),由于\(h_n \to 0\),所以当\(n\)足够大的时候\(r_n ( x ) = g + h_n \in U_\epsilon ( f )\).此时\(S_n ( r_n , x ) = S_n ( T , x ) + S_n ( h_n , x )\),但是\(T\)是有限项三角多项式,所以\(S_n ( r_n , x ) = O ( 1 ) + O ( \sqrt{ \ln n } ) \to \infty\).这就搞定了,那此时\(r_n \in E_m ( x )\)而且在\(f\)的邻域里.所以这个集合是稠密的.

接下来取\(E_x = \bigcap_{ m = 1 }^\infty E_m ( x )\),容易发现\(E_x\)中的所有函数在\(x\)这一点的傅里叶级数竟然都无界,我可以干脆取\(E = \bigcap_{ x \in \mathbb{ Q } } E_x\),则这里面存在一个函数,这个函数的傅里叶级数在任意有理点处发散.

其实还可以更牛,取\(F_m ( f ) = \{ x \in \mathbb{ R } | \varphi_f ( x ) > m \}\),这显然是个开集.取\(F_f = \bigcap_{ n = 1 }^\infty F_n\),这就是可数个开集的交.而且从上面的论证可以发现\(\mathbb{ Q } \subseteq F_f\),可是这里的\(\mathbb{ Q }\)是稠密的,所以\(F_f\)必然也是稠密的,那它就是可数个开稠集的交,有结论说可数个开稠集的交一定是不可数集合.

然而,还有结论说一个周期连续函数的傅里叶级数其实几乎处处收敛于本身.

Example1

\(f ( x )\)\(2 \pi\)周期连续函数,设\(M_n = \max_{ x \in [ - \pi , \pi ] } | S_n ( x ) |\),求证:\(\lim_{ n \to \infty } \frac{ M_n }{ \ln n } = 0\).

不妨设\(M_f = \max f\),考虑\(| S_n ( x ) | \leq | S_n ( x ) - f | + M_f\),而后者是个死数,除以\(\ln n\)后当然趋近于\(0\).

现在只需要看前者,然而:

\[ \begin{aligned} S_n ( x ) - f & = \frac{ 1 }{ \pi } \int_{ 0 }^\pi ( f ( x + t ) + f ( x - t ) - 2 f ( x ) ) D_n ( t ) \mathrm{ d } t \\ & = \frac{ 1 }{ \pi } \int_{ 0 }^\delta ( f ( x + t ) + f ( x - t ) - 2 f ( x ) ) D_n ( t ) \mathrm{ d } t \end{aligned} \]

而回忆到\(\int_0^\pi | D_n ( t ) | = O ( \ln n )\),由一致连续性前半部分显然可以决定一个\(\delta\)是前者\(< \epsilon\),这就搞定了.

0%