OI 数论中的上界估计与时间复杂度证明

这篇具有很好参考价值的文章主要介绍了OI 数论中的上界估计与时间复杂度证明。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

预备

0.1 渐进符号

其实不少高等数学 / 数学分析教材在讲解无穷小的比较时已经相当严谨地介绍过大 O、小 O 记号,然而各种历史习惯记法的符号滥用(abuse of notation) 直到现在都让笔者头疼. These notations seem to be innocent, but can be catastrophic without careful manipulation. For example,

  • n=O(n2)n2=O(n2)n=n2

    Knuth 在《具体数学》里举出的例子. “=” 隐含的对称性使其在 g(x)=O(f(x)) 中格格不入. 事实上,将 O(f(x)) 看作“阶不高于 f(x) 的所有函数的集合”是比“某个阶不高于 f(x) 的函数”更严谨的理解. 因此,本文将使用 f(x)O(g(x)) (有时也记为 O(f(x))O(g(x)))的集合论符号代替传统的 f(x)=O(g(x)) 记法.

  • n2sinnO(n2)i=1ni2sinii=1nO(i2)O(i=1ni2)O(n3) 或更一般的, g(x)O(f(x))P(n,i)g(i)P(n,i)O(f(i))O(P(n,i)f(i))

    没看出有啥问题,对吧?笔者在写作此文时犯了同样的错误. 请注意,大 O 记号的作用对象是函数,f(i) 是什么?它只是个函数值,是确定的数——这是因为 i 也是求和枚举中确定的数,而不是 n 这种真正代表变元的记号. 所以 O(f(i)) 是什么?它什么也不是.

    这种错误的出现是在所难免的,我们太习惯用 xx3+5x2+x 这种变元都不明确的记号来表示函数了. 写成 f(x) 也不严谨,因为只有 f 才应代表函数本身,f(x) 只能是函数值. 这样我们就可以放心地写下 O(f),不用担心把变元与确定值弄混了.

    然而大家还是喜欢写 O(n2)O(en2),而不是奇怪的 O(id2)O(expid2). 所以,我们大概只能沿用这种不太严谨的记号,并时刻提醒自己加倍小心了. (形如 xex2λ 风格“匿名函数”记号可能更好?)

    但上述命题从结论上是正确的. 正确的推导过程应为 P(n,i)g(i)P(n,i)Cf(i)CP(n,i)f(i)O(P(n,i)f(i)) 

    第一步是直接由大 O 记号的定义得到的结果.

Wikipedia 中有一张详尽的表格介绍了各种渐进符号的定义,OI Wiki 上也有极好的讲解,尚不熟练的读者可以参考. 有兴趣仔细研究的读者可以参考《具体数学》第九章、Wikipedia 及其 reference(个人推荐 Knuth 关于 OΩΘ 的短文). 本文除用 “” 和“”替代 “=” 外,完全使用 Knuth 提议的记号体系.

0.2 调和数 H(n) / 调和级数

调和级数的部分和 H(n) 定义为 H(n)=i=1n1i 通过一些与 e 有关的数列放缩可以证明 limn(H(n)logn)=c,其中 c0.577 是 Euler 常数. 因此 nH(n)nlognΘ(logn).

0.3 自然数等幂和 Pp(n) / p - 级数

p - 级数可视为调和级数的推广. 其部分和定义为 Pp(n)=i=1nip

p - 级数具有如下性质:

  • p>1 时,p - 级数收敛;

  • p=1 时,p - 级数是调和级数;

  • <p<1 时,我们指出 Pp(n)11pn1pΘ(n1p)

<p<1p - 级数的渐进估计可以从连续幂函数积分的角度理解. 证明这渐进性,离散情况下,可对 np 差分后前缀和 + 二项式定理得到高次项系数,或可用离散微积分理论得到精确表示(参见《具体数学》);连续情况下,Lagrange 中值定理应为较简单的估计方法. 这里从略. 总之,我们得到: Pp(n){Θ(n1p)p<1Θ(nlogn)p=1Θ(1)p>1

1 约数函数 σz(n)

约数函数(Divisor Function,也可称为除数函数、因数函数)是与 n 的因子有关的一类函数,定义如下:

Definition 1 (约数函数) σz(n)=dndz

z=0 时,σ0(n) 被称为约数个数函数(number-of-divisors function),常被记为 d(n)τ(n). 当 z=1 时,σ1(n) 被称为约数和函数(sum-of-divisors function),常直接记为 σ(n).

Example 1 估计 σ0(n) 的渐进上界.

也就是估计 n 的因子的数量. 一个广为人知的上界是 2n,因为 n 的所有小于 n 的因子 d 均与另一因子 nd 一一对应.

事实上进一步可以证明 σ0(n)o(nϵ)ϵ>0,虽然这在 OI 中并不实用.

Example 2 估计 σ0^(n)=i=1nσ0(i) 的渐进上界.

即估计 1n 中所有数因子个数的和. 这是一个形式上鲜为人知但其应用广为人知的例子. 变换求和顺序,容易得到

σ0^(n)=i=1nσ0(i)=i=1ndi1=d=1nndd=1nnd=nH(n)O(nlogn)

显然,这比 O(nn) 的平凡估计好上不少. 本例的思路不仅是埃氏筛(Sieve of Eratosthenes)的理论基础,也在杜教筛、快速 Mobius 变换、gcd 卷积等处出现.

进一步利用此技巧和 p - 级数的估计,我们甚至能在仔细研究 σz(n) 前就得到其前缀和的渐进估计:

Example 3 估计 σz^(n)=i=1nσz(i) 的渐进上界.

σz^(n)=i=1nσz(i)=i=1ndidz=d=1ndzndnd=1ndz1=nP1z(n){O(nz+1)z>0O(nlogn)z=0O(n)z<0

遗憾的是,对此前缀和做差分并不能得到 σz(n) 的优秀估计.

现在引入一个重要放缩技巧,其在后续估计中屡试不爽.

Proposition 1 dnf(d)i=1nf(ni)

显然,右式比左式多算了 in 的项,因此命题是正确的. 但我们还可以做得更好:

Proposition 2 dnf(d)i=1nf(i)+f(ni)

n 分治. 我们其实已经在 Example 1 估计 σ0(n) 时用过此技巧了.

Example 4 估计 σ1(n) 的渐进上界.

用 Proposition 1: σ1(n)=dndi=1nninH(n)O(nlogn)

可以证明用 Proposition 2 不会得到更优的结果.

我们发现了一个有趣的事实:σ1(n)σ0^(n) 的渐进上界均为 O(nlogn).

Example 5 估计 σz(n) 的渐进上界.

用 Proposition 2 和 p - 级数的性质:

σz(n)=dndzi=1niz+niz{2i=1nniz2nzi=1niz=2nzPz(n)z02i=1niz=2Pz(n)z<0{2nzO(1)z>12nO(logn)z=12nzO(n1z2)0z<12O(n1+z2)1<z<02O(logn)z=12O(1)z<1={O(nz)z>1O(nlogn)z=1O(n1+z2)1<z<1O(logn)z=1O(1)z<1

我们得到了一个相当优秀的渐进上界. 值得关注的是:

  • z=0 时,σ0(n)O(n12). 这与 Example 1 的结果一致.
  • z=12 时,σ12(n)O(n34),即 dndO(n34). 洛谷 P4980 Polya 定理模板题的一种比较 trivial 的解法的时间复杂度证明就来源于此. 我们之后还会在整除分块与杜教筛中见到它.

另外,如果只使用 Proposition 1 ,1<z<1 部分的渐进上界将只能估计至 O(n). 因此 Proposition 2 是更为优越的.

约数函数更复杂的上限与渐进估计可参考 Wikipedia.

2 整除分块

也被称为数论分块. 求 i=1nf(i)g(ni) 我们按 d=ni 分块求和: dg(d)ni=df(i) 可以证明,对一指定的 d,满足 d=nii 取遍一连续区间,故若 f 的前缀和能 O(1) 求出,块数量 #{ni}i=1n 即该算法的时间复杂度. 注意到当 in 时,ni 最多只有 n 种取值,而 in 时,1nin 表明其也最多只有 n 种取值. 因此整除分块的时间复杂度 T1(n)=#{ni}i=1n2nO(n)

方便起见,后文记 D(n)={ni}i=1n.

2.1 整除分块嵌套

将 Proposition 2 加强,我们有如下通用放缩:

Proposition 3 dnf(d)dD(n)f(d)i=1nf(i)+f(ni)

LHS 成立的关键在于 {d:dn}D(n);而 RHS 的本质就是上述对整除分块块数量上界的估计.

注意到 Proposition 2 是 Example 5 证明的核心,而 Proposition 3 是 Proposition 2 的加强版,故仿造 Example 5 的证明,我们有

Example 6 Sz(n)=dD(n)dz 则前述 Example 5 中 σz(n) 的上界与渐进上界也同样适用于 Sz(n).

现在可以对嵌套整除分块 i=1nf(i)j=1nig(j)h(nij) 的时间复杂度 T2 做出估计了. 对 Example 6 取 z=12,立刻有 T2(n)=dD(n)T1(d)2dD(n)d=2S12(n)4nP12(n)O(n34)

我们还可以进一步归纳. 假定 m0,zm:0zm<1,Tm(n)=O(nzm),我们有

Tm+1(n)=dD(n)Tm(d)CdD(n)nzm=CSzm(n)O(n1+zm2)

因此 zm+1=1+zm2. 边界条件 z0=0,数列递推求得 zm=12m,检验满足条件. 因此 m 重嵌套整除分块的时间复杂度 Tm(n)O(n12m)

3 杜教筛

杜教筛可以以低于线性的时间复杂度求解某些数论函数的前缀和. 其思路并不复杂. 设 f 为一数论函数,我们希望快速求得其前缀和 f^(n)=i=1nf(i). 考虑数论函数 gh=gfh(n)=dng(d)f(nd) 两端做前缀和得 h^(n)=i=1nh(i)=i=1ndig(d)f(id)=d=1ng(d)i=1ndf(i)=d=1ng(d)f^(nd)=g(1)f^(n)+d=2ng(d)f^(nd) 因此 f^(n)=1g(1)(h^(n)d=2ng(d)f^(nd))

故若 gh 的前缀和可 O(1) 算得,根据上式整除分块即可递归地计算出 f 的前缀和.

下面分析算法的复杂度. 注意到 nij=nij 故单轮递归涉及到的自变量均可表示为 d=ni 的形式. 一个 f^(d) 做整除分块耗时 T1(d),若采用记忆化递归,由上节分析,算法总时间复杂度为 dD(n)T1(d)=T2(n)O(n34)

但我们还可以做得更好——考虑先用 O(K) 的时间复杂度线性筛出前 Kf(n) 并求前缀和,则递归求解时,dKf^(d) 就无需再向下递归了. 为分析此类时间复杂度,对 Proposition 3 做最后一点扩展:

Proposition 4 dnd>Kf(d)dD(n)d>Kf(d)K<inf(i)+1imin{nK,n}f(ni)

特别的,当 K>n 时,有

dnd>Kf(d)dD(n)d>Kf(d)1inKf(ni)

故用 Proposition 4 ,当 K>n 时,算法在递归部分的时间复杂度降低为

DuK(n)=dD(n)d>KT1(d)=1inKT1(ni)1inKCni=Cn1inKi12=CnP12(nK)nO((nK)12)O(nK12)

总时间复杂度 O(K)+O(nK12)

为最小化时间复杂度,取 K=n23,得到最优时间复杂度 O(n23).

这部分的时间复杂度证明主要参考了文章.

4 Challenge

Example 7 1n 间的无平方因子数计数. n1018.

参见蓝桥杯 2023 省赛 A 组 J 题《翻转硬币》或《完全平方数》.

我们指出,无平方因子数有如下计数公式 f(n)=i=1nμ2(i)=i=1nμ(i)ni2

朴素实现复杂度为 O(n),考虑对 ni2 开发一种新的整除分块算法. 现在问题有三. 一是估计 #D2(n)=#{ni2}i=1n 这并不困难,按 in13in13 讨论即知其上界为 O(n13).

二是实现方案. 这里也直接给出:

ll sqrtN=sqrt(N);
ll ans=0;
for(ll l=1,r,d;l<=sqrtN;l=r+1){
    d=N/(l*l),r=sqrt(N/d);
    ans+=(S_mu(r)-S_mu(l-1))*d;
}

最后是算法时间复杂度分析. 普通的 ni 整除分块不会因杜教筛增加时间复杂度,但 ni2 则需要额外的讨论. 注意到该整除分块枚举中,需做杜教筛的数的集合为 {(nd)12}dD2(n) 同样类似 Proposition 3 ,我们有

Proposition 5 d2nf(nd2)dD2(n)f(d)i=1n13f(i)+f(ni2)

因此算法递归部分时间复杂度可估计为 dD2(n)DuK((nd)12)dD2(n)C(nd)12K12CK12(i=1n13(nni2)12+i=1n13(ni)12)=CK12(i=1n13i+n12i=1n13i12)K12(O(n23)+n12O(n16))O(n23K12) 总时间复杂度为 O(K)+O(n23K12)K=n49,得到最优时间复杂度 O(n49). 代入 n=1018,量级约为 108.

这估计并不算优秀. 传言存在 O(n25) 的估计,猜测大概优化了 {ni}i=1n{(nd)12}dD2(n) 的重叠部分。笔者尚未找出其推导方式.文章来源地址https://www.toymoban.com/news/detail-417815.html

References

1. Abuse of notation - wikipedia. (n.d.). https://en.wikipedia.org/wiki/Abuse_of_notation#Function_notation.
2. Graham, R. L., Knuth, D. E., & Patashnik, O. (1994). Concrete mathematics: A foundation for computer science (second, pp. 443–449). Addison-Wesley.
3. Big o notation - wikipedia # family of bachmann–landau notations. (n.d.). https://en.wikipedia.org/wiki/Big_O_notation#Family_of_Bachmann%E2%80%93Landau_notations.
4. 复杂度 - OI wiki. (n.d.). https://oi-wiki.org/basic/complexity/#%E6%B8%90%E8%BF%9B%E7%AC%A6%E5%8F%B7%E7%9A%84%E5%AE%9A%E4%B9%89.
5. Knuth, D. E. (1976). Big omicron and big omega and big theta. SIGACT News, 8(2), 18–24. https://doi.org/10.1145/1008328.1008329
6. Graham, R. L., Knuth, D. E., & Patashnik, O. (1994). Concrete mathematics: A foundation for computer science (second, pp. 47–56). Addison-Wesley.
7. Divisor function - wikipedia # growth_rate. (n.d.). https://en.wikipedia.org/wiki/Divisor_function#Growth_rate.
8. sun123zxy. (2020). sun123zxy’s blog - 原创OI题目 GCD卷积 problem and solution. https://blog.sun123zxy.top/posts/20201206-gcdconv/.
9. P4980 【模板】pólya 定理 - 洛谷 | 计算机科学教育新生态. (n.d.). https://www.luogu.com.cn/problem/P4980.
10. sun123zxy. (2020). sun123zxy’s blog - 等价类计数:Burnside引理 & Polya定理. http://blog.sun123zxy.top/posts/20200321-burnside/#s-4.3.
11. Ander. (2022). 杜教筛. https://zhuanlan.zhihu.com/p/521699400.
12. P9238 [蓝桥杯 2023 省 a] 翻转硬币 - 洛谷 | 计算机科学教育新生态. (n.d.). https://www.luogu.com.cn/problem/P9238.
13. P4318 完全平方数 - 洛谷 | 计算机科学教育新生态. (n.d.). https://www.luogu.com.cn/problem/P4318.

到了这里,关于OI 数论中的上界估计与时间复杂度证明的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • 数据结构 — 时间复杂度、空间复杂度

    数据结构_空间复杂度_时间复杂度讲解_常见复杂度对比 本文介绍数据结构中的时间复杂度和空间复杂度 ***文章末尾,博主进行了概要总结,可以直接看总结部分*** 博主博客链接:https://blog.csdn.net/m0_74014525 点点关注,后期持续更新系列文章 算法效率指的是算法在处理数据时

    2024年02月13日
    浏览(54)
  • 详解时间复杂度和空间复杂度问题

            前言:本来我并不认为时间复杂度和空间复杂的有多重要,只要日常会判断和分析算法的复杂度即可,但是,不论是在考研的数据结构与算法中,还是在日常的刷题中,我们都会见到,限制我们时间和空间复杂度的算法设计问题,这对我们要求就高了,所以,我们需

    2024年02月02日
    浏览(55)
  • 算法的时间复杂度和空间复杂度

    目录 本章重点 一 时间复杂度 2.1 时间复杂度的概念 2.2 大O的渐进表示法 2.3 常见的时间复杂度的计算 二 空间复杂度 三 常见复杂度对比 四 复杂度的oj练习 4.1 消失的数字 4.2 旋转数字 每一天都是人生限定,每一天都值得100%努力 (1)算法效率(2)时间复杂度(3)空间复

    2024年02月01日
    浏览(51)
  • 算法之【时间复杂度】与【空间复杂度】

    目录 一、算法 1、算法定义 2、两种算法的比较 3、算法的特性 4、算法设计的要求 二、算法的复杂度 1、时间复杂度 1.1定义 1.2大O的渐近表示法 1.3推导大O阶方法 1.4最坏情况与平均情况 1.5常见的时间复杂度计算示例 🍂常数阶: 🍂线性阶:  🍂对数阶: 🍂平方阶: 2、空间

    2024年02月05日
    浏览(62)
  • 什么是时间复杂度和空间复杂度

    🍕博客主页:️自信不孤单 🍬文章专栏:数据结构与算法 🍚代码仓库:破浪晓梦 🍭欢迎关注:欢迎大家点赞收藏+关注 数据结构(Data Structure)是计算机存储、组织数据的方式,指相互之间存在一种或多种特定关系的数据元素的集合。 算法(Algorithm):就是定义良好的计算过程

    2023年04月15日
    浏览(44)
  • 数据结构(时间复杂度,空间复杂度)

    算法的时间复杂度是一个数学函数,算法中的基本操作的执行次数,为算法的时间复杂度。 1.大O的表示法 2.推导大O表示法 1、用常数1取代运行时间中的所有加法常数。 2、在修改后的运行次数函数中,只保留最高阶项。 3、如果最高阶项存在且不是1,则去除与这个项目相乘的

    2024年02月07日
    浏览(51)
  • 【算法基础】时间复杂度和空间复杂度

    1 算法的评价 2 算法复杂度 2.1 时间复杂度(Time Complexity) 2.1.1 如何计算时间复杂度: 2.1.2 常见的时间复杂度类别与示例 2.2 空间复杂度 2.2.1 如何计算空间复杂度 2.2.2 常见的空间复杂度与示例 3 时间复杂度和空间复杂度计算示例 例子1:计算数组中所有元素的和。 例子2:快

    2024年02月08日
    浏览(58)
  • 算法的时间复杂度与空间复杂度

    1.算法效率 2.时间复杂度 3.空间复杂度 4.复杂度oj题目 1.算法效率 1.1 如何衡量一个算法的好坏 一辆车的好坏我们可以从价格,油耗...... 方面来衡量,但衡量一个算法的好坏我们该从哪一个方面入手呢?比如斐波那契数列: 斐波那契数列的递归实现方式非常简洁,但简洁一定

    2024年02月15日
    浏览(85)
  • 数据结构 --- 复杂度概念及计算讲解(时间复杂度,空间复杂度)

    今天没有sao话,今天认真学习 前言: 经常刷题的人都知道,我们在解决一道题时可能有多个解法,那么如何判断那个解法才是最优解呢? 我们通常从代码的两个方面进行判断:1.时间 2.空间。 –❀–❀–❀–❀–❀–❀–❀–❀–❀–❀–❀–❀–❀–❀–❀–❀–❀–❀

    2024年03月22日
    浏览(47)
  • 时间复杂度空间复杂度相关练习题

    【题目】:题目链接 思路1:排序——》qsort快排——》时间复杂度O(n*log2n)  不符合要求 思路2: (0+1+2+3+...+n)-(a[0]+a[1]+[2]+...+a[n-2]) ——》 时间复杂度O(N)空间复杂度为O(1) (0+1+2+3+...+n)直接用等差数列求和就可 思路3:数组中是几就在第几个位置写一下这个值  ——》

    2024年02月13日
    浏览(53)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包