ICode9

精准搜索请尝试: 精确搜索
首页 > 其他分享> 文章详细

数学杂谈 #17

2022-05-02 19:33:32  阅读:231  来源: 互联网

标签:AC 17 cdot DFT FFT 杂谈 overline 数学 operatorname


FFT 的若干优化

针对 FFT 的计算优化的出发点一般都是充分利用虚部空间。因为没有优化的计算,通常而言仅仅是实部给出了最终结果;而如果我们可以用好虚部,理论上我们至多可以减少一半左右的 FFT 计算——从“一个一次”到“两个一次”。

「三次」变「两次」

这个优化常常用在单纯的多项式乘法当中。

假如我们要计算 \(F(x)G(x)\) 这样的卷积,普通的做法是用 FFT 计算 \(\operatorname{DFT}(F)\) 和 \(\operatorname{DFT}(G)\),然后再计算 \(\operatorname{IDFT}(\operatorname{DFT}(F)\cdot \operatorname{DFT}(G))\) 就得到了结果,这需要三次 FFT。

贯彻我们之前的思想,我们尝试将 \(\operatorname{DFT}(F)\) 和 \(\operatorname{DFT}(G)\) 塞进一次 FFT 里面。这还是比较简单的,只需要构造:

\[H(x)=F(x)+iG(x) \]

为了得到 \(F(x)G(x)\),我们不难想到计算 \(H^2(x)\):

\[H(x)=F^2(x)-G^2(x)+i(2F(x)G(x)) \]

因此提取 \(H^2(x)\) 的虚部就可以得到我们想要的结果辣!并且是两次 FFT!

需要注意的是,这个对于精度的要求比较非常高,所以如果系数稍微大一点,最好还是少用这个优化。

没办法,FFT 就这个毛病

「七次」变「四次」

这个优化常常用在拆系数 FFT,也就是 MTT 中。

考察一个比较简单的情况:我们只拆了一次系数,只需要做一次乘法,也就是需要求:

\[(T\cdot A(x)+B(x))(T\cdot C(x)+D(x)) \]

其中 \(T\) 是一个常数,姑且认为它比较小。

那么,我们直接拆开,也就是要求:

\[T^2\cdot A(x)C(x)+T(A(x)D(x)+B(x)C(x))+B(x)D(x) \]

粗算一下,哇噻,居然要用七次 FFT 耶!完蛋了!

还是沿用之前的想法,我们把两块多项式塞到一个里面去,诸如:

\[P(x)=A(x)+iB(x)\\ Q(x)=C(x)+iD(x) \]

仍然可以尝试乘法:

\[PQ=AC-BD+i(AD+BC) \]

我们最终的目的应该是尝试求出 \(AC,BD,AD+BC\),也就是至少需要三个方程。然而,这里只提供了两个。

注意到,每个方程为两个变量相加减的形式。如果能再添加几个同样形式的方程,我们很有可能可以直接加减算出来结果。调整正负号可以直接找共轭:

\[P\overline Q=AC+BD+i(-AD+BC) \]

这样我们甚至可以直接解出 4 个变量,还只需要用到五次 FFT,想来应该会快不少。

但是还不够!\(Q\) 和 \(\overline Q\) 的变化很少,我们能不能直接通过 \(\operatorname{DFT}(Q)\) 来求出 \(\operatorname{DFT}(\overline Q)\) 呢?

虽然不能只计算,但是 FFT 的过程已经算好了 \(\omega_n^k\) 和 \(\overline{\omega_n^k}\) 两处的点值。我们尝试通过这个信息来给出 \(\operatorname{DFT}(\overline Q)\)。

考察两个复数 \(z_1,z_2\) 的运算:

  • \(\overline{\overline{z_1}}=z_1\)。

  • \(\overline{z_1+z_2}=\overline{z_1}+\overline{z_2}\)。

  • \(\overline{z_1\cdot z_2}=\overline{z_1}\cdot \overline{z_2}\)。

因此,可以得出结论 \(Q(\omega_n^k)=\overline{Q(\overline{\omega_n^k})}\)。这样就可以直接优化到四次 FFT!


另一种优化方法是,通过 \(\operatorname{DFT}(P),\operatorname{DFT}(Q)\) 直接得出 \(\operatorname{DFT}(A),\operatorname{DFT}(B),\operatorname{DFT}(C),\operatorname{DFT}(D)\),然后算出各项之后再 IDFT 回去。

这种方法的另一个关键在于,如何快速 IDFT。类似于 DFT 的加速方式,我们同样将两个需要 IDFT 的系数向量“塞到”同一个复数里面。比如,可以令:

\[\operatorname{DFT}(F)=\operatorname{DFT}(AC)+i\operatorname{DFT}(AD) \]

这样就有 \(F=AC+iAD\)。注意到 \(AC,AD\) 虚部为 0,因此可以分别提取两部得到结果。

小结

所以,优化 FFT 的关键在于:

  1. 将两个数压缩到同一个复数里面,提高空间利用率。

  2. 用好共轭等关系,生成尽可能多的方程,从而解出需要的变量。

标签:AC,17,cdot,DFT,FFT,杂谈,overline,数学,operatorname
来源: https://www.cnblogs.com/crashed/p/16216473.html

本站声明: 1. iCode9 技术分享网(下文简称本站)提供的所有内容,仅供技术学习、探讨和分享;
2. 关于本站的所有留言、评论、转载及引用,纯属内容发起人的个人观点,与本站观点和立场无关;
3. 关于本站的所有言论和文字,纯属内容发起人的个人观点,与本站观点和立场无关;
4. 本站文章均是网友提供,不完全保证技术分享内容的完整性、准确性、时效性、风险性和版权归属;如您发现该文章侵犯了您的权益,可联系我们第一时间进行删除;
5. 本站为非盈利性的个人网站,所有内容不会用来进行牟利,也不会利用任何形式的广告来间接获益,纯粹是为了广大技术爱好者提供技术内容和技术思想的分享性交流网站。

专注分享技术,共同学习,共同进步。侵权联系[81616952@qq.com]

Copyright (C)ICode9.com, All Rights Reserved.

ICode9版权所有