在ChatGPT、DeepSeek等發(fā)布以來,大語言模型(LLM)成為所有人追逐的方向。而其中處理音頻進(jìn)行語音識別、音頻生成;處理圖像,理解紋理、邊緣等特征,都離不開一個(gè)重要的數(shù)學(xué)工具,就是“傅里葉變換”,甚至于沒有它,就沒有人工智能的應(yīng)用。
不僅如果此傅里葉變換在物理學(xué)、數(shù)論、組合數(shù)學(xué)、信號處理、概率、統(tǒng)計(jì)、密碼學(xué)、聲學(xué)、光學(xué)等領(lǐng)域都有著廣泛的應(yīng)用。比如圖像處理和量子力學(xué)。它用于發(fā)現(xiàn)DNA等大型生物分子的結(jié)構(gòu)、壓縮數(shù)碼照片中的圖像數(shù)據(jù)、清理古老或損壞的錄音,以及分析地震。
來源 | 《改變世界的17個(gè)方程》
作者 | [英] 伊恩?斯圖爾特
譯者 | 勞佳

牛頓的《自然哲學(xué)的數(shù)學(xué)原理》為針對自然的數(shù)學(xué)研究打開了大門,但他的同胞們過分沉迷于誰先發(fā)明了微積分的爭議,而不是去做出進(jìn)一步的發(fā)現(xiàn)。在英格蘭的精英們眼中,自己國家在世的最偉大的數(shù)學(xué)家遭受了這種可恥的指控,真是太讓人義憤填膺了(這很大程度上可能是因?yàn)槁犃顺鲇谏埔獾薮赖呐笥褌兊脑挘?/p>
與此同時(shí),歐洲大陸的同事們則將牛頓關(guān)于自然法則的觀點(diǎn)拓展到了物理學(xué)的大多數(shù)領(lǐng)域。在波動(dòng)方程之后,很快就出現(xiàn)了非常相似的引力、靜電、彈性和熱流方程。許多方程都用發(fā)明者的名字命名:拉普拉斯方程、泊松方程。
關(guān)于熱的方程則沒有用人名命名,這個(gè)方程的名字缺乏想象力,還不完全準(zhǔn)確——“熱方程”。它由約瑟夫·傅里葉(Joseph Fourier)提出,而他的思想引出一個(gè)新的數(shù)學(xué)領(lǐng)域,其影響遠(yuǎn)遠(yuǎn)超出了問題最初的來源。波動(dòng)方程本來也可能引出這一思想,類似的方法在人們的數(shù)學(xué)意識中早有浮現(xiàn),但歷史卻選擇了熱學(xué)。
這種新方法有一個(gè)前途光明的開端:1807年,傅里葉根據(jù)一個(gè)新的偏微分方程向法國科學(xué)院提交了一篇關(guān)于熱流的文章。雖然這所著名的機(jī)構(gòu)拒絕發(fā)表文章,但它鼓勵(lì)傅里葉進(jìn)一步研究他的思想并再試一次。
當(dāng)時(shí),科學(xué)院有一個(gè)年度研究獎(jiǎng)項(xiàng),頒發(fā)給他們認(rèn)為足夠有趣的任何主題。他們選擇熱學(xué)作為1812年獎(jiǎng)項(xiàng)的主題。傅里葉正式提交了他經(jīng)過修訂和擴(kuò)充的文章,并贏得了獎(jiǎng)項(xiàng)。他的熱方程是這樣的:
這里的是一根金屬桿在時(shí)刻、位置處的溫度,其中桿無限細(xì),是一個(gè)常數(shù),指熱擴(kuò)散率。所以它真的應(yīng)該被稱為溫度方程。他還給出了一個(gè)更高維的版本:
對平面或空間中的任何指定區(qū)域都成立。
熱方程與波動(dòng)方程驚人地相似,但有一處重要的區(qū)別。波動(dòng)方程用的是對時(shí)間的二階導(dǎo)數(shù),但到了熱方程里則變成了一階導(dǎo)數(shù)。這個(gè)區(qū)別可能看起來很小,但其物理意義是巨大的。
和會永遠(yuǎn)振動(dòng)的小提琴琴弦不同(根據(jù)波動(dòng)方程,假設(shè)沒有摩擦或其他阻尼),熱量并不會無限期持續(xù)存在。相反,隨著時(shí)間的推移,熱量會耗散衰減,除非有熱源可以給它補(bǔ)充熱量。
因此,一個(gè)典型的問題可能是這樣的:加熱桿的一端以保持其溫度恒定,冷卻另一端并同樣保持恒定,求出桿達(dá)到穩(wěn)定狀態(tài)后溫度如何分布。答案是以指數(shù)方式下降。
另一個(gè)典型的問題是,指定沿桿的初始溫度分布,然后問這個(gè)分布隨時(shí)間如何變化。也許開始時(shí)左半部分溫度高,右半部分溫度低。這個(gè)方程就會告訴我們高溫部分的熱量如何擴(kuò)散到低溫的部分。
傅里葉的獲獎(jiǎng)回憶錄中最有趣的部分并不是這個(gè)方程,而是他如何求解它。如果初始分布是一個(gè)三角函數(shù),例如,則方程(對那些有處理此類問題的經(jīng)驗(yàn)的人來說)很容易求解,答案是 。這和波動(dòng)方程的基模有些相似,但那個(gè)公式是。
琴弦的永恒振蕩對應(yīng)的因子被指數(shù)代替,并且指數(shù)中的負(fù)號告訴我們,整體溫度分布沿著桿以相同的速率衰減。(這里的物理差異是波會保存能量,但熱流不會。)類似地,比如對于的初始分布,解是:同樣會消失,但速度快得多。式中的是,這是一般模式的一個(gè)例子,適用于或形式的初始分布。 要求解熱方程,只要乘上就行了。
接下來,故事大體上就和波動(dòng)方程差不多了。熱方程是線性的,因此我們可以把解疊加起來。如果初始分布是
那么解就是
并且兩種模以不同的速率衰減。但像這樣的初始分布有點(diǎn)兒刻意。為了解決我在前面提到的問題,我們想要這樣一個(gè)初始分布:其中桿有一半是,另一半是。這樣的分布是不連續(xù)的,用工程術(shù)語來說叫作“方波”。但正弦和余弦曲線是連續(xù)的。因此,正弦和余弦曲線的任何疊加都不能代表方波。
當(dāng)然,任何有限的疊加都不行。但是,如果我們允許無窮多項(xiàng)呢?那么我們可以嘗試將初始分布表示為一個(gè)無窮級數(shù),形如
其中、 是合適的常數(shù)(因?yàn)?,所以沒有)?,F(xiàn)在看來有可能得到方波了(見圖9.1)。實(shí)際上,大多數(shù)系數(shù)可以設(shè)為零。只有為奇數(shù)的需要保留,并且。

圖 9.1 如何利用正弦和余弦得到方波。左:正弦波分量。右:它們的和及方波。在這里,我們展示傅里葉級數(shù)的前幾項(xiàng)。更多的項(xiàng)可以更好地近似方波
傅里葉甚至給出了一般分布的系數(shù)和的積分通項(xiàng)公式:
在經(jīng)歷了對三角函數(shù)進(jìn)行冪級數(shù)展開的周折之后,他意識到還有簡單得多的方法可以推導(dǎo)出這些公式。如果你取兩個(gè)不同的三角函數(shù),比如和,將它們相乘,并從到積分,就會得到零。哪怕它們看起來是和也是一樣。但如果兩個(gè)函數(shù)是相同的,比如都是,那積分就不是零——實(shí)際上是。
如果你設(shè)是三角級數(shù)的和,將所有數(shù)字乘以并積分,則所有項(xiàng)都會消失,除了對應(yīng)于的那一項(xiàng),即。這一項(xiàng)的積分結(jié)果是。那么除以之后就得出了項(xiàng)的傅里葉公式。所有其他系數(shù)也是如此。
雖然這個(gè)公式贏得了法國科學(xué)院的獎(jiǎng)項(xiàng),但傅里葉的回憶錄因不夠嚴(yán)謹(jǐn)而受到廣泛批評,科學(xué)院也拒絕發(fā)表。這件事極不尋常,令傅里葉非常憤慨,但科學(xué)院不為所動(dòng)。傅里葉怒火中燒。物理的直覺告訴他自己是對的,如果你把他的級數(shù)代入這個(gè)等式,它顯然是一個(gè)解。它成立了。真正的問題是,他不知不覺間揭開了一個(gè)舊傷疤。
歐拉和伯努利多年來一直就波動(dòng)方程爭論類似問題,只不過方程里不是傅里葉提出的隨時(shí)間的指數(shù)耗散,而是波幅的無限正弦振蕩。背后的數(shù)學(xué)問題是同一個(gè)。事實(shí)上,歐拉已經(jīng)針對波動(dòng)方程發(fā)表了系數(shù)的積分公式。
然而,歐拉從未說過該公式適用于不連續(xù)函數(shù),這是傅里葉的工作中最具爭議的一點(diǎn)。無論如何,小提琴琴弦的模型并不涉及不連續(xù)的初始條件——那樣的話,模型將是一根斷掉的弦,根本不會振動(dòng)。但是對于熱來說,考慮將桿的一個(gè)區(qū)域保持在一個(gè)溫度,而讓相鄰區(qū)域保持在另一個(gè)溫度是很自然的。
實(shí)際的過渡將是平滑且非常陡峭的,但是不連續(xù)的模型也是合理且更便于計(jì)算的。事實(shí)上,熱方程的解就解釋了為什么過渡會迅速變得平滑且非常陡峭,因?yàn)闊崃繒M向擴(kuò)散。因此一個(gè)歐拉不需要擔(dān)心的問題變得無可避免,而這讓傅里葉遭了殃。
數(shù)學(xué)家開始意識到無窮級數(shù)是個(gè)危險(xiǎn)的東西。它們并不總是好好表現(xiàn)為有限和。最終,這些糾結(jié)的復(fù)雜性得到了解決,但這用到了一個(gè)新的數(shù)學(xué)觀,花費(fèi)了一百年的艱苦努力。在傅里葉的時(shí)代,每個(gè)人都覺得自己已經(jīng)了解了積分、函數(shù)和無窮級數(shù)是什么,但實(shí)際上這些理解都很模糊——“我看到它的時(shí)候就認(rèn)得?!?/p>
因此,當(dāng)傅里葉提交他的劃時(shí)代論文時(shí),科學(xué)院的官員有充分的理由保持警惕。他們拒絕讓步,所以1822年,傅里葉通過出版《熱解析理論》(Théorie analytique de la chaleur)一書來繞過他們的反對。1824年,傅里葉出任科學(xué)院秘書,狠狠打了批評者一耳光,并在科學(xué)院聲譽(yù)卓著的期刊上發(fā)表了他1811年的原版回憶錄,不刊一字。
我們現(xiàn)在知道,雖然傅里葉在精神上是正確的,但他的批評者也有充分的理由擔(dān)心嚴(yán)謹(jǐn)性。問題很微妙,答案也不是非常直觀。我們現(xiàn)在所謂的“傅里葉分析”非常好用,但它涉及傅里葉沒有意識到的深層問題。
問題似乎是:傅里葉級數(shù)什么時(shí)候會收斂到自己要代表的那個(gè)函數(shù)?也就是說,取的項(xiàng)越多,函數(shù)就近似得更好嗎?甚至連傅里葉都知道,答案并不是“一定會”。它似乎是“通常會,但在不連續(xù)點(diǎn)處可能出現(xiàn)問題”。例如,在溫度躍變的中點(diǎn),方波的傅里葉級數(shù)是收斂的——但數(shù)字錯(cuò)了。級數(shù)和是0,但方波取值為1。
對于大多數(shù)物理應(yīng)用而言,在一個(gè)孤立點(diǎn)改變了函數(shù)值無關(guān)緊要。經(jīng)過修改的方波看起來仍然是方的。它只是在不連續(xù)性上稍有區(qū)別。對傅里葉來說,這種問題并不重要。他當(dāng)時(shí)正在對熱流進(jìn)行建模,不介意模型是否有點(diǎn)兒刻意,或者是否需要做些對最終結(jié)果沒有重大影響的技術(shù)性改動(dòng)。但是,收斂問題不能輕易被忽略,因?yàn)楹瘮?shù)可能具有比方波更復(fù)雜的不連續(xù)性。
然而,傅里葉聲稱他的方法適用于任何函數(shù),所以它甚至應(yīng)該適用于這樣的函數(shù):當(dāng)是有理數(shù)時(shí),當(dāng)是無理數(shù)時(shí)則。這個(gè)函數(shù)到處都是不連續(xù)的。當(dāng)時(shí)對于這樣的函數(shù),人們甚至不清楚積分意味著什么,結(jié)果人們發(fā)現(xiàn)這才是爭議的真正原因。沒有人定義積分是什么,至少?zèng)]有人定義像這樣的奇怪函數(shù)。
更糟糕的是,沒有人定義函數(shù)是什么。即使你清理了那些遺漏的情況,這個(gè)問題也不僅僅關(guān)于傅里葉級數(shù)是否收斂。真正的困難在于理解它在什么意義下收斂。
這些問題解決起來很棘手。它需要一種由亨利·勒貝格(Henri Lebesgue)提出的新的積分理論、由格奧爾格·康托爾(Georg Cantor)從集合理論的角度重新設(shè)計(jì)的數(shù)學(xué)基礎(chǔ)(還惹出了一堆新的麻煩)、來自黎曼等巨匠的重要見解,還需要一點(diǎn)兒20世紀(jì)的抽象來解決收斂問題。最終的結(jié)論是,利用正確的解釋,傅里葉的想法可以變得很嚴(yán)謹(jǐn)。
它適用于非常廣泛但并不普遍的一類函數(shù)。級數(shù)是否對所有的值都會收斂到并不是完全正確的提法;只要在一種特定的技術(shù)意義下,不收斂的的值足夠罕見就萬事大吉了。如果函數(shù)是連續(xù)的,則級數(shù)會對任何收斂。在躍變不連續(xù)處,如方波從到躍變時(shí),級數(shù)會非常平等地收斂到緊鄰躍變?nèi)我粋?cè)處的平均值。有了對“收斂”正確的解釋,級數(shù)確實(shí)總是會收斂到函數(shù)。
它是作為一個(gè)整體收斂,而不是逐點(diǎn)收斂。如果要嚴(yán)格說明這一點(diǎn),需要找到合適的方式來衡量兩個(gè)函數(shù)之間的距離。有了這一切之后,傅里葉級數(shù)確實(shí)解決了熱方程。但它真正的意義遠(yuǎn)不止于此,純數(shù)學(xué)之外的主要受益者不是熱物理學(xué),而是工程學(xué),特別是電子工程學(xué)。
在其最通用的形式中,傅里葉方法將由函數(shù)確定的信號表示為所有可能頻率的波的組合。這稱為波的傅里葉變換。原始信號被替換成了它的頻譜——一系列正弦和余弦分量的振幅和頻率,相當(dāng)于以另一種方式對同一信息進(jìn)行了編碼。工程師會談?wù)搹臅r(shí)域到頻域的轉(zhuǎn)換。當(dāng)以不同方式表示數(shù)據(jù)時(shí),在一種表示中難以進(jìn)行或不可能的操作可能在另一種表示中變得很容易。
例如,你可以取一次電話交談,對它做傅里葉變換,并去除信號中所有頻率太高或太低導(dǎo)致人耳無法聽到的傅里葉分量。這使得同樣的信道可以發(fā)送更多的對話,這也是如今的電話費(fèi)相對來說如此低廉的一個(gè)原因。你無法在未轉(zhuǎn)換的原始信號上搞這一套,因?yàn)樗鼪]有“頻率”這樣一個(gè)明顯的特征。你不知道該去掉什么。
這種技術(shù)的一個(gè)應(yīng)用是設(shè)計(jì)能夠在地震中幸存的建筑物。對典型地震產(chǎn)生的振動(dòng)做傅里葉變換,我們就可以知道,振動(dòng)的地面在哪些頻率上傳遞的能量最大。建筑物有其自然的振動(dòng)模態(tài),這會與地震產(chǎn)生共振,也就是做出異常強(qiáng)烈的響應(yīng)。因此,使建筑物防震的第一個(gè)合理的步驟,就是確保建筑物喜歡的頻率與地震波的頻率不同。地震的頻率可以從觀測中獲得,建筑物的頻率則可以使用計(jì)算機(jī)模型來計(jì)算。
這只是傅里葉變換在幕后影響我們的生活的許多方式之一。在地震區(qū)建筑物中居住或工作的人們不需要知道如何計(jì)算傅里葉變換,但因?yàn)橛腥肆私?,所以這些居民在地震中幸存的機(jī)會大為提高。
傅里葉變換已成為科學(xué)和工程學(xué)中的常規(guī)工具,其應(yīng)用包括去除老舊錄音中的噪聲(如黑膠唱片上的劃痕造成的咔嗒聲)、使用X射線衍射找到發(fā)現(xiàn)生化分子(如DNA)的結(jié)構(gòu)、改善無線電接收、修飾從空中拍攝的照片、搭建聲吶系統(tǒng)(比如潛艇使用的那種),以及在設(shè)計(jì)階段就防止汽車發(fā)生不必要的振動(dòng)。在傅里葉輝煌思想的成千上萬種日常應(yīng)用中,我在這里就專門談一種,是大多數(shù)人在度假時(shí)會不知不覺使用的——數(shù)碼攝影。
在最近一次去柬埔寨的旅行中,我使用數(shù)碼相機(jī)拍攝了大約1400張照片,全都塞進(jìn)了一張2 GB的存儲卡,還有空間可以再裝400多張照片。確實(shí),我拍的照片分辨率不是特別高,所以每個(gè)照片文件的質(zhì)量大約是1.1 MB。但是圖片是全彩色的,在27英寸的計(jì)算機(jī)屏幕上看不出任何明顯的顆粒感,因此質(zhì)量的損失并不明顯。我的相機(jī)用了某種辦法把十倍于這張2 GB存儲卡容量的數(shù)據(jù)塞進(jìn)了卡里,這就像把一升牛奶倒進(jìn)一個(gè)蛋杯里。然而它還裝下了。問題是:怎么裝進(jìn)去的呢?
答案是數(shù)據(jù)壓縮。描述圖像的信息經(jīng)過處理來減小它的體積。這些處理中有一些是“無損”的,這意味著如果必要的話,可以從壓縮的版本中恢復(fù)出原始信息。之所以能夠做到這一點(diǎn),是因?yàn)檎鎸?shí)世界的大多數(shù)圖像包含冗余信息。
例如,大片的天空往往是相同的藍(lán)色(這也是我們喜歡的地方)。你可以存儲矩形的兩個(gè)對角坐標(biāo),以及“將整個(gè)區(qū)域設(shè)為藍(lán)色”的短代碼,而不是一次又一次地重復(fù)藍(lán)色像素的顏色和亮度信息。當(dāng)然,實(shí)際的做法并不完全是這樣,但它說明了為什么有時(shí)能夠進(jìn)行無損壓縮。如果不是無損的,“有損”壓縮也通??梢越邮?。
人眼對圖像的某些特征并不特別敏感,這些特征可以記錄在較粗糙的尺度上,而我們大多數(shù)人不會注意到,特別是沒有原始圖像可供比較的時(shí)候。以這種方式壓縮信息就像是打雞蛋:在一個(gè)方向上很容易,也完成了所需的工作,但它是不可逆的。非冗余信息丟失了。只是考慮到人類視覺的工作原理,這些信息一開始就沒起太大作用罷了。
與大多數(shù)隨拍相機(jī)一樣,我的相機(jī)將圖片保存在帶有類似于“P1020339.JPG”的標(biāo)簽的文件中。后綴指的是“聯(lián)合圖像專家組”(JPEG,joint photographic experts group),表明已使用特定的數(shù)據(jù)壓縮系統(tǒng)。用于調(diào)整和打印照片的軟件(例如Photoshop或iPhoto)都可以解碼JPEG格式,并將數(shù)據(jù)再轉(zhuǎn)換成圖片。數(shù)以百萬計(jì)的人經(jīng)常使用JPEG文件,但知道它們被壓縮了的人就不那么多了,而想知道工作原理的人就更少了。
這并不是批評:你不必知道原理就可以使用它,這才是重點(diǎn)。相機(jī)和軟件可以為你處理一切。但是,大致了解軟件的作用以及原理往往是個(gè)好主意,哪怕只是為了了解有些軟件是多么巧妙。如果你想的話,這里的細(xì)節(jié)可以跳過:我想讓你體會一下相機(jī)存儲卡中的每一張圖片里融入了多少數(shù)學(xué),但具體是哪些數(shù)學(xué)就不那么重要了。
JPEG格式2融合了五個(gè)不同的壓縮步驟。第一步將顏色和亮度信息(開始時(shí)是紅色、綠色和藍(lán)色的強(qiáng)度)轉(zhuǎn)換為另外三個(gè)在數(shù)學(xué)上等效,卻更適合人類大腦感知圖像的方式的信息。一個(gè)(亮度)代表整體亮度——同一圖片的黑白或“灰度”版本。另外兩個(gè)(色度)分別是亮度與藍(lán)光量和紅光量之差。
接下來,色度數(shù)據(jù)被粗?;簤嚎s到更小的數(shù)值范圍。僅這一步就可將數(shù)據(jù)量減半。它沒有造成可感知的損失,因?yàn)槿祟愐曈X系統(tǒng)對色差的敏感度遠(yuǎn)低于相機(jī)。
第三步使用了傅里葉變換的一種變體。這不是用于隨時(shí)間變化的信號,而是用于二維空間中的圖案。數(shù)學(xué)基本上是一樣的。所涉及的空間是圖片中的子像素塊。為簡單起見,只考慮亮度分量:同樣的想法也適用于顏色信息。我們從一個(gè)64像素的塊開始,對于每一個(gè)像素,我們需要存儲一個(gè)數(shù)字,即該像素的亮度值。
離散余弦變換是傅里葉變換的一種特殊情況,它將圖像分解為標(biāo)準(zhǔn)“條紋”圖像的疊加。其中一半圖像的條紋是水平的,另一半是垂直的。條紋有不同的間隔,就像普通傅里葉變換中的各種諧波一樣,其灰度值與余弦曲線非常接近。在塊的坐標(biāo)下,它們是各種整數(shù)和的的離散版本,如圖9.2所示。

圖 9.2 可以獲得任何 8 8 像素塊的64種基本圖案
這一步為第四步鋪平了道路,而第四步再次利用了人類視覺的不足。我們對大區(qū)域的亮度(或顏色)變化比對排列緊密的變化更敏感。因此,隨著條紋的間距變得更精細(xì),圖中的圖案就可以不用記錄得那么精確。這進(jìn)一步壓縮了數(shù)據(jù)。第五步,也是最后一步,使用“霍夫曼編碼”來以更高效的方式表達(dá)64種基本圖案的強(qiáng)度列表。
每次使用JPEG拍攝數(shù)碼圖像時(shí),相機(jī)中的電子裝置都會執(zhí)行所有這些操作,也許除了第一步。(專業(yè)人士現(xiàn)在轉(zhuǎn)而使用RAW文件,它們記錄實(shí)際數(shù)據(jù)而不壓縮,再加上常見的“元數(shù)據(jù)”,如日期、時(shí)間、曝光等。這種格式的文件會占用更多存儲空間,但存儲器每個(gè)月都在越變越大,越來越便宜,所以這也不再重要。)當(dāng)數(shù)據(jù)量減少到原始數(shù)量的10%時(shí),訓(xùn)練有素的眼睛可以發(fā)現(xiàn)JPEG壓縮造成的圖像質(zhì)量損失,未經(jīng)訓(xùn)練的眼睛可以在文件大小降低到2%~3%時(shí)清楚地看出質(zhì)量損失。因此,與原始圖像數(shù)據(jù)相比,你的相機(jī)可以在存儲卡上記錄大約十倍的圖像數(shù)據(jù),除非是專家,大多數(shù)人對此毫無覺察。
由于這些應(yīng)用,傅里葉分析已成為工程師和科學(xué)家的本能反應(yīng),但對于某些用途,該技術(shù)有一個(gè)重大缺陷:正弦和余弦會延伸到無窮。傅里葉的方法在試圖表示短信號時(shí)會遇到問題。它需要大量的正弦和余弦才能模仿局部的尖峰。問題不在于把尖峰的基本形狀搞對,而是要讓尖峰之外的所有東西都等于零。
你必須砍掉所有那些正弦和余弦無限長的波動(dòng)尾巴,做法是添加更多的高頻正弦和余弦來拼命抵消不必要的垃圾。因此傅里葉變換對于類似尖峰的信號是非常糟糕的:變換后的版本比原始版本更復(fù)雜,需要更多數(shù)據(jù)來描述它。
挽救局面的是傅里葉方法的一般性。正弦和余弦可以用在這里,因?yàn)樗鼈儩M足一個(gè)簡單條件:它們在數(shù)學(xué)上是獨(dú)立的。正式來說,這意味著它們是正交的:在一種抽象但容易理解的意義上,它們彼此成直角。歐拉的技巧(最終由傅里葉重新發(fā)現(xiàn))就在這里派上了用場。將兩個(gè)基本正弦波形相乘并在一個(gè)周期內(nèi)積分,就可以衡量它們之間的關(guān)系是否密切。
如果積分結(jié)果很大,說明它們非常相似;如果積分結(jié)果是零(正交性的條件),說明它們相互獨(dú)立。傅里葉分析之所以成立,是因?yàn)樗哪切┗静ㄐ渭日挥滞陚洌核鼈兪仟?dú)立的,而且有足夠多種,適當(dāng)?shù)丿B加后足以表達(dá)任何信號。實(shí)際上,它們相當(dāng)于所有信號構(gòu)成的空間上的一個(gè)坐標(biāo)系,就像普通空間中的三個(gè)軸一樣。
主要的新性質(zhì)是我們現(xiàn)在擁有無限多個(gè)軸:每個(gè)基本波形都是一個(gè)軸。一旦你適應(yīng)了這種思想,它就不會在數(shù)學(xué)上造成多少困難。它只是意味著,你必須使用無窮級數(shù)而不是有限和,并且稍微留意一下級數(shù)什么時(shí)候收斂。
即使在有限維空間中,也存在許多不同的坐標(biāo)系。例如,旋轉(zhuǎn)軸可以指向新方向。所以在信號的無限維空間中,存在與傅里葉非常不同的另外一些坐標(biāo)系也就不足為奇了。近年來,整個(gè)領(lǐng)域中最重要的發(fā)現(xiàn)之一就是一種新的坐標(biāo)系,其基本波形被限制在有限的空間區(qū)域里。它們被稱為“小波”,可以非常有效地表達(dá)尖峰,因?yàn)樗鼈儽旧砭褪羌夥濉?/p>
直到最近才有人意識到,可以進(jìn)行類似尖峰的傅里葉分析。起步很簡單:選擇特定形狀的尖峰,即“母小波”(圖9.3)。然后將母小波側(cè)向滑動(dòng)到各個(gè)位置,并改變比例來擴(kuò)展或壓縮,從而生成子小波(以及孫小波、曾孫小波,等等)。同樣道理,傅里葉的基本正弦和余弦曲線是“母小正弦波”,而高頻率的正弦和余弦曲線是“子小正弦波”。不過這些曲線是周期性的,和尖峰看起來不一樣。

圖 9.3 多貝西小波
小波被設(shè)計(jì)用于有效地描述類似尖峰的數(shù)據(jù)。此外,由于子小波和孫小波只是母小波的縮放版,因此可以聚焦于特定的細(xì)節(jié)水平。如果你不想看到細(xì)微的結(jié)構(gòu),只需從小波變換中刪除所有的曾孫小波就好了。要用小波表達(dá)豹子,你需要用幾個(gè)大的小波表示豹子的身體,用較小的小波表示眼睛、鼻子,當(dāng)然還有斑點(diǎn),用非常小的小波來表示一根根毛發(fā)。
要壓縮表達(dá)豹子的數(shù)據(jù),你可能會認(rèn)為單根毛發(fā)無關(guān)緊要,因此只需刪除這些特定的小波分量。最棒的是,圖像仍然看起來像豹子,它仍然有斑點(diǎn)。如果你嘗試使用豹子的傅里葉變換進(jìn)行這個(gè)操作,那么分量列表會很長,你也不清楚應(yīng)刪除哪些項(xiàng),結(jié)果可能認(rèn)不出來那是只豹子了。
這一切都非常好,但母小波應(yīng)該是什么形狀呢?在很長一段時(shí)間里,沒有人可以解決這個(gè)問題,甚至也沒法證明這樣好的形狀存在。但在20世紀(jì)80年代初,地球物理學(xué)家讓·莫萊(Jean Morlet)和數(shù)學(xué)物理學(xué)家亞歷山大·格羅斯曼(Alexander Grossmann)發(fā)現(xiàn)了第一個(gè)合適的母小波。1985年,伊夫·梅耶爾(Yves Meyer)發(fā)現(xiàn)了一個(gè)更好的母小波。
1987年,貝爾實(shí)驗(yàn)室的數(shù)學(xué)家英格麗·多貝西(Ingrid Daubechies)徹底顛覆了整個(gè)領(lǐng)域。雖然之前的母小波看起來很像尖峰,但它們都有一個(gè)非常微小的數(shù)學(xué)尾巴,一直擺動(dòng)到無限遠(yuǎn)。多貝西發(fā)現(xiàn)了一個(gè)沒有尾巴的母小波:在某個(gè)時(shí)間間隔之外,母小波總是恰好為零——這是一個(gè)真正的尖峰,完全局限于一個(gè)有限的空間區(qū)域內(nèi)。
小波類似于尖峰的特征使它們特別適合壓縮圖像。它們最初的大規(guī)模實(shí)際用途之一是存儲指紋,客戶是美國聯(lián)邦調(diào)查局(FBI)。FBI的指紋數(shù)據(jù)庫包含3億條記錄,每條記錄有8個(gè)指紋和2個(gè)拇指紋,最初存儲在紙卡上。這種存儲介質(zhì)使用不便,于是他們把圖像數(shù)字化并將結(jié)果存儲在計(jì)算機(jī)上。明顯的優(yōu)勢包括能夠快速自動(dòng)搜索與犯罪現(xiàn)場發(fā)現(xiàn)的指紋相匹配的指紋。
每張指紋卡的計(jì)算機(jī)文件長度為10兆字節(jié)(MB):8000萬位二進(jìn)制數(shù)字。因此整個(gè)存檔占用3000 TB的存儲空間:2.4億億個(gè)二進(jìn)制數(shù)字。更糟糕的是,每天要增加3萬個(gè)新指紋。因此存儲需求每天將增加2.4萬億位二進(jìn)制數(shù)字。FBI明智地判斷自己需要一些數(shù)據(jù)壓縮方法。
由于各種原因,JPEG不適合,因此在2002年,F(xiàn)BI決定使用小波,即“小波/標(biāo)量量化(WSQ)方法”來開發(fā)一種新的壓縮系統(tǒng)。WSQ通過刪除整個(gè)圖像中的細(xì)節(jié),將數(shù)據(jù)減少到其大小的5%。這絲毫不影響眼睛或計(jì)算機(jī)識別指紋的能力。
小波最近還有許多在醫(yī)學(xué)成像方面的應(yīng)用。醫(yī)院現(xiàn)在使用幾種不同類型的掃描儀來獲得人體或重要器官(如大腦)的二維橫截面。這些技術(shù)包括CT(計(jì)算機(jī)斷層掃描術(shù))、PET(正電子發(fā)射體層成像)和MRI(磁共振成像)。在斷層掃描術(shù)中,機(jī)器在身體的單一方向上觀察總組織密度或類似的量,就像你在固定位置看看所有組織是不是會變得稍微透明一樣。通過從許多不同角度拍攝一系列這樣的“投影”,再用上一些巧妙的數(shù)學(xué),就可以重建二維圖像。
在CT中,每個(gè)投影都需要X射線暴露,因此有充分的理由來限制所獲取的數(shù)據(jù)量。一方面,在所有這些掃描方法中,較少的數(shù)據(jù)在獲取時(shí)所需的時(shí)間也較少,同樣的設(shè)備就可以用于更多的患者。另一方面,良好的圖像需要更多的數(shù)據(jù),才能讓這種重建方法工作得更好。小波提供了一種折中方案,減少的數(shù)據(jù)量也帶來同樣可接受的圖像。通過小波變換去除不需要的分量,再次“反變換”得到圖像,就可以平滑和清理不良的圖像。小波還從根本上改進(jìn)了掃描儀獲取數(shù)據(jù)的方式。
事實(shí)上,小波幾乎到處都是。地球物理學(xué)和電氣工程領(lǐng)域雖然相隔遙遠(yuǎn),研究人員卻都在把小波引入自己的領(lǐng)域。羅納德·考夫曼(Ronald Coifman)和維克多·魏克爾豪斯(Victor Wickerhauser)用它們來消除錄音中不想要的噪聲:最近的一次成功是一場演出——勃拉姆斯演奏他自己的《匈牙利舞曲》。
錄音最初于1889年記錄在蠟筒上,而蠟筒已經(jīng)部分熔化;之后它被重新錄制到78轉(zhuǎn)的唱片上??挤蚵鼜某囊淮螣o線電廣播入手,當(dāng)時(shí)音樂幾乎已經(jīng)完全湮沒在周圍的噪聲里。在利用小波進(jìn)行“清洗”之后,你就可以聽到勃拉姆斯的演奏了——并不完美,但至少聽得見。對于一個(gè)200年前首次在熱流物理學(xué)中出現(xiàn),并被拒絕發(fā)表的想法來說,這樣的戰(zhàn)績可謂輝煌。
01

《改變世界的17個(gè)方程》
作者:[英] 伊恩?斯圖爾特
譯者:勞佳
?英國數(shù)學(xué)科普名家伊恩?斯圖爾特經(jīng)典名作,譯為多國語言
?李永樂推薦科普名作,“歐拉圖書獎(jiǎng)”獲獎(jiǎng)作品
?美國數(shù)學(xué)學(xué)會(AMS)&美國數(shù)學(xué)協(xié)會(MMA)聯(lián)袂推薦
了解世界運(yùn)轉(zhuǎn)的深層道理,看懂科學(xué)發(fā)展的規(guī)律
方程是一首首數(shù)學(xué)的詩,言簡意賅,卻充滿意義。闡釋自然與社會現(xiàn)象,連接數(shù)學(xué)與物理現(xiàn)實(shí),是方程的力量與美之所在。
從無線電廣播到智能手機(jī),從地圖測繪到衛(wèi)星導(dǎo)航,從世界旅行到太空探索……當(dāng)我們?nèi)チ私夥匠痰恼嬲齼r(jià)值,就會發(fā)現(xiàn)周圍世界的本質(zhì)。勾股定理、牛頓定律、混沌理論、相對論,方程展現(xiàn)了世界的深層模式,它們是前人的智慧,也為未來的探索打開大門——這是17個(gè)改變?nèi)祟悮v史進(jìn)程的方程所講述的人類文明崛起的故事。

熱門跟貼