深度 | 數(shù)字通信領域的天才香農:早在八十年前他就開啟了信息時代
克勞德·香農,圖片來自interaliamag.org
撰文 | 吳 軍
在香農之前和香農的時代,信息處理專家所關注的是如何進一步改進信息處理的具體方法,而通信專家則致力于改進具體的通信系統(tǒng)。香農則不同,他致力于尋找信息處理和通信的數(shù)學基礎,并且?guī)缀跻砸患褐鉀Q了信息處理、密碼學和通信最基本的理論問題。因此,香農無疑是信息史上劃時代的杰出人物,歷史因為他的貢獻而發(fā)生了巨大的轉折。
香農留給了世界很多的知識遺產,他除了找到了通信的數(shù)學基礎,更重要的是他揭示了信息的本質,給人類帶來了一種新的世界觀。
● ● ●
1937 年秋天,一位 22 歲的年輕人千里迢迢從麻省理工學院跑到了美國首都華盛頓特區(qū)進行他的碩士論文答辯。這種情況在美國其實非常罕見。在美國,碩士論文并不太重要,因為絕大部分碩士生根本不需要發(fā)表論文就可以獲得學位。
少數(shù)選擇發(fā)表論文的碩士生,其論文水平也遠遠無法和博士論文相比。美國高等教育對碩士生的要求, 只是掌握足夠多的專業(yè)知識,將來能從事相應領域的工作。而對博士生的要求,則是需要他們對人類的知識體系有所貢獻。正是在當時的學術氣氛中,這位年輕人奔赴千里只為一場非必要的答辯就顯得更加異乎尋常了。
非常之事的發(fā)生必有其原因。一方面,這位學生的導師非常特殊,他叫萬尼瓦爾·布什(Vannevar Bush),是美國 20 世紀最重要的科技管理者之一。作為美國的第一任總統(tǒng)科技顧問,布什不僅創(chuàng)立了美國國家科學基金會,還參與制定了美國政府支持和管理科學研究的基本國策。這項國策沿用至今,確保了從第二次世界大戰(zhàn)開始美國的科技水平始終遙遙領先于世界。另一方面,則是因為那篇答辯的論文很重要,它很有可能徹底改變世界,布什希望有更多的專家聽一聽, 所以給了這位年輕人到首都來匯報研究成果的大好機會。
至于這位年輕人的工作在歷史上具有何等的重要意義,就要從他一年多前進入萬尼瓦爾·布什在麻省理工學院的實驗室說起。
一位天才的橫空出世
1936 年,這位 21 歲的美國青年在密歇根大學讀完了兩個本科學位后,來到了麻省理工學院跟隨布什做碩士研究的課題。布什不僅是一位杰出的科技管理者,也是非常著名的電子工程專家,他設計了當時世界上最復雜的微分分析儀。那是一臺機械模擬計算機,可以通過一堆機械輪盤的運轉來進行微積分計算,求解微分方程。在電子計算機還沒有出現(xiàn)的年代,它算得上是最精密的實用計算設備。這位 21 歲的新生一來,布什就安排他管理微分分析儀。很顯然,這表明布什對他格外重視。
還沒有走進實驗室,這位新生就聽到屋內傳出了嗡嗡的巨大響聲。打開實驗室的大門,他看到一臺巨大的機器正在運行( 見圖10—1)。那臺機器設計得十分精巧,也極為龐大而復雜,它在某種程度上解決了當年巴貝奇想解決而不能解決的問題——讓機器完成微積分和解微分方程的運算。但是,它不具有埃達和巴貝奇所設想的靈活性。因為它每次計算不同的問題,設備結構都需要重新搭建一遍,這就讓它的實際使用價值大打折扣。為了解決這一問題,布什想發(fā)明一種新的分析儀,通過一些開關自行調整儀器的結構——激活一些新的功能,同時也關閉另外一些不需要的部分。過去這件事往往是通過工人操作螺絲刀來完成的,如今布什希望用開關來取代螺絲刀,而且用問題本身來控制開關。因此,他把這位新生帶進了實驗室,希望這位年輕人能夠用他的聰明才智幫助自己解決這個困擾許久的問題。

圖 1 微分分析
在接下來一年多的時間里,這位碩士生每天都會穿過麻省理工學院那條“沒有盡頭的走廊”[1],來到13 號樓[2]那間成天機械噪聲嗡嗡作響的實驗室,構想如何才能用開關來控制那臺十分復雜的機器。當時,人們已經開始廣泛使用繼電器來控制電路的連通與斷開——當給繼電器通電時,它就可以打開一個電路。人們通過這種方法用電流控制非常復雜的電路,以此決定哪部分工作、哪部分閑置。至于如何控制那些需要很復雜的邏輯才能激活或者關閉的電路,實現(xiàn)起來就頗費周章了。
接受了布什交給的任務,年輕人那天才的大腦便開始了高速運轉。他想到了在大學時學到的數(shù)理邏輯,也就是我們前面介紹的布爾代數(shù)。當時他學習這些內容,并不是在數(shù)學或者電路課堂上,而是源自哲學課的一部分。由此可見,通識教育對一個人的重要性?,F(xiàn)在, 那門哲學課所教授的知識即將派上用場。
這位碩士生很快就發(fā)現(xiàn),所有控制開關的復雜邏輯,其實就是布爾代數(shù)中那幾種簡單邏輯的組合而已,而且控制開關完全可以通過繼電器來實現(xiàn)。只要用繼電器實現(xiàn)了布爾代數(shù)中的“與”“或”“非”這三種簡單的邏輯,就能滿足各種要求,對各種電路進行控制。于是, 這位碩士生搭建了一個裝滿了各種繼電器開關的控制箱,來控制復雜的微分分析儀。最終他出色地完成了導師交給的這項艱巨任務。但是,完成任務的意義遠不止于此,因為它開創(chuàng)了一個完全嶄新的時代。在此之前,電路的設計完全靠經驗,在此之后,人們只要把控制電路的邏輯用布爾代數(shù)寫成一個方程式,就能夠按部就班地用最簡單的開關電路搭建出結構和功能十分復雜的機器。為了證明這一點,這位碩士生用自己的方法搭建了一個控制電路,只需要兩個并不復雜的步驟就能完成。而在此之前,他的同事靠經驗完成這件事則需要 11 個步驟。從此,人類對電路的設計從自發(fā)狀態(tài)上升到了自覺狀態(tài),設計電路不再憑直覺和經驗,而是靠方程式和任何人都能學會的簡單規(guī)則。
隨后,這位年輕人進入聞名遐邇的 AT&T 公司的貝爾實驗室完成了他的實習。在實習期間,他接觸到了通信網絡和交換機技術, 這些啟發(fā)他開始思考微分分析儀、電話網絡和布爾代數(shù)之間的共性。但是,他給那個世界上最出名的實驗室?guī)サ膬r值,遠超他的收獲, 而且大得多。貝爾實驗室的科學家也在探索這位年輕人在碩士期間已經解決的問題,但是沒有找到答案;而這位年輕人的出現(xiàn),則給那些科學家?guī)チ松羁痰乃伎?,即電路設計和數(shù)學的關聯(lián)。此外, 他還讓那些科學家看到,數(shù)學和邏輯其實是一回事,它們都可以通過一些簡單的方法,也就是布爾代數(shù)在同一個平臺上實現(xiàn)。從此,AT&T 公司在它的核心業(yè)務方面獲得了巨大的改進,它運用數(shù)學將全世界的電話網絡運營成本降低,且運行更加穩(wěn)定。
在完成實習之后,這位年輕人開始思考一些更本質的問題。因為他所提出的開關電路不僅能夠控制微分分析儀完成計算,而且它本身就可以實現(xiàn)二進制計算。比如,我們將開關的連通和數(shù)字 1 對應起來,將斷開和 0 對應起來,那么,我們就很容易實現(xiàn)一個如下邏輯的開關電路。

也就是說,當兩個開關都處于連通或者斷開狀態(tài)時,整個電路是斷開的;當兩個開關一個是連通另一個是斷開時,整個電路被連通。這種邏輯被稱為“異或”。這樣的電路有什么用呢?其實它可以用來實現(xiàn)二進制的加法。我們知道,在二進制中:

如果,我們把關注點集中在結果的個位數(shù)上,就會發(fā)現(xiàn)它和“異或”電路的結果完全相同。當然,在進行二進制 1+1 的時候還會有進位,這個問題也可以用開關電路來實現(xiàn)。如果我們回顧一下布爾代數(shù)中的“與”邏輯,就會發(fā)現(xiàn)進位和“與”邏輯實際上是保持一致的。因為只有當兩個加數(shù)都是 1 時,進位才為 1,否則就是 0。
這樣,利用簡單的“異或”邏輯和“與”邏輯,就可以實現(xiàn)二進制的加法——個位數(shù)上的結果取決于“異或”邏輯運算的結果,而進位取決于“與”邏輯運算。二進制的乘法就更簡單了,它本身就是“與”邏輯。四則運算中的減法和除法,又分別是加法和乘法的逆運算,它們也很容易用開關電路來實現(xiàn)。至于其他運算,則可以用數(shù)學公式變成四則運算,這樣所有的運算都可以用簡單的開關電路來實現(xiàn)。有意思的是,開關電路背后則是半個多世紀前就被提出的,但是人們一直沒有找到有直接用途的布爾代數(shù)。再后來,人們發(fā)現(xiàn)布爾代數(shù)中的“與”“或”“非”邏輯,以及我們前面提到的“異或”邏輯,
都可以用一種被稱為“與非”的邏輯來實現(xiàn)。也就是說,我們甚至不需要實現(xiàn)“與”“或”“非”三種基礎的邏輯電路,只要設計出一種簡單的電路來實現(xiàn)“與非”邏輯,就能用它作為基本模塊,來搭建能夠完成所有計算的各種復雜的電路。
這位年輕人后來還證明,世界上所有的信息都可以用兩種符號來表示,比如 0 和 1。于是,所有的信息處理、存儲和傳輸,從本質上講,就是兩種符號和一種簡單的(與非)邏輯。至此,信息處理就有了真正的數(shù)學理論基礎。這個基礎的重要性堪比幾何學中的公理,在此之上才有了今天完整的信息科學。
這位碩士生在通過碩士論文答辯之后,并沒有在第一時間把論文交回學校,而是開始從事更重要的事。第二年(1938 年)他將碩士期間的研究成果發(fā)表在美國電氣與電子工程師學會的學報上。一直到三年后他才把這篇碩士論文《繼電器和開關電路的符號分析》交回麻省理工學院,并且簽上了自己的名字——克勞德·E. 香農。同一年, 香農獲得了美國工程師學會的諾布爾獎[3],這是一年頒發(fā)一次,并且只授予一位 35 歲以下英才的工程獎項。
香農的這篇碩士論文毫無爭議地被譽為 20 世紀最重要的碩士論文,甚至有的學者認為,這可能是有史以來最重要的碩士論文。因為我們今天所有數(shù)字集成電路設計最底層的原理都寫在了這篇論文中。從此,人類信息處理進入數(shù)字化時代。
不過,這篇論文并沒有涉及如何運用程序來控制那些復雜的計算,而同一年一位英國的天才恰好給出了解決這個問題的數(shù)學模型。這兩位天才很快在貝爾實驗室相聚了。
天才的聚會
942 年,美國已經被迫卷入第二次世界大戰(zhàn)。那是一場全民戰(zhàn)爭,身處后方的科學家也責無旁貸地直接或者間接參與其中。整整的一代數(shù)學家和物理學家思考的是和戰(zhàn)爭直接相關的問題,比如:
被譽為一代天才的香農也接受了一個和戰(zhàn)爭直接相關的秘密任務,而他表面的身份僅僅是貝爾實驗室的研究員。
在二戰(zhàn)期間,參戰(zhàn)雙方都在千方百計地努力破獲對方的情報,同時讓自己的情報傳輸和通信變得更加安全。為此,雙方都想出了各種稀奇古怪的辦法,比如,美軍曾經找了 500 名印第安土著納瓦霍人作為戰(zhàn)場上的通信員,因為他們的語言外界無人能聽懂。但是當在戰(zhàn)場上進行遠距離通話時,顯然不能在所有的講話人身邊都安排這樣的通信員。因此,雖然美國采取了各種加密措施,并在通話中加入了干擾噪聲,以確保情報傳遞的安全,但是德國在荷蘭設立的大型監(jiān)聽站, 還是能竊聽到丘吉爾和羅斯福的談話,因為當時的技術還無法對語音通話進行加密。于是這個較難解決的任務就交給了貝爾實驗室,項目代號為 X,對外是嚴格保密的。貝爾實驗室內部對此還有一個特殊的代號,叫作 SIGSALY(見圖 2)。
SIGSALY 的技術在今天看來簡單得不值一提,但是在當時卻是一個壯舉。它的原理并不復雜,首先將語音進行數(shù)字化采樣,過濾掉語音中的一些冗余信息,然后對采樣信息(聲音振動的幅度)進行加密,也就是疊加一個密鑰。加密后的語音在常人聽起來就和噪聲差不多,因此即使敵方在電話線上裝了竊聽設備,并且截獲了通話的語音,也聽不懂具體內容。而自己的接收方,由于知道密鑰,就可以先將聲音解密,然后再用機器將聲音還原。這樣在聽到的聲音中就過濾掉了講話人的口音、語氣等很多輔助信息,只剩下非常簡明、尚能辨別含義的語音了。這對于當時的保密電話來講,能夠做到這一點已經很不容易了。

圖 2 在美國國家密碼博物館的 SIGSALY 語音加密系統(tǒng)展覽
在那個還沒有計算機的時代,要利用電子管搭建一個能完成上述功能的電子系統(tǒng)是一件工程量和難度都相當巨大的事情。SIGSALY 系統(tǒng)重達 45 噸,占地面積 250 平方米,建造費用高達 500 萬美元,是世界上第一臺電子計算機埃尼亞克的 10 倍。不僅如此,SIGSALY 工作起來耗電量也大得驚人,整個房間需要日夜不停地開著空調來降溫。為了傳輸一毫瓦的(語音)信息,居然要消耗掉 30 千瓦的電。
即便如此,SIGSALY 還是創(chuàng)造了很多項世界第一。這種對語音進行加密的語音系統(tǒng)被稱為聲碼器,至今軍隊的保密電話依然采用聲碼器來加密。SIGSALY 還第一次對電話進行了脈沖編碼調制(PCM),這是今天數(shù)字電話所用的技術,只不過我們平時用的電話不需要加密而已。此外,SIGSALY 也是世界上第一個語音合成系統(tǒng)。香農是 SIGSALY 小組的 20 多位成員之一,他負責檢驗各種加密算法,以保證 SIGSALY 系統(tǒng)加密后信息的安全。
在第二次世界大戰(zhàn)期間,美國幾乎所有的頂級科學家,包括愛因斯坦、馮·諾伊曼、奧本海默、恩利克·費米、歐內斯特·勞倫斯和阿瑟·康普頓等人都參與到和戰(zhàn)事直接相關的各種應用研究中。在這個過程中,誕生了核反應堆、原子彈、回旋加速器等現(xiàn)代科技成就, 更重要的是誕生了三個我們使用至今的理論(或者說新學科)。它們分別是維納的控制論、馮·諾伊曼的計算機系統(tǒng)結構和香農的信息論。當然,它們誕生的方式完全不同。維納的控制論,早在 1935 年他還在清華大學任教時就有了雛形,到了二戰(zhàn)時他想為戰(zhàn)爭做點兒事情,于是將那些初具雛形的理論用在了火炮控制上,并最終成形。使用至今的馮·諾伊曼系統(tǒng)結構,純屬馮·諾伊曼這位超級天才無心插柳的行為。他在研制氫彈時需要用到計算機,但發(fā)現(xiàn)從事計算機研發(fā)的人完全走錯了路,于是他提出了自己構建計算機的思路。香農建立信息論和這兩位成名已久的大人物完全不同,他只不過是在參與SIGSALY 項目時,思考了別人根本不曾思考的理論問題,或者說信息技術的數(shù)學基礎問題,然后找到了答案。
香農并非 SIGSALY 項目的負責人,他甚至沒有被告知自己所做的加密研究最終將應用于何處,因為 SIGSALY 在當時是絕密項目。不過,這項工作讓香農接觸到了語音編碼、通信和密碼學,并讓他對此產生了十分濃厚的興趣。當時,幾乎所有的密碼學家都把密碼學當作一門非常實用的學科,即利用技巧設計一個可以用得上的密碼系統(tǒng),或者找出其他密碼系統(tǒng)的數(shù)學破綻。但是,香農所思考的則是與密碼學相關的數(shù)學和哲學問題。他寫的密碼學論文并沒有涉及太多具體的密碼方法,因此當時的密碼學專家對此并不十分感興趣。不過, 在戰(zhàn)爭期間,香農還是有自己無話不說的知己的。
從 1942 年開始,在很長一段時間里,大家可以看到有兩個年輕人經常在貝爾實驗室的咖啡廳喝茶聊天。他們是 20 世紀兩位不世天才——香農和圖靈,后者是作為英國密碼項目訪問團成員來到美國的。圖靈當時才 30 歲,而香農也僅僅 26 歲。貝爾實驗室當時很想把圖靈留下來,他本人也很愿意留下來,但是美國安全機構對此有所顧慮,因為它不太想讓外國人插手軍方密碼這樣高度機密的研究。
這兩位年輕人在情報界的名氣讓他們的會面充滿了神秘色彩。后世的記者和傳記作家總在試圖了解他們當時到底談論了什么,但遺憾的是,不曾有任何人記錄了只言片語。有一點可以肯定的是,由于雙方的工作都屬于各自國家的最高機密,他們都沒有談及自己正在從事的工作細節(jié),也沒有打聽對方在做什么。很多年后,記者在采訪香農時又問及這個問題,香農講:“我們一點兒也沒有談到密碼學……一個字都沒有交流過?!碑敱粏柤笆欠衲懿鲁鰧Ψ皆谧鍪裁吹臅r候,香農講道:“我或許能猜到他所做的那些工作,但是肯定不知道具體的細節(jié)。我不了解(圖靈所破譯的)恩尼格瑪機,也不了解他(圖靈) 在其中是什么角色?!?/span>
事實上,香農和圖靈當時談論得更多的是哲學層面的一些問題, 比如能否讓機器像人類那樣產生智能。幾年后,也就是 1950 年,圖靈提出了判定機器是否具有智能的方法——圖靈測試。而到了 1956年,香農則和明斯基等 9 位科學家一起,提出了人工智能的概念。很多人都在猜測,如果這兩位天才當時能夠討論密碼學問題,其卓絕的智力碰撞也許能產生驚人的成就。事實證明,像密碼技術這樣的研究課題,對他們而言,實在是微不足道。雖然密碼學在二戰(zhàn)時特別重要,但是像香農和圖靈這樣超級聰明的頭腦,應該用于思考關于人類的更重大的問題。事實上,關于密碼學最根本的理論,香農在二戰(zhàn)期間已經于無意中徹底地解決了。真正讓這兩位年輕人經常坐到一起喝咖啡的原因,不是在某一個領域的共同語言,而是對彼此才華和思想的欣賞。圖靈非常仰慕香農的多才多藝,香農精通很多領域的知識, 堪稱科技領域的哲學家,這樣的人在英國很少見。同樣,香農對圖靈精深的思想贊嘆不已,絲毫不掩飾自己對圖靈的贊許。他常常向周圍的人們講:“圖靈有偉大的思想,他非常了不起。”
不過,二位天才間這類隨機的討論對香農創(chuàng)立信息論是否有所啟發(fā)就不得而知了。圖靈當時在破譯德國的恩尼格瑪密碼機時發(fā)現(xiàn)了對方密碼的一個破綻,就是加密后的密文并不具有完全的隨機性,以至有些常用的字符可以被推測出來,這就大大降低了英國人破譯德國密碼的計算量。比如,德國人習慣于使用X 取代單詞之間的空格符“ ”(空格),這對密碼設計來講是一個十分致命的破綻。因為空格符是文本中最常見的符號,能夠幫助閱讀者理解文本含義。香農在從事了一段時間的密碼學工作之后,就開始從具體的問題進入了更深層次的思考,他從信息的角度給出了密碼學兩個最根本的指導性建議。
首先,任何密碼在使用一段時間后都會有泄露的可能性,唯一不會被破譯的密碼就是一次性密碼。當然,在香農的那個年代,使用一次性密碼是根本不可能實現(xiàn)的事情,但是它成了今天量子通信的最重要亮點。
其次,加密后的密文要力求做到完全的隨機性,這樣即使對方截獲了密文,他們也不可能從密文中分析出任何有用的信息。在后來正式提出信息論之后,這個理論就被描述得更加清晰了。假如在對方截獲密文之前所了解的信息量是 I,而在截獲密文之后所得到的信息量是 I’,那么對方獲得的信息增量就是:
ΔI=I’—I
ΔI 要盡可能的小,最好等于零。這樣,無論對方截獲密文與否, 對我們的了解都不會有任何明顯的變化。
為什么要讓密文看上去完全隨機呢?因為完全隨機的信號中所包含的信息增量最少。而且,任何不是隨機的密文都會多少泄露一些信息。因此,像恩尼格瑪密碼機那樣的加密方式,因為所產生的密文并不具備完全的隨機性,是有十分嚴重的破綻的。
和圖靈一樣,香農對密碼這種智力游戲有著天生的興趣。他還是孩子的時候,就一個人成功破解了愛倫·坡小說《金甲蟲》中的一段密碼。那段密碼是用各種奇怪的符號寫成的,但是那些符號有著和英語相同的統(tǒng)計規(guī)律。它們雖然看上去是密文,其實卻包含了和明文相同的信息,而且這個信息可以輕易地被提取出來?;蛟S是因為任何能夠歸納出統(tǒng)計規(guī)律的加密對他來講都太容易破解,所以他對密文一定要具有隨機性這件事才有特別深刻的體會。
在香農之后,密碼學演進出了十分堅實的理論基礎,密碼才開始真正變得安全了。雖然“冷戰(zhàn)”持續(xù)的時間要比二戰(zhàn)長了 40 年,其間密電文的數(shù)量比二戰(zhàn)時多出了很多,但是卻沒有像二戰(zhàn)時那樣,雙方不斷地成功破譯對方的密碼。
當然,如果香農只是一個在密碼學領域有所建樹的理論家,他就不可能獲得今天在信息領域人人皆知的名氣。他所做出的更大貢獻在于,他發(fā)現(xiàn)了密碼學其實和通信在原理上根本就是一回事,并且提出了通信的數(shù)學原理。
噪聲信道:通信數(shù)學模型的基礎
在香農以前,從事密碼工作的人和從事通信領域的人常常是兩類截然不同的人。像貝爾、馬可尼這些人根本不懂密碼學,而雅德利等人也根本不懂通信。這兩類人相安無事地在各自的領域工作了多年, 也沒有覺得對方所擅長的領域和自己有什么關系。但是在香農之后, 這兩個領域就開始變得互通了,因為香農發(fā)現(xiàn)了它們共同的規(guī)律。香農在《保密系統(tǒng)的通信理論》(Communication Theory of Secrecy Systems)一文中這樣寫道:“密碼系統(tǒng)和有噪聲的通信系統(tǒng)沒有什么不同?!?/span>
這個結論對于外行來講只是一個陳述,但是對于這兩個領域的從業(yè)者來講,卻是一語道破天機。事實上,只要我們對比一下密碼傳輸和通信各自的工作方式,就不難明白為什么香農這么說了。
圖 3 顯示的是典型的通信過程。在這個過程中,講話人先發(fā)出信息,信息可以是語音,也可以是文字,然后經過調制變成通信線路能夠傳輸?shù)男盘?,比如電話線中的電信號,或者無線電廣播中的電磁波。接下來,這些調制后的信號經過信道進行傳輸。這個信道可以是銅導線、大氣,也可以是光纖。當信號到了接收方時,先要進行解調。這個工作由接收器完成,比如我們日常使用的收音機、電視機都是解調器。經過解調后,收聽人才能明白講話人原來要表達的信息。

圖 3 有噪聲信道的通信過程
上述通信過程由于無法完全避免噪聲的出現(xiàn),以至接收方所獲得的信息可能和發(fā)送方想傳遞的信息出現(xiàn)不一致的情況。比如,當我們和朋友在飯館里吃飯聊天時,如果周圍的環(huán)境非常吵鬧,我們就可能無法聽清朋友說話的聲音。這就是因為信號在空氣這個信道中進行傳輸時,噪聲被加了進來,和信號混在了一起,以至我們難以識別講話人在講什么。
真實的信道永遠是有噪聲的。其實電話通信、無線電通信的情形和我們在吵鬧的飯館里聊天差不多,電線中隨機的脈沖和電壓的波動,大氣中的宇宙射線和周圍無線電設備的干擾,都是影響信息有效傳遞的噪聲的來源。噪聲信道的假設是現(xiàn)代通信理論的基礎,它對于通信的重要性,就如同歐幾里得公理對于幾何學,亞當·斯密關于人是理性和自私的假設對于經濟學一樣。在香農之前,人們并沒有認識到噪聲是通信的天然屬性,還在持續(xù)不斷地努力研究,希望造出一種沒有任何噪聲的信道,或者讓通信不受噪聲的干擾。但是香農十分明確地告訴大家,這些努力都是徒勞的。當傳輸?shù)木嚯x不斷加長后,信號的強度也在持續(xù)減弱,而噪聲的強度并不會因此有絲毫下降,于是在超過一定的距離之后,接收方常常會覺得信號消失了。其實,信號本身其實并沒有消失,它們只是變弱了,甚至被徹底地掩埋在噪聲之下,讓人們無法辨認。當然,如果我們對噪聲有足夠多的了解,就可以反向疊加同樣的噪聲,將噪聲抵消掉。今天各種高端去噪聲的耳機用的就是這個原理。
接下來我們再來看看加密和解密的過程(如圖4 所示),就能理解它和基于噪聲通道的通信之間的一致性了。

圖4 加密和解密的過程
在圖4 中,我們要將信源發(fā)出的信息進行加密,然后把密文送到信道中傳輸。這時,信道中傳輸?shù)男盘柺怯稍行畔⒑兔荑€疊加后生成的,這和有噪聲信道中傳輸?shù)男畔⒂尚盘柡驮肼暞B加而成是一個道理。接收端在收到密文后,由于他知道應該用什么密鑰解密,因此可以將密鑰從密文中分離,恢復原有的信息,這就如同我們在了解噪聲之后可以消除噪聲一樣。
但是對于截取信號的竊密者來講,由于不知道密碼,就無法破解密文,信息被淹沒在噪聲中,無法分離出來。由此可見,加密和解密其實和噪聲信道的通信是一回事。
不僅密碼傳輸和噪聲信道的通信在過程上是一致的,而且所用方法在理論基礎上也是一致的。
對于正常的通信來講,我們希望噪聲盡可能低,信號盡可能強。這樣,我們就無須過濾噪聲,也無須知道噪聲的來源,就可以收到信號源發(fā)出的信息。這就是我們在嘈雜的飯館里說話需要大點聲的原因。香農提出了一個信噪比的概念,即信號的能量和噪聲能量的比值。當信噪比太低時,我們就無法準確地辨認對方傳來的信息。因此,改進通信系統(tǒng)的目標則是提高信噪比。
密碼設計的原理和有噪聲下的通信原理是相同的,但是追求的目標卻相反。密碼的設計者,要想方設法讓密文在外人看來完全是噪聲,沒有任何有價值的信息。從這個意義上講,加密就等價于在信號中加入噪聲。那么什么樣的密碼是安全的呢?香農指出,加入最難去除的噪聲所對應的密碼最安全。那么,什么是最難去除的噪聲呢?答案是白噪聲。它們是一種完全隨機的信號,在不同頻率下具有相同的強度,沒有任何可以辨別的特定性質。因此,想將白噪聲從信號中甄別出來并且徹底去除,根本無從下手。基于這個原理,香農指出,安全的加密方式是要讓密文看上去像白噪聲,各個字符出現(xiàn)的頻率都相同,找不到任何統(tǒng)計規(guī)律,解密者對此就無能為力了。這時,如果我們衡量一下密文的信噪比,它近乎為零。
在理解了密碼和噪聲信道的通信具有相同的原理之后,香農進一步建立了描述通信原理的數(shù)學模型,這個模型后來被稱為香農公式。這個公式對通信的意義類似于熱力學第二定律之于熱力學——它不僅指出了通信的極限,而且告訴了人們改進通信的方向。從那時開始, 人類在通信領域,從被動自發(fā)的狀態(tài)開始進入主動自覺的狀態(tài)。
香農為通信建立的數(shù)學模型,后來也成為人工智能的理論基礎。
20 世紀 70 年代,弗雷德里克·賈里尼克等人利用噪聲信道的通信模型,解決了語音識別、機器翻譯等一系列人工智能問題。直到今天, 這個模型依然被廣泛地應用于信息產業(yè)的方方面面。
注:本文節(jié)選自吳軍撰寫的新書《信息傳》,原文標題為“開啟信息時代的天才”。
注釋:
[1].這是人們給那條長上百米、貫穿麻省理工學院 4 棟大樓的走廊起的名字。
[2].麻省理工學院的人習慣于用數(shù)字給所有的東西起名字。
[3].諾布爾獎(Alfred Noble Award)和諾貝爾獎(Nobel Prize)在拼寫上很相似,以至很多人會把它們搞混,但它們完全是兩回事。
制版編輯 | 栗子