用數學模型預測交通,理性工具還是巨坑?

城市發(fā)展,修橋建路,離不開出行預測這一基本的決策工具。從70年前誕生至今,出行預測的發(fā)展見證了客觀嚴謹的科學方法在指導交通規(guī)劃方面的巨大成功。但本文作者認為,出行預測既是科學問題,也是政治問題。數學模型不應該、也不可能成為公共政策制定的唯一考量。拔高它的科學性不是解決問題的方案,而正是問題所在。
撰文 | 聶宇(美國西北大學)
● ● ●
引 言
交通運輸學界的前輩,David Boyce 和 Huw Williams 都曾站在各自專業(yè)領域的巔峰,見證了出行預測的誕生和成長。他們在榮退之后,總結反思,以全球視野,稟史家筆法,伏案十余年寫就《城市出行預測:歷史現狀未來》這本奇書(后文簡稱《出行史》)。
說《出行史》是一本奇書,是因為它兼收并蓄:既可作行業(yè)歷史泛讀,也是交通分析入門的精讀教材。普通讀者會從書中學到出行政策制訂、規(guī)劃實踐的常識,也能找到滿足好奇心的逸聞故實;專業(yè)人士則可通過此書整合知識體系,融會貫通,更上層樓。總結起來,《出行史》有三大特點:(一)對歐美出行預測發(fā)展史的比較分析;(二)兼顧出行系統(tǒng)分析中供給、需求兩大分支;(三)持論公允,無夸張曲解,也不文過飾非。對應這三點,下文也分為三節(jié)。前兩節(jié)講歷史,為出行預測立傳,回顧模型的前世今生;第三節(jié)作批判,反思得失,展望未來。
1
出行預測發(fā)源于1950年代的美國。其時戰(zhàn)后經濟繁榮,大量來自南方農村的人口涌入城市。受新增人口沖擊,部分城市居民開始搬離市中心,向郊區(qū)轉移。郊區(qū)化浪潮引發(fā)的職住分離,給道路交通系統(tǒng)帶來了巨大的升級壓力。1956年,埃森豪威爾政府通過聯邦公路援助法案,迎接機動化挑戰(zhàn),拉開了州際公路網建設的帷幕,一干就是二十多年。如此大規(guī)模的基礎設施投資,很自然地催生了對規(guī)劃的需求。簡言之,需要修多少路,什么樣的路,在哪里修,什么時候修?這些問題的提出讓聯邦和地方政府中的有識之士意識到,要做好公路網絡規(guī)劃的決策,首先要搞清楚居民的出行需求,以保證道路供給與之匹配。因為規(guī)劃面向未來,所以僅知道現狀出行需求還不夠,還需根據現狀對未來需求進行預測,這就是出行預測的發(fā)端。出行預測從那時起到今天,大致經歷了三個發(fā)展階段。
1953年,Douglas J. Carroll 牽頭在底特律開展了首次大規(guī)模城市出行研究。他把底特律地區(qū)分為兩百多個交通小區(qū),以家訪調查為基礎預測未來進出小區(qū)的出行總量,并估算總量在各小區(qū)對之間的分布,生成通常所說的出行表(或出行矩陣)。出行表最終通過一個簡單的步驟加載到路網之上,用于預測和評價不同規(guī)劃方案對應的交通流量、旅行時間和服務水平??梢钥吹剑滋芈裳芯恳呀浶纬闪撕髞泶竺ΧΦ乃牟浇煌ㄒ?guī)劃法的雛形,除了方式劃分,其他的三步,出行生成、出行分布和交通分配都已正式登場。
底特律大功告成之后,Carroll轉戰(zhàn)芝加哥,領導了出行預測史上最負盛名的地區(qū)交通研究。芝加哥研究第一次通過土地利用類型預測人均出行率,并正式考慮了公交在出行中的分擔率,由此引入了方式劃分的概念。人類歷史上第一次用計算機大規(guī)模求解最短路算法大概也是芝加哥研究的創(chuàng)舉,當時的芝加哥地區(qū)路網有多達2500個路段,對內存的要求逼近最新一代大型機(IBM704)的極限。
芝加哥研究之后,1960年代之初,美國公路局開始介入出行預測,總結實踐經驗,正式形成了由出行生成、出行分布、方式劃分和交通分配四個順序步驟組成的理論框架,并在隨后的十年間開發(fā)了影響深遠的出行預測計算程序包,從此成就了四步法一統(tǒng)江湖的地位。出行預測行業(yè)的奠基工作就此完成。

圖1 出行預測模型框架(美國交通部,1972)
到上世紀70年代中期,隨著美國州際公路網基本建成,多數大都市完成了中長期道路交通綜合規(guī)劃方案的制訂,并通過都會規(guī)劃組織的設立制度化,定期根據人口、就業(yè)趨勢對方案更新。
美國人從政治動蕩的60年代走出來,開始發(fā)現全民機動出行并非想象中的天堂。首先是路越多越堵。連接郊區(qū)和市中心的高速路加速了郊區(qū)化進程,結果是修路的速度趕不上通勤人口的增長。其次是汽車排放造成嚴重污染,霧霾酸雨在大城市成為家常便飯。再次,遍布的高速路侵占城市空間,割裂社區(qū),少數族裔深受其害。最后,中東石油危機造成油價飛漲,開車成本猛增,成為壓垮駱駝的最后一根稻草。
1977年,美國頒布《清潔空氣法案》修正案,要求出行規(guī)劃將空氣質量目標納入規(guī)劃步驟。從那之后,出行規(guī)劃的目標開始從單純滿足(機動)出行需求,轉向如何對出行需求進行管理,包括限制駕車出行,鼓勵使用更環(huán)保的方式等。而出行規(guī)劃實踐的重心也從編制長期方案轉向各類短期交通需求管理項目,如共乘車道設置,擁堵收費,公交改善等。
這一時期,傳統(tǒng)四步法仍然是出行預測實踐中的絕對主力,但學界迎來了方法論上爆發(fā)式的創(chuàng)新,各類成果開始緩慢地向實踐滲透轉移。這些創(chuàng)新主要圍繞對四步法的組合統(tǒng)一,增加模型現實性,以及以行為為核心的建模理念展開,開辟了組合出行模型、動態(tài)交通分配、離散選擇及活動模型等幾個大的領域,其影響綿延至今。

隨著蘇聯解體和冷戰(zhàn)結束,美國出行界在90年代初迎來兩個重要的聯邦法案:1990年的《清潔空氣法案》和1991年的《冰茶法案》(注2)。前者第一次對出行預測的步驟做出了具體要求,包括考慮出行在一天內隨時間變化的動態(tài)特性,以及四步法不同步驟間的反饋(即一致性)。后者提出了以提高道路設施運行效率為核心的治堵理念,并要求長期規(guī)劃應滿足《空氣法案》的交通控制措施,并綜合考慮交通投資決策對用地和經濟發(fā)展的影響。聯邦公路局隨后發(fā)起了交通模型改進工程,正式啟動對傳統(tǒng)出行預測方法的系統(tǒng)改進。
除去各都會組織對它們手中出行模型的修修補補,這期間大量的嘗試都圍繞活動模型和動態(tài)交通分配兩條技術路線展開,目標是通過應用微觀仿真技術提升出行預測中的行為和物理現實性,形成支撐短期甚至實時需求管理決策的能力,為打造 “智能交通系統(tǒng)” 服務。
遺憾的是,理想很豐滿,現實很骨感。時至今日,能在出行預測中經常使用活動模型和動態(tài)交通分配的都會組織依然寥寥無幾,真正唱主角的仍是早就被噴得體無完膚,打著各色補丁的四步法。也許一線規(guī)劃師和他們的主管一樣,習慣了蕭規(guī)曹隨,不自覺地抵抗新生事物。但是,使用這些新技術對數據收集、計算資源和分析能力提出的要求,確非一般都會組織所能滿足。而它們在實踐中體現出的真正價值,即對決策能力和預測準確度的提升,又跟它們高昂的價格背離。
這個時期出行領域細分趨勢明顯,本該互通有無、協(xié)同共進的技術路線經常處于并行的狀態(tài),多數研究者和規(guī)劃師滿足于在自己的一畝三分地里深耕,成為真正的 “專家”。某種意義上,這是一個領域范式成熟的表征。但三十年如白駒過隙,而創(chuàng)新在實踐中的應用始終乏善可陳,或許是舊范式已成桎梏、新范式的創(chuàng)立當提上日程之征兆。
圖3 1991年美國國會《冰茶法案》(ISTEA)
2
模型的前世今生
數學模型是出行預測的靈魂,也是它科學性的基礎。什么是數學模型呢?簡言之,模型是真實世界的鏡像,它通過合理簡化,把研究對象用抽象的數學符號和公式系統(tǒng)來表達,幫助決策者發(fā)現基本變量間的相互關系,掌握其演化的基本規(guī)律,并以此為據建立決策支撐體系。
Carroll的最初工作其實就是把一個復雜的決策問題——即如何規(guī)劃路網以滿足遠景出行需求—抽象并轉化為數學模型。他的模型有兩個基本組件:分割為交通小區(qū)的路網(供給),需要出行的居民(需求)。Carroll的初衷是量化各種道路規(guī)劃方案在未來對機動車出行服務水平的影響。為此,首先要估算小區(qū)內居民在工作日的出行次數,即出行生成。其次,出行總量在各小區(qū)對間如何分布,即出行分布。再次,各種方式(駕車、公交等)如何分擔各小區(qū)之間的出行量,即方式劃分。最后,小區(qū)出行量加載到道路網上以估算服務水平(旅行時間),即交通分配。四步法雖然很快就因為簡單實用被廣泛接受,但作為嚴謹的數學模型,它有幾個很大的漏洞。
首先,生成出行的思路非常粗糙:先通過調查把出行量跟解釋變量(如用地方案,人口等)或家庭特征(如擁車量,收入,人口結構等)關聯,然后以統(tǒng)計關系為基礎,把對解釋變量的預測轉化為出行總量的預測。這里的問題是從調查數據中回歸出來的統(tǒng)計關系只代表相關性,且在N年后未必適用。另外,有些變量(如用地方案)與出行有顯著的相互影響,但仍被當作外生變量單獨預測。
其二,出行分布和方式劃分在順序上位于交通分配之前,但卻依賴于交通分配生成的服務水平指標作為輸入。因此,順序四步法存在自相矛盾,即用于確定出行分布和方式劃分的服務水平偏離交通分配產生的服務水平。
其三,交通分配的基本假設是司機會選擇路網中最短(快)的路線。然而,隨著交通量上升,道路會產生擁堵,增加旅行時間,原來的最短路不再最短。Carroll意識到一部分司機會不斷換到其他路線以規(guī)避擁堵,但是沒有討論這個過程是否存在收斂點(即均衡態(tài)),以及如何計算收斂點。
其四,完全無視出行的動態(tài)特性。出行量瞬間加載到路網上,由提前標定的多項式函數轉化為旅行時間。這造成擁堵效應固化到路段,無法復制真實網絡里的傳播效應。更重要的是,任何與日程安排(例如出發(fā)時間)相關的出行決策都只能拋棄。
所謂不滿是向上的車輪。這些缺陷成為創(chuàng)新的源泉,其巨大推力在1960年代開始在學術界顯現。
首先討論均衡問題,是因為它的提出早于Carroll的芝加哥研究。這個理論上的重大突破,要歸功于50年代從戰(zhàn)后的德國漂洋過海,來到芝加哥大學做博后的經濟學家 Martin Beckmann。
對選路均衡的描述可以追溯到1920年英國經濟學家 Arthur Pigou 發(fā)表的《福利經濟學》以及1952年 George Wardrop 提出的Wardrop 均衡態(tài):均衡態(tài)被定義為 “無人能通過改變行駛路線降低旅行時間” 的狀態(tài)(注3)。Beckmann與兩位合作者于1956年發(fā)表《交通經濟學研究》,率先構造了均衡網絡交通分配的非線性數學規(guī)劃模型,并證明它的最優(yōu)解即Wardrop 均衡。通過求解Beckmann模型,即可獲得四步法中最后一步的精確解。后來的研究者發(fā)現,以Beckmann模型作為基礎,也可以推導出組合模型,把四步法中的后三步合為一體。然而,命運雖然在同一時間把Carroll和Beckmann安排到同一座城市,但卻讓他們擦肩而過。這兩位分別為出行預測的實踐和理論奠基的大神似乎對彼此的工作一無所知,錯失了攜手發(fā)展的良機,實為出行界一大憾事?!督煌ń洕鷮W研究》雖有后來的諾獎得主 Tjalling Koopmans 作序背書,但影響甚微,很快湮沒無聞,Beckmann當時也完全沒意識到,自己博后出站寫本書,居然開辟了一個新領域。
就實用性來說,Beckmann模型的致命傷是沒有能在實際網絡上對它求解的算法。冥冥之中似有天意,鑿開這塊璞玉的工具在《交通經濟學研究》發(fā)表的同一年,已經被兩位應用數學家Marguerite Frank 和 Philip Wolfe 鍛造完畢。不過出行領域要等到70年代初,才會由蒙特利爾大學的 Michael Florian 和西北大學的 Larry Leblanc 分別獨立發(fā)現,本來為二次規(guī)劃問題設計的Frank-Wolfe算法,竟是求解均衡模型的大殺器。也大約在那個時候,Beckmann的工作通過他在布朗大學的同事,希臘裔應用數學家 Stella Dafermos 等一干學者,被出行領域重新發(fā)現,奉為經典。直到現在,有Frank-Wolfe算法加持的網絡均衡模型,仍是出行預測領域應用最廣、研究最透、粉絲最多的理論。
模型一體化的最初嘗試是土地利用交通一體化。顧名思義,它認為交通規(guī)劃須和區(qū)域土地使用綜合考慮,一方面讓出行生成直接與土地類型關聯,另一方面允許道路設施規(guī)劃影響土地使用政策,包括工作、零售、居住用地的選址問題。在這一領域,Ira Lowry 的城市土地利用模型是60年代最出風頭的理論工作,而應用方面,則當首推以費城為中心的賓州-新澤西交通研究。然而,用地交通模型在實踐中表現很不給力,到70年代便開始遭到猛烈批評,其中言辭最彪悍的,是伯克利年輕氣盛的助理教授 Douglas J. Lee 寫的《大模型的安魂曲》。
對模型一體化貢獻最大的也許要數英國的應用數學家 Allan Wilson。他發(fā)現出行分布的重力模型與熵函數最大化問題(即找出可能性最大的出行模式)是等價的。由此生發(fā),Wilson意識到最大熵模型不僅可用于統(tǒng)一四步法中的出行分布、方式劃分和交通分配,而且與分層多項Logit模型一致。這一思路很快成為出行模型一體化的范式,在70年代先后出現了瑞典的 Suzanne Evans 的出行分布-交通分布組合模型,賓州大學 Tony Smith 用人類空間交互行為原則對最大熵模型的重新解讀,以及當時也在賓州大學任教的 David Boyce(《出行史》第一作者)對統(tǒng)一Evans組合模型和城市選址問題的嘗試。到90年代 Norbert Oppenheim 發(fā)表《城市交通需求建?!?,完整闡述了最大熵組合模型與隨機效用出行選擇模型之間的關系,為這一系列工作之集大成者。
最大熵法雖然名噪一時,從者甚眾(Boyce就對其頗為偏愛和推重),但它以統(tǒng)計物理來解釋出行現象的做法一直為人詬病。批評者認為它缺乏跟出行行為直接關聯的 “第一性” 原理,僅以最大似然率搜尋統(tǒng)計規(guī)律,難以具備真正的預測力。
解決這個 “第一性” 問題的,是2000年諾獎得主,美國經濟學家 Daniel McFadden。McFadden以個體行為作為預測的對象,用隨機效用最大化理論來對它建模。有了這個微觀基礎。從方式到終點,從路線到出發(fā)時間,復雜的宏觀出行現象可以用一系列互相關聯的離散選擇來描述?!袄硇越洕恕?/span>(homo economicus)會選擇效用最大的出行組合,而不同組合被選中的概率則反應了個體偏好和未知屬性的影響。通過這個理論,預測以行為作媒介來進行;而政策或者規(guī)劃方案的效果,也根據它們對出行組合屬性的影響來判斷。在70年代初期,McFadden以較小的調查樣本,用離散選擇模型正確預測了舊金山灣區(qū)捷運系統(tǒng)(BART)的分擔率,完敗官方的預測,一戰(zhàn)成名,奠定了微觀行為模型與傳統(tǒng)四步法分庭抗禮的局面(注4)。離散選擇模型從此進入快速發(fā)展時代,不僅在出行領域獨占鰲頭,也成為計量經濟學最重要的理論工具之一。在很短的時間內,這股浪潮先后催生了解決選項相關性的嵌套Logit結構,包羅萬象的廣義極值模型,以及微觀仿真方法。一大批后來聲名赫赫的學者,包括美國的Moshe Ben-Akiva,Charles Manski, Frank Koppelman和Ken Small, 英國的Huw Williams(《出行史》第二作者)和 Andrew Daly,都是在這個時期脫穎而出的。
從70年代末開始,“行為第一性” 的倡導者們進一步朔本清源,認為出行更合理的行為基礎是個體和家庭的活動。根據這個理念,出行本身是人類活動的派生需求,因此搞清楚個體活動的規(guī)律,預測出行自然順理成章?;顒幽P筒辉贊M足于預測單次出行,而是預測個人甚至家庭整天的活動日程安排,以及鏈接活動的出行環(huán)。由于預測對象維度的擴展,以及家庭活動的種類、動機和約束的多樣性,活動模型的復雜度和對數據、計算能力的要求呈指數上升,在一定程度上影響了實用性。到后來,理性經濟人假設本身,即個人選擇動機是追求效用最大化,也開始受到質疑。這一派的代表人物是心理學家、諾獎得主 Daniel Kahneman。在發(fā)表于2011年的暢銷書《快思慢想》中,Kahneman梳理了人類決策中認知偏差和非理性的來源,并討論了可以替換 “效用最大化” 的決策框架,包括在70年代末提出,到2000年以后被引入出行領域的前景理論。
出行決策最終形成路上的車流,而道路服務水平(即旅行時間)則跟車流大小緩急的物理特征相關。Lighthill and Witham 最初提出車流在路上的運動與河水在河道里的運動類似,可以用流體力學里的一維守恒律來描述;這是出行領域交通流理論分支的發(fā)端。很巧,它和Beckmann的《交通經濟學研究》以及 Frank-Wolfe 算法一樣,都發(fā)表于1956年。
也在這一年,出行領域另一位大名鼎鼎的人物,物理學家 Robert Herman 加入了通用汽車實驗室,主管基礎科學。在通用實驗室,Herman從司機行為入手研究交通流特性,提出了跟馳模型,并用實驗驗證標定。他不僅為后來的微觀交通仿真和動態(tài)交通分配夯實了科學基礎,更開風氣之先,通過創(chuàng)辦《交通科學》雜志和《運輸和交通流理論論壇》(注5),促進了出行領域各分支學科的交流、融合和發(fā)展。
交通流領域的另外一位頂尖學者,伯克利的 Gordon Newell, 也是物理學家出身。和Herman從微觀行為著眼不同,Newell更鐘愛以流體力學和排隊論為基礎的宏觀理論。這兩位先驅的學術理念傳承至今,在動態(tài)交通分析領域形成了微觀、宏觀和中觀仿真三大分支,其中最杰出的代表要數伯克利的 Carlos Daganzo 和我的同事 Hani Mahmassani。前者和Newell一起簡化并把Lighthill-Witham模型從單一路段推廣到網絡,奠定了它今天在動態(tài)交通分析中的主流地位;后者在80年代跟Herman合作,以動態(tài)交通仿真擴展網絡均衡概念,是動態(tài)交通分配領域的開創(chuàng)者之一。
最早把動態(tài)分析引入出行領域并跟經濟學模型結合的是另一位諾獎得主William Vickrey。他在1969年用排隊論構造了優(yōu)雅的瓶頸模型,以閉合形式描述早高峰擁堵形態(tài)與通勤者出發(fā)時間選擇的關系,并提出用動態(tài)擁堵收費可以消除擁堵,提高效率。有意思的是,這篇把擁堵收費從靜態(tài)擴展到動態(tài)的重要論文,在之后的十余年間在出行領域似乎無人知曉。直到80年代初,Vickrey的通勤模型才被美國的 Chris Hendrickson,Newell和Daganzo以及英國的 Mike Smith 等人重新發(fā)現,并通過以 Richard Arnott 為首的一批經濟學家的深耕,成為動態(tài)出行領域重要的分析工具。
早期出行模型的另一個缺陷是所謂的 “確定性假設”。批評者指出,實際出行系統(tǒng)的供需兩端都經常受各種隨機因素(如事故、異常天氣、特殊事件)影響,相當不確定。最先提出和解決隨機交通分配問題的大概是 Robert Dial,出行領域的算法設計天才。他1971的博士論文解釋了Logit隨機分配原理并設計了高效算法STOCH。到70年代中期,當時還在麻省理工任教的Daganzo和 Yosef Sheffi,Warren Powell 等學者開始系統(tǒng)研究隨機分配問題,到1985年Sheffi發(fā)表他的名作《城市交通網絡》之時,隨機模型已經占到了全書四分之一的篇幅。在后來的日子里,隨機性、可靠性和魯棒性的重要性逐漸凸顯,成長為對Beckmann模型進行升級拓展的標配。
3
出行預測批評
既然寫書評,批評自是題中應有之義。但這里寫的,并不是對《出行史》的批評,而是對出行預測領域本身的批評?!冻鲂惺贰分袑Τ鲂蓄A測的批評占了大半章的篇幅(第11章),有心的讀者請仔細把玩兩位老先生的史筆。需要說明的是,本節(jié)中的批評雖有些方面與《出行史》重疊,但大多為個人觀點??偨Y起來,我認為出行預測有五大問題,以下逐一辨析。
無法證偽的尷尬
預測未來出行需求是為了指導現在的行動,即交通或者用地規(guī)劃。但現在的行動,包括修高速路、造地鐵、收擁堵費等等,又會對需求形成擾動。所以曾任美國交通研究委員會主席的 Martin Wachs 認為,既然行動和預測互相影響,則以預測做為行動的出發(fā)點,邏輯上成了循環(huán)論證之困局(Dilemma of circularity,注6)。
譬如為了連接郊區(qū)和市區(qū)而考慮擴建高速路。假定規(guī)劃師預計20年后郊區(qū)每天去市區(qū)的通勤人數新增8000,按現狀公交分擔率,一半會選擇常規(guī)公交,另一半選擇開車。如果每條高速車道容納2000輛車,則新增兩條車道正好能夠滿足需求,不增加擁堵。20年后,發(fā)現通勤人數確實增加了8000,但公交分擔率降到了25%,高速路堵得一塌糊涂。這能夠說明規(guī)劃師20年前的預測大錯特錯嗎?亦或是擴建高速刺激了更多人購車,并且在習慣開車之后不愿再用公交了?還有一種場景,就是規(guī)劃師推薦修輕軌,雖然花費多一倍,但可以增加公交分擔率,吸收掉新增通勤人口。結果輕軌也許比高速路的吸引力更大,造成通勤人數增加到12000,輕軌不堪其負,擠不上輕軌的上班族也不甘心使用常規(guī)公交,依然駕車出行,高速路還是堵了。
循環(huán)論證的困境,決定了制定交通規(guī)劃這樣的公共政策無法擁有完全客觀的 “正確性” 標準。在上面這個例子里,修高速或輕軌都與預測嚴重偏離。前者增加了駕車出行,使高速路更擁堵,而后者讓更多的人搬到郊區(qū),惡化了職住分離。哪一個決策錯得更厲害呢?什么都不做會更好嗎?政策制訂者永遠不會知道。現實中真正實施的只有一個方案,它錯了,并不能證明它就是備選方案中錯得最離譜的。實際上,一個與預測偏離嚴重的方案甚至也可能是最佳方案,雖然這個命題同樣也無法證偽(not falsifiable)。
如果用哲學家 Karl Popper 的標準,不能證偽的出行預測是不能稱為科學的。使用數學模型或許可以為它披上一件科學的外衣,但改變不了它無法證偽這個基本事實。
大膽假設的危機
新文化運動領袖胡適說做學問應該 “大膽假設,小心求證”。在出行預測上,大膽假設并不難,甚至沒有它我們就寸步難行,但求證很多時候不是光靠小心就行的。
即使是最簡單的預測,例如把某地區(qū)出行的歷史趨勢做外推,也需要先建立出行量和土地使用、擁車率、收入水平、人口等解釋變量的統(tǒng)計關系,然后用它把解釋變量的趨勢轉化為出行量的趨勢。這里面至少需要四個隱含假設。首先,出行量和解釋變量存在因果關系(causation)而非簡單相關性(correlation);其次,未包含在模型里的因素對出行的影響可以忽略;其三,模型內嵌的因果關系在未來依然成立;最后;對解釋變量本身變化趨勢的獨立預測是正確的。這四個假設里面沒一個是好求證的。最后一個與出行本身無關,略過不表。分辨兩個變量的關系是因果還是相關雖然理論可行,但技術門檻很高,還需要耐心和運氣,實踐中操作性并不強。關于那些被模型忽略掉的變量,最出名的是汽油價格。在出行預測的奠基階段,油價因為長期維持在低位,且波動幅度不大,被模型直接忽略。到70年代石油危機驚醒夢中人,模型師們才發(fā)現原來油價也是會影響出行選擇的。至于假定歷史趨勢會持續(xù)下去,只能算是愿景,沒有任何理論依據。人們不愿意假設未來會偏離現有趨勢可以理解。除了大多數人天生對劇烈變化的排斥(即風險規(guī)避),另一個原因是大幅偏離趨勢的可能性是無窮多的,而每一個真正能實現的可能性遠低于維持趨勢的可能性。因此,大膽假設在出行預測中經常表現為保守主義。
對一個簡單統(tǒng)計外推的假設求證就如此艱難,就不要說其他各種真正大膽的假設了。僅以上文提到的通勤問題為例。在經濟學家眼里,這不過是個誘導需求(induced demand)問題,即增加出行供給會激發(fā)潛在需求,推動服務水平回到原來的平衡點。解決辦法很簡單,假設需求隨供給根據某個函數關系變化,讓模型通過供給水平來確定需求就行了。事實上,Beckmann在50年代年做出世界上第一個網絡均衡模型的時候,供需關系就已經是彈性的。這個辦法看上去解決了誘導需求引發(fā)的邏輯自洽問題,但實踐中卻會讓預測變得更復雜。這是因為需求不僅與供給有關,也與其他因素(如擁車率,人口)有關,并且受制于對它們做統(tǒng)計外推的各種假設。因此,增加一個供需函數解決不了存在的問題,反而讓各種關系變得剪不斷、理還亂,小心求證更無從說起。
有種觀點認為,循環(huán)論證和大膽假設的由來,歸根結底是簡化模型的需要和缺乏第一性原理的驅動。在出行領域中,第一性原理來自物理規(guī)律(如交通流理論)或者行為準則(如效用最大化)。統(tǒng)計外推屬于單純從數據中尋找規(guī)律的歸納法(inductive method)。普遍的看法是,因為沒有第一性原理(first principle)的加持,它無法獲得演繹法(deductive method)那樣的解釋力和預測力。
如果這是病源,那藥方自然是盡量用第一性原理把各種變量間復雜的關系表達出來,消除對外生條件的假設。比如,要解決誘導需求就把供需關系放到模型里;發(fā)現土地使用和出行相關,就構造土地使用-出行一體化模型;認識到出行是活動的衍生需求,那就轉而預測活動而不是出行;而活動又依賴于家庭結構的長期演化,因此,不如干脆把找工作、買房子甚至結婚生孩子都一起預測了。反正所有人類活動都涉及某種選擇,可以用經濟人效用最大化原理輕松搞定。
這樣層層加碼的邏輯終點必然是一個異常復雜,包含無數關系,試圖復制真實世界本身的 “超級模型”。某種意義上,這類似于物理學家的終極理想,即一個可以完全解釋并預測宇宙萬物演化的宏大理論。遺憾的是,這類超級模型制造的問題多半比它們解決的更多。撇開標定、計算復雜度、運行維護的挑戰(zhàn),海量變量之間復雜的相關性已經超出模型師可以控制甚至理解的范圍。這是因為在模型中每加入一組新的相關性,它可能會跟已有變量產生二階,甚至三階的關聯;上面提到供需關系和人口及擁車率的互動即是一例。在大模型里,這些關聯可能是無法預見的,也可能根本就在現實世界中不存在。正如Lee所說,“在模型中加入更多的組件給模型師帶來一種幻覺,讓他們覺得模型更完備,而不確定性降低了。但在實踐中,每個新組件帶來的未知因素都比已知的多?!?/span>(注7)在這樣的情況下,如果超級模型輸出結果與現實出現偏差,模型師幾乎無法判斷問題出在什么地方,它變成了真正的超級黑匣子?;蛟S有人會說,這樣跟機器學習殊途同歸,不也挺好的嘛。但問題是,機器學習做出黑匣子是求仁得仁,而用演繹法做出一個黑匣子未免就南轅北轍了。
過度擬合的陷阱
過度擬合是預測模型的常見病,但在復雜出行模型中,這個問題尤其難纏。前面講到,復雜模型由于內部關系太糾結,在模型輸出與觀察數據出現偏差的時候,很難從第一性原理出發(fā)去解決問題(如識別變量間尚未發(fā)現的因果關系,或者調整已知關系的函數形式)。這時候模型師通常會祭出標定這件法寶,即調整模型里某些參數,讓輸出與觀察匹配。這種做法本來無可厚非,但問題是當模型里有成千上萬的參數時,能夠與觀察相匹配的參數組合幾乎是無限的。不夸張地說,哪怕觀察的數據是在火星上收集的,模型也照樣可以跟它湊上。
所以數學家 John von Newmann 警告我們,“給我四個參數,我就可以湊出一頭大象,再多給我一個,我還能讓它搖鼻子呢?!?/span>(注8)湊出來的模型,不管跟觀察數據吻合得多么完美,用于預測時都難免差之毫厘謬以千里。雖然機器學習本質上用的也是這套方法,但成功使用機器學習的領域,通常決策變量的維度較小且結構性較強(如識別問題),加上龐大的數據量對變量空間覆蓋相對完整,使得它對過度擬合問題有較強的抵抗力。不幸的是,出行預測的輸出變量通常維度很高,結構復雜,刻畫系統(tǒng)特征的觀測數據很難達到應用機器學習的要求。
說句題外話,過度擬合的陷阱并非出行領域獨有。歷史、政治、和經濟學家們也經常掉進坑里,誤把從有限事件(數據)里擬合出來的規(guī)律(模型)當做可以預見未來的水晶球。第一個拿諾貝爾經濟學獎的美國人Paul Samuelson(哈佛大學前校長Larry Summers的叔叔),在1970年還寫書預言蘇聯的GDP會在1990年到2000年間超過美國(注9)。這個時候離蘇聯土崩瓦解只有不到20年。著名政治學家 Francis Fukuyama(《文明的沖突》作者Samuel Huntington 的弟子)在蘇聯解體后寫下《歷史的終結》,宣稱民主憲政是人類政治體制發(fā)展的終點??上哺洞笤捨饔巍防锏淖舷枷勺右粯樱轮辛碎_頭,沒有猜到結尾。40年之后,政治歷史并未終結,威權政體并未消亡,倒是西方憲政民主,正在經歷前所未有的危機和變局。 所以哈佛大學著名心理學家Stephen Pinker在《人性中的良善天使》(The better angels of our nature)中開玩笑說,“社會科學家絕不應該試圖預測未來,預測過去已經夠他們忙活了?!?/span>(注10)忠言逆耳利于行,出行領域或可以此為鑒。
圖4 數學家 John von Newmann
出行預測的本意是去除主觀因素(如長官意志、政治干預)的影響, 以科學指導決策。但出行預測的服務對象是公共政策制訂,而公共政策牽涉的社會各方,博弈關系錯綜復雜,它們之間的利益權衡并沒有完全客觀的評判標準。而前面提到的三大問題,即無法證偽、大膽假設和過度復雜,又為政治干預留出了巨大的操作空間。因為無法證偽,所以錯了無需擔責;允許大膽假設,則可用假設操控結果;模型過度復雜,從而解讀預測結果必須依賴少數專家的專業(yè)能力和操守。但是專業(yè)能力未必總是靠得住,因為有的超級模型已經變成了仙俠小說中要反噬其主的法寶。而職業(yè)操守,在名利面前,生存壓力之下,有時也會成為維持不起的奢侈品(還記得錢鐘書在《圍城》里戲謔 “廉恥并不廉”?)。
關于這個問題Wachs有段描述非常精彩,摘錄如下:
“頂住壓力,不把營私利己的預測裝點成完全客觀的技術分析,并不容易。專家們彬彬有禮地宣揚自家預測的客觀性,既可以維護行業(yè)的地位,也能彰顯存在感……假裝某個預測結果是完全客觀科學的,符合政策制定各方——包括專家、主管官員、和政策的倡導者——的利益,尤其當資源緊缺令取舍不可避免,而該結果正好支持由于種種原因被提前看好的政策之時”。(注11)
再以通勤問題為例。修輕軌還是擴建高速遠不僅是改善出行、造福民生這么簡單,它還涉及經濟發(fā)展、官員政績、承包商利益等方方面面。假設城市的管理者出于發(fā)展郊區(qū)經濟的考量,或者響應國家公交導向的倡導,傾向修輕軌。如果模型說明修建輕軌確實比擴建高速好,那自然皆大歡喜,其結果被奉為金科玉律,成為打擊 “質疑輕軌論” 的利器。如果不巧發(fā)現建輕軌不是最佳方案呢?這時候決策者大概要懷疑專家們的判斷力了。對輕軌的分擔率的估計過分保守了?人口老齡化的問題考慮到了嗎?高速路污染排放的成本是不是低估了?
由于模型中總有大量假設和可調參數,“調出” 決策者想要的結果,絕非難事。覺得這有違職業(yè)操守而斷然拒絕的人,也許專家這份很有前途的工作就干不成了;靈活性比原則性更強的人可以找出各種理由說服自己:其實原來的結果也未必就更合理,因為到底哪個更“正確”這個問題其實是無解的。
拋開這種誅心之論,決策者和專家們本身也難免受各種心理偏見的左右。其中最著名的是Kahneman發(fā)現的規(guī)劃謬誤(Planning fallacy),即規(guī)劃者普遍有過度樂觀的傾向,具體表現為低估項目成本和完成時間,高估收益。在出行領域里,規(guī)劃謬誤是家常便飯。
《出行史》第11章回顧從1970年代以來的出行預測時提到,“對于軌道項目而言,十之有九其乘客預測是高估的,平均高估106%”?!督煌ā冯s志前主編 David Hartgen 在2013年寫到,“高估出行量和低估成本的趨勢非常明顯,尤以收費公路為甚”(注12)。Planning fallacy 的心理學解釋有很多,比較著名的有一廂情愿癥(wishful thinking)和自利偏差(self-serving bias)。前者指規(guī)劃師錯把自己最想要的結果當成最靠譜的預測;后者源于決策者習慣性地把成功歸因于自己,把失敗歸咎與他人,最終喪失判斷能力。還有一種更為誅心的解釋叫添油戰(zhàn)術(authorization imperative),認為決策者有意無意在預測的時候降低成本,夸大收益,是為了讓項目獲批。而一旦項目上馬,就算大幅超過預算,納稅人為了挽救沉沒成本,也會乖乖追加投資。
結 語
在寫這篇讀書筆記時,我經常問自己,出行預測這門70年前在二戰(zhàn)后百廢待興的特殊社會經濟條件下興起的新學科,在全球經濟發(fā)展放緩,全球化進程受阻,人口老齡化趨勢加速的未來50年,還會繼續(xù)存在嗎?如果會,它該如何適應新的環(huán)境呢?
我還沒找到答案,但有幾點體會想寫出來,與同道中人相互啟發(fā)。
首先,做模型的目的是為了解決問題,所以一定要先有解決的問題,再去尋找或者打造工具。有的時候,甚至建模本身就不是解決問題的正途?;氐紺arroll的時代,他發(fā)明四步法的目標很明確:解決如何有計劃地擴建公路網的問題。但70年后的今天,很多專家手中的出行模型經過多年開發(fā),代代相傳,已不再是解決某個問題的專門工具,而儼然是包治百病的靈丹妙藥,或者無鎖不開的萬能鑰匙。關于這一點,Lee在《大模型的安魂曲》里有句話發(fā)人深省, “做一個不是為解決問題量身打造的模型,其有用性大概跟收集一堆不知道給誰用的數據差不多。(注13)”
其次,出行模型既不是越真實越好,也不是越復雜越好。George Box 的名言雖是老生常談,但還是值得再重復一次:“世界上沒有‘正確的’模型,只有有用的模型(注14)”。在有用的前提下,模型應該如愛因斯坦所說, “簡化到無法再簡化為止(注15)”。30多年前, Mahmassani在評價當時風靡一時的活動模型時曾寫道 ,“ 在瀏覽(活動模型)領域浩瀚的文獻時,你會感嘆研究者是否已經迷失在對…… 種種復雜性的追尋之中,而對簡單并可重復的規(guī)律視而不見”。其實很多時候,真正解決問題的正是那些簡單并可重復的規(guī)律(注16)。
最后,出行預測不全是科學問題,也是個政治問題。這話從一個熱愛數學模型、在大學里教工程的學者口中說出來好像有點匪夷所思。但是,我確實認為,出行預測模型既不應該、也不可能成為公共政策制定的唯一考量。拔高它的科學性不是解決問題的方案,而正是問題所在。由于社會經濟系統(tǒng)的復雜性,對幾十年后的未來需求給出有用的預測可能壓根兒是不可能的。正如 van Vuren 所說,“我們要丟掉模型可以解決問題,給出正確答案這種不切實際的幻想。(注17)” 模型能做的,不過是提高決策過程的透明度和效率,分解問題,對假設進行測試,幫助決策者思考、辯論和取舍罷了。
作者簡介
制版編輯 | 盧卡斯