科學與假設 · 第十一章 機率演算
在這裡查明關於機率演算的思想,無疑會使人感到驚訝。它與物理科學的方法有什麼關係呢?可是,我要提出而不去解決的問題自然地呈現在正在思考物理學的哲學家的面前。正是針對這一情況,我在前兩章常常不得不使用「機率」和「偶然性」的詞彙。
正如我在上面已經說過的:「預見的事實只能是可幾的。一個預見在我們看來不管建立得可能多麼牢固,我們從來也沒有絕對保證,實驗不會否證它。然而,其機率往往是很大的,以致我們實際上可以滿意它。」稍後,我又補充說,「看看簡單性的信念在我們的概括中起了什麼作用。我們已在為數眾多的特例中證實了簡單的定律;我們拒不承認這種如此經常重複的一致只能是偶然性的結果,……」
這樣,在許多境況下,物理學家與只盼望機遇的賭徒處在同一位置上。他像運用歸納推理一樣,也常常或多或少有意識地需要機率演算,這就是我不得不引入插話、中斷我們的物理學方法研究的原因,以便稍為比較仔細地審查一下這種演算的價值以及相信它有什麼好處。
機率演算這個名字本身就是一個悖論。與確定性相對的機率是我們不知道的東西,我們如何能夠演算我們不知道的東西呢?可是,許多著名的學者已經從事這種演算,而且不能否認,科學從中獲得了不少好處。
我們如何能夠說明這個表觀上的矛盾呢?
機率被定義了嗎?它到底能夠被定義嗎?如果不能定義,那我們怎麼敢針對它進行推理呢?人們將說,這個定義是很簡單的:一個事件的機率是有利於這個事件的個例數與可能的個例總數之比。
一個簡單的例子將表明,這個定義是多麼不完善。我擲出兩個骰子。要使這兩個中的一個至少出現六點的機率是多少?每一個骰子能夠顯示出六個不同的點;可能的個例數是6×6=36;有利的個例數是11;機率是11/36。
這是正確的答案,但是,難道我不可以同樣說:兩個骰子上現出的點能夠形成6×7/2=21種不同的組合嗎?在這些組合中,6個是有利的;機率是6/21。
現在,為什麼第一種枚舉可能個例的方法比第二種合理呢?
無論如何,這不是我們的定義所能告訴我們的。
因此,我們只好用下述說法完善我們的定義:「一個事件的機率是有利於這個事件的個例數與可能的個例總數之比,倘若這些個例同樣是概然的話。」這樣一來,我們便被迫用概然定義概然了。
我們怎麼能夠知道,兩個可能個例同樣是概然的呢?這難道是依據約定嗎?如果我們在每個問題的開頭都放一個明晰的約定,那可就好了。於是,除了應用算術和代數法則以外,我們將無事可做,而且我們將完成我們的演算,我們的結果毫無懷疑的餘地。但是,如果我們希望稍微應用一下這個結果,那麼我們必須證明我們的約定是合理的,於是我們將發現我們恰恰面臨著我們企圖迴避的困難。
人們能說健全的感官足以向我們表明應該採納什麼約定嗎?哎呀!貝爾特朗德(Bertrand)先生為了自娛而討論了下述的簡單問題:「圓的弦可比內接正三角形之邊大的機率是多少?」這位傑出的幾何學家相繼採納了健全的感覺似乎同樣都能說出的兩個約定,他發現一個機率是1/2,另一個機率是1/3。
似乎從所有這一切就能斷言,機率演算是一門無用的科學,而且我們必須懷疑這種模糊的本能,可是我們剛才還稱其為健全的感覺,並習慣於求助它來證明我們的約定是合理的呢。
但是,我們也不能贊成這個結論;沒有這種模糊的本能,我們便無從做起。沒有它科學則是不可能的,沒有它我們既不能發現定律又不能應用定律。例如,我們有權利闡述牛頓定律嗎?毋庸置疑,許多觀察都與它相符;但這不是偶然性的簡單結果嗎?此外,這個定律幾個世紀以來都為真,我們怎麼知道它明年是否還將為真呢?對於這個異議,你會感到無從回答,除非說:「那是極其不可能的。」
但是,姑且承認這個定律吧。依靠它,我自信我自己能夠計算從現在起一年后土星的位置。我有權利相信這一點嗎?誰能夠告訴我,在從現在到那時這段時間內,一個以極大速度運動的巨大質量不會通過太陽系附近,從而產生未預見到的擾亂呢?在這裡,只能再一次回答:「那是極其不可能的。」
從這種觀點來看,全部科學只可能是機率演算的無意識的應用而已。譴責這種演算就是譴責整個科學。
在有些科學問題上,插入機率演算是比較明顯的,我將稍微詳述一下。在這些問題的最前沿有內插法問題,在內插法中,已知一定數目的函數值,我們企圖猜測中間值。
我同樣要提到著名的觀察誤差理論,我以後還要提及它;氣體運動論這個眾所周知的假設假定,每一個氣體分子都描繪出極複雜的軌道;但是,由於大數的效果,唯一可觀察的平均現象服從馬略特和蓋-呂薩克(Gay-Lussac)的簡單定律。
所有這些理論都建立在大數定律的基礎上,機率演算顯然會毀壞它們。的確,它們只有特殊的利益,除了涉及內插法外,這些都是我們心甘情願付出的犧牲。
但是,正如我上面說過的,可以受到懷疑的也許不僅僅是這些部分的犧牲;整個科學的合法性恐怕將受到挑戰。
我確實知道有人可能會說:「我們是無知的,可是我們必須行動。為了行動,我們無暇全力以赴地進行充分的調查,以消除我們的無知。況且,這樣的調查也需要無數的時間。因此,我們必須在未知之前作決定;不論成功與否,我們不得不這樣做,我們必須在不完全相信這些法則的情況下遵循它們。我知道的並不是某一事物是真實的,不過在我看來,最好的方針就是權當它是真實的而行動。」從那時起,機率演算從而科學本身都只有實際的價值了。
不幸的是,困難並沒有因此而消失。賭徒想一舉獲勝;他詢問我的意見。如果我向他提出建議,那麼我要運用機率演算,但是我不能保證成功。這就是我所謂的主觀機率。在這個個案中,我必須滿足於我剛才給出梗概的說明。但是,假定一觀察者在賭博現場,他記下各盤的輸贏,賭博繼續了很長時間。當他匯總他的記錄時,他將發現,事件的發生與機率演算的規律一致。這就是我所謂的客觀機率,正是這個現象必須加以說明。
有許多保險公司應用機率演算法則,它們把紅利分給它們的股東,這些紅利的客觀實在性是無可辯駁的。乞靈於我們的無知和行動的必要性不足以說明它們。
因此,絕對的懷疑論是不可接受的。我們可以懷疑,但是我們不能整個兒宣布不適用。有必要進行討論。
Ⅰ. 機率問題的分類。為了把所呈現的關於機率的問題恰當地加以分類,我們可以從許多不同的觀點考察它們,首先從普遍性的觀點考察它們。我在上面已經說過,機率是有利個例數與可能個例數之比。由於沒有較好的名詞,我所謂的普遍性將隨著可能個例數增加。這個數可以是有限的,例如我們擲一局骰子,其中可能個例數是36。這是一次普遍性。
但是,例如我們要問,圓內的點在內接正方形內的機率是多少,那麼圓內有多少點便有多少可能個例,也就是說有無限多可能個例。這是二次普遍性。普遍性還能夠向前推進。我們可以問函數將滿足給定條件的機率。於是,人們能設想出多少不同的函數,就有多少可能個例。這是三次普遍性,例如當我們企圖尋找與有限的觀察數相符合的最概然的定律時,我們就上升到三次普遍性了。
我們可以使自己站在完全不同的觀點上。如果我們不是無知的,那就不會有機率,無非為確定性留下了位置。但是,我們的無知不能是絕對的,因為那樣根本就不會再有任何機率,由於甚至要達到不確定的科學,還需要一點光明才行。因此,機率問題可以按照這種無知的或深或淺來進行分類。
在數學中,我們甚至可以提出機率問題。從對數表中隨意取出的對數的第五位小數是9,其機率若何?可以毫不猶豫地回答,這個機率是1/10;在這裡,我們具有該問題的所有數據。我們不用求助對數表就能夠計算我們的對數,但我們不想去自找麻煩。這是第一級無知。
在物理科學中,我們的無知變得更大。一個系統在給定時刻的狀態取決於兩件事:它的初始狀態和狀態變化所依據的定律。如果我們知道這個定律和這個初始狀態,那麼我們將有一個待解決的數學問題,我們又落回到第一級無知上。
但是,常常會發生這種情況:我們知道定律,卻不知道初始狀態。例如,可以問小行星目前的分布如何?我們知道,自古以來,它們服從克卜勒定律,但是我們不知道它們的初始分布是什麼。
在氣體運動論中,我們假定氣體分子沿直線軌道運動,並服從彈性體碰撞定律。但是,因為我們不知道它們的初始速度,所以我們也不知道它們現在的速度。
機率演算只能使我們預言由這些速度組合將要引起的平均現象。這是第二級無知。
最後,不僅初始條件,而且定律本身都可能是未知的。這樣,我們便達到第三級無知,至於現象的機率,一般說來,我們根本不再能肯定任何東西。
人們往往不是藉助或多或少的關於定律的不完善的知識試圖猜測事件的,事件可能是已知的,我們想去尋找定律;或者,我們不是由原因推導結果,而是希望從結果推導原因。這些是所謂的原因機率問題,從它們的科學應用的觀點來看是最有趣的。
我和一位先生玩紙牌遊戲,我知道他是很誠實的。他正準備發紙牌。他翻出王牌的機率是多少?是1/8。這是結果機率的問題。
我和一位不相識的先生玩牌。他發了十次牌,而翻出六次王牌。他是騙子的機率是多少?這是原因機率中的問題。
有人可能會說,這是實驗方法的基本問題。我觀察到x的n個值和相應的y值。我發現,後者與前者之比實際上是常數。這裡有一個事件,其原因何在呢?
大概存在著y與x成比例的普遍定律吧,大概小小的發散是由於觀察的誤差吧?這是人們正在不斷詢問的一種類型的問題,每當我們從事科學工作時,我們都在無意識地解決它。
現在,我將把這些不同範疇的問題提出來加以評論,同時依次討論我上面所謂的主觀機率和客觀機率。
Ⅱ. 數學中的機率。自從1882年以來,求圓面積的不可能性已被證明;但是,即使在那時之前,所有幾何學家都認為,這種不可能性是如此之「可能(概然)」,以致科學院不經審查,就拋棄了一些不幸的狂人每年遞交的關於這個課題的論文,哎呀,這些論文可真是太多了!
科學院錯了嗎?顯然不是這樣,它清楚地知道,這樣做不會冒一點扼殺重大發現的危險。科學院不可能證明它是對的,但它十分清楚地了解,它的本能不會犯錯誤。假使你要問科學院院士,他們會回答說:「我們曾作過比較,是無名學者能夠解決長期努力依然懸而未決的問題的機率大,還是地球上多了一個狂人的機率大;在我們看來,第二個機率好像比較大。」這些是十分充足的理由,但它們毫無數學根據,它們純粹是心理的理由。
如果你再進一步追問他們,他們會補充道:「你為什麼要假定超越函數的特別值是代數數呢?如果π是一個代數方程的根,你為什麼要假定這個根是函數sin2x的周期,而同一方程的其他根則又不然呢?」總而言之,他們要求助於以模糊形式出現的充足理由律。
然而,他們能夠從中推出什麼呢?至多不過推出它們時代使用的行為規則,與其閱讀激起他們合理懷疑的學究式的文章,倒不如把時間花在日常工作上更有用。但是,我上面所謂的客觀機率與這裡的第一個問題毫無共同之處。
至於第二個問題,則是另外的樣子。
考慮一下我在對數表中找出的頭10 000個對數。在這10 000個對數中,我隨意取出其中之一。它的第三位小數是偶數的機率是多少?你將毫不猶豫地回答是1/2;事實上,如果你在對數表中挑出這10 000個數的第三位小數,你將發現偶數和奇數幾乎一樣多。
或者,如果你樂意的話,讓我們寫出與10 000個對數對應的10 000個數來;若相應的對數的第三位小數為偶數,則這些數中的每一個是+1,若為奇數,則是-1。接著,取這10 000個數的平均值。
我會毫不遲疑地說,這10 000個數的平均值大概是0,如果我實際去計算它,我便可以核驗它是極小的。
但是,即使這一核驗也是不需要的。我可以嚴格地證明,這個平均值小於0.003。為了證明這個結果,我不得不作相應冗長的演算,這裡沒有它的篇幅,為此我只好引用我在1899年4月15日的《科學總評論》上發表的一篇文章。我希望引起注意的唯一之點如下:在這一演算中,我只應需要把兩件事實作為我的個例的基礎,也就是說,對數的一階導數和二階導數在所考慮的區間內依然處在某些極限之間。
因而,這是一個重要的結果,即該性質不僅對對數為真,而且對任何連續函數也為真,由於每一個連續函數的導數都是有限的。
如果我預先確定了這個結果,首先是因為我就其他連續函數常常觀察到類似的事實;其次,是因為我在心裡以或多或少的無意識的和不完善的方式做過推理,這種推理能使我得出前面的不等式,正如一位嫻熟的演算能手,在做完乘法之前,總能考慮到它大約是多少了。
此外,由於我所謂的我的直覺只不過是真實推理片斷的不完善的概要,這就明白了觀察為何能確認我的預見,客觀機率為何與主觀機率一致。
我將選擇下述問題作為第三個例子:隨便取一個數u,n是一個給定的很大的整數。sinnu的概值(probable value)是什麼?這個問題獨自毫無意義。為了使它有意義,就需要約定。我們將公認,數u處在a和a+da之間的機率等於ϕ(a)da;因此,它與無限小區間da成比例,而且等於這個區間與僅依賴於a的函數ϕ(a)之積。至於這個函數,我可以任意選擇它,但是我必須假定它是連續的。當u增加2π時,sinnu的值依然相同,因此我可以在不失去普遍性的情況下設想,u處在0與2π之間,這樣我便有可能假定,ϕ(a)是周期函數,其周期是2π。
所求的概值可以方便地用單積分表示,很容易證明,這個積分小於
2πMk/nk,
Mk是ϕ(u)的k階導數的極大值。於是我們看到,如果k階導數是有限的,那麼當n無限增加時,我們的概值將趨於0,而且比1/nk-1更快地趨於0。 因此,當n很大時,sinnu的概值是零。要定義這個值,我需要約定;但是,無論約定可能是什麼,其結果總是相同的。在假定函數ϕ(a)是連續的和周期的時,我只是給我自己強加了很少的限制,這些假設是如此自然,以致我們可以自問,如何能夠避免它們。
通過對前述三個在各方面如此不同的例子的審查,已經使我們一方面瞥見到哲學家所謂的充足理由律是什麼,另一方面瞥見到對所有連續函數都是共同的某些性質這一事實的重要性。研究物理科學中的機率將導致我們得到同一結果。
Ⅲ. 物理科學中的機率。我現在來到與我們所謂的第二級無知有關的問題上,也就是說,在這些問題中,我們知道定律,但不知道系統的初始狀態。我能增加許多例子,但只想舉一個。在黃道帶上,小行星目前可能的分布如何?
我知道它們服從克卜勒定律。我們甚至根本不用改變問題的性質就可以假定,它們的軌道都是圓的,並且處在同一平面上,我們知道這個平面。另一方面,談到它們的初始分布,我們卻一無所知。不過,我們卻毫不猶豫地斷定,它們的分布現在幾乎是均勻的。為什麼呢?
設b是小行星在初始時刻的黃經,也就是說,初始時刻是零。設a是它的平均運動。它在目前時刻,即在t時刻的黃經將是at+b。說目前的分布是均勻的,也就是說at+b的倍數的正弦和餘弦之平均值是零。為什麼我們肯定這一點呢?
讓我們用平面上的一點來代表每一個小行星,也就是說,用其坐標恰恰是a和b的點來代表。這一切表示點將被包括在該平面的某一區域內,但是當點很多時,這個區域看來好像布滿了點。關於這些點的分布,我們一無所知。
當我們想把機率演算用於這樣的問題時,我們怎麼辦呢?在該平面的某一部分可以找到一個或多個表示點的機率是多少?由於我們無知,我們只好做任意的假設。為了說明這個假設的性質,請容許我利用粗糙的但卻是具體的圖像,以代替數學公式。讓我們設想,在我們平面的表面上,鋪一層虛構的實物,其密度是可變的,但卻是連續地變化的。然後我們一致說,在該平面一部分上找到表示點的概數(probable number)與在那裡找到的虛構的物質之量成比例。因此,如果我們在該平面上有相同範圍的兩個區域,那麼在這一區域或那一區域找到一個小行星的表示點的機率將與在這一區域或那一區域虛構物質的平均密度彼此一樣。
於是,這裡有兩種分布:一種是實在的,其中表示點很多、十分密集,但卻像原子假設中的物質分子一樣是離散的;另一種遠離實在,其中我們的表示點被連續的虛構物質代替。我們知道,後者不能是實在的,但是我們的無知迫使我們採納它。
倘若我們還有關於表示點的真實分布的某些觀念的話,我們就可以這樣排列它,使得在某範圍的一個區域中,這種虛構的連續物質的密度幾乎與表示點的數目成比例,或者,如果你願意的話,也可以說與包括在那個區域中的原子數成比例。甚至這也是不可能的,我們的無知太厲害了,以致我們被迫任意選擇函數,來定義我們的虛構物質的密度。我們將只受我們幾乎不能避免的假設的限制,我們可以假定這個函數是連續的。正如我們將要看到的,這能夠充分地使我們得出結論。
小行星在時刻t的概然分布是什麼?或者確切地講,黃經在時刻t的正弦,即sin(at+b)的概值是多少?起初我們做出了任意的約定,但是我們若採用它,則這個概值就完全確定了。把平面分成面元。考慮sin(at+b)在每一個面元中心的值;把這個值乘以面元的面積和虛構物質的相應密度。然後,取該平面所有面元之和。按照定義,這個和將是我們所求的平均概值,它是用二重積分表示的。人們乍看起來可能認為,平均值取決於定義虛構物質密度的函數的選擇,由於這個函數ϕ是任意的,按照我們所做的任意選擇,我們能夠得到任何平均值。但這並非如此。
簡單的演算表明,當t增加時,我們的二重積分急劇地減小。因此,我完全無法告訴,關於這個或那個初始分布的機率,我們能做什麼假設;但是,不論作什麼假設,結果將是相同的,這使我擺脫了我的困難。
無論函數ϕ是什麼,當t增加時,則平均值趨於零,而且由於小行星肯定已完成了極大次數的旋轉,所以我可以斷言,這平均值是很小的。
我可以像我希望的那樣選擇ϕ,不過總有一個限制:這個函數必須是連續的;而且,事實上,從主觀機率的觀點來看,選擇非連續函數也許是不合理的。例如,我會有什麼理由假定,初始黃經必須嚴格為0°,而不能處在0°和1°之間呢?
但是,如果我們採用主觀機率的觀點,如果我們從我們設想的虛構物質是連續的分布過渡到我們的表示點在其中仿佛形成分立的原子那樣的真實分布,那麼困難就出現了。
sin(at+b)的平均值將十分簡單地用
1/nΣsin(at+b)
來表示,n是小行星的數目。作為與連續函數有關的二重積分的替代,我們將有離散項之和。可是,沒有人會認真地懷疑,這個平均值實際上是很小的。 由於表示點十分密集,我們的離散和一般來說與積分的差異將是極其微小的。
當離散項的數目無限增加時,積分就是這些項之和趨近的極限。如果項很多,和與它的極限相差也很小,也就是說,與積分相差很小,我就積分所說的話對於和本身而言還將為真。
然而也有例外。例如,對於一切小行星來說,如果
b= -at,
那麼所有行星在時間t的黃經總是π/2,其平均值顯然等於1。為使情況如此,在時刻0時,也許有必要讓小行星都處在特殊形狀的螺旋上,這個螺旋的螺紋是十分密集的。每一個人將承認,這樣的初始分布是極為不可能的(而且,即使假定它實現了,這種分布在目前,例如在1900年1月1日,也不會是均勻的,但是在幾年後,它卻會變均勻)。 可是,我們為什麼認為這種初始分布不可能呢?這是必須說明的,因為我們若沒有理由把這個怪誕的假設作為不可能的而加以拒絕,那麼一切都會毀壞的,而且我們再也不能就某個目前分布的機率做出任何斷言了。
我們將再次求助充足理由律,我們總是必須重新提起它。我們應該承認,開始時行星幾乎分布在一條直線上。我們應該承認,它們是不規則分布的。但是,在我們看來,似乎沒有充足的理由認為,某種未知的原因引起它們沿著如此規則卻又如此複雜的曲線運行,這仿佛是特意如此選擇的,從而使得目前的分布不可能均勻。
Ⅳ. 紅與黑。像輪盤賭這樣的機遇遊戲所產生的問題,基本上與我剛才論述的問題完全類似。例如,把一個輪盤分為極多的紅黑相間的等分。用力使指針旋轉,在轉了許多圈之後,它停在這些分格之一上。這個分格是紅的機率顯然是1/2。指針旋轉的角度為θ,且包括幾個整圈。用這樣的力轉動指針,使這個角度必須處於θ與θ+dθ之間,我不知道其機率是多少;但是,我能夠做出約定。我可以假定,這個機率是ϕ(θ)dθ。至於函數ϕ(θ),我能夠以完全任意的方式選擇它。在我選擇時,沒有什麼東西能夠指導我,但是我自然地被導致假定這個函數是連續的。
設ε是每一個紅分格和黑分格的長度(在半徑為1的圓周上測量)。我們必須計算ϕ(θ)dθ的積分,一方面把它擴大到所有紅分格,另一方面把它擴大到所有黑分格,並把結果進行比較。
考慮區間2ε,它包括紅分格和接著它的黑分格。設M和m是函數ϕ(θ)在這個區間的最大值和最小值。擴大到紅分格的積分將小於Σ Mε;擴大到黑分格的積分將大於Σmε;因此,二者之差將小於Σ(M-m)ε。但是,如果假定函數θ是連續的;此外,如果區間ε相對於指針旋轉過的總角度來說很小,那麼差M-m將是很小的。因此,兩個積分之差將很小,機率將十分接近1/2。
我們看到,在對函數θ一無所知的情況下,我必須像機率是1/2那樣去行動。另一方面,如果我使自己站在客觀的觀點上觀察若干次,那麼我理解,為什麼觀察使我得到紅的次數與黑的次數大約一樣多。
所有的賭博者都知道這個客觀規律;但它卻使他們陷入了值得注意的錯誤之中,這種錯誤雖則常常被揭露出來,但他們總是一再墮入其中。例如,當紅的連贏六次時,他們押在黑的上,以為他們這回准勝;他們說,因為紅的連贏七次是十分稀少的。
實際上,他們獲勝的機率依然是1/2。的確,觀察表明,七個接連紅的系列是十分稀少的,但是六個紅接著一個黑的系列同樣是十分稀少的。
他們注意到七個紅的系列是罕有的;如果他們沒有看到六個紅和一個黑的稀罕,那只是因為這樣的系列沒有引起注意。
Ⅴ. 原因機率。現在我們開始談談原因機率問題,從科學應用的觀點來看,這是最重要的問題。例如,兩個恆星在天球上十分接近。這種表觀的接近僅僅是偶然性的結果嗎?這些恆星雖然幾乎在同一視線上,但它們處在與地球極其不同的距離、從而相互之間十分遙遠嗎?或者,這種表觀的接近也許與實際的接近是一致的?這是原因機率的問題。
我首先想起,在迄今我們關注的結果機率的所有問題開始,我們總是必須做出或多或少被證明是合理的約定。在大多數個案中,如果結果在某種程度上不依賴於這個約定,這僅僅是因為某些假設容許我們先驗地排除不連續函數,或者比如說,排除某些荒謬的約定。
當我們處理原因機率時,我們將會發現某些類似的東西。一個結果可以由原因A或原因B產生。該結果剛剛被觀察到了。我們要問它由原因A產生的機率。這是後驗的原因機率。但是,如果沒有或多或少被證明是合理的約定預先告訴我,原因A開始起作用的先驗的機率是多少,那麼我就不能計算後驗的原因機率;我意指對於某個沒有觀察到該結果的人而言的這個事件的機率。
為了說明得更清楚,我回到上面提到的玩紙牌遊戲的例子。我的對手首先發牌,他翻出王。他是騙子的機率是多少?通常講授的公式給出8/9,結果顯然是相當令人驚奇的。如果我比較仔細地檢查一下結果,那麼我會看到,這個演算仿佛在我坐到桌旁之前就做過了,我已經認為在兩次機會中有一次我的對手是不誠實的。這是一個荒謬的假設,因為在此種情況下我肯定不會和他玩了,這便說明了結論的荒謬性。
關於先驗機率的約定是不合理的,這就是為什麼後驗機率演算把我引向不能容許的結果。我們看到這個預備約定的重要性。我甚至還想補充說,如果不做預備約定,後驗機率問題便毫無意義。預備約定總是必須做出的,或者直截了當地做出,或者不言而喻地做出。
再舉一個更有科學特點的例子。我想決定一個實驗定律。當我了解這個定律時,它能夠用曲線來描繪。我做了若干孤立的觀察;其中每一個將用一點來表示。當我得到這些不同的點時,我在它們之間引一條曲線,儘可能使曲線靠近它們,可還是保持曲線的規則形狀,沒有角點,或者沒有太急劇的彎曲,或者曲率半徑沒有突然的變化。在我看來,這個曲線將表示概然定律,我不僅假定它將告訴我在所觀察到的值之間的中間函數值,而且假定它將給我比直接觀察更精確的觀察值。這就是我使曲線通過點的附近而不通過點本身的原因。
這裡有原因機率的問題。結果是我記錄的測量;這些結果取決於下述兩個原因的組合:現象的真實定律和觀察的誤差。知道了結果,我們必須尋求現象服從這個或那個定律的機率以及觀察受這個或那個誤差影響的機率。於是,最概然定律對應於所畫的曲線,而最概然的觀察誤差則由相應點與這個曲線的距離來表示。
但是,在任何觀察之前,如果我沒有形成某一定律的機率的先驗觀念以及我所面臨的誤差偶然性的先驗觀念,那麼這個問題將毫無意義。
如果我的儀器是好的(而且我在做觀察前已了解這一點),我將不容許我的曲線與表示初步測量的點偏離得太多。如果儀器不好,我可以使曲線離點稍遠一些,以便得到彎曲較少的曲線;我將較多地犧牲規則性。
那麼我為什麼企圖畫一條沒有曲折的曲線呢?這是因為,我先驗地認為定律是用連續函數(或用其高階導數是很小的函數)表示的,這種定律比不滿足這些條件的定律更可能。沒有這個信念,我們所談的問題就沒有意義;內插法就是不可能的;從有限數目的觀察中無法推導出定律;科學便不會存在了。
50年前,物理學家認為,在其他情況相同時,簡單的定律比複雜的定律更可能。他們甚至求助於這個原則來袒護馬略特定律,反駁勒尼奧(Regnault)實驗。今天,他們拒斥這個信念;可是,有多少次他們被迫像他們持有這個信念一樣地去行動!不管情況怎樣,這種傾向遺留下來的是對於連續性的信念,我們剛才看到,假如這個信念本身不得不消失的話,實驗科學就變得不可能了。
Ⅵ. 誤差理論。我們就這樣被導致談誤差理論,這個理論直接與原因機率問題相關。在這裡,我們再次發現結果即若干不一致的觀察,我們企圖去推測原因,這些原因一方面是所測量的量的真值,另一方面是在每次孤立觀察中所造成的誤差。有必要計算每一個誤差的後驗可能量是多少,從而計算所測量的量的概值。
但是,正如我剛剛說明的,如果我們不先驗地承認,也就是說,在所有觀察之前不承認誤差機率定律,那麼我們就不可能知道如何著手進行這個演算。誤差定律存在嗎?
所有計算者承認的誤差定律是高斯(Gauss)定律,它是用某一超越曲線表示的,該曲線以「鐘形曲線」的名字而聞名。
不過,首先回想一下系統誤差和偶然誤差的經典區別是恰當的。如果我們用過長的米尺測量長度,我們將總是得到太小的數,而且測量幾次也是無用的;這就是系統誤差。即使我們用準確的米尺測量,但是我們也會犯錯誤;不過,我們有時錯得多,有時錯得少,當我們取多次測量的平均值時,則誤差將趨於減小。這就是偶然誤差。
顯而易見,系統誤差原來不能滿足高斯定律;但是,偶然誤差能滿足嗎?人們嘗試做了大量的證明;幾乎所有的證明都是粗製濫造的謬論。不管怎樣,我們可以從下述假設出發證明高斯定律:所造成的誤差是大量的部分誤差和獨立誤差的結果;每一個部分誤差是很小的,而且服從任何機率定律,只要正誤差的機率與均等的負誤差的機率相同。顯然,這些條件常常能被滿足,但並非總是如此,對於滿足這些條件的誤差來說,我們可以保留偶然誤差的名稱。
我們看到,最小二乘法並非在每一種個案中都是合理的;一般說來,物理學家比天文學家更懷疑它。無疑地,這是因為天文學家除了遇到與物理學家一樣的系統誤差以外,還必須與極重要的誤差來源作鬥爭,這種誤差來源完全是偶然的;我指的是大氣波動。於是,聽到物理學家和天文學家討論觀察方法是很奇怪的。物理學家使人們相信,一次好的測量比多次不好的測量更有價值,他們首先關心的是憑藉預防最小的系統誤差來消除誤差,而天文學家對他說:「但是,你這樣只能觀察少數恆星;偶然誤差將不會消失。」
我們應該得出什麼結論呢?我們必須繼續利用最小二乘法嗎?我們必須識別。我們已消除了我們可以懷疑的一切系統誤差;我們清楚地知道還有其他誤差,不過我們無法把它們檢查出來;我們必須下定決心,採用一個確定的數值,可以把它看做是概值;為此,顯然最好的做法是應用高斯方法。我們只應用與主觀機率有關的實際法則。在這裡無須多說。
但是,我們希望更進一步,不僅肯定概值是這麼多,而且肯定結果的概差是這麼多。這是絕對不合理的;只有我們保證所有系統誤差都被消除了,它才為真,但是我們對此絕對一無所知。我們有兩個觀察系列;應用最小二乘法則,我們發現,第一個系列的概差比第二個系列的概差小一倍。不過,第二個系列可以比第一個系列好,因為第一個系列也許受到很大的系統誤差的影響。我們能夠說的一切就是,第一個系列可能比第二個系列好,由於它的偶然誤差較小,我們沒有理由肯定一個系列的系統誤差比另一個的大,我們關於這點的無知是絕對的。
Ⅶ. 結論。在前文中,我提出了許多問題,其中還沒有一個解決了。可是,我並不懊悔把它們寫下來,因為它們也許會引起讀者對這些棘手的疑問進行思考。
不管情況怎樣,其中某些方面似乎妥善地建立起來了。為了著手進行任何機率演算,進而為了使這種演算有任何意義,就必須承認假設或總是具有某種程度任意性的約定是出發點。在選擇這個約定時,我們只能以充足理由律為指導。不幸的是,這個原則是十分模糊的和十分靈活的,在我們剛剛做出的粗略審查中,我們看到它採取了許多不同的形式。我們最為經常遇到的形式是對於連續性的信念,這種信念很難用無可置疑的推理去辯護,但是若沒有它,整個科學也許就不可能了。最後,機率演算可以富有成效地應用的問題,是結果獨立於起初所做的假設的問題,只要這個假設滿足連續性條件就行。