心理物理學綱要 · 第八章 感受性的測量方法

根據第六章中得出的原理,絕對感受性可以通過絕對刺激強度的倒數即集中感受來估量,也可以通過引起相同大小感受的絕對刺激強度的倒數即廣延感受來測量。為了測量簡單的差別感受性,可以用刺激差異量的倒數或者引起相同差別感受的差異程度來表示。相對差別感受性則可以用刺激比率的倒數,或者引起相同大小感受差異的刺激程度來衡量。 沒有區別簡單與相對差別感受性的方法,因為在這兩種情況下我們都必須確定引起特定感受差異的兩種刺激量。在這個時候,我們要關注差異的絕對強度或者刺激的比率,以此來用兩者之一的倒數測量感受性。每一種方法都具有自己的意義。不過現在,討論獲得前一種結果的方法就足夠了。 在這些定義的基礎上進行測量,也就是假設我們在各種條件下都能夠切實準確地判斷感受與感受差異的等價性,並且能夠對它們進行陳述,這些任務乍一看沒有那麼容易。然而正如我們之前提到過的,大家都知道利用光度計的測量方法是基於對感受等價性的判斷,就音樂而言,一個人必須經常判斷兩個音調的一致性,以及兩個音調間的差距是否相同,也就是音差。我們現在要以某些普遍的方法來證明感受差異的等價性。事實上,相對於絕對感受性的測量方法,關於差別感受性的測量方法迄今為止已有很大的進步了。因此我們要開始主要研究這些方法。 對於這裡將要提到的這些方法,重點討論對它們本質的一般理解以及它們之間的相互關係,並對保證它們準確性的共同必要條件進行介紹。我們關注的重點是它們在實驗與計算中的應用,這在後面幾章中將進行詳述,並且對所獲得的結果做出解釋。然而如果我試圖闡述在更周詳的調查中必須考慮到的特殊實驗與計算方法,或者我想為所有可用的規則提供理論基礎和實驗證據,我可能會破壞討論的流暢性,干擾那些更關注方法的一般理解而非方法使用的人的興趣。因此為了更詳細地說明這些方法以及基於這些方法的實驗系列,我更希望選取《心理物理學領域的測量方法與測定》(Massmethoden und Massbestimmungen im Gebiete der Psychophysik)這本書中的一些內容,並且簡單引用一下《測量方法》(Massmethoden),以對目前的這項工作做一些補充。我在這裡簡單述及的很多內容都在那本書里有詳細的論述。你也會發現那裡有更精確的理論觀點和明確的實驗證明。 差別感受性的測量方法 概述 當前有三種測量差別感受性的方法,為了簡潔起見,我分別稱之為: (1)最小可覺差法。 (2)正誤法。 (3)平均差誤法。 首先,我們檢驗這三種方法在同一項任務中的表現,特別是區別重量差異的準確性。我們希望以通過這種方式的介紹,引出對這些方法的初級表面的理解,儘管實際上到現在為止,人們只使用了前兩種方法。 在使用最小可覺差法時,我們要通過提起兩個容器A和B來比較它們的重量,這兩個容器中水的重量有輕微的差異。如果重量的差異足夠大,就能被感覺到,否則就不會。最小可覺差法的主要目的在於確定多大的重量差別才能剛好被感覺到。我們可以用這個差異量的倒數作為感受性水平的指標。 這種方法的一般操作如下,即將刺激從容易被覺察降低到剛剛可覺察的水平,以及再將刺激從不可覺察增加到剛剛可覺察,兩者完成相同次數的操作,取平均值作為結果。 如果有人採用很小的重量差異進行多次重複實驗,就會經常弄錯差異的方向,即較輕的容器會被認為較重,反之亦然。然而如果重量增加得越多或者感受性越強,正確的次數就將大於錯誤次數或占總次數的比例會增大。正誤法從本質上講,它的目標在於確定在各種比較感受性的情況下,想得到相同的正確判斷與錯誤判斷比率,或者正確判斷與總判斷數比率時,所需要增加的重量。這些不同情況下感受性的程度用這個附加重量的倒數表示。 不確定的情況需要刪除,但是應該半數計入正確判斷,另外半數計入錯誤判斷。 以給定容器的實際重量作為標準,被試可以只根據感覺判斷來匹配與之相同的重量。一般來說,一個人在判斷時會出現一定量的低估。當把一個與被試判定的重量相同的容器放到天平上時,就可以發現這個誤差。重複進行這個實驗可以得到許多誤差數據,我們可以據此計算出一個平均差誤。我們把通過這種方法得到的平均差誤的倒數,作為重量的差別感受性。這就是平均差誤法。 由於正誤差與負誤差在相同程度上源於缺乏正確的知覺,因此它們對我們的測量是同樣有用的。也就是說它們不應相互抵消,而應該把它們的絕對值相加。 正如這些方法可以用於重量的感受方面,它們也可用於視聽感受等,還可用於廣延感受。例如用最小可覺差法測量廣延感受性時,需要判斷兩支圓規的兩腳間距的差異達到多少時,才能讓被試剛好感受到差異,可以通過視覺或者放在皮膚上兩種途徑來判斷。使用正誤法判斷兩支圓規兩腳間距的細微差異時,我們需要記錄實驗試次中正確與錯誤的次數。最後在平均差誤法中,我們則要確定當一個人嘗試匹配相等的兩支圓規腳間距時所產生的平均誤差。 這三種方法目的相同且相互補充。在第一種方法中,把區分明顯差異與不明顯差異的邊界值作為最小可覺差;在第二種方法中,需要進行計數的是表面差異(即判斷完全隨機,有時候是正確的,有時候是錯誤的反應);在第三種方法中,測量的是感覺不到的差異。 這三種方法在測量感受性方面存在相對——有的時候不存在——細微的差別。後面我們會看到當我們意在某些感受性測量中尋求感受測量的基礎時,這個事實正是最有幫助的。 就我們現在看來,這些方法均適用於所有的感覺範疇,但是我們還遠不能用哪怕其中任一種方法來測量所有的感覺。同樣地,這三者中也沒有一種可以完全用於測量單一的感覺。 最小可覺差法過去曾被用於獨立的實例中,例如德勒澤納(Delezenne)用它測試對音差純度差異的感受性。這種方法應用很廣泛,最佳的結果可見韋伯所做的對重量、觸覺和視覺空間知覺感受性的研究[1]。就我自己而言,我僅僅在光強度、視距和溫度判斷領域內使用這種方法做過幾個不太深入的實驗。 對於正誤法,除了圖賓根(Tübingen)的醫學生哈格梅耶爾(Hegelmayer)對視覺廣度的研究[2],以及倫茨(Renz)與沃爾夫(Wolf)在聽覺測量領域的研究[3]之外,我還不知道有其他應用的先例。由於這兩項研究都是由維洛特所資助的年輕人所實施的,有人就會認為是他把這種方法分派給他們的,儘管他們並沒有明確說明這一點。就我個人而言,我曾使用這種方法對重量判斷進行過非常深入的實驗。 在某種意義上,與通過伴隨誤差的大小來判斷觀察精確性的方法一樣,平均差誤法的歷史也同樣悠久。然而據我所知,這種方法僅在對物理和天文學觀察精確性的客觀測量中,或者確定這些測量誤差源的大小時才會得以應用。[4]該方法從未被認為是或作為鑑別感覺靈敏度的心理物理學方法而使用。但是這種方法對於我而言卻是實現上述目標最有用的方法,而且我和福爾克曼(Volkmann)一起用它確定了視覺廣度和觸覺判斷研究的精確性。 從實際的角度來看,最小可覺差法是三種測量方法中最簡單也最直接的方法。它能最迅速地達到目標,並且需要的運算也是最少的。其中最小可覺差是根據等價的感受獲得的,即使有人可能需要以重複的方式來加強單個判斷和計算的準確性,他可能也只需要較少次數的實驗就可以了,因為每一次觀察本身就是結果。另一方面,用其他方法的時候,為了得出關於差別感受等價性的結論,需要對很多次正確和錯誤的例子或者誤差的情況進行觀察,而且這種判斷需要通過計算的過程來實現。而最小可覺差法在多數情況下,例如在基礎數據的初步確定中以及當一個人沒有充足的時間用於觀察時,似乎是一種很好的選擇。然而,該方法對更詳盡的調查似乎不太合適,也不能像其他兩種方法那樣達到同樣高的準確度,因此導致研究者經常發現自己不得不靠多次的實驗來獲得準確性。最小可覺差法主要的缺點之一是相比於其他兩種方法,由於其基於主觀判斷,因此對於最小可覺的定義會為產生誤差留下更多的空間。最小可覺的定義不可能是絕對的,因為不管是第一個時間點即感受差異變得剛剛可以覺察到的點,還是第二個點即感受差異消失的點,均不能非常精確地確定。一個人的不確定區間與其是否知曉這種感受的存在有關。如果一個人不想把最小可覺的判斷標準設定得太高,也就是只接受基於重複實驗獲得的差異結果,而且非常確定地排除了任何例外情況,這個方法就變成了正誤法。如果這樣的話,我們就有必要頻繁使用一個稍小的差異作為剛剛能被感覺的標準,因為總是會出現差異的方向判斷錯誤,或者是判斷不確定的情況。關於這些情況出現的頻率必須被列入考慮範圍。 儘管如此,我們仍可以說,經驗表明了人能夠就構成微小但能清楚感知到的差異形成統一的標準。這個差異的標準能夠在不同的實驗中足夠精確地重複,即使不是完全地複製這個結論,也可以通過重複實驗獲得理想的結果。上述評論無論如何也不能降低這種方法的價值,因為它們只是為了說明這種方法相對於其他方法的優缺點。可以說沒有這種方法,心理物理學就失去了其最有用的工具。在專家的手中,最小可覺差法通過獲得的基礎數據證明了自己的價值。像我一樣的局外人也有充分的機會說服自己相信它的有用性。 正誤法可能是最單調乏味的,如果一個人沒有足夠的時間和耐心最好不要使用這種方法進行研究,因為少數幾個正確或錯誤的情況不能得出什麼結果。儘管如此,通過大量的實驗我們能夠得到非常不錯的結果——實驗結果間的一致性較好,並且揭示了感覺領域內的合理關係。雖然需要計算的輔助,但是只有簡便易行的操作才能為人們所用。鑒於人們在最小可覺差法中受到簡單差異的局限(也就是剛剛可以感覺到的差異),而使用正誤法時人們則可以隨意選擇或大或小的細微差異來測量差別感受性。用這種方法得到的正確和錯誤次數的不同值可以用於進行專門化的比較。 平均差誤法也需要大量的數據取樣以及輔助計算。正誤法和平均差誤法都具有一個很大的優勢就是它們依賴機率論已經證明的定理,而且甚至自己就可以為這些定理的發展提供支持。的確,對這些方法的長期實踐激起了我非常持久濃厚的興趣,並且這種興趣隨著機率論的發展而與日俱增。 一般考慮的因素和預防措施 我剛剛簡單介紹過的方法可能乍一看去很簡單,實際上卻是符合原則的,在它們的使用過程中有很多需要考慮的因素和預防措施。它們有的與觀察有關,有的則與計算有關;它們還部分依賴於專門化的方法和實驗的領域。然而下面的規則或多或少具有普適性。 在這三種方法中不規則的隨機波動發揮著主要作用。有些是操作本身所固有的,其他則是對比較尺度解釋中存在的主觀因素。如果考慮隨機影響的範圍,用最小可覺差法確定的差異有時看來似乎很誇張,有時卻又縮減了很多。一個人為了確保自己判斷的穩定性,他必須選擇一個原始值,而這個值從大體上說,比不存在這些波動的情況下的原始值要大得多。由於這些隨機性因素導致的主要影響,所記錄的最小可覺值就增大了。在正誤法中,隨機性的影響會使人在兩次實驗中對同一個重量產生或輕或重的感覺。這種情況與隨機性的影響相比,較大重量的影響並不是很重要,因為平均下來,不規則隨機波動形成更重和更輕方向影響的幾率是大致相同的,正確判斷和錯誤判斷的次數就很明顯地表現為相等了,或者至少與沒有或有較少隨機性影響的情況相比,正確判斷的次數下降了。最後,在平均差誤法中,由於隨機性導致的刺激程度會時大時小,但如果刺激變化的幅度越大,我們可以立即看到平均差誤也會跟著變大。 簡單地說,根據這三種方法的情況發現,隨機性的作用越大,感受性的測量值越小,不存在能夠不受隨機性影響而得到測量結果的方法。它們的平均值總是作為一個因素伴隨在測量中。只要這個因素保持恆定,也就是只要這些不規則波動保持相同大小的平均值,這種影響就不會妨礙我們得到可比性較強的感受性測量結果。事實上,沒有這些隨機波動,正誤法和平均差誤法甚至都不能夠存在。它們強調了一個重要的需要考慮的因素,即只有那些感受性的測量之間具有可比性的情況下,才能夠滿足隨機影響均等的假設。這條假設要求實驗期間外部和內部的條件完全一致。測量中任何的技術改變,都會直接影響隨機因素的作用進而導致數據可比性的缺失。同樣地,由於內部條件的可能變化,我們無法假設不同個體或者同一個體在不同時間受到相同的隨機因素影響。因此每當發現感受性的測量值缺少一致性時,我們必須確認一下這是真實偏差造成的,還是由於沒有達到實驗背景可比性的要求。 如前所述,一般來說多次重複實驗是必要的,在正誤法和平均差誤法中,尤其需要大量的測定以得到可靠的結果。這種情況下觀察的多樣性,與物理學和天文學測量中的同類情況相比,本質上具有不同的意義。使用常用方法形成的幾種準確的測量方式,可以相當準確地對物理和天文參數值加以確定。另一方面,在平均差誤法和正誤法中,大量的測定本身就是準確性的必要條件。每一項獨立的觀察沒有任何意義,幾次即使是很嚴謹的測定也不具有最終的準確性。獨立的正確和錯誤的判斷以及獨立的誤差,實際上分布得很不規則。儘管是在表面上具有可比性的環境下得到的,部分實驗數據仍然會產生截然不同的結果。人們經常會驚訝地發現,在實驗的主要部分中,這些不規則性產生的結果自身具有相當高的一致性。重點是機率領域的大數定律[5]在這裡也適用。只要案例的數量很大,這條定律就可以控制隨機性。 沒有比普羅透斯更適合用來比喻我們的方法了,他不是單純而心甘情願地回答別人向他提出的問題,而是通過不停地變化自己的外形來迴避一切回答。不過通過足夠長時間的堅持,人們就可以迫使他給出一個答案。在過去我浪費了很多的時間,尤其是使用正誤法時,努力從數個小時或是數天的實驗中得出結論,但是卻不能得到任何肯定的結果。直到我下定決心每天花一個小時在同一個問題上,並且堅持了數月才得到了滿意的結果。 且不說無法避免的影響,所提到的,幾率波動的範圍會影響測量值的大小,隨機因素的影響必須用頻繁的重複來補償。如果變異性和感受性保持不變,實驗就必須堅持下去,直到我們在不同的時間點都能獲得一致的測量結果。這樣一來,單獨的隨機差異就會失去影響,而最終的結果也會獨立於隨機因素。為了確保這個結論,我們要持續或者重複每一個實驗系列,直到主要的部分或實驗重複在相關的結果上呈現一致。數量級的偏差自然會很小,因此是可以接受的,這就像我們必須接受物理實驗中的觀察誤差一樣,因為作為我們方法中產生的觀察誤差的一部分,這些隨機誤差不可能被完全抵消。即使在較小的子集中達到一致,我們也不能完全滿意,因為這種一致性本身就可能是由於隨機因素產生的。機率論事先為我們提供了一種預估精確度的方法,這裡的精確度可以從給定數量的實驗試次中,在給定的機率水平上進行預估。另一方面,通過觀察次數,以及單獨實驗或系列觀察的某些部分所反映的相似性程度,我們也可以計算精確度的範圍。 如有可能,我們應該從一開始就根據預先安排的計劃進行實驗,以與特定的目標相契合。然而預實驗往往對發現測量的最佳條件,以及發現在設計實驗程序中應該注意的因素有很大的幫助。如果沒有同時觀察練習效應的話,預實驗也具有優勢,即它們幫助我們通過練習的第一階段,並且避免主實驗中部分的早期變異。同時,練習的影響始終都是需要加以處理的因素,留意練習的影響並且從第一個預實驗起就要注意發現它的規律,這是極為有效的,因為當練習已經部分發生或者作用達到極限時,後續實驗中的練習效應就會很小甚至消失了。 為了避免獲得片面的或者只在特定條件下成立的結果,我們應該考慮環境中廣泛存在的可能的系統誤差。我經常發現在給定條件下看起來相當常見的結果,卻與其他環境下的結果截然不同。[6]如果結果沒有在許多不同的環境下得到證實,在判定結果通用性之前我會非常謹慎。然而我的這條準則也導致了矛盾。隨著人們實驗條件的組合數量增加,可以在每一單獨條件下實施的實驗數就減少了,因此我們只用一種實驗條件所得到的測量結果通常具有較低的準確性。所以,當我們一開始想要研究任何事情時,就要立即保持謹慎態度,可以說如果把程序限制在某些固定的變量上,我們就不能得到任何正確的結果。 以重量提舉實驗為例,我們能夠研究對於標準重量改變的差別感受性大小。試想一下,一個人用單手提起某個重量並確定了上述這些關係,那麼他用另一隻手提起這個重量也會得到相同的結果嗎?或者如果一個人用一隻手提起了一個重量,而用另一隻手提起了另一個重量,可以等價替換為用同一隻手同時提起這兩個重量的結果嗎?如果一個人換了提舉的位置,或者提舉的方式,或者兩個重量及其容器的位置又會怎樣呢?提舉每一容器的速度、時間間隔、順序即先提還是後提較重的重量,或者提舉的高度會不會導致結果的差異呢?如果按照標準重量從小到大升序排列進行,或者按照相反的順序實施,實驗會得到相同的結果嗎?用已受到疲勞影響的手臂或者未受影響的手臂,結果有何不同?根據重量差異的大小,正確和錯誤判斷的比率會發生什麼變化?諸如此類的問題很多很多。 所有這些影響的確定實際上屬於對重量差異感受性的詳盡調查範疇,在關於感受性的其他調查領域中,其他的影響也將會層出不窮地出現,並且需要我們加以研究。每個因素會依次需要一系列合適的實驗,來幫助我們對其大小、方向以及對其他環境的依賴性加以確定。 需要比較不同因素的影響時,我們應該依次進行每一項實驗,同一天或者每過幾天交替進行升序與降序實驗序列,並交替使用較大和較小的差異值。通過改變感受性或者其他原因而導致的實驗序列對結果的影響,我們可以加以識別、補償或者仔細考慮。例如就重量提舉實驗來說,需要將這個過程應用於不同重量標準、不同比較系列、不同的提舉重量間差異等等——所有實驗實施的條件。 例如,如果用一系列標準重量進行實驗,我們可以在同一天先進行一個升序的系列,然後再進行降序的系列,第二天先做降序系列再做升序系列。我們還可以在一天只進行升序系列的實驗,第二天再進行降序實驗,有條不紊地堅持這種交替對完成實驗流程很有必要。 在一些實驗中,我會輪流以不同的值開始和結束,而不是一直用最低或最高值開始和結束,按順序或者倒序進行實驗序列就好像數值在一個圓上循環排列一樣,在這個圓上可以隨意選擇起始點。然而預期系列順序效應的安排所帶來的完全補償作用,可能還無法抵消方法複雜度的提高所帶來的負面影響,或者只有在特殊的環境下才有可能實現。 一般來說,在檢驗系列順序對實驗的影響時必須考慮不同的條件。這些條件可能部分地互相對立和衝突,有時這個條件有時又可能另一個條件占上風。一方面,注意和感覺器官的活動可以說是在實驗開始後的一段時間之後才發揮功能的,然後才開始達到某種一致,在缺少練習的情況下尤為如此。另一方面,被試會變得厭倦、疲勞或者在某些條件下由於不斷的練習而導致憤怒。最後在一些限制條件下,適度的練習會使被試從一開始就感覺到練習的影響,而且這種感覺會在長時間的實驗系列中一直持續。我們要通過專門性的調查對這些影響各自進行分析。這些影響會自動地在每項研究中發揮作用,因此我們應該尤其防範以下幾點。 除非本身就是研究對象,否則我們就要很好地避免這些條件造成的重要變化(也就是說當出現嚴重的厭倦或憤怒情緒時,我們不應該繼續實驗),並且應該傾向於選擇那些練習效應平緩或已經達到極限的實驗,而不是那些練習效應很大的實驗。然而因為長時間連續的實驗,無論每天與每天之間,還是各個系列的時段之間,都必須以具有一致性以及能夠在給定的時間內完成實驗作為前提,在這方面我們必須根據個體和實驗條件選擇一個最佳的界限。這個界限必須由每個人自己的判斷決定。無論如何,我們應該對這些影響進行準確的測定和補償,而不是避免這些影響,因為這些影響是絕不可能消除的。對實驗試次從方法學角度進行合理的安排,可以很好地控制它們的影響。想要了解詳情可以參見關於每種方法的討論。 正如條件的系統改變所具有的幫助性和必要性,為了探究它們的差異造成的影響,我們需要在最大可能的前提下獲得它們的一致性——這些數據可能不容易獲得,因此允許數據產生一定的變異——要把所有這些實驗結合起來,以得到一套給定條件下的一致性結果。即使可以控制相關的外部條件,內部條件也不可能完全得到控制。感受性本身以及某些其他起次要作用的內部條件中仍然會存在變異性,這些變化的原因既無法加以計算也不能被移除。這個事實導致了兩種可能的考慮。第一種是如果我們不能通過數據本身確定其可比性,就不能在沒有進行進一步調查的情況下,得出不同時間得到的測量結果具有可比性的結論,即使這些結果是在相同的外部條件下得到的。第二,為了分別檢驗這些因素,應該把較長的實驗系列分解為幾個部分,這不僅要根據不同的實驗條件,還要根據不同的時段劃分。一般來說,比起一次性得到整個未分解實驗系列的結果,我們把每個實驗片段的結果加以組合計算更為理想。 將實驗分解為幾個部分有其優勢,這讓我們能夠估計結果的恆定性是變大還是變小,以及獲得可能存在的由於練習所帶來的變化。尤其是與我們把觀察作為一個整體時相比,它從數學角度給我們提供了一個更好地剔除內部干擾作用的機會(這種干擾在較長的實驗系列中通常在相反的方向上起作用)——這一點我們在後面關於方法的專門討論中可以看到。 由於較少的觀察次數,我們對部分實驗進行數學處理的方法所得到的結果,比我們使用所有實驗得到結果的可靠性確實要降低很多。但是根據機率原理可以看到,將實驗分解為部分所損失的可靠性,可以在這些部分的結果被整合後得到恢復。因此前面提到將實驗分解為各個子群的優點依然存在。 然而另一方面,分解的方法使對結果的處理和報告更加複雜了。在正誤法和平均差誤法中,子群中所包括的實驗次數對所獲得的數值具有影響,這可以通過理論和實驗得以證實。當實驗次數增大時這種效應就會消失。如果實驗次數很少時就必須對數據進行校正,總是使用相同的實驗次數也有助於減少不良的後果。 由於每一個長期的實驗系列都會持續幾天或者幾個星期甚至幾個月,我們應該以儘可能規律的時間間隔安排實驗,如果可能的話,在分解時分實驗最好包括相同的實驗次數,對子測驗要進行相同並且均等的安排。這樣對順序的嚴格遵守,不僅非常有助於使得不同階段進行的實驗具有可比性,並且維持了它們的關係,還可以避免實驗條件可能形成的混亂和意外事件。而且用上述方法還能夠簡化計算和促進觀察法的使用,但是如果一次用一種順序觀察,另一次又用另一種順序,上次的實驗試次數那麼多,這次的實驗試次數又這麼多,這次用這種實驗條件,下次就用另一種實驗條件,完全置嚴格的規則於不顧,那麼觀察的有用性在各個方面都會大打折扣。在用我們的方法隨時進行的有規則的實驗過程中,需要組織和保持的細節規則越多,帶來的好處就變得越明顯。 此外,如果一個系列的實驗持續幾天,大多情況下我會把它們安排在一天的同一個時段,因為睡眠或者吃飯所耗費的時間可能影響我們要調查的感受性。這種影響很有可能被忽略,尤其是當背景環境總是相同時。儘管如此,這個因素應該首先被單獨進行調查,在完成調查之前就應該引起注意。無論如何,在實驗一般規則中必須注意到這條預防措施,即保持實驗試次間在時間上的嚴格順序關係。 因為根據我們的方法,判斷應該純粹地基於對感覺的觀察,我們應該注意判斷不能由一個人的想像或者對結果的期望而加以確定——簡而言之就是想像的力量。另一方面,我們也不能太過盲目地進行實驗以避免想像的可能影響。我們的方法為這兩種錯誤的產生提供了機會。 在能力範圍之內,我們應該合理安排實驗條件的順序、觀察值的記錄以及誤差的合併或正確錯誤判斷的加和(還有基於此的所有計算)以排除其他不可避免的失誤。由於涉及大量的記錄、加和與計算,我們應該採用重複和其他控制方法。在記錄和使用數據本身時,一定要注意絕對的誠信。 這幾條規則乍一看去並不起眼,但細細看來,其重要性和困難度都大大提升。根據我自己和同事的經驗,我不信任任何沒有經過重複或其他方法檢驗的加和或計算。即使重複地再計數與再計算,我們往往也會如校對中一樣容易出現忽視誤差的情況,尤其是當用相同的方式一項接著一項進行時。在這方面我們怎麼強調注意和謹慎都不為過。無論重複或其他檢驗在操作中變得如何令人厭倦,為了不因應用中的失誤損害謹慎觀察的好處,這些重複和檢驗措施還是很有必要的。 然而,即使在進行任何記錄前,我們也很容易在條件的系統變化安排過程中出現失誤,這種變化通常是有必要的,往往可以通過打亂條件的序列,或者在沒有必要改變的前提下繼續進行幾個子實驗。因此我們應該將對這些內容的仔細檢查核對作為一項常規措施。 關於記錄的誠信問題,我們總想——並不是想要篡改結果——剔除異常值,例如平均差誤法中由於注意力不集中而導致的巨大誤差值。這個步驟沒有基於任何原理,也沒有什麼限制,但這會僅僅由於模糊的表象就產生武斷的決定。如果可能的話這種情況應該加以避免,但如果情況已經發生了,我們就應該使用大數量的實驗試次尋求補救。控制隨機因素的或然律(正誤法和平均差誤法也依靠它得以成立)預期到特殊事件很少發生的情況。把這些意外情況排除於計算之外沒有什麼好處,因為計算本身是必須基於這些與機率有關的定律的。當然在長時間的實驗系列中,使注意保持在完全不變的水平是不可能的,即使我們已盡力保證它的一致性。這些意外的變動本身就是隨機波動性的一部分,它們是這些方法所固有的,我們不可能通過任意手段改變或然律所產生的影響,因為它適用於大樣本。 記下觀察的日期很重要,不僅出於我對整齊有序的偏好,更重要的是因為在實驗過程中可能發生的感受性周期性和持續的變化,只能用這種方法在結果的匯集和應用中得到識別和總結。我們最好也記下所有的例如溫度這樣的次要條件,這些條件也可能影響到實驗的成敗或結果的可比性,即使當這種影響還沒有得到證明的時候。就這方面來說,做得過多比做得太少要好。 有兩個或更多的觀察者報告匯總他們的研究,將對於我們的工作尤為有利。他們能夠互相補充、幫助和檢查。對於一個觀察者而言,想要獨自成功且徹底地從事一個單獨的感覺領域或其中某一重要方面的研究是不容易的。分工對於這項廣泛性的任務而言是很有必要的,正如將不同時間所得的不同結果整合起來一樣必要。在某些條件下,由於技術原因需要兩名觀察者(或者至少是一名觀察者和一名助手)的直接合作。最後,在我們的研究領域裡,由於存在這樣的風險,即研究結果主要依賴於觀察者的個性,所以一個觀察者得到的結果要經過一人或更多人的檢驗,這是很重要的。因此根據特殊的環境,分工可以通過觀察領域的劃分、共同參與同一實驗,或者通過整個實驗的獨立重複等方式良好地執行。 有人可能會說在我們的工作中,通常沒有單個觀察者的結果會被認為是確定的,即使這個結果是由最可靠的觀察者得到的,除非該結果得到另一名可靠觀察者的檢驗,因為一名觀察者的可靠性只是可以保證他自己獲得結果的誠信和精確性,而不能保證他所觀察到結果的可靠性就能推廣到其他所有結果。這種一般化的觀點認為,雖然存在某些關係和定律事實,但我們可以從一開始就假定它們不僅僅是關於個性的問題。 根據這些觀點,可能有人說在共同的任務中幾名觀察者的合作努力是如此重要,但對於實驗心理物理學測量結果而言,它們還只是由觀察者在協作者或助手輔助下得到的,這種局限性會導致結果有效性不高。不過,正如對任何觀察的獨立檢驗都非常重要一樣,在對最小的干擾、儘可能一致的條件,以及對時間、實驗條件、實驗序列進行了最充分控制的前提下開展該領域的觀察也同樣重要。我們應該儘量避免對實驗條件的先驗知識所帶來的風險,因為它們會提供想像的線索進而導致結果的歪曲。由於某種原因,在不需要助手的情況下卻勉強讓其加入是做無用功的體現,正如一部機器的複雜度在不必要的時候也就變成了妨礙操作的特徵。在關於測量方法的專門性討論中,通過關於條件的本質和在這方面的已有經驗,我們會有更多的機會回到這個話題上。一般觀點不能成為特定規則的堅實基礎。 實驗的時間與空間關係:常誤 由於我們的方法由兩個級別的比較構成,連續的呈現比同時的要好,尤其是因為當注意不可避免地在兩個級別中轉換時,同步呈現幾乎不可能實現。因此如果可能的話應該對實驗進行合理的安排,因為儘管觀察一個緊接著一個,互不影響,但在觀察者的記憶中會發生疊加的情況。正如韋伯說過的,用這種方法比較大小的能力是很奇特的,必須等到內部心理物理學未來發展到一定的程度,才能得到解釋。現在我們必須以其存在的事實為討論基礎。 因為被比較的知覺在時間上不是完全吻合的,正如它們在空間上不完全吻合一樣,我們通過改變感知器官的條件而發現了影響測量的效應。我把這些條件簡稱為大小比較的時間和空間狀態條件。它們是構建精確的感受性比較測量法的主要困難來源。在這些方法的發展中,必須特別注意對這些困難的測查和消除,通過數學和其他流程處理後,將可能獲得比初始狀態下更多的結果。迄今為止,相對於主觀的查證,我們在這個方向上所投放的注意力要少一些。 一般來說我們能夠談及它們所涉及的時間關係:(1)每一個差異大小被感知到的時間,例如在重量提舉實驗中提起一個重量時,或者在距離判斷中判斷了一個距離,等等;(2)在感知一個對象大小與另一個對象大小時允許經過的時間;(3)時間順序,哪一個先被感知;(4)在一個人做出決定之前重複比較次數的多少。通常,習慣會給這些條件帶來某種一致性,在個別實驗中可能發生的微小差異的影響從長遠看來會被平均。在計時器的幫助下,系統的實驗實施能夠有助於恰當地產生完全的一致性和可比性。通過有意地改變條件,我們可以觀察到它們的影響。迄今為止有關這個領域的工作很少。但我在用正誤法進行重量提舉實驗的過程中,仍注意時時顧及著這些因素。 此時我僅僅是泛泛地談論被比較對象大小的空間關係,這本身沒有什麼意義,因為比起時間關係,條件在不同方法和研究領域下的變化甚至更多。我只是做一個預先評論,我們需要特別關注感覺器官的配對性質,一方面,因為這在是以單獨而不是合作進行的方式前提下,為配對器官的感受性程度提供了比較的機會,另一方面,就其合作來說,因為使配對器官在被比較對象間保持一致狀態並不是件容易的事情。 因此,當需要判定的一個容器重量以及所使用方法中的正確次數改變時,差異就因此產生了,這個差異依賴於待比較的重量是在左邊還是右邊的容器中。這種差異的產生不是因為人的右手或左手具有什麼特異功能,而是因為用一隻手提起一個容器,另一隻手提起另一個容器,兩隻手很可能具有不同的感受性。如果用同一隻手先後提起兩個容器,能夠看出在兩個重量間切換時這隻手(臂)會自動改變提起時所達到的位置,因此它提舉兩個重量的模式也發生了細微的改變。正如我可以通過實際實驗所證明的那樣,實際情況對結果是很重要的。在通過眼睛使用平均差誤法判斷距離的實驗中,用以匹配其他距離的標準距離是在其他距離的左邊還是右邊、上邊還是下邊,都會造成差異。在辨別皮膚上兩點間距的匹配實驗中,當一個人在自己的身體上做實驗時,是用右手抓住代表標準腳間距的圓規,而左手拿著另一支圓規進行判斷,還是顛倒過來進行,對於實驗結果也是非常重要的,即使當使用帶柄的圓規時也是如此,因為在某種意義上,使用圓規的方式可能發生改變。其他情況下也是如此。 時間和空間條件在一系列給定的實驗中是保持不變的,不過當需要比較的差異程度不同時,它們可能發生變化,但在最終獲得的測量結果中,它們為一個我們通常稱之為常誤的概念提供了基礎。 在重量提舉實驗中使用正誤法,當其他條件都相同時,先提起被比較的重量所在的容器多次,與後將其提起相同次數時的情況進行對比,常誤就得到了證明。在一次實驗中正確判斷與錯誤判斷次數的比率與另一次實驗中的相比,會有很大的差異。同樣在實驗試次數目非常大的情況下,較重的重量放在左邊的容器中和放在右邊的容器中相比,也存在著差異。[7]當用平均差誤法測量通過眼睛或觸覺來判斷距離的感受性時,由於在經過多次實驗後,被試判斷結果的平均數與給定的標準距離仍然不一致,促使常誤就變得很明顯了,但是由於所比較距離間的時空關係逐漸趨於穩定,常誤將會沿著正向或者負向發生可見的變化。在這種關係中,我們還發現,正誤差的總和(即偏離標準的正向偏差的總和)經常與負誤差的明顯不同,而不是在絕對值上相等。這個差異很大,不能歸於不可補償的隨機誤差。 有人可能懷疑這些結果,把這些觀察歸因於想像的影響。然而,在親身實驗過這些方法後,他會很快相信雖然他盡了最大的努力,自己仍無法逃避這些常誤。由於我在這種關係中所觀察的結果確確實實地把想像的影響排除了,我必須承認這些實驗中非常意外出現的常誤,在一開始就令我最為迷惑,在我設法消除它們之前,也是最令我尷尬的事實。即使是今天在這個領域做了大量的工作,尤其是在對重量和觸覺進行了測量後,我還是不清楚它們的最終原因,我確定的只有它們存在的事實。之前曾提到那些重複我實驗的研究者們,也發現了相當一致的結果。 有人可能會注意到,常誤的存在僅僅是將由我們的方法得到的測量結果複雜化,但不會使結果變得不準確。如果誤差真的是恆定的,我們可以通過適當的方法將其排除,同時也可以準確地確定其數值,我會在後面針對單個方法的討論中加以說明。 不幸的是,嚴格來說,常誤的恆定性也不高。關於先提起放在左邊的容器的實驗,抑或右邊或左邊距離的判斷中,我今天所做的有關哪邊較大哪邊較小的判斷,跟另一天的結論並不總是相同的。此外,即使外部條件保持恆定,內部加工也會發生驚人的變化。這些變化很容易隨著我們的方法而變化,但是當談到最終結果的精確性時我們就會遇到困難,因為由於常誤而產生的變異性與平均差誤法中純粹的可變誤差產生了混淆,並且污染了可變誤差。在正誤法中,誤差以另一種方式始終影響著測量。因此,我們要投入最大的精力來排除變異性,或者通過對觀察的設計或處理儘可能使其無害(類似於化學中的分餾法)。 儘管有這些因素存在,但我們不可以將由常誤的存在導致我們方法複雜化的情況視為缺點,而應該將其視作一項重要的優點,因為常誤的確定本身就是心理物理學測量可行研究的一部分。畢竟它們的影響對於與感受相聯繫的因素而言,是非常典型的且應該得到測量。然而同時也存在將它們排除在差別感受性測量之外的機會,這也是我們現在所關心的問題。因此,我們不應該僅僅把常誤當作無用的廢物丟掉;我們應該根據適用的條件、定律和變量將其仔細地與感受性的測量分開,並且在每一個領域接連開展研究。我們的觀察方法應該切實地推進實驗技術,因為它們不僅可以將意外常誤的發生一般化,而且展示了一些常誤的來源,而這在之前幾乎沒有得到人們的思考。我的《測量方法》中還有更多有關這方面的內容。 在測量感受性的方法範圍內,影響常誤的實驗條件中蘊含著關於其區分力的證據。 對於想要親自採用我所描述的實驗方法來開展研究的人來說,前面的評論遠遠沒有告訴他們需要了解以及觀察些什麼。因為我有責任對《測量方法》進行更詳盡的解釋,我將重點介紹後兩種方法的本質性特點。我會在此做個簡要的概述,之後將更徹底地討論這個問題。在這個過程中,關於正誤法我會以重量提舉實驗為基礎,而關於平均差誤法我會以視覺和觸覺距離判斷實驗為基礎,因為只有這些才是我可以自由支配的實驗領域。接下來的通篇內容中,我使用的術語會根據所涉及的方法而變化。 正誤法在重量提舉實驗中的應用 以下說明的實驗(始於1855年)構成了正誤法的基礎,它一開始是為了更仔細地驗證韋伯定律這一簡單目的而施行的。出於完善方法本身的興趣人們進一步進行了相關實驗,我曾經很希望對不同條件下方法的精確性進行調查,並提升實驗和技術,這在當時是無法實現的,後來當這些調查成為可能時,相關研究規模就逐漸擴大了。有幾年的時間裡,我把做實驗當作一種每天例行的勞動,一天進行一小時直至全部結束。做實驗需要系統地進行很長的一段時間,這是為了對各種特定的關係進行調查。用這種方法收集的材料在這卷書里不可能詳盡完整地列舉。人們為了確定不同時間和變化條件下的重要差異,進行了大量的實驗和不斷重複的實驗系列,這在後面的幾個章節里還會提及並給出證明。這項工作同樣徹底影響了方法使用的實踐過程。 我們的方法依賴於確定正確判斷次數與錯誤判斷次數相對於總判斷次數的比率,一般我傾向於使用後面這種比率[8]。我假定把正確判斷的次數稱為r,錯誤判斷的次數稱為f,總判斷數為n,我們主要關注的比率就是r/n。然而,如果一套特定觀察的結果被分成幾個子群並且分別加以計算,r和n則分別指每一個子群的正確判斷數和總判斷數,而v則代表子群的數量,因此vn就變成一整套特定觀察的總判斷數了。當整個實驗系列涉及幾套這樣必須互相比較的觀察時(通常情況都是如此),那麼vn就必須再乘以套數以得到整個系列的總數。 注意每個不確定判斷應該被分成兩半,一半歸入正確判斷,另一半歸入錯誤判斷。為了避免這樣一來存在著很多半數,我把每項正確判斷記為兩次正確,每次錯誤判斷記為兩次錯誤,每次不確定判斷記為一次正確一次錯誤,因為計算r/n只需要計數數據。 P指代標準重量,也就是用以比較的裝載在容器里的重量,標準P中是沒有D的,D代表一個實驗試次中使用的重量增量(附加重量)。我們給h指定一個值,這個值與差別感受性直接成正比,因此與能夠與給出相同r/n的D成反比例關係,簡言之也就是我們所關心的差別感受性的測量值。 實現這種方法有兩種程序方式。根據第一種方式,我們要在反覆提起放下載重容器之後決定哪個重量較重或較輕。根據第二種方式,每個容器只提起一次來加以比較,在這之後就立即進行明確的判斷,不確定的情況則一半計正確一半計錯誤。 一開始我總是使用第一種方式,後來我捨棄了用那種方法所做的全部實驗結果,而開始只用第二種方式了,因為我確信第二種方式有更多的優勢。不僅是因為這種方式與第一種方式相比能夠導致更大的一致性,而且它能為消除和確定準確的時間和空間影響提供基礎,因為這種影響會產生常誤。正如我們將要看到的,只有用第二種方式,這些影響才能合理地相互牽制。 當然用第二種方式比第一種方式更容易犯關於差異方向的錯誤。即使D恆定不變且總判斷次數一直保持一致,不明確判斷和錯誤判斷的次數也會相對更大。然而基於在任何條件下都會產生誤差的事實,因此這種方式沒有看起來那麼不準確。任何比率r/n的降低均可以通過使用更大的D來補償,而這個比率太大也不會對測量起到什麼好的作用。另一方面,第二種方式在同一時間內能夠產生更多的結果,它也可以使每一組配對重量的結果與另一組完全相同或具有可比性。 如果使用第一種方式,一定不能讓被試知道較重重量的位置,為了排除先入觀念判斷的影響,因此在決定其位置時需要助手的協助。在第二種方式中,根據下面給出的描述,這種預防措施就不必要也不適用了。在對整個情況進行更詳細的說明後,這些道理就會變得更顯而易見了。 根據給出的規則,容器應該總是被一個接一個地提起。因此,兩次配對的提舉才能構成第二種方式的判斷基礎,先提起一個,再提起另一個;因此它是由兩次單獨的重量提舉組成。然而,因為正如所指出的,每次判斷都被計了兩次,另外需注意總的判斷次數應對單次的提舉次數進行計數,而不是成對的提舉次數。 當我用同一隻手提起兩個容器時,我稱其為單手操作;當我用一隻手提起一個容器而用另一隻手提起另一個容器時,我稱之為雙手操作。即使是單手操作我也是用雙手加以實施的,因為右手和左手是交替使用的。在每一個長時的實驗系列中都會發現右手多多少少——儘管不是很明顯——比左手更敏感。然而我們發現單手操作與雙手操作相比,其敏感性並不存在顯著差異。容器受時間和空間關係的恆定影響在單手、雙手、左手和右手操作之間進行了比較,發現四種操作差異顯著。然而在此我尚不想就這個問題詳細展開說明。 承載標準重量P的容器(與置於其中的物體一起)的設置需要特別的考慮。在我浪費了大量的時間用不完善的儀器進行實驗後,最終我才發現了一套令人滿意的裝置,下面簡要描述一下,容器有一個可以轉動的圓形手柄,容器內的一系列用於固定重量的裝置與容器構成了一個連續的實體。 我想舉一個例子可能大家都會比較感興趣——確實也只有一個例子——關於必須面對的瑣碎的問題,這些問題都可能成為這類實驗中耽誤時間的原因,我先描述幾個不完美的安排。 開始我用簡單的中空木質圓筒作為容器,我用手從上部抓住它。如果重量很重,我的手就需要抓緊,否則容器會從手中滑落,然而如果重量很輕,手就會抓得松一些。因此就無法保證抓握力度的一致。後來,我在容器上裝上了銅手柄,它可以繞著銷釘在每個容器底部直徑兩端自由旋轉,因此當提起容器的時候它們會由於重力而自動轉到一個位置。但是這種裝置很快就磨鬆了。之後,我把手柄鉚接得更靈活一些,但為了節省重量我用薄的黃銅做手柄,這導致當我開始使用更重的重量時手柄會彎曲,因此破壞了實驗條件間的可比性。於是我用更堅固的材料代替黃銅片,並拋棄了以前的所有實驗結果,之後用新裝置做了近一年嚴謹且艱苦的實驗。雖然最後我沒有把這些實驗結果都拋棄,但至少它們需要重複和檢驗,因為從一定程度上我了解到所有先前的實驗觀察現在看來都是多餘的——或者可能充當新系列實驗結果的附加檢查值。在隨後的結果中它們都被徹底刪去了。在下面的內容中可以發現原因。最初使用的壓載物,現在已經被拋棄了,只是還在用於校正重量,它的體積大小是與重量成比例地變化的。因為容器必須要足夠大以容納最大的重量負荷,當提起容器的時候,較小的或者甚至一些較大的重物都會移動。我假想即使不考慮這個事實,當手抓起手柄的時候,容器重量的壓力也會落到手的同一點上,因此容器中重量物體的可能移動並不會產生不利的情況。由於需要挨個研究和檢驗的情況很多,它們均有可能影響實驗的進程,我就忘了對上述這個因素進行專門的研究。這個疏忽得到了報應。當我最終有意將重量固定在容器的中間或兩邊並試圖加以比較,從而想要確保並將我的研究引到這一方向上時,我發現兩種情況下的結果有很大的差異,不是由於重量的不同,而是由於壓力分布的差異。當重量處於中心時,一個容器似乎是最重的,當需要對位置的極端情況作比較時,這種差異是絕不能忽略的。當然在我的實驗裡發生移動的可能性很小,而且通過大量的實驗可能互相抵消。根據主要的結果子群間各自相同,以及後來使用改進裝置後得到非常一致結果的事實,這種推測可以得到證實。儘管如此我對自己之前的結果還是不滿意,結果的準確性和單獨測定的可靠性(即使不是整體的數據)都具有風險,我寧願費勁再用新裝置重新測定,而不願讓事情保持原狀。 後面我所提到的所有實驗都是根據第二種方式進行的——幾乎所有的實驗都採用了這種方式,我稱其為一般環境或條件。這裡省略了第二重要的內容,我留在《測量方法》一書中說明。只有在偏差可以通過研究獲得的情況下,才能測得偏離一般條件的偏差。 最後對容器內部的設置僅僅包括了一個具有四個垂直銅柱組成的框架,這些銅柱在底部由水平的橫杆連接起來。容器所載重量物(鉛或鋅塊)的邊角都是直角並且大小與框架正好相吻合。這些重量物只是厚度不同,這樣它們就可以牢固地卡在框架中,而不會在提舉的過程中移動了。標準重量P包括容器、重量物和蓋子,蓋子的中間焊有一個小空盒。兩個標準容器經過仔細處理,可認為是完全相同的。附加的重量D被放在容器蓋子上方的盒子中。這樣附加重量就會固定在標準重量的中間位置。容器的手柄由一個直徑1巴黎英寸[9]的木製圓柱體構成,手柄可以繞著軸心旋轉。提起容器的時候要用整隻手抓住手柄。 根據所使用蓋子的輕重,每一容器包括蓋子重有300或400克兩種條件。300克是最小的標準重量P,也就是當容器的蓋子最輕而且沒有附加重量時的情況。我所使用的最大標準重量是3000克;我的裝置可能不能長時間承受更重的重量。當實驗目的並非檢驗使用不同標準重量的結果時,我通常以1000克作為標準重量。 最常用的附加重量為0.04P和0.08P。 儘管兩個容器在構造上完全一致,但在每個系列實驗中為了抵消可能忽視的差異影響,D分別加在兩個容器上的次數也要是一樣的。 我用一塊裝在實驗桌邊的橫板對提起重量達到的高度加以限制,具體高度為2巴黎英寸9巴黎行。 提起容器的時候要擺脫襯衫袖子的束縛。 提舉實驗是這樣進行的,例如如果在第一次比較中先提起的是左邊的容器,下一次就要先提起右邊的容器,如此交叉往復。單獨的一套實驗包括32組連續交替的提舉配對或是64次獨立的提舉,其中D一直是在同一個容器中的。在每套實驗做到一半時(也就是32次單獨的提舉),這個容器的位置從右邊換到左邊。不同的時間和附加重量D的位置形成了四種不同的組合,構成了所謂的四種主要條件的基礎,這在下面會具體討論。在一套實驗中,每一種方法都對應16次單獨的提舉或判斷。每天通常連續進行8到12套這樣的實驗,每個實驗包含了64次的提舉,其中會有適當的實驗條件(P、D等)變化。對於較長的實驗系列而言,有可能持續將近一個月的時間。 提起一個容器的時間為一秒鐘,由一個節拍器控制,放下容器用時一秒鐘,提起與放下容器之間的時間間隔也為一秒。因此,一次用於進行比較的配對重量提舉需要用時整整五秒鐘。同樣的時間——五秒鐘——也是兩個實驗試次之間的間隔。這個時間用來記錄結果。在單手操作中總是採用空閒的那隻手進行記錄,在雙手操作中,則以隔天交替一次的方式確定記錄用手。 經過練習,實驗者可以跟著節拍器的節奏機械地完成這些操作。正如我的數據本身所顯示的,雖然注意指向能夠很快地變得一致而機械,但注意本身在每天實驗過程的最後階段似乎沒有顯著地減弱。對於附加重量D在哪一邊的判斷,隨著時間和空間位置的恆定影響以及隨機的不規則影響而發生了不規則的改變:右邊更重、左邊更重和不確定。可以說這些影響以客觀的方式出現,得來全不費工夫,而無須進行選擇和思考,均無疑是第一種方式中出現的情況。 為了避免混淆,並且更方便地使分別包含在四種主要條件下的正確判斷次數增加,我們應該對記錄進行合理的安排,安排的具體方法在《測量方法》中有敘述。 我們暫時結束關於實驗外部條件的討論,現在我要轉到有關方法的一般性原理了。 方法的一般性任務是為每一對比較來找到參數r/n的比值——或者如果我們把整體分為v個部分就要得到v個r/n的值——並從這些值里,獲得差別感受性的測量結果。我們必須在重量差別感受性的每種研究條件下均進行比較。相關的次要任務還包括明確恆定影響的方向和大小,它是作為實驗程序的副產品存在的。 現在看來似乎從一開始就存在著一個根本性的困難。 我們知道,在其他條件相同的情況下,r/n的比率隨著重量差別感受性的增加而增大。然而我們還知道,r/n加倍不意味著感受性的加倍,但根據我們先前對感受性測量的概念,附加重量D減半而r/n保持不變,對應的是兩倍的感受性。根據這些一般的情況,我們現在可以得到以下的觀察結果。 無論你想讓感受性低至何種程度,我們總是能夠找到一個相對於P來說足夠大的增量D,使得幾乎全部或全部的判斷都會是正確的。即使是感受性最大程度的增加也不會帶來r/n的增加,這一點大家一定可以理解。那麼在這些條件下,我們就不能以此作為感受性的一般恰當標準,因為即使感受性急劇變化,r/n的比率也會保持恆定或幾乎恆定。另一方面,假設感受性大大地提高了,那麼一個極小的附加重量就足夠使r/n接近n/n,我們也會相應地判斷出感受性的增量。因此我們不得不回到之前對測量概念的定義,它是事物所固有的本質。但我們應該如何據此來重新改進我們的方法呢? 例如,假設我想要比較右手和左手對重量的差別感受性。我會多次提起同樣的標準重量P和同樣的附加重量D,左手(L)和右手(R)交替進行。然後我會針對左右手獲得不同的比率r/n,這使我可以判斷兩隻手的感受性孰高孰低,但是我無法得到它們二者感受性測量的比較結果。現在的問題是,需要獲得能夠導致左右手產生相同r/n比率的增量D的不同大小。 如果我只想要研究不同P值下單手的感受性,或者雙手的平均感受性,也會出現類似的問題。正如從經驗中可知,較輕的P相對於較重的P而言,增加相同的重量D會導致更大的r/n,但是問題的重點是在不同的P值下,找到使r/n恆定的不同D值,以使得可以用D的倒數表示不同P值的感受性測量結果。 從這點看來,迄今所用的正誤法確實只適用於給出一個多了還是少了的指示,而不是具體可比的感受性測量值。儘管如此,還是可以發展這種方法來獲得測量結果。 目前最直截了當的方法是使用試誤的程序。我們可以在測驗的條件下改變附加重量直到得到相同的比率r/n。然而由於需要非常多個試次,甚至才能為同一個D找到準確的數值,這個過程對於每一個被研究的D值都需要投入大量的觀察,因此不僅會非常枯燥,而且即使經過這麼多枯燥的試次後也不一定會得到準確的結果。 我們當然可以在緊鄰的兩個數值中插入數值(即插值法)。在很長的一段時間中我都是用這種方法的。然而即使這種方法也只能部分地克服不方便和不精確的問題。幸運的是這些缺點可以簡單而徹底地被克服。 由每一個特定D得到的r/n值,可以用於推測需要什麼樣的D來得出其他的r/n,只要P和其他條件是恆定的,而且r/n是根據足夠量的n個試次而獲得的。使用的公式原則上是準確的,在實驗測量中是成立的。雖然公式基於數學分析,但它也很容易付諸實踐。因此可以用來計算我們想要得到的恆定的r/n。事實上,基於任何一個足量的n個試次[10]獲得的比率r/n,我們都能夠不用計算而在表格中直接查到相關差別感受性的測量值。這種測量與我們前面的定義相符,我會馬上說明怎樣使用,不過首先要對這個公式的推導過程進行簡要說明。 在我改進方法的過程中,對機率論的興趣一次又一次地使我得以向前推進,在其中我想到了以下幾點:(1)根據我們的程序,差別感受性的測量參數可以通常由標為h的值表示,根據高斯的觀點,只要精確性是僅僅依賴於類似程序中差異知覺的感受性而得到的,那麼h就可以提供觀察精確性的測量;(2)實驗確定的比率r/n和前面提到的h與用以確定r/n的重量增量D——r/n和hD——之間應該存在數學關係,這可以使我們從r/n得到hD,因此通過除以D可以得到差別感受性的值h。 首先只是理論上確定這種關係,其次需用實驗加以證明,最後將其運用於我們的方法實踐中。我相信我已經圓滿地完成了這三項任務,這樣正誤法就應該能夠達到真正的測量方法標準。 我們要把相關的數學推導過程插入下面這個獨立的部分中,因為就方法應用的實踐目的而言,並沒有必要將其中的數學原理解釋得非常透徹。實驗證據主要表明了在假定感受性恆定的條件下,當找到給定D值對應的r/n值時,如果存在一個與第一個D值成比率的D,那麼前者的r/n值(根據我們的數學關係加以計算)在後者的實驗中是可以再測得的。當然允許由未加補償的隨機因素引起的小規模偏差存在。或者用同一證據的另一形式,我們可以表明在感受性不變而D不同的條件下,基於我們確定的數學關係,通過實驗確定的r/n能夠與計算得到的hD值相對應,而根據我們表格中的數據,hD與D值是成比例的。[11]作為證據,我進行了一項擴展的實驗研究系列,這在《測量方法》中有相關論述。我們在第九章和第十二章中還會看到一些相關數據。 因此可以用純實驗的方法呈現這個問題,這樣任何人,即使沒有理解操作規則的推理過程,甚至沒有數學背景也能夠使用這種方法來進行測量。他還能夠滿懷自信地加以使用,因為這種方法的數學推導已經得到了著名的數學家權威的認證,並且通過了經驗的檢驗。 正誤法計算的公式與數學推導 到目前為止還沒有人提出當附加重量D保持恆定時,如何確定比值r/n怎樣隨著標準重量P的大小而變化的先驗原理。這更應該屬於需要通過實驗加以確定的原則性問題。另一方面,我們需要根據機率論的原則,確定當標準重量P保持恆定而附加重量變化(差別感受性h保持不變)時,r/n將如何變化(假定有很大的n)的先驗條件,或者如果影響重量增加感受的任一外部變量發生了變化時,通過D如何能夠一勞永逸地預測所有變化。如果可以實現這些目標,同樣的原理對於我們確定觀察誤差相對數量的變化也是適用的,其中觀察誤差的大小會變化,而觀察精確度保持恆定。然而我們所關心的r/n與Dh的關係卻不能用有限的表達式加以表示,而是必須表示為一個整體,出於實際操作的目的必須製成表格,製作表格過程如下所述。 從現在起用θ表示整式,它在這裡的使用與表示相對數值或限定大小的誤差機率一樣。唯一不同在於重量增量的一半D/2被通常表示為Δ的誤差項代替。我們寫作 公式中,π是魯道夫常數[12],e是自然對數的底數,t=hΔ=hD/2, h是高斯概念系統中精確度的量度。在很多地方,都有可以查到與給定θ值對應t值的表格,例如在1834年的《柏林天文年鑑》(Berlin astronom.Jahrb., pp.305 ff.)中,給到了t=2.0的範圍值;在一份特殊的且已絕版的石印表格中,給到了t=3.0的範圍值。因此,給定對應於r/n的θ,我們可以同時確定t或hD/2。 我們現在馬上要開始證明下面這些等式,它們是我們方法的基礎,通過這些公式可以由r/n得到θ。 因此 只需按照如下的要點來考慮r/n和θ的關係就足夠了。我們通過等式(2r/n)-1=θ就能根據觀察得到的r/n計算出θ值,在綜合表中可以根據θ的積分值查找對應的t=hD/2的值,然後用這個值除以D/2來得到h。或者,如果我們將在正誤法中取的h定為平均差誤法中的一半(接下來我們就是這麼做的),我們可以直接除以D。為了避免把每次觀察得到的r/n值單獨換算成(2r/n)-1,我把積分表中的θ進行了轉換,轉換後的表給出了θ=(2r/n)-1和t的關係,可以直接從r/n和t列查到。後續的基本表是用這種方法推導出來的。 我向莫比烏斯(A.F.Möbius)教授展示了r/n和θ關係的數學推導,並且通過了他的檢驗,因此可以認為是精確無異議的。他還幫我進行了更加簡練和精確的推導,相比之下我的公式就有點拙劣了,不過最後得到的結果是一樣的。因此下面我想再展示一下他的推導來取代我之前的推導。 莫比烏斯的推導使用了一條直線兩個部分的偏離為例,而不是兩個重量差異的例子。二者的原理是相同的。 一般把 作為測量誤差落入-Δ和+Δ區間的機率,其中h和前面一樣代表測量精確度,π是魯道夫常數。 如現在給出 A  C  B 作為一條直線上的三個點,C接近於但不是正好處於A和B的中間。用正誤法進行n次觀察的過程中,我有a次判斷A比B更加接近C,也就是CB>CA。我還判斷n-a=b次B比A更接近C即CB<CA。CA<CB和CB<CA的可能性隨著a和b相應地發生變化,兩種可能性本身就是a/n和b/n。 如果我們用 A  C M  B 表示一條線,M是A和B之間真正的中點,C緊靠M在A的一邊,那麼我的判斷就是正確了a次而錯誤了b次。換言之,我相信點C在M和B之間的次數為b。在b次的判斷中,每次我都錯誤地判斷了C的位置,我錯誤地認為在往B的方向上,線段CM相對於M而言,是靠近B的一邊的。因此我每次在同一方向都犯了一個>CM的錯誤。錯誤的機率一方面可以用=b/n的方式表示,另一方面可以表示為 其中CM是正數。現在 因此 接下來可知 最後,因此有: 這兩個a/n和b/n的表達式也可以這樣解釋:在對直線ACMB的n次觀察中,只有A和B是確定的,一個人有a次相信M處於C和B之間(正確判斷),有b次(錯誤)判斷M位於A和C之間。然而綜合的區間對於a/n是-hCM到∞之間,對於b/n是-∞到-hCM之間,這就類似於線段CB與AC。因為如果我們把ACMB視為正向而M作為起點,C和B的橫坐標就變成-CM和MB,A和C的橫坐標就分別成為-AM和-CM了。然而AM和MB相對於CM而言,可以視為無窮大。 接下來是莫比烏斯的推導。 為了將直線的例子轉換為重量的例子,我們不得不用重量P代替AC,用P+D代替BC。AM=(AC+BC)/2的長度現在成為P+(D/2),線段CM因此對應於D/2, D/2代替前面公式中的CM。此外,a/n等於我們的r/n, b/n等於我們的f/n,這引出了以下表達式,可以直接應用於我們的方法: 或者如果我們將積分 用θ簡化表示,那麼 前面提到一個事實,就是正誤法的精確性或感受性h是平均差誤法的一半,但這不影響我們對正誤法的應用,因為在這種情況下只有相對值t或h是重要的。必須考慮這些因素,以防有人想要通過正誤法比較由平均差誤法所得到的結果的絕對值,這樣可能要用到θ的積分。對可能誤差或r/n或t的變異性的預估也是如此,但這裡我們暫時先不討論。 現在我們轉到實踐問題上: 我們所涉及的判斷程序僅僅是由以下的查表過程組成的,我把這個表稱為正誤法的基本表,t=hD的值對應於實驗確定的分數r/n(如果r/n的數值不能在表中準確地找到,則可以使用插值法)。然後將這個數除以D來確定h的值,即我們想得到的感受性測量值,或者當D恆定時,我們也可以通過獲得的t=hD值並使用這種方法直接進行測量,這在許多情況下是非常方便的。 當沒有恆定影響(除了恆定重量增量D)存在時,或者這些影響在確定r/n的過程中已被實驗設計補償時,這條規則足以判斷哪邊的重量是較大的。當情況並非如此時,誤差的恆定來源就會混入t值,其現在不再只是依賴h和D(D只表示附加重量),而且還依賴於這些無關變異來源。即使D是恆定的,如果這些變異性的次要來源與D不能保持相對恆定,簡單地用t除以D自然也不能讓我們得到正確的h,而且t值不能代替h作為可比性的度量。然而即使這樣,合理安排實驗程序,使用適當的基本表是校正的最簡單方法。後面我會分別加以說明。 注意:(1)因為只涉及t或h的比率,我習慣於將t的制表值中所有的數字看作一個整數,而忽略它是小數的事實。[13]下面這張表中所引用的計算值總是採取這種形式。(2)只需要將r/n大於0.5的值制入表中。如果出現小於0.5的r/n,就如下面將要討論的這種情況中出現的那樣,這個情況是實驗中一個常見的現象,尤其是發生在D不太大的給定實驗條件下,我們必須使用f/n=(n-r)/n而不是r/n,在表中名為r/n的列下查找,並把對應的t值加上負號代入確定hD、hp和hq的表達式中,關於hp和hq後面會說明。(3)表中r/n=1(也就是所有判斷均正確的隨機事件)對應的t值是無窮值。嚴格來說,這假定了觀察到的數值是無窮的。一般來說我們應該使D足夠小而n足夠大,以保證這種情況不會發生。 正誤法的基本表 譯者註:表中的差異值指的是t的差異值,為後一個值減去前一個值的結果,如費希納前文所述的,他不再使用小數點,而直接用整數形式表達。下同。 我們使用基本表最簡便的方法是一勞永逸地取n=100,也就是我們每次分別為100次判斷確定r值。較長的系列以100次為單元進行拆分,求出每一部分的t值之後分別加和與求平均值,出於其他原因,這種部分處理的方式都是必需和有用的。之後的唯一要做的就是刪掉r/n列中的零和小數點[14],以直接找到通過實驗得到的r值。我們可以走捷徑,不僅可以通過拆分以形成r/n,而且也出於插值法的需要,因為我們可以在表中精確地查到所有實驗所需的r值。 如果我們不將100選作n值,我們就無法在基本表里精確找到合適的r/n值。我們可以很容易地在不同列差異值的幫助下,通過簡單插值法確定對應的t,因此我們產生的t值誤差大約只是0.0001至0.0002之間,而轉換成r/n的誤差大約是0.85。這個誤差不重要,因為這種觀察結果中的第四位小數均可被視為是無關緊要的。然而,採用更大的r/n值,我們會在插值中產生更大的誤差,r/n越大誤差值也會越大。因此我附加了幾個表格來補充表格的最後部分,其中r/n值的間隔更小,通過這些表我們可以為更精細插值的獲得提供充分的基礎。 補充表格Ⅰ 補充表格Ⅱ 表格的數字並不意味著n=100有著特殊的優勢。就我個人來說,我總是傾向取n=64而不是n=100。我把所有較長的實驗系列分成了n=64的幾個部分,分別給這些部分加上了t值,並且由此得到了總數和平均數。我的理由是,64作為2的冪,比起100可以被分成更多的部分,我最初在劃分時想要保持開放的方式。後來我堅持使用這個數字,為的是使所有實驗系列具有可比性,正如在後面會提到的,由於基本n值的大小對於測量結果的大小有特定的影響,應該始終保持可比性。因此我常用基本表中的r值是與n=64相對應的,這是為了避免將分數r/n轉換為小數以及出於內插值計算必要性的考慮,這些在前面的表格中都有描述。下面這張表格是供那些和我有同樣需求的人使用的。 出於對各部分實驗條件進行比較的目的,我需要將較長的實驗系列作為整體或者劃分為各個較大的部分,這樣可以較方便地進行處理,因此我還建立了一個n=512的表格,因為我的所有系列均是由64次判斷的倍數組成,64是512的1/8。n=64、2×64或4×64的表格也可以由此得出。這裡需要重新提及引用的θ積分,憑藉關於r/n和θ的等式,專家們能夠毫無困難地發展出以任何n為基礎的表格(通過插值法的幫助)。無論選擇了哪個n值作為基礎值,只要所有的實驗都保持同一基礎值,我們都可以很好地完成這個表格。較長的系列可以被分成同樣長度的幾個部分,我們可以一直都使用這些數值來設計表格。 基本表 n=64 假設感受性h保持恆定,那麼P也就不變(因為h隨著P發生變化,而不隨著D變化),我們還可以使用基本表查到根據已有的D和P計算出的r/n比值,據此推導出D,D值對於計算其他所需的r/n是很有必要的。只要用r/n值在表格中搜索相應的t值即可。我們還可以得到下列比值:一個t=hD比另一個t=hD的值,等於相應的這個D比另一個D的值。反過來看,給出一個D值,我們就可以從表中找到屬於這個已知D值的r/n值,只要h保持不變。然而,我們的方法並不是輕易地就能被投入實踐,因為如前所述,最後所有的結論都依賴於h的確定,或者有時只需要t即可。 我們不要忘記,如我已經解釋過的,表格的便捷使用只有在給定條件下才成立,也就是輕重表現的估量只依賴於D,與隨機性無關。現實中它還依賴於時間和空間因素的恆定影響。事實上,t的制表值不僅僅是hD,而是h(D+M),其中M是除了D之外的所有恆定影響的代數和,它也決定著輕重表現的判斷選擇。把這個因素納入考慮,我們的實驗任務將把測試和對它們的評估綜合起來,這樣我們就能通過使用前面的表格達到補償M值的目的,總是可以返回一個與沒有外部資源干擾出現的情況下相同的hD值。 我們先前提到的一般操作方法時刻都在以改進程序為目的而進行著調整。我們搭配了不同的時間和空間順序,產生了四種主要的實驗條件,較重的重量以完全動態的方式在其中展開輪換:(1)在左邊的容器中且先被提起;(2)在左邊的容器中且後被提起;(3)和(4)對應於在右邊容器中的情況。為了將這四種主要的條件區分開來,我們將它們分別定義為,較重的重量: (1)在左邊的容器中先被提起。 (2)在左邊的容器中後被提起。 (3)在右邊的容器中先被提起。 (4)在右邊的容器中後被提起。 我將四種條件依次簡寫如下: Ⅰ>,Ⅱ>,Ⅰ<,Ⅱ< 每種條件下對應的正確判斷之和變為 r1, r2, r3, r4 將從表中的查得的對應t值(不能再簡單地與hD等同)除以n值求得的商,分別記為 t1, t2, t3, t4 假定所有主要條件中的n值均相同。 如果我們將四種主要條件中的t值加和然後除以4,就能很容易發現M能夠由於完全補償而抵消。因此我們可以得到 除以D就可以像前面一樣得到純粹的h值。只要D是恆定的,我們還可以用hD或4hD本身作為測量結果。 這種對M影響的完全補償法是基於以下理由的。根據討論,提起重量的時間順序和容器的空間位置影響輕重表現的判斷。我把由於時間順序導致的影響稱為p,而將空間位置導致的稱為q。如果是相反的時間和空間順序,那麼p和q就會帶有不同的符號。我們希望給既定位置的符號是任意指定的,只要我們是用符號表示相反的位置。例如如果我們在第一種條件下把p和q取為正值,那麼在我們的四種主要條件下,第一次的M就有值+p和+q,第二次為-p和+q,第三次為+p和-q,第四次為-p和-q。因此以下為t=h(D+M)在四種主要條件下的對應值: t1=h(D+p+q) t2=h(D-p+q) t3=h(D+p-q) t4=h(D-p-q) 這四個值相加然後除以4等於hD。第一個和第四個等式相加(同樣第二個和第三個等式相加)再除以2也足以使我們得到hD。 通過加法和減法,同樣的等式適用以計算hp和hq,進而得到p和q的值。首先: 通過用這些hp和hq的值除以前面計算出來的值 可以得到p和q對D的比率,將這些比率乘上以克來表示的D值時,就可以得到以克為單位的p和q值。每個hp和hq,以及hD值均可以通過任兩種主要條件下得到的t值來確定,這樣不同計算方法所得到的值可以相互進行一致性核對。 依賴於作用的方向,p和q在這個過程中可以取正值也可以取負值,這樣它們的方向和大小就能同時得到確定。根據p和q被引入基本等式的方式,我們必須對它們的符號意義加以說明。 整個問題的最終解決方案以及由其衍生出的次級要點,均通過以下等式對h、p和q進行確定: 當然,只要整個過程使用同樣的參數值,我們就可以像數學方面的專家那樣,頻繁且輕而易舉地將諸多部分獲得的結果進行組合,或者乘以更大的倍數後進行相互比較,例如hD、hp、hq或4hD、4hp、4hq等等。 我在所有重量提舉實驗中對差別感受性的確定都是用這種方法得到的,後面我會再加以描述(第九和第十二章中)。它完全消除了p和q的影響,同時使獲得這些效應的準確值變為可能。我在此對這個問題進行的只是粗略描述,在上述兩章中都採用一種以上的方法進行了解釋和證實。大家在《測量方法》一書中可以看到對這個問題的全面且更加有條理的討論。 未來當需要使用到符號時,我將還是會遵從提到的符號定義一致的標準,當感覺第一次提起的重量較重時,就將時間順序對提舉的影響p記為正值。如果不考慮D的作用前提下,第二個容器更重的話,我就將其記為負的。當感覺左手的容器更重,我就稱空間因素的效果是正的,當右手上的容器更重的時候,就稱空間因素的效果為負。例如,如果我說,p的影響是+10克的話,這就意味著,除去真實情況下兩個容器的輕重關係,第一個容器比第二個容器感覺上要重10克。第十二章中我們會給出這樣的例子。 儘管時間的和空間上的關係保持一致,但是p和q仍然可能因為內部的因素而導致變化,由於這些客觀的條件只能根據人的主觀外在表現才能反映出來,出於未知因素的影響,導致這些條件都是富於變化的。 由於內外條件的變化,p和q的結果可能會發生很大的變化。我在各種不同條件下進行的所有實驗結果都顯示,如果不排除標準重量的輕重、先前手臂疲勞或者單雙手操作實驗範式對p的影響,就會導致p朝負值方向發展,表現為正值的絕對值減少或負值的絕對值大小增加,或者會從正值變成負值。結果進一步表明,在其他條件一定的情況下,右手單手操作相比於左手而言,p和q值中正值更多,負值更少。結果最終還表明,這些作用的大小和方向本質上並不依賴於D的大小。更多的細節我在這裡就不贅述了。 在計算t和獲得總體的r/n之前,也可以通過增加四種主要條件的r來補償p和q的效應,具體方法是在基本表中查找一個共同的t值來代表hD值。這種範式有時候是可以滿足要求的,但是對於我來說,這是一種不完全補償,因為通過這種方法,人們不能得到準確的hD值(並因此也得不到準確的h值),這些值是在不出現上述效應時才能獲得的,這一點我即將會說到。 例如我們假設,p的效應會在第二次提起的重量中更為顯著。同樣我們還誇大地假設,這個效應是不尋常的,甚至是無窮大的。很明顯,給其中一個容器增加有限的D對判斷沒有特別大的影響,第二次被舉起的容器總是會更重。那麼如果第一次舉起有D的容器的次數與第二次相同(就像我們的實驗中的那樣),並且將兩種順序條件下的結果都加到一起,就會如同在一般條件下人們獲得正確和錯誤次數相等的情況一樣,這種情況中可以假設其中p的影響被消除了,對和錯的次數就相等了,就好像是重量的差別感受性是0。就好比由於這個因素的作用,對D的感受性似乎被清除了。另一方面,如果提舉的時間序列效應不存在,D在兩種不同的時間條件下應該被感知為相等的。這樣根據容器的空間位置,就能確定正確判斷占優的水平程度(與重量的大小和感受性狀態成比例)。因此我們不能認為,相反時間序列導致的正確判斷次數增加,是與完全不存在時間序列影響的情況下相等的。但很顯然,越趨近於極限,這個因素的效應就越強。p的情況同樣適用於q,也同樣適用於這兩種因素同時存在的情況。另一方面,為了能夠分別使用不同的r而產生不同條件下的t,我們設計了一套完全補償程序,它將會有效地得到與沒有p和q的效應情況下相同的hD結果,因為這種效應可以被這種實驗操作所消除。 很容易看出,D的影響肯定也能與p和q一樣得到消除。當D非常大的時候,無論是提舉的順序還是左右手條件的影響幾乎都不起作用,判斷僅僅會受到D的位置影響。為了保證空間和時間條件下D被覺察的次數相等,就像我們的實驗程序中的一樣,就要求第一次和第二次提舉的位置以及左手和右手使用的次數相等,或者與D的增幅相稱。 雖然這種關係在理論上很容易表示,但是我必須坦白,我僅僅是通過經驗得出這種關係的,因為在實驗中即使不通過計算也可獲知,由於標準重量的作用,p的影響有時候會很大,以至於我們提及過的被忽略的D就變成了可覺察的。經過計算,差別感受性之間的函數關係發生了改變,因為在計算t值之前,我總是會對屬於不同空間和時間條件下的正確次數進行加和。 我們很容易看出,如果不允許將這四個主要條件下的情況分開,通過這種包含了反覆交替提舉容器的過程,只能得出一個不完全補償的結果。 此外,當人們只關心是「多」、「少」還是「相等」的判斷,而不關心如何對差別感受性進行真正的測量時,或者當他需要假設在研究過程中,p和q的效應沒有或者幾乎沒有重要改變時,就可能會免掉一個完全補償程序。當然在這種情況下,人們不僅會將這四個主要條件組合在一起,還會認為我們不必一開始就將數值直接轉換成t值,因為對於由特定的n個試次構成且D為給定值的實驗中,相等的r值——或者更大或者更小——表示的是一個相等的,或更大或更小的差別感受性。當然,我們必須牢記這個程序仍然是取決於p和q效應的恆定性的。就像前面已經提及過的,任何大量規則且恆定的干擾作用,都與大量的不規則隨機波動一樣,有著同樣的結果,也就是它減少了正確的反應次數(r)。因此,當恆定效應更大時,並且由此增大只在完全補償條件下才會消失的錯誤結果機率的情況下,假如存在相同的,甚至是更大的差別感受性,四種主要條件組合得到的r值就會被證實是變小了。由於內部因素影響所導致的巨大變異性,即使是仔細控制了外部條件的可比性,我們永遠都不能完全肯定以下事實,即用於比較的結果的確是在具有可比性的條件下獲得的。完全補償(也就是將這四種主要條件分離,之後分別轉換為t值)雖然會更麻煩,但是能夠保證更高的可信度,而對r單純的比較僅能用於粗略的估計和初步的測量。 沒有對相同次數的觀察和四種主要條件的規則輪換進行系統的使用,就不能對p和q的恆定效應進行準確的消除與確定,這樣的使用可以預知附加重量位置的規律性變化,並且形成穩定的認識。這種認知必然會影響到的第一種程序方式的判斷,其中曾提及用於計算r的每次判斷,都僅僅是在來回反覆地提起容器之後才做出的。上述影響在第二種方式中不存在,因為其中每一組被提起的重量都會影響r,但大家知道結果也會受隨機因素和容器時空因素的影響。因此對D位置的認識不能用於推測某一組特定重量的判斷結果,人們必須通過客觀證據對感覺進行判斷。通過我的實驗結果表格可以證實這種觀點。單手判斷的結果看似不規律分布,但從整體上而言,它由p和q的效應決定的頻率,和由D的位置決定的頻率是相同的(有時候前者甚至大於後者)。事實上在許多的實驗系列中,在某些主要條件下,儘管可能會提前預知D的位置,但仍會出現錯誤的次數遠遠大於正確的情況。 相應地,我們在使用第二種方式時不需要助手協助,雖然他在第一種程序方式中是不可或缺的,因為他必須在觀察者不知情的情況下改變附加重量的位置。事實上,他不允許在第二種方式中出現,因為在這個步驟中,對附加重量位置進行穩定的個人性質的檢視,以及在重量提舉過程中不被打擾地保持同等的注意狀態,這兩個條件缺一不可。 我按照第一種方式進行了長達數月的實驗,在轉換到第二種方式之前,我很謹慎地讓自己儘量忽略附加重量的位置,或者忽略任何有關其位置的信息,現在我已經可以很好地比較這兩種方式了。當然,如果針對這種程序方式中必須出現的與附加重量位置有關的信息,我沒有充分的信心保證它沒有風險的話,我是不會停在第二種方式而不再進行其他嘗試的。 如果有任何人根據這種方式去進行實驗,而發覺這些解釋不足以排除對我實驗推理的質疑,那我必須請他們去參考《測量方法》一書了,那其中關於這個實驗方法性質和方法本身進行了詳盡的說明,同樣還給出了實驗的結果,它們可以有效地反擊這些質疑。在任何情況下,只要有人按照上述程序方式進行了仔細的個別研究,我都允許他們存有反對意見。 出於計算的目的,我不僅是有規律地將實驗分為四種主要條件,而且值得一提的是,我還根據時間段和其他條件進行了分組。通過這種方法,每個單獨的t值都是基於64次簡單的重量提舉實驗試次而獲得的,再將它們組合之後加和或平均,而不是從總體的n個實驗試次中推導出每個主要條件的t值。這樣操作的原因我已經提及多次了,並且也在《測量方法》中有詳細的討論。 當然,這樣計算會相當不方便,特別是實驗系列較長的時候。然而,它卻能減少由恆定效應引發的有害變異。 人們還應該考慮到這樣的情況,即從部分結果中推得的hD值,多多少少會比從總體中計算得來的hD值要大——當各部分的規模越小時,兩者之間的差異就會越大。我可以針對這一點給出理論上的解釋,但現在我想先忽略這一點。為了保證這些數據的可比性,就要求必須從擁有相同數量n的各部分實驗進程中獲得推論,而且被使用的n也應該被提及。在我自己的實驗研究結果中,關於簡單提舉的次數n一直是64,除非有其他特定說明,該結果之後將會提及。 關於D的大小(應該選擇合適的D的大小,不應太大或太小)、對結果意義的檢驗和一些其他小的要點,我也提供了一些實踐方面的建議,這些會留到《測量方法》中再討論。 平均差誤法在視覺廣度和觸覺中的應用 關於實驗方面,我們注意到在視覺距離的判斷中,為了避免由圓規兩腳分開的角度帶來的其他作用,最好使用平行線索、平行點或者間距較大的兩點來標誌所要估計的距離,而避免使用間距較近的兩點,除非事先設定了這樣的實驗目標。 在觸覺實驗中,我用手柄將兩根英式縫紉針[15]固定在一起,製作成圓規來進行實驗。實驗過程中,我握著圓規的手柄[16]。規腳的末端只是稍有些鈍或者根本不鈍,這是為了能在尺子的刻度上準確地進行讀數。只能輕輕地用規腳末端刺激皮膚,避免過於強烈的刺激。觸覺的大部分實驗都是由我在自己身上完成的,但是出於比較的考慮,我也請了一名助手來協助實驗。在這種情況下,發現常誤變小但可變誤差大大增加了,這是因為由他人操縱另一支圓規,就會導致缺乏一個統一的使用標準,這就使得隨機因素的作用增加了。我馬上會說到如何消除這些誤差。 在估計視覺或者觸覺廣度中,使用到所謂的標準距離,指的是在實驗過程中保持不變的固定長度值。可變距離是被試估計出的與標準距離相等的廣度,一般來說多少存在著誤差。每段可變距離與標準距離之間的差異,我稱之為原始誤差,用δ表示以區分於純誤差Δ。 正如講到的,由很多觀察得到的廣度平均差誤,一般會與標準距離有非常大的偏離,正的原始誤差之和與負的原始誤差之和的絕對值不相等。其中一者會比另一者的數值大很多。為了恰當地應對這種情況,我將平均差誤對標準距離的偏離視為常誤,並將單個判斷相對於平均數的偏離視為純粹的可變誤差。我將這兩種誤差當作是原始誤差的一個替代品。因為每個原始誤差從代數學意義上而言,都是由一個常誤和一個純粹的可變誤差構成的,所以我稱它們都是原始誤差的成分。常誤用c表示,純粹的可變誤差用Δ表示,所以一個給定的實驗系列或實驗部分的純粹誤差總和用∑Δ表示。只有純粹誤差可以用於測量差別感受性,並且只有根據它而非原始誤差才能得到用於測量的平均差誤。常誤依賴於被比較刺激的時間和空間位置的恆定效應,也依賴於主觀條件影響判斷的形式。 在《測量方法》里我會討論到,將原始誤差拆分為各種成分是必要的,這既出於數學上也出於理論上的原因。在原始誤差和它的組成部分之間同樣存在數學上的關係,對這一點的認識在我們使用這一方法時是很有用的。這個問題同樣也會在《測量方法》里討論到,在這裡我僅限於討論這種方法中最關鍵的細節部分。 目前的重點問題在於要認識到可變誤差和常誤之間的基本獨立性,就像實驗中顯示的那樣。當被用來比較的距離改變了相對位置或者序列發生了改變,常誤也因此發生了改變,那麼兩種情況下的原始誤差之和間可能常常會存在著很大的差異,而實際上純粹誤差之和卻是相同的。有一個例外就是這些結果都伴隨著不同且不規則的平均隨機波動效應,但是在我們的實驗中這種情況不多見。因此在測量常誤時,似乎並不需要僅僅為了測量可變誤差,就去通過改變刺激位置和序列重複進行這些距離的比較,儘管這種做法也是不允許的。在合適的方法的前提下,通過組合在不同的位置和序列條件下獲得的數值,我們就能根據它們的來源分離出不同的成分,就如我在《測量方法》中詳細描述的那樣,並且這對於專家而言也是非常淺顯的。這種處理從本質上而言,與在正誤法中分別測量p和q效應的思路是一致的。 在視覺廣度的判斷中,必須要區分左右或者上下的情況(取決於這些距離是水平的還是垂直的),以及標準距離與可變距離間的位置關係。在觸覺的實驗中,用右手握住作為標準刺激的圓規,而用左手握住作為可變刺激的圓規,也可以反過來;抑或假若一個人在實驗中是雙手重疊操作的,那他必須用同一隻手握住兩支圓規,其中一支圓規位於手的上半部分,另一支位於手的下半部分,也可以反過來。另外,我也已經完成以時間為變量的觸覺實驗,具體是指標準刺激和可變刺激哪個先呈現。 當從純粹的可變誤差中獲得平均誤差之後,就要面臨兩種形式平均誤差的選擇問題了。其中一種,我就將它命名為「平均誤差」(或者,為了做出區分,將它命名為「簡單平均誤差」),記為ε,由純誤差的簡單平均得來,公式為: 其中m表示純誤差總和中的誤差數量。另一個,是天文學家所稱的「平均誤差」,但是在這裡,我們要稱之為「二次平均誤差」[17],用εq表示。它的計算是先將每個單誤差平方,然後將這些平方的總和∑Δ2除以m,再將所得到的商開方,公式為: 總之,它是誤差均方的開方。如果誤差的數量夠大的話,根據或然律,這兩種平均誤差的比值是一個常數,可以形成以下公式: 其中π是魯道夫常數,所以這個二次平均誤差大概是簡單誤差的5/4。這一點我對自己很有信心,因為我進行了大量的系列實驗,結果與我的這個公式非常一致,通過足夠多次的測量,發現只有在小機率情況下結果會偏離正常情況。相關證據在《測量方法》中給出了。大家也可以在第九章中看到一項證據,是關於視距判斷的。從那項結果來看,似乎我們使用的是εq還是ε並不重要。然而,有一個事實可能會影響到我們的選擇,即ε在計算過程中的精確性相對而言是更差的,而基於同等數量的觀察,計算出的εq相對而言更保險,因此(根據或然律)如果要得到同等顯著性的話,ε的計算需要114個觀察數據,而εq只需要100個。我仍然相信,由於我們的實驗一直都是建立在大量的觀察數據基礎之上的,所以這種實踐性的因素對於ε是非常有利的,這在《測量方法》中將會完整地討論到。實驗數量的優勢抵消了εq在顯著性方面那一點點(m很大時就可以忽略)優勢。在任何情況下,這種選擇都是開放性的。無論什麼時候,需要處理由給定次數觀察獲得的結果時,直接使用測量中獲得的純粹誤差之和∑Δ,與使用ε一樣合理,而且還不需要進行除以m這樣的運算。 我們應該對這樣一個事實給予特別的注意,即純粹的差值總和與純粹的平均誤差(無論是ε還是εq)一樣,都會在大小上有輕微的變動,這依賴於由計算出來的偏差是基於偏差總和的平均數得到的,還是將實驗結果分為幾個部分,分別計算每個部分的平均誤差,再分別計算純粹誤差,最後將結果加和或平均而得到的。這個流程討論過的正誤法相類似,都是基於相同的推理。總的來說其他條件保持相同的前提下,偏差與平均差誤的總和是更大的,而分到各個部分就變小了。例如,將100個原始偏差作為一個整體時所計算而得的純粹偏差之和,比將這100個原始偏差分為兩部分,每部分均包含50個原始偏差,再分別計算這兩部分的偏差之和,之後再相加所得的結果更大。同理,分為兩個各包含50個原始偏差得到的和,要大於將其分為4個各包含25個原始偏差得到的和更大,依此類推。然而,這種差別是很小的,除非把這些數據分為非常非常小的部分。 對於為什麼會有這種差別,有兩個原因。第一,是因為觀察的數量少,偏差的平均值——以及據其計算出的校正誤差——就會偏離其真實值,而真實數值指的是在相同的條件下,可由無限多次觀察而獲得的數值。機率論的手法和經驗可以證明,誤差的均方以及簡單平均誤差一般情況下(並且總是呈正態分布)都太小。另一個原因是因為常誤的變異性,我們永遠都不能忽視它在較長系列實驗中的作用,否則就會導致當觀察的結果與這種變異性累加在一起,並且由此計算得出平均誤差和校正誤差時,偏差總和會受到一定干擾的影響而且這種影響還將變大。 可以對第一種導致差別的原因進行校正,這種校正只需要有限的m就可以完成。通過它,偏差的總和與平均誤差就會得到妥善處理,就像是從有限數量的觀察中得到真正的平均誤差,並且可以用於計算校正誤差。這種校正長期被應用於物理和天文學研究之中,作用是獲得用以確定觀察精確性的二次平均誤差。它用公式 來表示εq,而非 有人可能會立刻認識到這種校正並不具有多大的重要性,並且當m很大時,其中的差異基本可以忽略不計。對簡單平均誤差進行相應校正的方法至今還沒有開發出來,因為沒有實用價值。我發現通過類比推理可以發現校正誤差均方中的潛在偏差,具體是將 乘以 π是魯道夫常數。對方程進行稍作簡化但仍然足夠精確的處理[18],可以採用 這種表達與下面的公式得到的數值相近,但比下面這種表達方式要更好一點,即 大家只要執行這些計算就能看出其中的原因。[19] 有一位數學方面的專家已經幫我檢查過這種校正的偏差,這將在《測量方法》里講到。當暫時只需要計算總和,而不計算平均誤差ε時,有一個相同的因子將會被用以修正有限m個試次的偏差總和。如果一個系列實驗被分為幾個部分進行(也就是說,假如校正誤差是從特定幾個部分的平均誤差中獲得的),那這種對有限的m的校正應該在各個部分內單獨進行,而不是將m中的所有子集全部合起來進行。第九章第五部分會給出具體的例子。 如果只關注對類似關係的測定,那麼在進行不同數量的觀察時,可以採用統一m數量或者將總體均分為數個m的方式,我們就永遠只需要對有限的m進行測定即可。在這種情況下,由有限的m造成平均誤差或偏差總和的減小,對於所有操作的影響程度是相同的。 對於第二個原因沒有校正的可能,但是可以通過將整體分為足夠多個部分來避免這種誤差。考慮到針對第一種原因,可以通過校正或者始終保持相同m的方法來消除它的不良影響,所以一般情況下,我沒有選擇將較長的實驗系列視為一個整體進行處理的方式,而是採用部分處理的方式來消除第二種原因導致的不良誤差影響。在我關於觸覺的實驗中,我總是將實驗進程按照m為10進行劃分(即m和∑Δ的校正因子為31/30),即每段中包含10次觀察,在皮膚上不存在其他刺激干擾的前提下,實驗可以一段緊接著一段地進行。(有些部分,尤其是前額,不能忍受在同一個部位上一個接一個地進行如此多的實驗。) 在任何情況下展示這種實驗程序時,都有必要按照正誤法中的要求一樣,報告整個實驗是否被分成了幾個部分以及採用的m是多少。從這一點上說,我會根據正誤法中選用n和ν的方法,一樣地在平均差誤法中選用m和μ。換句話說,當這些實驗進程被分為幾個部分的時候,m代表單獨一段進程中包含的觀察數量,μ代表進程的段數,所以μm就表示總的觀察數量。將每一個特定的觀察值加和將獲得最終的結果,而這些觀察值會構成μ個單獨的結果。 如果偏差總和產生非常小的平均誤差,就有必要考慮兩種其他校正的方法,我將這兩種校正方法稱為區間大小的校正和等級估算的校正。第一種校正涉及一個事實,即記錄誤差總是被給定的有限區間分隔,該區間隨著用以測量誤差標尺的刻度大小而變化,這些刻度估計會精確到小數,這就使得無限的中介誤差可以濃縮為刻度上毗鄰的點。這個事實會影響到平均誤差。第二種校正涉及這樣的一個事實,即用標尺來測量誤差過程的方法,本身就是不精確的。第一種校正需要考慮誤差理論中的純粹的數學原則,是先驗的。第二種校正中,則需要針對標尺上的特定單元的刻度,對所估計誤差的表現形式進行實驗觀察。福爾克曼在《薩克森學會報告》(Berichte der sächs.Soc., 1858, p.173)中報告過關於這個因素的一項有趣的調查。在這裡我將會避開關於這些校正的討論,因為幾乎沒有人關注它們。 為了根據觀察數量確定平均誤差和偏差總和的顯著性,需要一些公式和準則,它們比校正本身更為重要,通過這些準則,分別得到的觀察結果可以組合在一起,形成最準確的全面性結果。這方面所需的任何基礎信息都可以從機率論中獲得,並以可用的形式付諸實踐。充分的解釋需要一個初步的討論,而這就離題太遠了。 在任何情況下若要對平均差誤法提出深刻的見解,都需要對數學誤差理論中的主要觀點有一定的了解,誤差理論是機率論的一個分支。關於這方面,我相信我已在《測量方法》一書中針對其中的要點進行了闡釋,而且我敘述的方式能夠讓不了解這一理論的人也能夠理解。我在這裡就不再多說了。 三種方法間的數學關係 也許有人會問這三種測量方法兩兩之間的關係是什麼樣的。讓我們假設一個既定感覺領域的最小可覺差,平均誤差和比例r/n(因此t=hD)已經測定,並且差別感受性也保持不變。於是問題出現了:它們互相之間是如何聯繫的呢?這必須要基於以下的原因才能作答。 嚴格來說,最小可覺差就是應用於正誤法中時,為了達到沒有錯誤反應的前提,所得到的不能再減小的距離差異,因為實際上這種差異是剛剛可以注意到的,意味著差異是存在的,並因此排除任何錯誤反應的情況,而且它是剛剛可以注意到的,也就是說如果差異再小一點的話,就不能被感覺到。然而事實上,如果有人想防止在對一個給定差異進行反應時出現錯誤,就必須使得這個差異足夠大以至於隨機因素不會使其降低至下閾限。如果實驗中具有壓倒性的正確判斷數量,在同時兼顧相關隨機因素的平均大小和主觀估計的情況下,我們會允許各種差異的大小和錯誤數量的存在,並且仍然認為這個差異是最小可覺差。 另一方面,如果不允許錯誤情況或只允許偶爾的錯誤情況存在的話,平均誤差必須要比最小可覺差小。對於平均差誤法,如果差異(例如,兩支圓規腳間距的差異)仍然可以被覺察到的話,那就需要不斷地改變這個距離直到它不再被覺察。總體來說,從零開始,所有比最小可覺差小的誤差,都是平均差誤法測量關注的內容。鑒於這些原因,最小可覺差和平均誤差之間的關係不大。 然而,正誤法和平均差誤法之間存在這樣一種數學關係,即二者主要由機率積分聯繫在一起。當通過簡單或二次平均誤差的大小來彌補正誤法中的差異D時,我們可以利用上述關係,推測出其他類似環境下的正確和錯誤判斷比值。正如我在《測量方法》中所說的,如果使用簡單平均誤差作為重量差異(重量提舉實驗中的附加重量)的話,那麼比率r/n約為2/3,或者更確切地說是0.655032。 這種理論上的關係仍然需要實驗上的證明,測試過程中可能存在著一些困難,例如在兩種情況下,測試環境必須具有可比性,這樣才能使隨機因素在兩種情況下的作用相同。 絕對感受性的測量方法 這些方法幾乎完全沒有試用於有關集中感受的研究中。除了沙夫豪特(Schafhäutl)對最小可聽絕對響度的測定、韋伯和卡姆勒(Kammler)對最小可覺壓的測定(將會在第十一章詳細闡述),我不知道還有哪些例子。在視覺領域,對絕對感受性的測定甚至是不可能的,因為我們不能忽略光感的內部來源,這一點我將在第九章探討。 另一方面,測量絕對感受性的方法又在廣延感受領域得到大量應用。目前有很多人正在針對視網膜或皮膚這兩個區域,從事著最小可覺大小或最小可覺距離的測定。對於後一個區域而言,最著名的研究是韋伯從心理物理學角度對皮膚最小可覺距離的測量,這項工作是具有前沿性的。這種方法的操作類似測量差別感受性時所用的最小可覺差法,後來很多測量絕對感受性的實驗操作都只是借用這一稱呼。進行這項測量的另外兩種方法,也同樣能在絕對感受性測量領域找到類似的對應。 福爾克曼基於簡易的觀察得到結論,認為構成最小可覺距離的圓規兩腳間距並不是絕對固定的,而是在一定的範圍內波動。在連續實驗中,同樣的兩點間距設定,有時候能被感覺是分離的,但是有的時候卻不能被感覺到分離,只要不超過上限——超過上限就一直能感覺到分離,或者不超過下限——比下限低就總不能感覺到分離。然而,我們不能對這些範圍進行絕對精確的測定,但是這個事實,就如我們經驗所得的那樣,並不能阻止我們在不同的實驗中尋找具有可比性的距離。我們可以根據上述方法,再結合下述兩種值中的一種來測定常模值,其中一種值是通過設定不同的圓規兩腳間距去接觸皮膚來找到的近上限值,另一種是通過測定在上下限之間的距離來求得的最小可覺距離平均值,獲得的常模值可作為我們測量的基礎。如果不是這樣的話,韋伯的實驗和結果也無法被其他人所證實。可以基於這些觀察結果對韋伯的方法進行修正,這個方法類似於正誤法,而福爾克曼也確實這樣做了。它包括以下兩個部分:(1)在上述的上下限之間選定一個兩腳間距值,重複使用這個數值進行實驗,注意每次使用情況下的結果,並且記錄注意到兩腳間距存在的次數和沒有注意到的次數;(2)在上述區間內選定數個兩腳間距值,重複這個操作。在這個例子中,對於給定的兩腳間距來說,如果皮膚上的某個特定部分的廣延感受性越高,正確判斷(即被試可以感知到兩腳之間存在著距離)發生的次數就越多,而在保持同樣的正確判斷次數的前提下,廣延感受性越高,圓規兩腳間的距離也就越小。任何一個給定正確判斷與總判斷次數的比值,都可以作為感受性比較的基礎,在皮膚的不同部位,通過調整合適的兩腳間距來實現這個比值。然而福爾克曼傾向於認為,最好在那些距離被注意到和沒有被注意到的比例相同的皮膚位置上,應用這個比值進行研究。由於我們不能對合適的圓規兩腳間距進行絕對精確的測量,所以必須通過插值法使我們記錄的數值儘量與實驗中所使用的間距相對應,才能保證足夠的精確度。福爾克曼的實驗中應用到了這種方法,證明了觸覺感受性中練習效應的作用,具體內容參見《薩克森學會報告》(1858, pp.47 ff.)。其間有趣的實驗結果很好地證明了這種方法的效用。 韋伯方法的另外一種變式,即我稱之為等效法的方法,已被我與平均差誤法聯繫在一起,應用於觸覺領域並且得到發展,兩者是類似的。與此同時,韋伯甚至在更早時,就曾使用過相同的方法研究過皮膚不同部位對壓力的差別感受性。[20] 正如應用於觸覺的這種方法,它的關鍵是在皮膚不同的兩個位置A和B上,交替使用兩支圓規A和B,採用一支圓規對應一個位置的形式,比較它們的廣延感受性。對於放置在A位置的圓規A,保持其兩腳間距為A,調整放置在B位置的圓規B的兩腳間距B,直到其帶來的感覺與A一致為止。當然實際上,可能會因皮膚上的不同部位感受性的程度不同,而導致實驗結果有很大的出入。使用這種方法,可以確定在皮膚的不同部位上,能夠產生同樣觸覺時的兩腳間距。它們的倒數可以視為廣延感受性的一個量度,但要有大量的實驗次數作基礎。 至此,有人可能會很輕易地就滿足了,認為這個方法靈敏、準確,因為它會得到一致的結果,並且非常可靠,只要皮膚上的各個點能夠保持大致相同的感受性程度。它們的一致性可以由不同部位的比較結果得以展示,而可靠性則可以很容易地通過計算結果平均數的機率誤差得以證明。然而,如果結果的比值改變了,那這個方法可以對這些改變進行具體的檢驗。我對實驗的同一個部分進行了持續數月的重複,當每天僅只進行少數的實驗試次時,我確實看到比值能夠保持不變。然而可以確定的是,如果每天經常性地進行大量的實驗試次,就會產生嚴重的練習效應,我觀察到這些原本相等的結果逐漸發生改變,總的來說,那些不太敏感部位的結果逐漸向敏感部位的結果靠近,練習更明顯地惠及前者而不是後者。 這種方法優於前兩個的另一個優點在於,它沒有將對皮膚感受性的比較僅僅局限於最小可覺距離,而是可以在任意給定距離條件下進行比較。另一方面,也有一個劣勢,它只能得到絕對感受性的相對性數據,而在一個最小可覺情況下獲得的數值(或者是可覺的情況和不可覺的情況出現的比例相等時,對應的感受性值)會導致一個差距,這個差距值是以一種絕對的方式來定義皮膚某一給定區域的絕對感受性值。因此,必須允許這些方法中的每一種都能以自己獨特的方式起作用。 很容易看到,在等效法中使用的程序從本質上來說和平均差誤法中使用的是相同的,僅僅是對圓規兩腳間距的調整方式不同,但是有人發現對於皮膚上的測試點而言,用於比較的不是點之間的距離差異而是距離大小的比值。然而,我們也必須考慮被比較的距離比值——標準距離與可變距離的比例——採用的是平均差誤法,我們還必須考慮等效法中每個兩腳間距B與平均兩腳間距B之間的差值,就如校正誤差Δ中的做法一樣。根據這些想法,那麼等效法本質上只是平均差誤法的一般化形式,反過來,平均差誤法是等效法的一種特殊情況,在所有可能的位置,人們都可用B與A相比較,選擇A並將其當作標準距離,將B當作可變距離。類似於平均差誤法中常誤和校正可變誤差的關係效應,在平均差誤法中也被再次發現,只是以一種更一般化的方式。與平均差誤法中一樣,等效法也需要注意與前一種方法相關的各種注意和預防措施。 每一種比較的反向關係是特別重要的。例如,當已經建立了從B(嘴唇)到A(下巴)的等價關係,那也必須通過相等的實驗次數測定從B(下巴)到A(嘴唇)的互補等價關係。每個結果應該分開記錄然後計算平均數,避免常誤導致的單側化效應。我的《測量方法》一書中將會給出充分的證據和解釋來說明為何這種預防措施如此重要。這種情況下的常誤大小也可以通過簡單的計算得出。 * * * 注釋: [1] 特別參見其對觸覺和一般感受性的著作以及他的《收集的程序》(Programmata collecta)。 [2] Vierordt's Arch.,1852,Ⅺ,p.844. [3] Vierordt's Arch.,1856, XV(2),p.185 oderPogg.Ann., XCVIII, p.600. [4] 例如,斯坦海爾在他的《亮度測量要素》(Elemente der Helligkeitsmessungen,p.75)中提到的那樣,以及朗吉耶(Langier)在《法國科學院進展》(Comp.rend., XLIV, p.841)中論述的,等等。 [5] 大數定律是以確切的數學形式表達了大量重複出現的隨機現象的統計規律性,即頻率的穩定性和平均結果的穩定性,並討論了它們成立的條件。——譯者注 [6] 對於還沒有加以處理的常誤,這條警示是非常重要的。 [7] 此外,倫茨和沃爾夫提到了他們採用正誤法進行的關於聲音的實驗,一個人傾向於把先聽到的聲音知覺為更響,而另一個人覺得第二個聲音更響。這個結果表明不同時間關係的影響得到了體現,並且這種影響會根據環境而改變。 [8] 原文此處有誤,下文中提到主要關注的是r/n,即正確次數與總判斷次數的比率,應為「傾向於使用前面這種比率」。——譯者注 [9] 1巴黎英寸等於1.066英制英寸(約2.7厘米),1巴黎行等於0.0888英制英寸(約0.23厘米)。費希納在有的章節中會省略去「巴黎」一詞,譯者對有明顯省略的地方都進行了補充,但是有的地方確實難以分辨。——譯者注 [10] 當大量的試次被分成幾部分時,n就變小了,這樣每個部分中的準確性就降低了,但是我們可以在後面對部分的結果進行整合時加以補償。 [11] 由於我們所涉及的差別感受性是隨著P變化的(只要D很小就不會隨D變化),所以相同感受性條件下的實驗需要恆定的P。 [12] 魯道夫·范·科伊倫(Ludolph van Ceulen, 1540—1610),數學家,以計算π值或稱魯道夫常數聞名,他最後運算到小數點後35位。在費希納的時代,π的十進制等效值一般被稱作是魯道夫常數。——譯者注 [13] 即在下表中的小數,費希納均把它們去掉小數點視作整數,尤其是在差異值這一列中可以明顯地看出,後文中所有的數據均是這樣處理的。——譯者注 [14] 也就是乘以次數100。——譯者注 [15] 即我們現在通用的縫紉針。——譯者注 [16] 通過我自己所做過的一些比較,使用無手柄的圓規時,實驗過程中必須握著它的兩腿,這樣會造成更大的恆定和可變誤差。 [17] 這種誤差現在被稱為標準差,但在這裡仍然沿用費希納的叫法。——譯者注 [18] 即對π進行了取整的處理。——譯者注 [19] 甚至連校正係數 也僅僅是一個整數的近似值,因為它不能以一種有限的形式表達,但這種取整所產生的偏差是很小的。 [20] Progr.coll.,p.97.