Das Problem

Bei der Durchsicht der von den Studenten im Physikalischen Grundpraktikum angefertigten Protokolle fällt auf, dass die dort mit der Methode der linearen Regression erhaltenen Ergebnisse zum Teil erheblich von den mit Mathematica (2014) berechneten Kontrollwerten abweichen.

Das Problem soll an einem einfachen Beispiel aus dem Einführungskurs verdeutlicht werden. Beim Versuch F4 (siehe hierzu: Einführungspraktikum (2007) Seite 9...11) wird eine Feder schrittweise mit Massestücken von ca. 50 g belastet. Die Position $ x$ einer an der Feder befestigten Marke wird mit Hilfe einer Spiegelskala gemessen (erste Messreihe). Nach Erreichen der Höchstbelastung mit 8 Massestücken wird die Feder wieder schrittweise entlastet und dabei die Position der Marke erneut abgelesen (zweite Messreihe). Die Unsicherheit der so bestimmten Positionen $ x$ wird sowohl durch den systematischen Restfehler der verwendeten Spiegelskala als auch durch Fehler beim Ablesen von der Spiegelskala bestimmt. Der Mittelwert der Massen $ \overline{m}$ aller im Versuch verwendeten Massestücke beträgt 50.22g bei einer Standardabweichung von 0,36g. Auch dieser Wert beeinflusst die Streuung der gemessenen Positionen.

Aus dem Anstieg der Geraden

$\displaystyle x = x_0 - \frac{\overline{m} g}{k} i$ (1)

kann dann die gesuchte Federkonstante bestimmt werden. Hierbei bedeuten $ x_0$ die unbekannte Position der verwendeten Markierung bei unbelasteter Feder, $ g$ die Erdbeschleunigung, $ k$ die gesuchte Federkonstante und $ i$ die Anzahl der Massestücke, mit denen die Feder belastet wird. Das negative Vorzeichen resultiert aus der Tatsache, dass sich der Nullpunkt der verwendeten Spiegelskala unten befindet, und daher die Werte von $ x$ mit zunehmender Belastung abnehmen. Der Wert $ x_0$ für $ i = 0$ kann nicht abgelesen werden, da die Achsen der unbelasteten Federn mehr oder weniger stark gebogen sind. Eine typische Messdatenreihe, aufgenommen am Messplatz 2 am 7.1.2015, ist in Tabelle 1 aufgelistet.

$ i$ Belastung Entlastung
1 186.0 186.0
2 175.5 176.0
3 165.0 165.5
4 155.0 156.0
5 145.5 146.0
6 135.5 136.0
7 126.0 125.0
8 116.0 115.5

Tabelle 1: Beispiel einer Messdatenreihe des Versuchs F4

Betrachtet man diese Daten als 16 Wertepaare $ i , x$, dann können sie mit der Methode der linearen Regression, so wie sie zum Beispiel in Schenk (2012) (Seiten 9 und 17...18), Nollau (1975) Seiten 129...151 , Fahrmeir (2009) Seiten 59...63 und 90...95 oder im Einführungsskript (2007) Seite 42 Gleichungen 49, 50 und Seite 42 Gleichung für $ s_y$ (nach Gleichung 51) beschrieben ist, ausgewertet werden. In diesem Fall erhält man unabhängig von der verwendeten Software Mathematica (2014) oder QtiPlot (2014) identische Resultate (siehe Tabelle 2).

Da mit dem systematischen Restfehler der verwendeten Spiegelskala $ u_x = 200\mu m +5\;10^{-4}\;x$ (Einführungspraktikum (2007) Seite 11) eine Abschätzung des Fehlers der Position $ x$ vorliegt und dieser für die einzelnen Messpunkte unterschiedlich ist, erscheint die Anwendung der gewichteten linearen Regression sinnvoll. Diese Methode wird z.B. von Nollau (1975) (Seiten 152...156) oder Fahrmeir (2009) (Seiten 124...127) ausführlich beschrieben. Bei der instrumentellen Gewichtung werden die Größen $ c \frac{1}{s_i^2}$ als Gewichte verwendet. $ s_i^2$ ist dabei die Varianz, das Fehlerquadrat, der jeweiligen Position $ x_i$ und $ c$ eine frei wählbare Konstante, die oftmals gleich 1 gesetzt wird.

Die Ergebnisse der obigen Messreihe mit der Methode der instrumentell gewichteten linearen Regression mit den beiden zuvor schon genutzten Auswerteprogrammen sind ebenfalls in der Tabelle 2 aufgelistet. Zusätzlich erfolgte eine Auswertung der Daten mit den Formeln aus Nollau (1975) und Fahrmeir (2009) sowie mit den im Einführungsskript (2007) auf Seite 41,42 angegebenen Gleichungen 43 und 45. Letztere lässt sich aus der von Wolff (2014) auf den Seite 117/118 hergeleiteten Gleichung 9.20 für $ \alpha = 2$ ableiten.

lineare Regression
Software $ x_0$ Anstieg $ A$
  Wert Fehler Wert Fehler
Mathematica 195.723 0.225292 -10.0149 0.0446145
QtiPlot $ \dagger$ 195.723 0.225292 -10.0149 0.0446145
Einführungsskript 195.723 0.225292 -10.0149 0.0446145
gewichtete lineare Regression (instrumentelle Gewichtung)
Software $ x_0$ Anstieg $ A$
  Wert Fehler Wert Fehler
Mathematica 195.707 0.233646 -10.0114 0.044768
Nollau 195.707 0.233646 -10.0114 0.044768
QtiPlot $ \dagger$ 195.707 0.156635 -10.0114 0.030012
Einführungsskript 195.707 0.156635 -10.0114 0.030012
Mathematica $ \ddagger$ 195.707 0.156635 -10.0114 0.030012

$ \dagger$ LinearFit mit und ohne Option ,,Scale Errors with sqrt(Chi2/doF)``
$ \ddagger$ LinearModelFit mit Option ``VarianceEstimatorFunction $ \rightarrow$ (1&)``
Tabelle 2: Ergebnisse der Auswertung der Messdaten mit verschiedenen Methoden und verschiedener Software. Die zugehörigen Ausgaben der genutzten Software sind im Anhang (QtiPlot und Mathematica) enthalten.

Sieht man sich die Ergebnisse genauer an, fällt sofort auf, dass die von Mathematica und QtiPlot berechneten Standardabweichungen der Parameter $ x_0$ und $ A$ nicht übereinstimmen. Demgegenüber liefern sowohl Mathematica und die Berechnung mit den Gleichung von (z.B. Fahrmeir, 2009; Nollau, 1975) als auch QtiPlot und die Gleichungen aus dem Einführungsskript jeweils zueinander passende Ergebnisse. Verwendet man bei der Auswertung mit Mathematica die Option ,,VarianceEstimatorFunction $ \rightarrow$ (1&)``, so stimmt das Ergebnis sowohl mit den von QtiPlot ausgegebenen Werten als auch mit den mit Hilfe der Gleichungen aus dem Einführungsskript berechneten Werten überein. Damit deutet sich hier ein grundsätzliches Problem an, dass über die eingangs aufgeworfene Frage, ob die Software QtiPlot richtig rechnet, weit hinausgeht und auf die Frage hinausläuft, warum stehen die Formeln aus dem Einführungsskript im Widerspruch zu gängigen Lehrbüchern (z.B. Nollau, 1975; Fahrmeir, 2009).

Ein erster Hinweis darauf findet sich bei James (2006) auf Seite 3.

,,Unfortunately, statisticans do not agree on basic principles. They can crudely be divided into two schools: Bayesian and frequentists (or classical).

The Bayesian approach is closer to everyday reasoning, where probability is interpreted as a degree of belief that something will happen, or that a parameter will have a given value.

The frequentist approach is closer to scientific reasoning, where probability means the relative frequency of something happening. This make it more objective, since it can be determined independently of the observer, but restricts its application to repeatable phenomina. ``

Liegt die Ursache für die unterschiedlichen Formeln und Ergebnisse in den Unterschieden zwischen diesen beiden Richtungen begründet? Dazu sollen die jeweiligen Aussagen näher betrachtet werden, wobei eine Beschränkung auf das allgemeine linear Modell erfolgt. Zu den Grundlagen, zu Herleitungen und Beweisen sowie zu weiterführenden Fragen sei auf die angegebene Literatur verwiesen.

schaefer 2017-12-09