kramann.info
© Guido Kramann

Login: Passwort:










5.1.1 Lineare Regression

Trägt man die Messungen in einem Koordinatensystem als Punkte ein, so erhält man im allgemeinen Fall eine Punktwolke.

Lägen alle Punkte auf einer Geraden, dann hätte man keine Messfehler und der Zusammenhang zwischen den Wertepaaren wäre linear.

Wenn aber im allgemeinen Messfehler vorliegen, dann stellt sich die Frage, wie man eine Gerade am so durch die Punkte hindurchlegen kann, dass sie im Durchschnitt überall möglichst nah an den Messpunkten liegt.

Eine mögliche Lösung dieses Problems stellt die lineare Regression dar.

Sind die Messpunkte Wertepaare (x1,y1), (x2,y2), (x3,y3)...(xn,yn), so trifft die passende Geradengleichung y=bx+a in der Regel nicht genau auf die Punkte, sondern es gibt bei jedem Wertepaar einen mehr oder weniger grossen Fehler ei:

y1=bx1+a+e1
y2=bx2+a+e2
y3=bx3+a+e3
...
yn=bxn+a+en

Mit Hilfe der Formel für die lineare Regression können nun a und b so bestimmt werden, dass die Summe der quadrierten Fehler minimal wird, also e12 + e22 + e32 + ... + en2 möglichst klein wird.

Hier zunächst die Formeln zur optimalen Bestimmung von a und b aus allen Messwerten:

Formel Lineare Regrssion für b
Formel Lineare Regrssion für a

Nun wäre es natürlich noch interessant zu erfahren, wie man auf die Formel für die Lineare Regression kommt.

Hier ist die Herleitung dazu:

Die Summe des quadrierten Fehlers läßt sich folgendermassen schreiben (vergl. weiter oben):

Fehler

Diesen Fehler gilt es zu minimieren. Ein notwendiges Kriterium dafür, dass eine Funktion ein lokales Extremum erreicht, ist, dass ihre erste Ableitung zu Null wird.

Achtung: Hier geht es um die Festlegung von a und b! a und b sind hier die Variablen, die anderen Größen sind bei konkreten Messwerten alle konstant. Darum wird die Gleichung für die Summe der Fehlerquadrate jeweils nach a und nach b abgeleitet und von beiden Ergebnissen verlangt, dass sie zu Null werden.

Partielle Ableitung nach a
Partielle Ableitung nach b

Da die Gleichung sowohl von a als auch von b abhängt, und bei den Ableitungen die jeweils nicht betrachtete Größe als konstant angesehen wird, spricht man hier von einer partiellen Ableitung nach a und b. Hierfür werden gerundete Differentialsymbole geschrieben. Ansonsten gelten die üblichen Ableitungsregeln, hier wird insbesondere dadurch abgeleitet, dass man die äußere Ableitung der Klammer mit der inneren multipliziert:

Gleichung A1:
Gleichung A1
Gleichung B1:
Gleichung B1

Das folgende sind zunächst Äquivalenzumformungen von A1 und B1:

A2:
Gleichung A2
B2:
Gleichung B2

Nun wird A2 durch n geteilt und mit Summe xi multipliziert und zu Gleichung B2 addiert. Man erhält dann:

C1:
Gleichung C1

Diese kann nach b aufgelöst werden:

C2:
Gleichung C2

Parameter a ergibt sich dann aus Gleichung A2 durch einsetzen des nun bekannten Parameters b:

Berechnung von a