Ez az a vonal, amely legközelebb illeszkedik a változókhoz, ha lineáris korrelációról van szó.
Példa:
Tanári munkámban úgy éreztem, hogy a matematikában jó eredményeket szerzett diákok jó eredményt értek el a fizikában és fordítva.
Tehát egy diagramot készítettem egy diagramon Excelben, ahol x = matematika és y = fizika, ahol minden tanuló pontot képvisel.
Észrevettem, hogy a pontok összegyűjtése szivarformának tűnt, nem pedig az egész helyen (ez utóbbi egyáltalán nem jelent korrelációt).
És akkor két dolgot tettem:
(1) Számítottam a korrelációs együtthatót (ami magas volt)
(2) Vettem a "legjobban illeszkedő vonalat"
Ez utóbbi a regressziós vonal, és még egy egyenlet is hozzá lehet rendelni.
Ebből többé-kevésbé ésszerűbb előrejelzést készíthet a másikból, attól függően, hogy mennyire jó a korreláció (a korreláció egy másik téma).
Megjegyzés:
Sok „buts” és „ifs” van. Egyrészt ésszerűen biztosnak kell lennie abban, hogy a korreláció lineáris.