Чому значення R-Squared не вказує нічого про причинно-наслідковий зв'язок?

Чому значення R-Squared не вказує нічого про причинно-наслідковий зв'язок?
Anonim

Відповідь:

R-квадрат вказує на те, наскільки добре спостережувані дані відповідають очікуваним даним, але тільки дає інформацію про кореляцію.

Пояснення:

Значення R-квадрата вказує на те, наскільки добре ваші спостережувані дані або зібрані вами дані відповідають очікуваній тенденції. Це значення говорить вам про силу відносини, але, як і всі статистичні тести, нічого не дається, що говорить вам про причину, що стоїть за відносинами або її силою.

У наведеному нижче прикладі ми можемо бачити, що графік ліворуч не має ніякого відношення, як це показано низьким значенням R-квадрата. Графік праворуч має дуже сильну зв'язок, що вказує на R-квадрат значення 1. В жодному з цих графіків не можна сказати, що в кінцевому підсумку викликає цей зв'язок.

Кореляція не означає причинності. Ваші значення X можуть дуже добре вплинути на ваші значення Y, але інші фактори можуть бути в грі, або відносини можуть бути пов'язані з випадковими наслідками. Ти можеш infer причинності, але це ваша інтерпретація, і вона не може бути доведена статистичними випробуваннями. Маючи високе значення R-квадрата, все ще тільки повідомляє вам про силу відносини, але не його причину.

Довести причинність є дуже великим завданням. Якщо ви хочете зрозуміти причинно-наслідковий зв'язок, найкраще зробити це за допомогою експериментів.