Середнє значення є найбільш використовуваним показником центру, але бувають випадки, коли рекомендується використовувати медіану для відображення та аналізу даних. Коли може бути доречним використовувати медіану замість середнього?

Середнє значення є найбільш використовуваним показником центру, але бувають випадки, коли рекомендується використовувати медіану для відображення та аналізу даних. Коли може бути доречним використовувати медіану замість середнього?
Anonim

Якщо в наборі даних є кілька екстремальних значень.

Приклад:

У вас є набір з 1000 випадків зі значеннями, які не надто далеко один від одного. Їхня величина дорівнює 100, як і їх медіана. Тепер ви заміните тільки один випадок на випадок, який має значення 100000 (просто щоб бути екстремальним). Середнє буде різко зростати (майже до 200), тоді як медіана буде незмінною.

Розрахунок:

1000 випадків, середнє значення = 100, сума значень = 100000

Втратити 100, додати 100000, сума значень = 199900, середнє = 199,9

Медіана (= випадок 500 + 501) / 2 залишається незмінною.