Що таке центральна гранична теорема?

Що таке центральна гранична теорема?
Anonim

Відповідь:

Центральна гранична теорема робить сувору інтуїтивну ідею про те, що оцінки середнього (оціненого з деяких вибірок) деяких вимірювань, пов'язаних з деяким населенням, покращуються з ростом розміру вибірки.

Пояснення:

Уявіть собі ліс, що містить 100 дерев.

А тепер уявімо, що (досить нереально), що, вимірюється в метрах, одна чверть з них має висоту 2, одна чверть з них має висоту 3, одна чверть з них має висоту 4, а чверть з них мають висота 5.

Уявіть собі вимірювання висоти кожного дерева в лісі і використання інформації для побудови гістограми з відповідним чином обраними розмірами бункерів (наприклад, від 1,5 до 2,5, від 2,5 до 3,5, від 3,5 до 4,5 і від 5,5 до 6,5; я розумію, що я не вказав бункер, до якого належать межі, але тут не має значення).

Для оцінки розподілу ймовірностей дерев можна використати гістограму. Зрозуміло, що це не було б нормальним.Насправді, за умови відповідного вибору кінцевих точок, це було б єдиним, оскільки б рівна кількість дерев відповідала одній із зазначених висот у кожному бункері.

А тепер уявіть, що ви входите в ліс і вимірюєте висоту всього двох дерев; розрахуйте середню висоту цих двох дерев і відзначте її. Повторіть цю операцію кілька разів, щоб у вас була колекція середніх значень для зразків розміру 2. Якщо б ви побудували гістограму оцінок середнього значення, вона більше не була б однорідною. Натомість, ймовірно, буде більше вимірювань (оцінки середнього значення на основі зразків розміром 2) поблизу загальної середньої висоти всіх дерев у лісі (у цьому випадку,

#(2 + 3 + 4 + 5)/4 = 3.5# метрів).

Як би було більше оцінки середнього поряд з істинне населення означає (що відомо в цьому нереалістичному прикладі), ніж далеко від середнього, форма цієї нової гістограми буде ближче до нормального розподілу (з піком поблизу середнього).

А тепер уявіть, що ви входите в ліс і повторюєте вправу за винятком того, що вимірюєте висоту 3 дерев, обчислюючи середнє значення в кожному випадку, і записуєте його. Гістограма, яку ви б побудували, мали б ще більшу оцінку середньої величини поблизу істинного середнього, з меншим поширенням (шанс вибору трьох дерев у будь-якому одному зразку, таким чином, щоб всі вони походили з будь-якої з кінцевих груп --- або самі високий або дуже короткий --- менше, ніж вибирати три дерева з вибором висот). Форма вашої гістограми, що включає оцінку середнього розміру (кожне середнє значення, засноване на трьох вимірах), буде ближче до нормального розподілу і відповідне стандартне відхилення (оцінок середнього, а не батьківського населення) буде менше.

Повторіть це для 4, 5, 6 і т.д., дерева на середнє значення, а гістограма, яку ви побудуєте, буде виглядати все більше і більше як нормальний розподіл (з поступово більшими розмірами вибірки), з середнім значенням розподіл оцінки середнього бути ближче до істинного середнього, а стандартне відхилення оцінок середнього стає вужче і вужче.

Якщо ви повторюєте вправу для (виродженого) випадку, коли всі дерева вимірюються (у кількох випадках, записуючи середнє значення в кожному випадку), то гістограма матиме оцінку середнього значення лише в одному з бункерів. (та, що відповідає істинному середньому значенню), без будь-яких змін, так що стандартне відхилення (розподіл ймовірностей, оцінене з), що "гістограма" буде дорівнює нулю.

Отже, центральна гранична теорема зазначає, що середнє значення деякої оцінки середнього числа окремої популяції асимптотично наближається до істинного середнього, а стандартне відхилення оцінки середнього (а не стандартного відхилення розподілу батьківської популяції). стає дедалі меншим для більших розмірів вибірки.