Спосабы разліку дысперсіі

Аўтар: Robert Simon
Дата Стварэння: 21 Чэрвень 2021
Дата Абнаўлення: 1 Ліпень 2024
Anonim
Самый простой способ выровнять пол! Наливной пол за 20 минут.
Відэа: Самый простой способ выровнять пол! Наливной пол за 20 минут.

Задаволены

Дысперсія вымярае дысперсію набору дадзеных. Гэта вельмі карысна для стварэння статыстычных мадэляў: нізкая дысперсія можа сведчыць пра тое, што вы апісваеце выпадковую памылку ці шум замест асноўнай сувязі ў дадзеных. У гэтым артыкуле wikiHow вучыць, як разлічваць дысперсію.

Крокі

Спосаб 1 з 2: Разлічыце дысперсію выбаркі

  1. Напішыце ўзор набору дадзеных. У большасці выпадкаў статыстыкі маюць толькі інфармацыю пра выбарку або падгрупу насельніцтва, якое яны вывучаюць. Напрыклад, замест агульнага аналізу "кошту ўсіх аўтамабіляў у Германіі", статыстык можа знайсці кошт выпадковай выбаркі ў некалькі тысяч аўтамабіляў. Статыстык можа выкарыстаць гэты ўзор, каб атрымаць добрую ацэнку кошту аўтамабіляў у Германіі. Аднак больш верагодна, што ён дакладна не будзе адпавядаць рэальным лічбам.
    • Напрыклад: Пры аналізе колькасці булачак, якія прадаюцца ў дзень у кавярні, вы ўзялі выпадковы шасцідзённы ўзор і атрымалі наступныя вынікі: 38, 37, 36, 28, 18, 14, 12, 11, 10,7, 9,9. Гэта выбарка, а не сукупнасць, таму што ў вас няма дадзеных за кожны дзень, калі крама працуе.
    • Калі кожны Кропкі дадзеных у майстры, перайдзіце да спосабу ніжэй.

  2. Запішыце формулу дысперсійнай формулы. Дысперсія набору дадзеных паказвае ступень дысперсіі кропак дадзеных. Чым бліжэй дысперсія да нуля, тым бліжэй згрупаваны пункты дадзеных. Пры працы з узорамі набораў дадзеных выкарыстоўвайце наступную формулу для разліку дысперсіі:
    • = /(п - 1)
    • дысперсія. Дысперсія заўсёды вылічаецца ў квадратах.
    • уяўляе значэнне ў вашым наборы дадзеных.
    • ∑, што азначае "сума", кажа вам вылічыць наступныя параметры для кожнага значэння, а затым скласці іх разам.
    • x̅ - сярэдняе значэнне выбаркі.
    • n - колькасць пунктаў дадзеных.

  3. Вылічыце сярэдняе значэнне ўзору. Сімвал x̅ альбо "х-гарызантальны" выкарыстоўваецца для абазначэння сярэдняга значэння ўзору. Вылічыце, як і любую сярэднюю: складзіце ўсе дадзеныя і падзеліце іх на колькасць балаў.
    • Напрыклад: Спачатку складзіце пункты дадзеных: 17 + 15 + 23 + 7 + 9 + 13 = 84
      Далей падзяліце вынік на колькасць кропак дадзеных, у дадзеным выпадку шэсць: 84 ÷ 6 = 14.
      Сярэдняе ўзор = x̅ = 14.
    • Вы можаце разглядаць сярэдняе значэнне як "цэнтральную кропку" дадзеных. Калі дадзеныя сканцэнтраваны вакол сярэдняга значэння, дысперсія невялікая. Калі яны разыходзяцца далёка ад сярэдняга, дысперсія высокая.

  4. Адніміце сярэдняе значэнне ад кожнага пункта дадзеных. Цяпер самы час вылічыць - x̅, дзе знаходзіцца кожная кропка ў вашым наборы дадзеных. Кожны вынік будзе паказваць на адхіленне ад сярэдняга значэння кожнай адпаведнай кропкі, альбо, прасцей кажучы, на адлегласць ад яго да сярэдняга.
    • Напрыклад:
      - x̅ = 17 - 14 = 3
      - x̅ = 15 - 14 = 1
      - x̅ = 23 - 14 = 9
      - x̅ = 7 - 14 = -7
      - x̅ = 9 - 14 = -5
      - x̅ = 13 - 14 = -1
    • Праверыць разлікі вельмі проста, таму што вынікі павінны скласці нуль. Гэта таму, што пры сярэднім значэнні адмоўныя вынікі (адлегласць ад сярэдняга да малых лікаў). станоўчыя вынікі (адлегласць ад сярэдняга да большага ліку) цалкам выключаюцца.
  5. Усе вынікі ўстаўце ў квадрат. Як было адзначана вышэй, у бягучым спісе адхіленняў (- x̅) прысутнічае сума нуля, гэта азначае, што "сярэдняе адхіленне" таксама заўсёды будзе роўна нулю, і нічога не скажаш пра дысперсію дадзеных. Каб вырашыць гэтую задачу, мы знаходзім квадрат кожнага адхілення. У выніку ўсе станоўчыя лікі, адмоўныя значэнні і дадатныя значэнні больш не анулююць адзін аднаго і не даюць суму нулю.
    • Напрыклад:
      (- x̅)
      - x̅)
      9 = 81
      (-7) = 49
      (-5) = 25
      (-1) = 1
    • Цяпер у вас ёсць (- x̅) для кожнай кропкі дадзеных у выбарцы.
  6. Знайдзіце суму значэнняў квадрата. Цяпер самы час вылічыць увесь лічнік формулы: ∑. Вялікая цыкла clo патрабуе дадаць наступнае значэнне элемента для кожнага значэння. Вы разлічылі (- x̅) для кожнага значэння ў выбарцы, таму вам трэба толькі скласці вынікі.
    • Напрыклад: 9 + 1 + 81 + 49 + 25 + 1 = 166.
  7. Падзяліце на n - 1, дзе n - колькасць пунктаў дадзеных. Даўней, калі вылічвалі дысперсію выбаркі, статыстыкі дзялілі толькі на n. Гэта дзяленне дасць вам сярэдняе значэнне адхілення ў квадраце, якое дакладна адпавядае дысперсіі гэтай выбаркі. Аднак майце на ўвазе, што выбарка - гэта толькі ацэнка большай папуляцыі. Калі вы возьмеце іншую выпадковую выбарку і зробіце той самы разлік, атрымаеце іншы вынік. Як высветлілася, дзяленне на n -1 замест n дае вам лепшую ацэнку дысперсіі большай папуляцыі - пра што вы сапраўды клапоціцеся. Гэтая карэкцыя настолькі распаўсюджана, што ў цяперашні час прынята вызначэнне дысперсіі выбаркі.
    • Напрыклад: У выбарцы ёсць шэсць кропак дадзеных, таму n = 6.
      Дысперсія выбаркі = 33,2
  8. Зразумець дысперсію і стандартнае адхіленне. Звярніце ўвагу, што, паколькі ў формуле ёсць ступені, дысперсія вымяраецца ў квадраце адзінак зыходных дадзеных. Гэта візуальна бянтэжыць. Замест гэтага часта стандартнае адхіленне бывае вельмі карысным. Але няма сэнсу марнаваць намаганні, бо стандартнае адхіленне вызначаецца квадратным коранем з дысперсіі. Вось чаму дысперсія выбаркі запісваецца як, а стандартнае адхіленне выбаркі -.
    • Напрыклад, стандартнае адхіленне вышэйзгаданага ўзору = s = √33,2 = 5,76.
    рэклама

Метад 2 з 2: Разлічыце дысперсію папуляцыі

  1. Пачынаючы з набору асноўных дадзеных. Тэрмін "папуляцыя" выкарыстоўваецца для абазначэння ўсіх адпаведных назіранняў. Напрыклад, калі вы даследуеце ўзрост жыхароў Ханоя, ваша агульная колькасць насельніцтва будзе ўключаць узрост усіх асоб, якія жывуць у Ханоі. Звычайна вы ствараеце электронную табліцу для такога вялікага набору дадзеных, але вось меншы прыклад набору дадзеных:
    • Напрыклад: У пакоі акварыума роўна шэсць акварыўмаў. Гэтыя шэсць рэзервуараў змяшчаюць наступную колькасць рыбы:





  2. Запішыце формулу агульнай дысперсіі. Паколькі папуляцыя ўтрымлівае ўсе неабходныя нам дадзеныя, гэтая формула дае нам дакладную дысперсію папуляцыі. Каб адрозніць яго ад дысперсіі выбаркі (якая з'яўляецца толькі ацэнкай), статыстыкі выкарыстоўваюць іншыя зменныя:
    • σ = /п
    • σ = дысперсія ўзору. Гэта звычайна каўбаса ў квадраце. Дысперсія вымяраецца ў квадратах адзінак.
    • уяўляе сабой элемент у вашым наборы дадзеных.
    • Элемент у ∑ вылічваецца для кожнага значэння, а потым складаецца.
    • μ - агульная сярэдняя.
    • n - колькасць пунктаў дадзеных у папуляцыі.
  3. Знайсці сярэдняе насельніцтва. Пры аналізе папуляцыі сімвал μ ("mu") уяўляе сярэдняе арыфметычнае. Каб знайсці сярэдняе значэнне, складзіце ўсе дадзеныя, а потым падзеліце на колькасць пунктаў.
    • Вы можаце разглядаць азначэнне як "сярэдняе", але будзьце асцярожныя, бо слова мае шмат матэматычных азначэнняў.
    • Напрыклад: сярэдняе значэнне = μ = = 10,5
  4. Адніміце сярэдняе значэнне ад кожнага пункта дадзеных. Кропкі дадзеных, блізкія да сярэдняга, маюць розніцу, бліжэйшую да нуля. Паўтарыце задачу аднімання для ўсіх кропак дадзеных, і вы, верагодна, пачнеце адчуваць дысперсію дадзеных.
    • Напрыклад:
      - μ = 5 – 10,5 = -5,5
      - μ = 5 – 10,5 = -5,5
      - μ = 8 – 10,5 = -2,5
      - μ = 12 - 10., = 1,5
      - μ = 15 – 10,5 = 4,5
      - μ = 18 – 10,5 = 7,5
  5. Устаўце ў квадрат кожны знак. На гэты момант некаторыя вынікі, атрыманыя на папярэднім этапе, будуць адмоўнымі, а некаторыя - станоўчымі.Калі візуалізаваць дадзеныя на ізамарфнай лініі, гэтыя два элементы ўяўляюць лічбы злева і справа ад сярэдняй. Гэта не прынесла б карысці пры вылічэнні дысперсіі, бо гэтыя дзве групы скасавалі б адна адну. Замест гэтага пастаўце іх у квадрат, каб усе былі пазітыўнымі.
    • Напрыклад:
      (- μ) для кожнага значэння я працуе з 1 па 6:
      (-5,5) = 30,25
      (-5,5) = 30,25
      (-2,5) = 6,25
      (1,5) = 2,25
      (4,5) = 20,25
      (7,5) = 56,25
  6. Знайдзіце сярэдняе значэнне вашых вынікаў. Цяпер у вас ёсць значэнне для кожнай кропкі дадзеных, звязанае (не непасрэдна) з тым, наколькі далёка гэты пункт дадзеных знаходзіцца ад сярэдняга значэння. Асерадніце, складаючы іх і дзелячы на ​​колькасць значэнняў, якія ў вас ёсць.
    • Напрыклад:
      Агульная дысперсія = 24,25
  7. Кантактны рэцэпт. Калі вы не ўпэўненыя, наколькі гэта адпавядае формуле, выкладзенай у пачатку метаду, запішыце ўсю праблему ад рукі і не скарачайце:
    • Пасля знаходжання розніцы ад сярэдняга і квадраты, у вас ёсць (- μ), (- μ) і гэтак далей да (- μ), дзе знаходзіцца апошняя кропка дадзеных. у наборы дадзеных.
    • Каб знайсці сярэдняе з гэтых значэнняў, складзіце іх і падзеліце на n: ((- μ) + (- μ) + ... + (- μ)) / n
    • Перапісаўшы лічнік з сігмападобным абазначэннем, у вас ёсць /п, дысперсія формулы.
    рэклама

Парада

  • Паколькі дысперсія цяжка вытлумачыць, гэта значэнне часта вылічаецца як зыходная кропка для знаходжання стандартнага адхілення.
  • Выкарыстанне "назоўніка" замест "п" у назоўніку - метад, які называецца карэкцыяй Беселя. Выбарка - гэта толькі ацэнка поўнай сукупнасці, і сярэдняе ўзор выбаркі мае пэўны ўхіл, каб адпавядаць гэтай ацэнцы. Гэтая карэкцыя ліквідуе вышэйзгаданую прадузятасць. Гэта датычыцца таго факту, што раз пералічана n - 1 кропка дадзеных, гэта апошняя кропка п была канстантай, таму што для вылічэння сярэдняга значэння выбаркі (x̅) у формуле дысперсіі выкарыстоўваліся толькі пэўныя значэнні.