Як знайсці рэжым набору лічбаў

Аўтар: John Stephens
Дата Стварэння: 1 Студзень 2021
Дата Абнаўлення: 1 Ліпень 2024
Anonim
КАК ЗАЩИТИТЬСЯ ОТ НАПАДЕНИЯ ЛЮБОЙ СОБАКИ
Відэа: КАК ЗАЩИТИТЬСЯ ОТ НАПАДЕНИЯ ЛЮБОЙ СОБАКИ

Задаволены

У статыстыцы рэжым мноства лікаў лічбы з'яўляюцца найбольш часта ў гэтай папуляцыі. Набор дадзеных не павінен мець толькі адзін рэжым - калі два ці больш значэння лічацца найбольш распаўсюджанымі, то гэты набор дадзеных можна выклікаць бімадальны (два рэжымы) альбо мультымадальны (шматрэжымны) - іншымі словамі, усе найбольш распаўсюджаныя значэнні з'яўляюцца рэжымам набору. Падрабязна пра вызначэнне рэжыму набору дадзеных гл. Крок 1 ніжэй, каб пачаць.

Крокі

Спосаб 1 з 2: знайдзіце рэжым набору дадзеных

  1. Пералічыце нумары ў вашым наборы дадзеных. Рэжымы часта атрымліваюць з набораў статыстычных дадзеных альбо са спісу лікавых значэнняў. Такім чынам, каб знайсці рэжым, вам трэба мець набор дадзеных для пошуку. Складана вылічыць значэнні рэжыму толькі пры дапамозе візуалізацыі, за выключэннем занадта малых набораў дадзеных, таму ў большасці выпадкаў самым разумным спосабам з'яўляецца запіс (альбо ўвод) набору дадзеных . Калі вы працуеце з паперай і алоўкам, проста запішыце значэнні ў наборы дадзеных па парадку, пры выкарыстанні калькулятара вам можа спатрэбіцца праграма Excel.
    • Працэс пошуку рэжыму набору дадзеных лягчэй зразумець, калі праілюстраваць яго на прыкладзе. У гэтым раздзеле давайце выкарыстаем наступны набор значэнняў у якасці прыкладу: {18, 21, 11, 21, 15, 19, 17, 21, 17}. На наступных этапах мы знойдзем рэжым гэтай калекцыі.

  2. Сартаваць лічбы ад найменшага да найбольшага. Разумна размясціць значэнні набору дадзеных у парадку ўзрастання. Хоць гэта неабавязкова, гэта палягчае працэс пошуку рэжыму, паколькі групуе падобныя значэнні побач. Для вялікіх набораў дадзеных гэта сапраўды неабходна, бо складана класіфікаваць доўгія спісы і памятаць, колькі разоў кожны нумар з'яўляецца ў спісе і можа прывесці да памылак.
    • Калі вы працуеце з паперай і алоўкам, запіс можа зэканоміць час у доўгатэрміновай перспектыве. Праглядзіце набор лічбаў, каб убачыць, які лік найменшы, і, знайшоўшы яго, пачніце новы набор дадзеных з гэтага найменшага ліку, за якім ідзе другі, трэці найменшы і гэтак далей. Пераканайцеся, што вы пішаце кожную лічбу, роўную колькасці выпадкаў, калі яна з'явілася ў зыходным наборы дадзеных.
    • З дапамогай калькулятара вы можаце сартаваць спісы значэнняў ад малых да вялікіх усяго за некалькі клікаў
    • У прыведзеным вышэй прыкладзе пасля сартавання наш новы спіс будзе: {11, 15, 17, 17, 18, 19, 21, 21, 21}.

  3. Падлічыце, колькі разоў паўтараецца кожная лічба. Наступны крок - падлічыць колькасць з'яўленняў кожнага нумара ў наборы.Знайдзіце значэнне, якое найбольш часта сустракаецца ў наборы дадзеных. Для адносна невялікіх набораў дадзеных, кропкі якіх адсартаваны па ўзрастанні, пошук "кластараў" падобных значэнняў і падлік іх узнікнення адносна просты.
    • Калі вы працуеце з паперай і алоўкам, запомніце свой лік, запішыце, колькі разоў кожнае значэнне сустракаецца ў кожным кластары аднаго і таго ж ліку. Калі вы выкарыстоўваеце праграму Excel для працоўнага стала, вы можаце зрабіць тое ж самае, запісаўшы іх у поле побач, альбо выкарыстаўшы адну з функцый праграмы для падліку кропак дадзеных.
    • У нашым прыкладзе ({11, 15, 17, 17, 18, 19, 21, 21, 21}) 11 сустракаецца адзін раз, 15 сустракаецца адзін раз, 17 сустракаецца двойчы, 18 сустракаецца адзін раз. адзін раз, 19 з'яўляюцца адзін раз, і 21 з'явіўся тры разы. 21 - найбольш частае значэнне ў гэтым наборы дадзеных.

  4. Вызначце значэнне, якое сустракаецца часцей за ўсё. Калі вы ведаеце, колькі выпадкаў сустракаецца кожнае значэнне, знайдзіце значэнне з большасцю выпадкаў. Гэта рэжым вашага набору дадзеных. Звярніце ўвагу, што У наборы дадзеных можа быць больш аднаго рэжыму. Калі два значэнні маюць аднолькавую большасць выпадкаў у папуляцыі, то гэта мноства бімадальны (два рэжымы), калі такіх значэнняў тры, тады набор трымадальны (тры рэжымы) і г.д.
    • У прыведзеным вышэй прыкладзе ({11, 15, 17, 17, 18, 19, 21, 21, 21}), бо 21 сустракаецца не больш, 21 - гэта рэжым.
    • Калі адно значэнне больш за 21 таксама з'яўляецца тры разы (напрыклад, дадатковых 17 у наборы), потым 21 і гэты лік абодва будзе рэжым.
  5. Не блытайце рэжым са сярэднім значэннем або медыянай. Тры статыстычныя паняцці, якія часта згадваюцца разам, гэта сярэдняя, ​​медыяна і рэжым. Паколькі гэтыя паняцці маюць падобныя па гучанні назвы, і таму, што ў наборы дадзеных значэнне можа быць часам закрыта. не адзін ролі ў гэтых лічбах, таму іх лёгка пераблытаць. Аднак незалежна ад таго, ёсць у вашым наборы дадзеных рэжымы ці не, ён заўсёды мае медыяну або сярэдняе значэнне. Важна разумець, што гэтыя тры паняцці цалкам незалежныя адзін ад аднаго. Глядзі ніжэй:
    • Сярэдняя набору дадзеных - гэта сярэдняе значэнне гэтага набору. Каб знайсці сярэдняе значэнне, дадайце ўсе значэнні ў наборы разам, а потым падзяліце суму на колькасць членаў у наборы. Напрыклад, пачатковы набор лікаў ({11, 15, 17, 17, 18, 19, 21, 21, 21}), сярэдняе будзе 11 + 15 + 17 + 17 + 18 + 19 + 21 + 21 + 21 = 160/9 = 17.78. 9 азначае, што ў наборы 9 лічбаў.

    • Медыяна набору дадзеных - гэта "сярэдні лік", які дзеліць малыя і вялікія значэнні гэтага набору на дзве роўныя паловы. Возьмем прыклад вышэй ({11, 15, 17, 17, 18, 19, 21, 21, 21}) 18 з'яўляецца медыянай, таму што гэта сярэдні лік - роўна чатыры лікі большыя за яго і на чатыры нумары меншыя за яго. Звярніце ўвагу, што калі колькасць значэнняў у наборы роўная, то медыяна - гэта сярэдняе арыфметычнае двух сярэдніх лікаў.

    рэклама

Спосаб 2 з 2: знайсці рэжым у асаблівых выпадках

  1. У наборах дадзеных, дзе кожнае значэнне мае роўную колькасць выпадкаў, рэжым адсутнічае. Калі значэнні ў дадзеным наборы сустракаюцца аднолькавую колькасць разоў, гэты набор дадзеных не мае рэжыму, паколькі ніводнае з іх не сустракаецца больш, чым любы іншы. Напрыклад, наборы дадзеных, у якіх кожнае значэнне сустракаецца толькі адзін раз, не маюць рэжыму. Тое ж самае тычыцца набораў дадзеных са значэннямі, якія сустракаюцца двойчы, тройчы і г.д.
    • Калі мы зменім прыклад набору дадзеных на {11, 15, 17, 18, 19, 21} так, каб кожнае значэнне сустракалася толькі адзін раз, цяпер гэты набор дадзеных Рэжыму няма. Гэта тое ж самае, калі мы зменім набор дадзеных так, каб кожнае значэнне сустракалася двойчы: {11, 11, 15, 15, 17, 17, 18, 18, 19, 19, 21, 21}.
  2. Рэжымы нечисловых набораў дадзеных можна знайсці гэтак жа, як і для лікавых набораў дадзеных. Увогуле, большасць набораў дадзеных ёсць Колькасны - яны ўтрымліваюць лікавыя дадзеныя. Аднак некаторыя наборы дадзеных утрымліваюць інфармацыю, якая не прадстаўляецца ў выглядзе лічбы. У гэтых выпадках "рэжым" па-ранейшаму з'яўляецца найбольш часта сустракаемым значэннем у гэтым наборы дадзеных, як і ў лічбавым наборы дадзеных. У гэтых выпадках пошук рэжыму магчымы, а медыяна або сярэдняе значэнне немагчымыя.
    • Возьмем прыклад у біялагічным апытанні для вызначэння парод дрэў рэгіёну. Набор дадзеных па відах дрэў у рэгіёне: {Bang, Phuong, Bang, Thong, Bang, Bang, Phuong, Phuong, Thong, Bang}. Гэты тып набору дадзеных называецца наборам дадзеных Імя таму што кропкі дадзеных адрозніваюцца толькі на аснове іх назвы. Рэжым набору дадзеных Выбух таму што ён з'яўляецца найбольш (пяць разоў, а Пхуонг - тры разы, а Тонг - два разы).
    • У прыведзеным вышэй прыкладзе вы не можаце вылічыць сярэдняе або медыяну, паколькі кропкі дадзеных не з'яўляюцца лічбавымі.
  3. Для сіметрычных размеркаванняў з модай рэжым, сярэдняе і медыяна супадаюць. Як ужо адзначалася вышэй, рэжым, медыяна і / або сярэдняе значэнне могуць быць аднолькавымі пры пэўных абставінах. У тых выпадках, калі функцыя шчыльнасці набору дадзеных утварае ідэальна сіметрычную крывую з адным рэжымам (напрыклад, крывой Гауса або "Крывой званочка"), то рэжым, сярэдняе і медыяна будуць тое ж значэнне. Паколькі функцыя размеркавання будзе наносіць графік адноснага ўзнікнення кропак дадзеных, натуральны рэжым будзе знаходзіцца ў сярэдзіне сіметрычнай крывой размеркавання, бо гэта самая высокая кропка графіка і адпавядае значэнню. самы папулярны. Паколькі набор дадзеных сіметрычны, гэты пункт на графіцы будзе адпавядаць медыяне (сярэдняе значэнне набору дадзеных) і сярэдняму значэнню (сярэдняму значэнню набору дадзеных).
    • Разгледзім наступны прыклад {1, 2, 2, 3, 3, 3, 4, 4, 5}. Калі скласці графік размеркавання гэтага набору дадзеных, мы атрымаем крывую сіметрыі вышынёй 3 пры x = 3 і да 1 пры x = 1 і x = 5. Паколькі 3 - гэта цана лячэнне часцей за ўсё, гэта рэжым. Паколькі сярэдняе 3 значэнне набору мае 4 значэнні па абодва бакі, 3 таксама медыяна. Нарэшце, сярэдняе насельніцтва складае 1 + 2 + 2 + 3 + 3 + 3 + 4 + 4 + 5 = 27/9 = 3, што азначае, што 3 - таксама сярэдняе значэнне.
    • Выключэнне з гэтага правіла складаецца ў тым, што сіметрычныя наборы дадзеных маюць больш за адзін рэжым - у гэтым выпадку, паколькі для гэтага набору дадзеных існуе толькі адна медыяна і сярэдняе значэнне, абодва рэжымы не будуць супадаць з іншымі кропкамі. .
    рэклама

Парада

  • Вы можаце мець некалькі рэжымаў.
  • Калі ўсе лічбы з'яўляюцца толькі адзін раз, няма рэжыму.

Што вам трэба

  • Папера, аловак і гумка