Аўтар:
Charles Brown
Дата Стварэння:
9 Люты 2021
Дата Абнаўлення:
1 Ліпень 2024
![БУДЕМ СТРОИТЬ ДОМ В 2022 ГОДУ И ДЕЛАТЬ РЕМОНТ!!!!](https://i.ytimg.com/vi/TnipwyQU-ng/hqdefault.jpg)
Задаволены
- Крок
- Спосаб 1 з 3: Разлічыце SSE ад рукі
- Метад 3 з 3: суадносіце SSE з іншымі статыстычнымі дадзенымі
Сума квадратаў (SSE) - гэта папярэдні статыстычны разлік, які прыводзіць да розных значэнняў дадзеных. Калі ў вас ёсць набор значэнняў дадзеных, карысна мець магчымасць вызначыць, наколькі гэтыя значэнні цесна звязаны. Вы павінны ўпарадкаваць свае дадзеныя ў табліцы, а потым правесці даволі простыя разлікі. Пасля таго, як вы знойдзеце SSE для набору дадзеных, вы можаце знайсці дысперсію і стандартнае адхіленне.
Крок
Спосаб 1 з 3: Разлічыце SSE ад рукі
Стварыце табліцу з трох слупкоў. Самы зразумелы спосаб вылічыць SSE - пачаць з табліцы з трох слупкоў. Пазначце тры слупкі
Запоўніце падрабязнасці. Першы слупок змяшчае значэнні вашых вымярэнняў. Запоўніце слупок
Вылічыце сярэдняе. Перш чым вы зможаце вылічыць памылку для кожнага вымярэння, вы павінны вылічыць сярэдняе значэнне ўсяго набору дадзеных.
- Сярэдняе значэнне набору дадзеных - гэта сума значэнняў, падзеленая на колькасць значэнняў у наборы. Гэта можа быць прадстаўлена сімвалічна са зменнай
Вылічыце індывідуальныя значэнні памылак. У другі слупок вашай табліцы вы павінны ўвесці значэнні памылак для кожнага значэння дадзеных. Памылка - гэта розніца паміж вымярэннем і сярэдняй.
- Для дадзенага набору дадзеных адніміце сярэдняе значэнне 98,87 ад кожнага вымеранага значэння і запоўніце вынікі ў другім слупку. Гэтыя дзесяць разлікаў выглядаюць наступным чынам:
Разлічыце SSE. У трэцім слупку табліцы знайдзіце квадрат кожнага атрыманага значэння ў сярэднім слупку. Яны ўяўляюць сабой квадраты адхіленняў ад сярэдняга значэння для кожнага вымеранага значэння дадзеных.
- Для кожнага значэння ў сярэднім слупку выкарыстоўвайце калькулятар для разліку квадрата. Вынікі запішыце ў трэці слупок наступным чынам:
Складзіце квадраты памылак. Апошні крок - пошук сумы значэнняў у трэцім слупку. Пажаданы вынік - SSE, або сума квадратаў памылак.
- Для гэтага набору дадзеных SSE вылічваецца шляхам складання дзесяці значэнняў у трэцім слупку:
Пазначце слупкі табліцы. Вы ствараеце табліцу з трыма слупкамі ў Excel з тымі ж трыма загалоўкамі, што і вышэй.
- У ячэйцы A1 увядзіце загаловак "Значэнне".
- У полі B1 увядзіце загаловак "Адхіленне".
- У полі C1 увядзіце загаловак "Адхіленне ў квадраце".
Увядзіце свае дадзеныя. У першым слупку вы павінны ўвесці значэнні вымярэнняў. Калі набор невялікі, вы можаце лёгка набраць яго ад рукі. Калі ў вас вялікі набор дадзеных, вам можа спатрэбіцца скапіяваць і ўставіць дадзеныя ў слупок.
Вызначыце сярэдняе значэнне пунктаў дадзеных. У Excel ёсць функцыя, якая вылічвае для вас сярэдняе значэнне. У пустую ячэйку пад табліцай дадзеных (не важна, якую ячэйку вы абралі) увядзіце наступнае:
- = Сярэдні (A2: ___)
- Не ўводзіце прабел. Запоўніце гэтае месца імем ячэйкі вашага апошняга пункта дадзеных. Напрыклад, калі ў вас ёсць 100 пунктаў дадзеных, вы выкарыстоўваеце функцыю:
- = Сярэдні (A2: A101)
- Гэтая функцыя ўтрымлівае дадзеныя з вочак A2 па A101, таму што верхні радок змяшчае загалоўкі слупкоў.
- Пры націску Enter або пры націску на іншую ячэйку ў табліцы зноў запраграмаваная ячэйка аўтаматычна запаўняецца сярэднім значэннем дадзеных.
Увядзіце функцыю для вымярэння памылак. У першай пустой ячэйцы ў слупку "Адхіленне" увядзіце функцыю для разліку розніцы паміж кожнай кропкай дадзеных і сярэдняй. Для гэтага выкарыстоўвайце імя ячэйкі, дзе знаходзіцца сярэдняе значэнне. Давайце выкажам здагадку, што вы выкарыстоўвалі ячэйку A104.
- Функцыя разліку памылак, якую вы ўводзіце ў вочку B2:
- = A2- $ A $ 104. Знакі даляра патрэбныя, каб пераканацца, што вы зафіксавалі скрынку A104 для любога разліку.
- Функцыя разліку памылак, якую вы ўводзіце ў вочку B2:
Увядзіце функцыю для квадратных памылак. У трэцім слупку вы можаце даручыць Excel вылічыць патрэбны квадрат.
- У вочку C2 увядзіце наступную функцыю:
- = В2 ^ 2
- У вочку C2 увядзіце наступную функцыю:
Скапіруйце функцыі, каб запоўніць усю табліцу. Пасля ўводу функцый у верхнюю ячэйку кожнага слупка, B2 і C2, адпаведна, вам неабходна запоўніць усю табліцу. Вы можаце перапісаць функцыю ў любым радку табліцы, але гэта зойме занадта шмат часу. Выкарыстоўваючы мыш, вылучыце ячэйкі B2 і C2 разам і, не адпускаючы кнопку мышы, перацягніце ў ніжнюю ячэйку кожнага слупка.
- Мяркуючы, што ў вашай табліцы ёсць 100 пунктаў дадзеных, перацягніце мыш да клетак B101 і C101.
- Адпускаючы кнопку мышы, формулы капіруюцца ва ўсе ячэйкі табліцы. Табліца павінна аўтаматычна запаўняцца разліковымі значэннямі.
Знайдзіце SSE. Слупок C вашай табліцы змяшчае ўсе значэнні памылак у квадраце. Апошні крок - дазволіць Excel вылічыць суму гэтых значэнняў.
- У ячэйку пад табліцай, магчыма C102 у гэтым прыкладзе, увядзіце наступную функцыю:
- = Сума (C2: C101)
- Калі вы націснеце Enter або націсніце ў іншай ячэйцы табліцы, вы атрымаеце значэнне SSE вашых дадзеных.
- У ячэйку пад табліцай, магчыма C102 у гэтым прыкладзе, увядзіце наступную функцыю:
- Для кожнага значэння ў сярэднім слупку выкарыстоўвайце калькулятар для разліку квадрата. Вынікі запішыце ў трэці слупок наступным чынам:
- Для дадзенага набору дадзеных адніміце сярэдняе значэнне 98,87 ад кожнага вымеранага значэння і запоўніце вынікі ў другім слупку. Гэтыя дзесяць разлікаў выглядаюць наступным чынам:
- Сярэдняе значэнне набору дадзеных - гэта сума значэнняў, падзеленая на колькасць значэнняў у наборы. Гэта можа быць прадстаўлена сімвалічна са зменнай
Метад 3 з 3: суадносіце SSE з іншымі статыстычнымі дадзенымі
Разлічыце адхіленне ад SSE. Пошук SSE для набору дадзеных, як правіла, з'яўляецца асновай для пошуку іншых, больш карысных, значэнняў. Першы з іх - дысперсія. Дысперсія - гэта мера таго, наколькі вымяраныя дадзеныя адхіляюцца ад сярэдняга значэння. Гэта фактычна сярэдняе значэнне квадрата адрозненняў ад сярэдняга.
- Паколькі SSE - гэта сума квадратных памылак, вы можаце знайсці сярэдняе значэнне (гэта дысперсія), проста падзяліўшы на колькасць значэнняў. Аднак калі вы вылічыце дысперсію выбарачнай серыі, а не ўсёй сукупнасці, дысперсію вы дзеліце на (n-1), а не на n. Такім чынам:
- Дысперсія = SSE / n, калі вылічыць дысперсію ўсёй папуляцыі.
- Дысперсія = SSE / (n-1), пры разліку дысперсіі выбаркі дадзеных.
- Для праблемы выбаркі тэмпературы пацыентаў можна меркаваць, што 10 пацыентаў - гэта толькі ўзор. Такім чынам, дысперсія вылічваецца наступным чынам:
Разлічыце стандартнае адхіленне SSE. Стандартнае адхіленне - гэта часта выкарыстоўванае значэнне, якое паказвае, наколькі значэнні набору дадзеных адхіляюцца ад сярэдняга значэння. Стандартнае адхіленне - квадратны корань з дысперсіі. Памятаеце, што дысперсія - гэта сярэдняе значэнне вымярэнняў квадрата памылак.
- Такім чынам, пасля вылічэння SSE вы можаце знайсці стандартнае адхіленне наступным чынам:
Выкарыстоўвайце SSE для вызначэння каварыянтнасці. Гэты артыкул прысвечаны наборам дадзеных, якія адначасова вымяраюць толькі адно значэнне. Аднак у многіх даследаваннях можна параўнаць два асобныя значэнні. Напрыклад, вы хочаце ведаць, як гэтыя два значэнні суадносяцца адзін з адным, а не толькі са сярэдняй велічынёй набору дадзеных. Гэта значэнне - каварыянтнасць.
- Разлікі для каварыяцыі занадта падрабязныя, каб іх можна было апісаць тут, за выключэннем таго, што вы будзеце выкарыстоўваць SSE для кожнага тыпу дадзеных, а затым параўноўваць яго. Для больш падрабязнага апісання каварыянтнасці і звязаных з ёй разлікаў вы можаце знайсці артыкулы па гэтай тэме на wikiHow.
- У якасці прыкладу выкарыстання ковариации вы можаце параўнаць узрост пацыентаў у медыцынскім даследаванні з эфектыўнасцю прэпарата пры зніжэнні тэмпературы ў ліхаманцы. Тады ў вас ёсць адзін набор дадзеных пра ўзрост і другі набор тэмператур. Затым вы знойдзеце SSE для кожнага набору дадзеных, а адтуль дысперсію, стандартныя адхіленні і каварыянтнасць.
- Такім чынам, пасля вылічэння SSE вы можаце знайсці стандартнае адхіленне наступным чынам:
- Паколькі SSE - гэта сума квадратных памылак, вы можаце знайсці сярэдняе значэнне (гэта дысперсія), проста падзяліўшы на колькасць значэнняў. Аднак калі вы вылічыце дысперсію выбарачнай серыі, а не ўсёй сукупнасці, дысперсію вы дзеліце на (n-1), а не на n. Такім чынам: