Разлічыць суму квадратаў (SSE)

Аўтар: Charles Brown
Дата Стварэння: 9 Люты 2021
Дата Абнаўлення: 1 Ліпень 2024
Anonim
БУДЕМ СТРОИТЬ ДОМ В 2022 ГОДУ И ДЕЛАТЬ РЕМОНТ!!!!
Відэа: БУДЕМ СТРОИТЬ ДОМ В 2022 ГОДУ И ДЕЛАТЬ РЕМОНТ!!!!

Задаволены

Сума квадратаў (SSE) - гэта папярэдні статыстычны разлік, які прыводзіць да розных значэнняў дадзеных. Калі ў вас ёсць набор значэнняў дадзеных, карысна мець магчымасць вызначыць, наколькі гэтыя значэнні цесна звязаны. Вы павінны ўпарадкаваць свае дадзеныя ў табліцы, а потым правесці даволі простыя разлікі. Пасля таго, як вы знойдзеце SSE для набору дадзеных, вы можаце знайсці дысперсію і стандартнае адхіленне.

Крок

Спосаб 1 з 3: Разлічыце SSE ад рукі

  1. Стварыце табліцу з трох слупкоў. Самы зразумелы спосаб вылічыць SSE - пачаць з табліцы з трох слупкоў. Пазначце тры слупкі Значэнне{ displaystyle { text {Значэнне}}}Запоўніце падрабязнасці. Першы слупок змяшчае значэнні вашых вымярэнняў. Запоўніце слупок Значэнне{ displaystyle { text {Значэнне}}}Вылічыце сярэдняе. Перш чым вы зможаце вылічыць памылку для кожнага вымярэння, вы павінны вылічыць сярэдняе значэнне ўсяго набору дадзеных.
    • Сярэдняе значэнне набору дадзеных - гэта сума значэнняў, падзеленая на колькасць значэнняў у наборы. Гэта можа быць прадстаўлена сімвалічна са зменнай μ{ displaystyle mu}Вылічыце індывідуальныя значэнні памылак. У другі слупок вашай табліцы вы павінны ўвесці значэнні памылак для кожнага значэння дадзеных. Памылка - гэта розніца паміж вымярэннем і сярэдняй.
      • Для дадзенага набору дадзеных адніміце сярэдняе значэнне 98,87 ад кожнага вымеранага значэння і запоўніце вынікі ў другім слупку. Гэтыя дзесяць разлікаў выглядаюць наступным чынам:
        • 99,098,87=0,13{ дысплей 99,0-98,87 = 0,13}Разлічыце SSE. У трэцім слупку табліцы знайдзіце квадрат кожнага атрыманага значэння ў сярэднім слупку. Яны ўяўляюць сабой квадраты адхіленняў ад сярэдняга значэння для кожнага вымеранага значэння дадзеных.
          • Для кожнага значэння ў сярэднім слупку выкарыстоўвайце калькулятар для разліку квадрата. Вынікі запішыце ў трэці слупок наступным чынам:
            • 0,132=0,0169{ Displaystyle 0,13 ^ {2} = 0,0169}Складзіце квадраты памылак. Апошні крок - пошук сумы значэнняў у трэцім слупку. Пажаданы вынік - SSE, або сума квадратаў памылак.
              • Для гэтага набору дадзеных SSE вылічваецца шляхам складання дзесяці значэнняў у трэцім слупку:
              • С.С.Э=6,921{ displaystyle SSE = 6.921}Пазначце слупкі табліцы. Вы ствараеце табліцу з трыма слупкамі ў Excel з тымі ж трыма загалоўкамі, што і вышэй.
                • У ячэйцы A1 увядзіце загаловак "Значэнне".
                • У полі B1 увядзіце загаловак "Адхіленне".
                • У полі C1 увядзіце загаловак "Адхіленне ў квадраце".
              • Увядзіце свае дадзеныя. У першым слупку вы павінны ўвесці значэнні вымярэнняў. Калі набор невялікі, вы можаце лёгка набраць яго ад рукі. Калі ў вас вялікі набор дадзеных, вам можа спатрэбіцца скапіяваць і ўставіць дадзеныя ў слупок.
              • Вызначыце сярэдняе значэнне пунктаў дадзеных. У Excel ёсць функцыя, якая вылічвае для вас сярэдняе значэнне. У пустую ячэйку пад табліцай дадзеных (не важна, якую ячэйку вы абралі) увядзіце наступнае:
                • = Сярэдні (A2: ___)
                • Не ўводзіце прабел. Запоўніце гэтае месца імем ячэйкі вашага апошняга пункта дадзеных. Напрыклад, калі ў вас ёсць 100 пунктаў дадзеных, вы выкарыстоўваеце функцыю:
                  • = Сярэдні (A2: A101)
                  • Гэтая функцыя ўтрымлівае дадзеныя з вочак A2 па A101, таму што верхні радок змяшчае загалоўкі слупкоў.
                • Пры націску Enter або пры націску на іншую ячэйку ў табліцы зноў запраграмаваная ячэйка аўтаматычна запаўняецца сярэднім значэннем дадзеных.
              • Увядзіце функцыю для вымярэння памылак. У першай пустой ячэйцы ў слупку "Адхіленне" увядзіце функцыю для разліку розніцы паміж кожнай кропкай дадзеных і сярэдняй. Для гэтага выкарыстоўвайце імя ячэйкі, дзе знаходзіцца сярэдняе значэнне. Давайце выкажам здагадку, што вы выкарыстоўвалі ячэйку A104.
                • Функцыя разліку памылак, якую вы ўводзіце ў вочку B2:
                  • = A2- $ A $ 104. Знакі даляра патрэбныя, каб пераканацца, што вы зафіксавалі скрынку A104 для любога разліку.
              • Увядзіце функцыю для квадратных памылак. У трэцім слупку вы можаце даручыць Excel вылічыць патрэбны квадрат.
                • У вочку C2 увядзіце наступную функцыю:
                  • = В2 ^ 2
              • Скапіруйце функцыі, каб запоўніць усю табліцу. Пасля ўводу функцый у верхнюю ячэйку кожнага слупка, B2 і C2, адпаведна, вам неабходна запоўніць усю табліцу. Вы можаце перапісаць функцыю ў любым радку табліцы, але гэта зойме занадта шмат часу. Выкарыстоўваючы мыш, вылучыце ячэйкі B2 і C2 разам і, не адпускаючы кнопку мышы, перацягніце ў ніжнюю ячэйку кожнага слупка.
                • Мяркуючы, што ў вашай табліцы ёсць 100 пунктаў дадзеных, перацягніце мыш да клетак B101 і C101.
                • Адпускаючы кнопку мышы, формулы капіруюцца ва ўсе ячэйкі табліцы. Табліца павінна аўтаматычна запаўняцца разліковымі значэннямі.
              • Знайдзіце SSE. Слупок C вашай табліцы змяшчае ўсе значэнні памылак у квадраце. Апошні крок - дазволіць Excel вылічыць суму гэтых значэнняў.
                • У ячэйку пад табліцай, магчыма C102 у гэтым прыкладзе, увядзіце наступную функцыю:
                  • = Сума (C2: C101)
                • Калі вы націснеце Enter або націсніце ў іншай ячэйцы табліцы, вы атрымаеце значэнне SSE вашых дадзеных.

Метад 3 з 3: суадносіце SSE з іншымі статыстычнымі дадзенымі

  1. Разлічыце адхіленне ад SSE. Пошук SSE для набору дадзеных, як правіла, з'яўляецца асновай для пошуку іншых, больш карысных, значэнняў. Першы з іх - дысперсія. Дысперсія - гэта мера таго, наколькі вымяраныя дадзеныя адхіляюцца ад сярэдняга значэння. Гэта фактычна сярэдняе значэнне квадрата адрозненняў ад сярэдняга.
    • Паколькі SSE - гэта сума квадратных памылак, вы можаце знайсці сярэдняе значэнне (гэта дысперсія), проста падзяліўшы на колькасць значэнняў. Аднак калі вы вылічыце дысперсію выбарачнай серыі, а не ўсёй сукупнасці, дысперсію вы дзеліце на (n-1), а не на n. Такім чынам:
      • Дысперсія = SSE / n, калі вылічыць дысперсію ўсёй папуляцыі.
      • Дысперсія = SSE / (n-1), пры разліку дысперсіі выбаркі дадзеных.
    • Для праблемы выбаркі тэмпературы пацыентаў можна меркаваць, што 10 пацыентаў - гэта толькі ўзор. Такім чынам, дысперсія вылічваецца наступным чынам:
      • Дысперсія=SSE(п1){ displaystyle { text {Варыянтнасць}} = { frac { text {SSE}} {(n-1)}}}Разлічыце стандартнае адхіленне SSE. Стандартнае адхіленне - гэта часта выкарыстоўванае значэнне, якое паказвае, наколькі значэнні набору дадзеных адхіляюцца ад сярэдняга значэння. Стандартнае адхіленне - квадратны корань з дысперсіі. Памятаеце, што дысперсія - гэта сярэдняе значэнне вымярэнняў квадрата памылак.
        • Такім чынам, пасля вылічэння SSE вы можаце знайсці стандартнае адхіленне наступным чынам:
          • Стандартнае адхіленне=SSEп1{ displaystyle { text {Стандартнае адхіленне}} = { sqrt { frac { text {SSE}} {n-1}}}}Выкарыстоўвайце SSE для вызначэння каварыянтнасці. Гэты артыкул прысвечаны наборам дадзеных, якія адначасова вымяраюць толькі адно значэнне. Аднак у многіх даследаваннях можна параўнаць два асобныя значэнні. Напрыклад, вы хочаце ведаць, як гэтыя два значэнні суадносяцца адзін з адным, а не толькі са сярэдняй велічынёй набору дадзеных. Гэта значэнне - каварыянтнасць.
            • Разлікі для каварыяцыі занадта падрабязныя, каб іх можна было апісаць тут, за выключэннем таго, што вы будзеце выкарыстоўваць SSE для кожнага тыпу дадзеных, а затым параўноўваць яго. Для больш падрабязнага апісання каварыянтнасці і звязаных з ёй разлікаў вы можаце знайсці артыкулы па гэтай тэме на wikiHow.
            • У якасці прыкладу выкарыстання ковариации вы можаце параўнаць узрост пацыентаў у медыцынскім даследаванні з эфектыўнасцю прэпарата пры зніжэнні тэмпературы ў ліхаманцы. Тады ў вас ёсць адзін набор дадзеных пра ўзрост і другі набор тэмператур. Затым вы знойдзеце SSE для кожнага набору дадзеных, а адтуль дысперсію, стандартныя адхіленні і каварыянтнасць.