Anonim

Teória za p- hodnotami a nulová hypotéza sa na prvý pohľad môžu zdať komplikované, ale pochopenie pojmov vám pomôže orientovať sa vo svete štatistík. Bohužiaľ, tieto pojmy sa často zneužívajú v populárnej vede, takže by bolo užitočné pochopiť základné základy pre všetkých.

Prečítajte si tiež náš článok Ako odstrániť každý ďalší riadok v programe Excel

Vypočítanie hodnoty p modelu a preukázanie / vyvrátenie nulovej hypotézy je s MS Excel prekvapivo jednoduché. Existujú dva spôsoby, ako to urobiť, a my ich pokryjeme oba. Poďme sa kopať.

Nulová hypotéza a p- hodnota

Nulová hypotéza je vyhlásenie, ktoré sa tiež označuje ako predvolená pozícia, ktoré tvrdí, že vzťah medzi pozorovanými javmi neexistuje. Môže sa tiež použiť na asociácie medzi dvoma pozorovanými skupinami. Počas výskumu túto hypotézu otestujete a pokúsite sa ju vyvrátiť.

Napríklad povedzte, že chcete zistiť, či má určitá strava strava významné výsledky. Nulová hypotéza v tomto prípade spočíva v tom, že neexistuje žiadny významný rozdiel v hmotnosti testovaných subjektov pred a po diéte. Alternatívnou hypotézou je, že strava spôsobila zmenu. To by sa vedci pokúsili dokázať.

Hodnota p predstavuje pravdepodobnosť, že štatistický súhrn by bol rovný alebo väčší ako pozorovaná hodnota, ak je neplatná hypotéza pre určitý štatistický model pravdivá. Aj keď sa často vyjadruje ako desatinné číslo, vo všeobecnosti je lepšie vyjadriť ho v percentách. Napríklad hodnota p 0, 1 by mala byť vyjadrená ako 10%.

Nízka hodnota p znamená, že dôkazy proti nulovej hypotéze sú silné. To ďalej znamená, že vaše údaje sú významné. Na druhej strane vysoká hodnota p znamená, že neexistujú žiadne presvedčivé dôkazy proti hypotéze. Aby dokázali, že výstrelok funguje, vedci by museli nájsť nízku hodnotu p .

Štatisticky významný výsledok je taký, ktorý je veľmi nepravdepodobný, ak je neplatná hypotéza pravdivá. Úroveň významnosti sa označuje gréckym písmenom alfa a musí byť väčšia ako hodnota p, aby bol výsledok štatisticky významný.

Mnohí vedci v mnohých oblastiach používajú hodnotu p, aby získali lepší a hlbší prehľad o údajoch, s ktorými pracujú. Medzi popredné oblasti patrí sociológia, trestné súdnictvo, psychológia, financie a ekonómia.

Nájdenie hodnoty p- hodnoty v Exceli

Hodnotu p sady údajov nájdete v MS Excel pomocou funkcie T-Test alebo pomocou nástroja na analýzu údajov. Najprv sa pozrieme na funkciu T-testu. Preskúmame päť vysokoškolákov, ktorí chodili na 30-dňovú diétu. Porovnáme ich hmotnosť pred a po jedle.

POZNÁMKA: Na účely tohto článku použijeme MS Excel 2010. Aj keď to nie je ten najnovší, mali by sa tieto kroky vo všeobecnosti vzťahovať aj na novšie verzie.

Funkcia T-testu

Podľa týchto krokov vypočítajte hodnotu p pomocou funkcie T-Test.

  1. Vytvorte a vyplňte tabuľku. Náš stôl vyzerá takto:

  2. Kliknite na ľubovoľnú bunku mimo svojho stola.
  3. Zadajte: = T.Test (.
  4. Po otvorenej zátvorke zadajte prvý argument. V tomto príklade ide o stĺpec Before Diet. Rozsah by mal byť B2: B6. Funkcia zatiaľ vyzerá takto: T.Test (B2: B6.
  5. Ďalej zadáme druhý argument. Stĺpec After Diet a jeho výsledky sú našim druhým argumentom a rozsah, ktorý potrebujeme, je C2: C6. Pridajme ho do vzorca: T.Test (B2: B6, C2: C6.
  6. Po druhom argumente zadajte čiarku a v rozbaľovacej ponuke sa automaticky zobrazia možnosti jednostranného rozdelenia a rozdelenia rozdelenia na dve strany. Poďme si vybrať prvú - jednostrannú distribúciu. Dvakrát naň kliknite.
  7. Zadajte inú čiarku.
  8. V ďalšej rozbaľovacej ponuke dvakrát kliknite na možnosť Spárované.
  9. Teraz, keď máte všetky potrebné prvky, zatvorte držiak. Vzorec pre tento príklad vyzerá takto: = T.Test (B2: B6, C2: C6, 1, 1)

  10. Stlačte Enter. Bunka okamžite zobrazí hodnotu p . V našom prípade je hodnota 0, 1333906 alebo 13, 3906%.

Táto p- hodnota, ktorá je vyššia ako 5%, neposkytuje silný dôkaz proti nulovej hypotéze. V našom príklade výskum nepreukázal, že diéta pomohla testovaným subjektom stratiť značné množstvo na váhe. To nevyhnutne neznamená, že nulová hypotéza je správna, iba to, že ešte nebola vyvrátená.

Trasa analýzy údajov

Nástroj na analýzu údajov vám umožňuje robiť veľa zaujímavých vecí, vrátane výpočtov hodnoty p . Na zjednodušenie použijeme rovnakú tabuľku ako v predchádzajúcej metóde.

Takto sa to robí.

  1. Pretože v stĺpci D už máme rozdiely v hmotnosti, preskočíme výpočet rozdielu. Pre budúce tabuľky použite tento vzorec: = „Bunka 1“ - „Bunka 2“.
  2. Ďalej kliknite na kartu Údaje v hlavnej ponuke.
  3. Vyberte nástroj na analýzu údajov.
  4. Zrolujte nadol v zozname a kliknite na možnosť t-Test: Spárovať dve vzorky pre prostriedky.
  5. Kliknite na tlačidlo OK.
  6. Zobrazí sa kontextové okno. Vyzerá to takto:

  7. Zadajte prvý rozsah / argument. V našom príklade je to B2: B6.
  8. Zadajte druhý rozsah / argument. V tomto prípade je to C2: C6.
  9. V textovom poli Alpha ponechajte predvolenú hodnotu (je to 0, 05).
  10. Kliknite na prepínač Output Range a vyberte, kde chcete výsledok. Ak je to bunka A8, zadajte: $ A $ 8.
  11. Kliknite na tlačidlo OK.
  12. Excel vypočíta hodnotu p a niekoľko ďalších parametrov. Konečná tabuľka môže vyzerať takto:

Ako vidíte, jednosmerná hodnota p je rovnaká ako v prvom prípade - 0, 1333905569. Pretože je nad 0, 05, pre túto tabuľku platia nulové hypotézy a dôkazy proti nej sú slabé.

Čo je potrebné vedieť o p -Value

Tu je niekoľko užitočných rád týkajúcich sa výpočtov hodnoty p v Exceli.

  1. Ak sa hodnota p rovná 0, 05 (5%), údaje v tabuľke sú významné. Ak je nižší ako 0, 05 (5%), údaje, ktoré máte, sú veľmi významné.
  2. V prípade, že hodnota p je vyššia ako 0, 1 (10%), údaje v tabuľke sú zanedbateľné. Ak je v rozmedzí 0, 05 - 0, 10, máte marginálne významné údaje.
  3. Môžete zmeniť hodnotu alfa, aj keď najbežnejšie možnosti sú 0, 05 (5%) a 0, 10 (10%).
  4. Výber dvojstranného testovania môže byť lepšou voľbou v závislosti od vašej hypotézy. Vo vyššie uvedenom príklade znamená jednostranné testovanie, že skúmame, či testované subjekty po diéte schudli, a to je presne to, čo sme potrebovali zistiť. Testom s dvoma koncami by sa však skúmalo aj to, či získali štatisticky významné množstvá hmotnosti.
  5. Hodnota p nemôže identifikovať premenné. Inými slovami, ak identifikuje koreláciu, nemôže identifikovať príčiny, ktoré sú za ňou.

Hodnota p- hodnota bola demystifikovaná

Každý štatistik, ktorý stojí za svoju soľ, musí poznať príčiny a nedostatky testovania nulových hypotéz a čo to znamená p- hodnota. Tieto znalosti budú užitočné aj pre výskumníkov v mnohých ďalších oblastiach.

Už ste niekedy použili program Excel na výpočet hodnoty p štatistického modelu? Ktorú metódu ste použili? Uprednostňujete iný spôsob výpočtu? Dajte nám vedieť v sekcii komentárov.

Ako vypočítať p-hodnotu v Exceli