Cramér's V
Ve statistice je Cramérův V (někdy označovaný jako Cramérovo phi nebo Cramersovo C a označovaný jako φc) populární[citace potřebná] míra asociace mezi dvěma nominálními proměnnými, která udává hodnotu mezi 0 a +1 (včetně). Je založena na Pearsonově chí-kvadrát statistice a byla publikována Haraldem Cramérem v roce 1946.
φc je vzájemná korelace dvou diskrétních proměnných a lze ji použít u proměnných, které mají dvě nebo více úrovní. φc je symetrická míra, nezáleží na tom, kterou proměnnou umístíme do sloupců a kterou do řádků. Nezáleží ani na pořadí řádků/sloupců, takže φc lze použít s nominálními nebo vyššími typy dat (uspořádanými, číselnými atd.).
Cramérův V lze použít i pro modely chí-kvadrát dobré shody, pokud existuje tabulka 1×k (např.: r=1). V tomto případě se k bere jako počet volitelných výsledků a funguje jako míra tendence k jednomu výsledku.
Mohlo by vás zajímat: Cramérovo–von Misesovo kritérium
Cramérova V se pohybuje od 0 (což odpovídá nulové asociaci mezi proměnnými) do 1 (úplná asociace) a může dosáhnout hodnoty 1 pouze tehdy, když se obě proměnné navzájem rovnají.
φc2 je střední kvadratická kanonická korelace mezi proměnnými[citace potřebná].
V případě kontingenční tabulky 2×2 se Cramérovo V rovná koeficientu Phi.
Všimněte si, že vzhledem k tomu, že hodnoty chí-kvadrátu mají tendenci růst s počtem buněk, čím větší je rozdíl mezi r (řádky) a c (sloupce), tím větší je pravděpodobnost, že φc bude mít tendenci k hodnotě 1, aniž by existoval silný důkaz významné korelace.[potřebná citace]
Cramérův V se vypočítá jako druhá odmocnina statistiky chí-kvadrát vydělená velikostí vzorku a délkou minimální dimenze (k je menší z počtu řádků r nebo sloupců c).
Vzorec pro koeficient φc je následující:
Hodnota p pro významnost φc je stejná, jaká se vypočítá pomocí Pearsonova chí-kvadrát testu [citace potřebná].
Vzorec pro rozptyl φc je znám.
Na rozdíl od kontingenční tabulky je hodnota V relativně nezávislá na počtu sloupců nebo řádků.
Další míry korelace pro nominální data:
Průměr (aritmetický, geometrický) - Medián - Modus - Výkon - Rozptyl - Směrodatná odchylka
Testování hypotéz - Významnost - Nulová hypotéza / Alternativní hypotéza - Chyba - Z-test - Studentův t-test - Maximální pravděpodobnost - Standardní skóre/Z skóre - P-hodnota - Analýza rozptylu
Funkce přežití - Kaplan-Meierův test - Logrankův test - Míra selhání - Modely proporcionálních rizik
Normální (zvonová křivka) - Poissonova - Bernoulliho
Zkreslující proměnná - Pearsonův korelační koeficient součinu a momentu - Korelace pořadí (Spearmanův korelační koeficient pořadí, Kendallův korelační koeficient pořadí tau)
Lineární regrese - Nelineární regrese - Logistická regrese