Cramér's V

Ve statistice je Cramérův V (někdy označovaný jako Cramérovo phi nebo Cramersovo C a označovaný jako φc) populární[citace potřebná] míra asociace mezi dvěma nominálními proměnnými, která udává hodnotu mezi 0 a +1 (včetně). Je založena na Pearsonově chí-kvadrát statistice a byla publikována Haraldem Cramérem v roce 1946.

φc je vzájemná korelace dvou diskrétních proměnných a lze ji použít u proměnných, které mají dvě nebo více úrovní. φc je symetrická míra, nezáleží na tom, kterou proměnnou umístíme do sloupců a kterou do řádků. Nezáleží ani na pořadí řádků/sloupců, takže φc lze použít s nominálními nebo vyššími typy dat (uspořádanými, číselnými atd.).

Cramérův V lze použít i pro modely chí-kvadrát dobré shody, pokud existuje tabulka 1×k (např.: r=1). V tomto případě se k bere jako počet volitelných výsledků a funguje jako míra tendence k jednomu výsledku.

Mohlo by vás zajímat: Cramérovo–von Misesovo kritérium

Cramérova V se pohybuje od 0 (což odpovídá nulové asociaci mezi proměnnými) do 1 (úplná asociace) a může dosáhnout hodnoty 1 pouze tehdy, když se obě proměnné navzájem rovnají.

φc2 je střední kvadratická kanonická korelace mezi proměnnými[citace potřebná].

V případě kontingenční tabulky 2×2 se Cramérovo V rovná koeficientu Phi.

Všimněte si, že vzhledem k tomu, že hodnoty chí-kvadrátu mají tendenci růst s počtem buněk, čím větší je rozdíl mezi r (řádky) a c (sloupce), tím větší je pravděpodobnost, že φc bude mít tendenci k hodnotě 1, aniž by existoval silný důkaz významné korelace.[potřebná citace]

Cramérův V se vypočítá jako druhá odmocnina statistiky chí-kvadrát vydělená velikostí vzorku a délkou minimální dimenze (k je menší z počtu řádků r nebo sloupců c).

Vzorec pro koeficient φc je následující:

Hodnota p pro významnost φc je stejná, jaká se vypočítá pomocí Pearsonova chí-kvadrát testu [citace potřebná].

Vzorec pro rozptyl φc je znám.

Na rozdíl od kontingenční tabulky je hodnota V relativně nezávislá na počtu sloupců nebo řádků.

Další míry korelace pro nominální data:

Průměr (aritmetický, geometrický) - Medián - Modus - Výkon - Rozptyl - Směrodatná odchylka

Testování hypotéz - Významnost - Nulová hypotéza / Alternativní hypotéza - Chyba - Z-test - Studentův t-test - Maximální pravděpodobnost - Standardní skóre/Z skóre - P-hodnota - Analýza rozptylu

Funkce přežití - Kaplan-Meierův test - Logrankův test - Míra selhání - Modely proporcionálních rizik

Normální (zvonová křivka) - Poissonova - Bernoulliho

Zkreslující proměnná - Pearsonův korelační koeficient součinu a momentu - Korelace pořadí (Spearmanův korelační koeficient pořadí, Kendallův korelační koeficient pořadí tau)

Lineární regrese - Nelineární regrese - Logistická regrese