A Kolmogorov-kritérium kritikus értékei. Kolmogorov-Smirnov alkalmassági kritériuma a népesség eloszlásának felmérésének egyik módja. Kritérium használata a normalitás tesztelésére

Kritérium hozzárendelés

A kritérium két disztribúció összehasonlítására szolgál:

a) empirikus elméletivel, például egységes vagy normál;

b) egy tapasztalati eloszlás egy másik empirikus eloszlással.

A kritérium lehetővé teszi, hogy megtalálja azt a pontot, ahol a legnagyobb a két eloszlás közötti halmozott eltérések összege, és felmérheti ennek az eltérésnek a megbízhatóságát.

A kritérium leírása

Ha a módszerben a két eloszlás gyakoriságát hasonlítottuk össze külön az első számjegyre, akkor az első és a második számjegy összegére, majd az első, második és harmadik számjegy összegére stb. Így minden alkalommal összehasonlítjuk az adott kategóriában felhalmozott gyakoriságokat.

Ha a két eloszlás közötti különbség szignifikáns, akkor egy ponton a halmozott gyakoriságok különbsége eléri a kritikus értéket, és a különbségeket statisztikailag szignifikánsnak ismerhetjük fel. Ezt a különbséget a kritériumképlet tartalmazza. Minél nagyobb az empirikus érték, annál jelentősebbek az eltérések.

Hipotézisek

Az eloszlások közötti különbségek megbízhatatlanok (a köztük lévő maximális halmozott különbség pontjából ítélve).

: Az eloszlások közötti különbségek megbízhatóak (a köztük lévő maximális halmozott eltérés pontjából ítélve).

A Kolmogorov-Smirnov kritérium alkalmazásához a következő feltételeknek kell teljesülniük:

1. A mérés intervallum- és arányskálán végezhető el.

2. A mintáknak véletlenszerűnek és függetlennek kell lenniük.

3. Kívánatos, hogy két minta össztérfogata ≥ 50 legyen. A minta méretének növelésével a vizsgálat pontossága növekszik.

4. Az empirikus adatoknak lehetővé kell tenniük bármely jellemző növekvő vagy csökkenő sorrendbe állítását, és szükségszerűen tükrözniük kell annak egyirányú változását. Abban az esetben, ha nehéz betartani az attribútum sorrendjének elvét, jobb a kritérium használata -négyzet.

Ez a kritérium ugyanazon problémák megoldására szolgál, mint a kritérium x és-négyzet. Más szóval, használható az empirikus eloszlás összehasonlítására az elméletivel, vagy két empirikus eloszlás egymással. Ha azonban alkalmazáskor -négyzetben összehasonlítjuk a két eloszlás gyakoriságát, majd ebben a kritériumban az egyes kategóriákra (alternatívára) tartozó halmozott (halmozott) gyakoriságokat hasonlítjuk össze. Sőt, ha két eloszlásban nagynak bizonyul a halmozott gyakoriságok különbsége, akkor a két eloszlás közötti különbség jelentős.

8.12. feladat. Tegyük fel, hogy a kísérletben a pszichológusnak egy hatoldalú kockát kell használnia, amelynek oldalán 1-től 6-ig vannak számok. A kísérlet tisztasága érdekében egy „ideális” kockát kell beszerezni, pl. úgy, hogy kellően sok feldobás esetén minden éle megközelítőleg ugyanannyiszor esne ki. A kihívás az, hogy megtudjuk, hogy egy adott kocka közel lesz-e a tökéleteshez?

Megoldás. Dobjunk kockával 120-szor, és hasonlítsuk össze a kapott tapasztalati eloszlást az elméletivel. Mivel az elméleti eloszlás egyformán valószínű, a megfelelő elméleti gyakoriságok 20. Az empirikus és az elméleti gyakoriságok eloszlását együtt mutatja be a 8.15. táblázat:

A Kolmogorov – Smirnov kritérium szerinti számításhoz számos transzformációt kell végrehajtani a 8.15. táblázat adataival. Ezeket a transzformációkat a 8.16. táblázatban mutatjuk be, és elmagyarázzuk, hogyan érhetők el:

Szimbólum FE a 8.16. táblázatban a halmozott elméleti gyakoriságokat jelöljük. A táblázatban ezeket a következőképpen kapjuk meg: az első elméleti 20-as frekvenciához hozzáadjuk a második, szintén 20-as frekvenciát, így a 20 + 20 = 40 számot kapjuk.A második frekvencia helyére 40 kerül. Ezután a következő elméleti frekvenciát hozzáadjuk a 40-hez, a kapott 60-at a harmadik elméleti frekvencia helyére, és így tovább.

Szimbólum FB a 8.16. táblázatban a kumulált empirikus gyakoriságok láthatók. Kiszámításukhoz az empirikus gyakoriságokat növekvő sorrendbe kell rendezni: 15, 18, 18, 21, 23, 25, majd sorrendben össze kell adni őket. Tehát először az első frekvencia egyenlő 15-tel, hozzáadjuk a második legnagyobb frekvenciát, és a kapott 15 + 18 = 33 összeget a második frekvencia helyére tesszük, majd 18-at hozzáadunk 33-hoz (33 + 18 = 51 ), a kapott 51-es szám kerül a harmadik frekvenciák helyére stb.

Szimbólum FE- FB | a 8.16. táblázatban az elméleti és a tapasztalati gyakoriságok közötti különbség abszolút értékeit oszloponként külön feltüntettük.

Ennek a kritériumnak az empirikus értéke, amelyet a következőképpen jelölünk D Az emp-t a (8.13) képlettel kapjuk meg:

Hogy a számok közé kerüljön FE - FB | keressük meg a maximális számot (esetünkben ez 9), és osszuk el a minta méretével P. A mi esetünkben P= 120 tehát

Ehhez a kritériumhoz a kritikus értékeket tartalmazó táblázat az 1. függelék 13. szám alatt található. Az 1. függelék 13. táblázatából azonban az következik, hogy ha a mintában lévő elemek száma meghaladja a 100-at, akkor az értékek ​A kritikus értékeket a (8.14) képlettel számítjuk ki.

Kolmogorov-Smirnov kritérium. A minta homogenitásának hipotézisének tesztelése

A minta homogenitási hipotézisei olyan hipotézisek, amelyek szerint a szóban forgó minták ugyanabból az általános sokaságból származnak.

Legyen két független minta belőle populációk ismeretlen elméleti eloszlásfüggvényekkel és.

A tesztelt nullhipotézisnek van versengésellenes formája. Feltételezzük, hogy a és függvények folyamatosak, és a becsléshez a statisztikákat használjuk Kolmogorova - Szmirnova.

Kolmogorov-Smirnov kritérium ugyanazt az elképzelést használja, mint Kolmogorov-kritérium. A különbség azonban abban rejlik, hogy a Kolmogorov-próba az empirikus eloszlásfüggvényt hasonlítja össze az elméletivel, míg a Kolmogorov-Smirnov-teszt két empirikus eloszlásfüggvényt.

A Kolmogorov-Smirnov teszt statisztikája a következő:

, (9.1)

ahol és két mintából felépített tapasztalati eloszlásfüggvények térfogatokkal és.

A hipotézist elvetjük, ha a statisztika ténylegesen megfigyelt értéke nagyobb, mint a kritikus, azaz. , és egyébként elfogadják.

Kis mintaméretek esetén a kritérium meghatározott szignifikanciaszintjeinek kritikus értékei speciális táblázatokban találhatók. at (és gyakorlatilag at) a statisztikák eloszlása ​​a statisztika Kolmogorov-eloszlására redukálódik. Ebben az esetben a hipotézist szignifikancia szinten elvetjük, ha a ténylegesen megfigyelt érték nagyobb, mint a kritikus, azaz. , és egyébként elfogadják.

1. példa^ KÉT MINTA EGYSÉGESSÉGÉNEK ELLENŐRZÉSE

Két ellenőrzést végeztek Viszonteladói üzletek az alulsúly azonosítása érdekében. Az eredményeket a táblázat foglalja össze:


^ Intervallum száma

Alulsúlyozási intervallumok, g

Frekvenciák

1. minta

2. minta

1

0 – 10

3

5

2

10 – 20

10

12

3

20 – 30

15

8

4

30 – 40

20

25

5

40 – 50

12

10

6

50 – 60

5

8

7

60 – 70

25

20

8

70 – 80

15

7

9

80 – 90

5

5

Az első minta mérete egyenlő volt, a második pedig -.

Megoldás:

Jelöljük és - az 1-es és 2-es halmozott mintavételi frekvenciákat;
, - empirikus eloszlásfüggvényeik értékei, ill. A feldolgozott eredményeket a táblázat foglalja össze:














10

3

5

0.027

0.050

0.023

20

13

17

0.118

0.170

0.052

30

28

25

0.254

0.250

0.004

40

48

50

0.436

0.500

0.064

50

60

60

0.545

0.600

0.055

60

65

68

0.591

0.680

0.089

70

90

88

0.818

0.880

0.072

80

105

95

0.955

0.950

0.005

90

110

100

1.000

1.000

0.000

A táblázat utolsó oszlopa ezt mutatja. A (9.1) képlet alapján megkapjuk ... A statisztikai táblázatokból ismert, hogy. Mivel ekkor a nullhipotézis elfogadott, azaz. Az ügyfelek alulsúlyát ugyanaz az eloszlási függvény írja le.

^

STATISZTIKAI FÜGGETLENSÉG ÉS TRENDAZONOSÍTÁS


Véletlenszerű adatok elemzésekor gyakran adódnak olyan helyzetek, amikor azt kell kideríteni, hogy a megfigyelések vagy a paraméterekre vonatkozó becslések statisztikailag függetlenek-e, vagy trendnek vannak kitéve. Ez különösen fontos az elemzés során nem stacionárius adatok.

Az ilyen tanulmányokat általában az alapján végzik el terjesztés mentes vagy nem paraméteres módszerek, amelyben nem tesznek feltételezéseket a vizsgált adatok eloszlási függvényével kapcsolatban.
^

Sorozat kritérium


Tekintsük egy valószínűségi változó megfigyelt értékeinek sorozatát, ahol minden megfigyelés két, egymást kizáró osztály valamelyikéhez van rendelve, amelyeket egyszerűen (+) vagy jelölhetünk.
(-). Nézzünk néhány példát:

A példák mindegyikében a következő űrlapok sorozata jön létre:

^ A sorozat azonos típusú megfigyelések sorozata, amely előtt és után ellentétes típusú megfigyelések következnek, vagy egyáltalán nincsenek megfigyelések.

Az adott sorozatban a megfigyelések száma; és a sorozatok száma egyenlő.

Ha egy megfigyelési sorozat ugyanazon valószínűségi változó független kimeneteléből áll, pl. ha az egyes kimenetelek valószínűsége [(+) vagy (-)] megfigyelésről megfigyelésre nem változik, akkor a sorozat sorozatszámának mintaeloszlása ​​egy valószínűségi változó, amelynek átlaga és szórása:

(9.2)

(9.3)

Itt természetesen az eredmények száma (+) és az eredmények száma (-). Egy adott esetben, ha:

. (9.4)

Tegyük fel, hogy van okunk gyanítani egy tendenciát a megfigyelések sorrendjében, pl. okkal feltételezhető, hogy a (+) vagy (-) előfordulási valószínűsége megfigyelésről megfigyelésre változik. A trend megléte a következőképpen igazolható. Tegyük fel, hogy nincs trend nullhipotézisként, azaz. tegyük fel, hogy a megfigyelések ugyanazon valószínűségi változó független eredményei. Ezután a hipotézis bármilyen szükséges szignifikanciaszintű teszteléséhez össze kell hasonlítani a megfigyelt sorozatszámot a hipotézis elfogadási tartomány határaival egyenlő és ahol.

Ha a megfigyelt sorozatok száma kívül esik a hipotézis elfogadási tartományán, akkor a nullhipotézist szignifikanciaszinttel el kell utasítani. Ellenkező esetben a nullhipotézis elfogadható.

2. példa^ A SOROZAT KRITÉRIUMÁNAK ALKALMAZÁSA

A független megfigyelések sorozata létezik:


5.5

5.1

5.7

5.2

4.8

5.7

5.0

6.5

5.4

5.8

6.8

6.6

4.9

5.4

5.9

5.4

6.8

5.8

6.9

5.5

Ellenőrizzük a megfigyelések függetlenségét úgy, hogy megszámoljuk a sorozatok számát a megfigyelések mediánnal való összehasonlításával kapott sorozatban. Alkalmazzuk a kritériumot a szignifikancia szinttel.

Az adatok elemzéséből azt találjuk, hogy az érték a medián. Ezután bevezetjük a (+) for, (-) for jelölést. Tehát kapjuk:

Példánkban a hipotézis elfogadásának területe a következő:

.

Statisztikai táblázatokkal találjuk meg. Mivel

A gyakorlatban a χ 2 kritérium mellett gyakran alkalmazzák a Kolmogorov-kritériumot, amelyben az empirikus eloszlásfüggvény és a megfelelő elméleti eloszlásfüggvény közötti különbség abszolút értékének maximális értékét tekintik az eltérés mértékének. az elméleti és empirikus eloszlásokat

a Kolmogorov-teszt statisztikájának nevezik.

Az α szignifikanciaszint beállításával meg lehet találni a megfelelő kritikus értéket

A táblázat a Kolmogorov-kritérium kritikus értékeit mutatja néhány α-ra.

4.2. táblázat.

A Kolmogorov-kritérium alkalmazási sémája

1.Készítsen egy empirikus eloszlásfüggvényt és egy feltételezett elméleti eloszlásfüggvényt F (x).

2. Meghatározzuk a Kolmogorov-statisztikát D - az elméleti és tapasztalati eloszlás, valamint az érték közötti eltérés mértékét.

3. Ha a számított λ érték nagyobb, mint a kritikus érték, akkor a H 0 nullhipotézis, hogy az X valószínűségi változó adott törvény elosztása elutasításra kerül.

Ha, akkor úgy gondoljuk, hogy a H 0 hipotézis nem mond ellent a kísérleti adatoknak.

Példa. A Kolmogorov-kritériumot használva α = 0,05 szignifikancia szinten teszteljük azt a H 0 hipotézist, hogy az X valószínűségi változónak - a vállalat dolgozóinak outputja - normális eloszlási törvénye van.

Megoldás... 1. Készítsünk empirikus és elméleti eloszlásfüggvényt.

Az empirikus eloszlásfüggvényt a relatív halmozott gyakoriságok szerint ábrázoljuk.

A képlet alapján megszerkesztjük az elméleti eloszlásfüggvényt

ahol

A számítási eredményeket a táblázat foglalja össze:

4.3. táblázat.

3. kérdés

λ - Kolmogorov-Smirnov teszt

Kritérium hozzárendelés

Kritérium λ két disztribúcióra tervezték:

a) empirikus az elméletivel pl. egységes vagy normál;

b) egy empirikus megosztani mással empirikus terjesztés.

A kritérium lehetővé teszi, hogy megtalálja azt a pontot, ahol a legnagyobb a két eloszlás közötti halmozott eltérések összege, és felmérheti ennek az eltérésnek a megbízhatóságát.

A kritérium leírása

Ha a χ 2 módszerben kategóriánként külön-külön hasonlítottuk össze a két eloszlás gyakoriságát, akkor itt először az első számjegyre, majd az első és a második számjegy összegére, majd az első számjegyére hasonlítjuk össze a gyakoriságokat, második és harmadik számjegy stb. Így minden alkalommal összehasonlítjuk az adott kategóriában felhalmozott frekvenciákat.

Ha a két eloszlás közötti különbség szignifikáns, akkor egy ponton a halmozott gyakoriságok különbsége eléri a kritikus értéket, és a különbségeket statisztikailag szignifikánsnak ismerhetjük fel. A kritériumképletben λ ez a különbség benne van. Minél nagyobb az empirikus érték λ , annál jelentősebbek a különbségek.

Hipotézisek -

H 0: A két eloszlás közötti különbség nem szignifikáns (a köztük lévő legnagyobb halmozott különbség pontjából ítélve).

H 1: A két eloszlás közötti különbség szignifikáns (a köztük lévő legnagyobb halmozott különbség pontjából ítélve).

Grafikus ábrázolás kritérium

Szemléltetésképpen nézzük meg a sárga (4. sz.) szín eloszlását M. Luscher 8 szín tesztjében. Ha az alanyok véletlenszerűen választottak színeket, akkor a sárga, mint az összes többi, ugyanolyan nagy valószínűséggel elfoglalhatja a választott 8 pozíció bármelyikét. A gyakorlatban azonban a legtöbb alany ezt a színt, a „várakozás és remény színét” helyezi a sor tetejére.

ábrán. A 4,9 oszlop a sárga 8 találatának relatív gyakoriságát mutatja először az 1. pozícióban (az első bal oszlopban), majd az 1. és 2. pozícióban (a második oszlopban), majd az 1., 2. és 3. pozícióban és így tovább. látni, hogy a rudak magassága folyamatosan növekszik, mivel tükrözik az adott pozícióra felhalmozott relatív frekvenciákat. Például a 3. pozícióban lévő oszlop magassága 0,51. Ez azt jelenti, hogy az alanyok 51%-a az első három pozícióba helyezte a sárgát.

8 A relatív gyakoriság vagy gyakoriság a megfigyelések teljes számához viszonyított gyakoriság; ebben az esetben a sárga szín eltalálási gyakorisága egy adott pozícióban, az alanyok számára vonatkoztatva. Például a sárga szín eltalálásának gyakorisága az 1. pozícióban ƒ = 24; az alanyok száma n = 102; relatív gyakoriság ƒ * = ƒ / n = O, 235.

ábra szaggatott vonala. 4,9 pont van összekötve, ami azt a felhalmozott frekvenciát tükrözi, amely akkor figyelhető meg, ha a sárga színnel egyenlő valószínűséggel eltalálja mind a 8 pozíciót. A folytonos vonalak az empirikus és az elméleti relatív gyakoriságok közötti eltéréseket jelzik. Ezeket az eltéréseket a következővel jelöljük d.

4.9. ábra... Összehasonlítások a λ-kritériumban: a nyilak az egyes kategóriákra vonatkozó relatív gyakoriságok tapasztalati és elméleti halmozódásai közötti eltéréseket jelölik

ábrán látható maximális eltérés. 4,9 jelöléssel d max A színnek ez a harmadik pozíciója az a fordulópont, amely meghatározza, hogy ez az empirikus eloszlás lényegesen eltér-e az egységestől. Ezt az 1. példa alapján ellenőrizzük.

A kritérium korlátaiλ

1. A kritériumok megkövetelik, hogy a minta elég nagy legyen. Két empirikus eloszlás összehasonlításakor szükséges, hogy n 1,2 > 50. Az empirikus eloszlás összehasonlítása az elméletivel néha megengedett, ha n > 5 (Van der Waerden B.L., 1960; Gubler E.V., 1978).

2. A számjegyeket bármely előjel növekvő vagy csökkenő sorrendjében kell rendezni. Szükségszerűen tükrözniük kell valami egyirányú változást benne. Elbocsátásnak vehetjük például a hét napjait, a terápia utáni 1., 2., 3. hónapot, testhőmérséklet emelkedést, elégtelenség érzet növekedését stb. Ugyanakkor, ha vegyük azokat a kisüléseket, amelyekről véletlenül kiderült, hogy sorakoznak egy adott sorrendben, akkor a frekvenciák halmozódása a kisülések véletlenszerű szomszédságának csak ezt az elemét fogja tükrözni. Például, ha Heckhausen módszerében hat ingerképet különböző sorrendben mutatunk be különböző alanyoknak, akkor nincs jogunk beszélni a reakciók halmozódásáról a szabványkészlet 1. képéről a 2. képre való átmenet során stb. Nem beszélhetünk egy jellemző egyirányú változásáról, amikor a „születési sorrend”, „nemzetiség”, „megszerzett végzettség sajátossága” stb. kategóriákat hasonlítjuk össze. Ezek az adatok nominatív skálák: nem mutatnak egyértelmű egyirányú változást a tulajdonságban.

A frekvenciákat tehát nem halmozhatjuk fel kisülésekkel, amelyek csak minőségileg különböznek egymástól, és nem jelentenek sorrendi skálát. Minden olyan esetben, amikor a számjegyek a kategória egyetlen jellemzőjének sem növekvő, sem csökkenő sorrendben vannak, a χ 2 módszert kell alkalmazni. .

1. példa:Az empirikus és elméleti eloszlás összehasonlítása

Egészséges férfiakból, műszaki és katonai-műszaki egyetemi hallgatókból álló, 19 és 22 év közötti, 20 éves átlagéletkorú mintán a Luscher-tesztet 8 színű változatban végezték el. Megállapítást nyert, hogy az alanyok gyakrabban preferálják a sárga színt, mint elutasítják (4.16. táblázat). Vitatható-e, hogy a sárga szín eloszlása ​​8 pozícióban egészséges alanyokban eltér az egyenletes eloszlástól?

4.16. táblázat

Sárga empirikus találati arány mind a 8 pozícióban (n = 102)

Sárga pozíciók

Empirikus frekvenciák

Fogalmazzuk meg a hipotéziseket.

H 0: A sárga empirikus eloszlása ​​a nyolc pozícióban nem tér el az egyenletes eloszlástól.

H 1: A sárga empirikus eloszlása ​​a nyolc pozícióban eltér az egyenletes eloszlástól.

Most kezdjük el a számításokat, fokozatosan töltve ki az eredményeket a λ kritérium kiszámításának táblázatával . Jobb az összes műveletet a táblázat szerint követni. 4.17, akkor tisztábbak lesznek.

Írjuk be a táblázatba a számjegyek nevét (számait) és a hozzájuk tartozó empirikus gyakoriságokat (4.17. táblázat első oszlopa).

Ezután kiszámítjuk a tapasztalati gyakoriságokat ƒ * a következő képlettel:

ƒ* j= ƒ*/ n

ahol f j - a sárga szín eltalálásának gyakorisága az adott pozícióban; n a megfigyelések teljes száma;

j - pozíciószám sorrendben.

Írjuk fel az eredményeket a második oszlopba (lásd 4.17. táblázat).

Most ki kell számítanunk a felhalmozott empirikus gyakoriságokat ∑ƒ*. Ehhez összefoglaljuk az ƒ * empirikus gyakoriságait. Például az 1. kategória esetében a kumulált tapasztalati gyakoriság megegyezik az 1. kategória tapasztalati gyakoriságával, Eƒ * 1 = 0,235 9.

A 2. számjegynél a kumulált tapasztalati gyakoriság az 1. és 2. számjegy tapasztalati gyakoriságának összege lesz:

Eƒ * 1 + 2 = O, 235 + 0,147 = 0,382

A 3. számjegynél a kumulált tapasztalati gyakoriság az 1., 2. és 3. számjegy tapasztalati gyakoriságának összege lesz:

Eƒ * 1 + 2 + 3 = 0,235 + 0,147 + 0,128 = 0,510

Látjuk, hogy a feladat egyszerűsíthető úgy, hogy az előző kisülés halmozott tapasztalati gyakoriságát összegezzük ennek a kisülésnek az empirikus gyakoriságával, például a 4. kategória esetében:

Eƒ * 1 + 2 + 3 + 4 = 0,510 + 0,078 = O, 588

Írjuk be ennek a munkának az eredményét a harmadik oszlopba.

Most össze kell hasonlítanunk a felhalmozott empirikus gyakoriságokat a felhalmozott elméleti gyakoriságokkal. Az 1. kategória esetében az elméleti gyakoriságot a következő képlet határozza meg:

f* elmélet = 1/k

9 Az összes képletet a diszkrét, egész számokkal kifejezhető jellemzőkre adjuk meg, például: sorszám, tantárgyak száma, egy csoport mennyiségi összetétele stb.

ahol k - a bitek száma (jelen esetben a színpozíciók).

A kérdéses példához:

f * elmélet =1/8=0,125

Ez az elméleti frekvencia mind a 8 számjegyre vonatkozik. Valójában annak a valószínűsége, hogy véletlenszerű kiválasztással mind a 8 pozícióban sárga (vagy bármilyen más) színt találunk, 1/8, azaz. 0,125.

Az egyes kisülésekre felhalmozott elméleti frekvenciákat összegzéssel határozzuk meg.

Az 1. kategória esetében a halmozott elméleti gyakoriság megegyezik a kisülésbe való belépés elméleti gyakoriságával:

f *t1 =0,125

A 2. számjegynél a halmozott elméleti frekvencia az 1. és 2. számjegy elméleti frekvenciáinak összege:

f * t1 + 2 =0,125+0,125=0,250

A 3. kategória esetében a halmozott elméleti gyakoriság az előző kategóriába halmozott elméleti gyakoriság összege ennek a kategóriának az elméleti gyakoriságával:

f * t1 + 2 + 3 =0,250+0,125=0,375

Meghatározhatja az elméleti felhalmozott frekvenciákat és szorozva:

S f * T j = f * elmélet * j

ahol f * elmélet - elméleti gyakoriság;

j a bit sorszáma.

Írjuk be a számított halmozott elméleti gyakoriságokat a táblázat negyedik oszlopába (4.17. táblázat).

Most már csak az empirikus és az elméleti halmozott frekvenciák közötti különbségek kiszámítása (3. és 4. oszlop). Az ötödik oszlop ezeknek a különbségeknek az abszolút értékét rögzíti, jelöléssel d.

Határozzuk meg az 5. oszloppal, hogy a különbség abszolút értékei közül melyik a legnagyobb. Ennek neve d max. Ebben az esetben d max = 0,135.

Most a Tab-hoz kell fordulnunk. X 1. számú melléklet a kritikus értékek meghatározásához d max n = 102-nél.

4.17. táblázat

A kritérium számítása a sárga választások egyenletes eloszlású (n = 102) eloszlásának összehasonlításakor

Sárga pozíció

Empirikus gyakoriság

Empirikus gyakoriság

Akkumulált tapasztalati gyakoriság

Akkumulált elméleti frekvencia

Különbség

Ebben az esetben tehát

Nyilvánvaló, hogy minél jobban eltérnek az eloszlások, annál nagyobbak a különbségek a felhalmozott frekvenciákban. Ezért nem lesz nehéz számunkra a jelentős és jelentéktelen zónákat a megfelelő tengely mentén elosztani:

d emp - d kr

Válasz: De p = 0,05-nél el kell utasítani. A sárga eloszlása ​​a nyolc pozícióban eltér az egyenletes eloszlástól. Az összes végrehajtott műveletet algoritmus formájában ábrázoljuk

ALGORITMUS 14

A különbség abszolút értékének kiszámításad empirikus és egyenletes eloszlás között

1. Írja be v a számjegyek és a megfelelő tapasztalati gyakoriságok nevének táblázata (első oszlop).

ƒ * emp = ƒ emp /n

ahol ƒ emp- tapasztalati gyakoriság erre a kategóriára vonatkozóan;

P- a megfigyelések teljes száma.

Írja be az eredményeket a második oszlopba.

f* j=∑ f* j -1 + f* j

ahol f* j -1

j a bit sorszáma;

f * j: - az adott j-ro rang empirikus gyakorisága.

Írja be az eredményeket a táblázat harmadik oszlopába.

f*Tj=∑ f*Tj -1 + f*Tj

ahol =∑ f*Tj -1 - a korábbi kisülésekben felhalmozott elméleti gyakoriság;

j a bit sorszáma;

ƒ * t j: - az adott kisülés elméleti gyakorisága. Írja be az eredményeket a táblázat harmadik oszlopába.

5. Számítsa ki az empirikus és elméleti halmozott frekvenciák közötti különbségeket minden egyes számjegyre (a 3. és 4. oszlop értékei között).

6. Írja be az ötödik oszlopba a kapott különbségek abszolút értékét, előjelük nélkül! Jelölje be őket d.

7. Határozza meg a különbség legnagyobb abszolút értékét az ötödik oszlopból - d max .

8. táblázat szerint X Az 1. függelék kritikus értékek meghatározása vagy kiszámítása d max adott számú megfigyeléshez n.

Ha d max egyenlő a kritikus értékkel d vagy meghaladja azt, az eloszlások közötti különbségek jelentősek.

2. példa: kettő egyezéseempirikus eloszlások

Érdekes összevetni az előző példában kapott adatokat X. Klar 800 alanyra kiterjedő felmérésének adataival (Klar H., 1974, 67. o.). X. Clar kimutatta, hogy a sárga az egyetlen szín, amelynek 8 pozíción belüli eloszlása ​​nem különbözik az egységestől. Az összehasonlításhoz a χ 2-t használta . Az általa kapott empirikus gyakoriságokat a táblázat tartalmazza. 4.18.

4.18. táblázat

A sárga ütés empirikus gyakorisága mind a 8 pozícióban X. Klara tanulmányában (Klar H., 1974 nyomán) (n = 800)

Sárga színű számjegyek pozíciói

Empirikus frekvenciák

Fogalmazzuk meg a hipotéziseket.

H 0: A sárga empirikus eloszlása ​​8 pozícióra a hazai mintában és az X mintában. Clara nem tér el.

H 1: A sárga empirikus eloszlása ​​8 pozícióra a hazai mintában és az X mintában. Clara különbözik egymástól.

Mivel ebben az esetben az egyes kategóriák halmozott empirikus gyakoriságait fogjuk összehasonlítani, nem érdekelnek bennünket az elméleti gyakoriságok.

Minden számítást a 15. algoritmus szerint kell elvégezni a táblázatban.

ALGORITMUS 15

A λ kritérium számításaamikor két empirikus eloszlást hasonlítunk össze

1. Írja be a táblázatba az 1. eloszlásban (első oszlop) és a 2. eloszlásban (második oszlop) kapott számjegyek nevét és a megfelelő tapasztalati gyakoriságokat!

ƒ * e = ƒ e /n 1

ahol ƒ uh

n 1 [- megfigyelések száma a mintában.

Írja be a tapasztalati eloszlási gyakoriságokat 1 a harmadik oszlopba.

ƒ * e = ƒ e /n 2

ahol ƒ uh- tapasztalati gyakoriság egy adott kategóriában;

n 2 - a megfigyelések száma a 2. mintában.

Írja be a 2. tapasztalati eloszlási gyakoriságokat a táblázat negyedik oszlopába.

∑ƒ* j =∑ƒ* j -1 +ƒ* j

ahol ∑ƒ* j -1 - az előző kisülésekben felhalmozott gyakoriság;

j - a kategória sorszáma;

ƒ* j -1 - ennek a kisülésnek a gyakorisága.

Jegyezze fel az eredményeket az ötödik oszlopba.

7. Határozza meg a hetedik oszlopból a különbség legnagyobb abszolút értékét!

ahol n 1 - megfigyelések száma az első mintában;

n 2 - a megfigyelések száma a második mintában.

9. táblázat szerint XI 1. függelék annak meghatározására, hogy a statisztikai szignifikancia melyik szintjének felel meg a kapott λ érték .

Ha λ emp > 1,36, az eloszlások közötti különbségek jelentősek.

A minták sorrendje tetszőlegesen megválasztható, mivel a köztük lévő különbségeket a különbségek abszolút értékével becsüljük meg. Esetünkben elsőnek a hazai, másodiknak a Clara mintát fogjuk tekinteni.

4.19. táblázat

A kritérium számítása empirikus eloszlások összehasonlításakor

sárga a hazai mintában (n1 = 102)

és a minta Clara (n2 =: 800)

Sárga pozíció

Empirikus frekvenciák

Empirikus frekvenciák

Felhalmozott empirikus adatok

Különbség

∑ƒ * 1 - ∑ƒ * 2

∑ƒ * 1

∑ƒ * 2

A felhalmozott empirikus frekvenciák közötti maximális különbség 0,118, és a második számjegyre esik.

A 15. algoritmus 8. pontjával összhangban kiszámítjuk a λ értékét :

táblázat szerint XI. 1. függelék határozza meg a statisztikai szintet
a kapott érték szignifikanciája: p = 0,16:

Az érthetőség kedvéért építsünk fel egy jelentőségtengelyt.

A tengelyen az elfogadott szignifikanciaszinteknek megfelelő λ kritikus értékei láthatók: λ 0,05 = 1,36, λ 0,01 = 1,63.

A szignifikancia zóna jobbra, 1,63-tól és tovább, a jelentéktelenségi zóna balra 1,36-tól alacsonyabb értékekig terjed.

λ emp< λ кр

Válasz: De ez elfogadott. A sárga empirikus eloszlása ​​a hazai mintában és a X. Klára mintában 8 pozícióban egybeesik. Így a sárga eloszlása ​​a két mintában nem különbözik, ugyanakkor eltérően korrelál az egyenletes eloszlással: Klárában nem találtunk eltérést az egyenletes eloszlástól, 8 hazai mintában pedig eltérést ( p<0,05). Возможно, картину могло бы прояснить применение другого метода?

E.V. Gubler (1978) azt javasolta, hogy a λ-kritérium használatát a φ *-kritériummal kombinálják (anguláris Fisher-transzformáció).

A λ és φ * módszerek kombinálásának ezekről a lehetőségeiről a következő előadásban lesz szó.

.5. Algoritmus az eloszlások összehasonlítására szolgáló kritérium kiválasztásához

Ez a kritérium azt is lehetővé teszi, hogy felmérjük a két minta közötti különbségek jelentőségét, beleértve annak lehetséges felhasználását

Ez a kritérium azt is lehetővé teszi, hogy felmérjük a két minta közötti különbségek jelentőségét, beleértve az empirikus és az elméleti eloszlás összehasonlítását is.

A kritérium lehetővé teszi, hogy megtaláljuk azt a pontot, ahol a két eloszlás közötti eltérések halmozott gyakoriságának összege a legnagyobb, és felmérjük ennek az eltérésnek a megbízhatóságát. Nullhipotézis H 0 = (a két eloszlás közötti különbség megbízhatatlan (a köztük lévő maximális halmozott eltérés pontjából ítélve)).

Sematikusan a Kolmogorov-Smirnov-kritérium alkalmazására szolgáló algoritmus a következőképpen ábrázolható:

Illusztráljuk egy példán a Kolmogorov-Smirnov kritérium használatát.

A tanulók kreatív tevékenységének vizsgálata során az eredményeket a kísérleti és a kontrollcsoportra kaptuk (lásd a táblázatot). Jelentősek a különbségek a kontroll és a kezelési csoport között?

Az asszimilációs szint

Gyakoriság a kísérleti csoportban

Gyakoriság a kontrollcsoportban

172 fő

120 ember

Hozzávetőleges

36 fő

49 fő

Rossz

15 fő

36 fő

Minta nagysága

n 1 = 172 + 36 + 15 = 223

n 2 = 120 + 49 + 36 = 205

A relatív gyakoriságok kiszámítása f , egyenlő a frekvenciák és a minta méretével való osztásának hányadosával a két rendelkezésre álló minta esetében.

Ennek eredményeként az eredeti táblázat így fog kinézni:

A kísérleti csoport relatív gyakorisága ( f exp)

A kontrollcsoport relatív gyakorisága ( f számláló)

Frekvenciakülönbség modul | f exp - f számláló |

172/223≈ 0.77

120/205≈ 0.59

0.18

36/223≈ 0.16

49/205≈ 0.24

0.08

15/223≈ 0.07

36/205≈ 0.17

A kapott relatív frekvenciák különbségeinek modulusai közül kiválasztjuk a legnagyobb modulust, amelyet jelölünk d max ... A vizsgált példában tehát 0,18> 0,1> 0,08 d max = 0,18.

A λ emp kritérium tapasztalati értékét a következő képlet segítségével határozzuk meg:

Annak megállapításához, hogy a vizsgált kritérium hasonló a két csoport között, hasonlítsuk össze a kritérium kísérleti értékét a szignifikanciaszint alapján speciális táblázatból meghatározott kritikus értékével. Nullhipotézisként fogadjuk el azt az állítást, hogy az összehasonlított csoportok az asszimiláció szintjében jelentéktelen mértékben különböznek egymástól. Ebben az esetben a nullhipotézist el kell fogadni, ha a kritérium megfigyelt értéke nem haladja meg a kritikus értékét.

Figyelembe véve, hogy a táblázat szerint meghatározzuk a kritérium kritikus értékét: λ cr(0,05)=1,36.

Így λ emp = 1,86> 1,36 = λ cr. Következésképpen a nullhipotézist elvetjük, és a csoportok szignifikánsan különböznek a figyelembe vett kritérium szerint.

Vegye figyelembe, hogy a vizsgált minták térfogatának elég nagynak kell lennie: n 1 ≥50, n 2 ≥50.



 
Cikkek tovább téma:
Az alkalmazottak részére kiadott bizonyítványok nyilvántartási naplója
Az alkalmazottak számára kiállított igazolások nyilvántartása megkönnyíti a szükséges információk megtalálását, és lehetővé teszi a statisztikai adatok kiválasztását. Olvassa el a helyes kitöltésről és vezetésről, töltsön le egy mintát Olvassa el cikkünket: Anyakönyvi napló kitöltése és vezetése
Egyszerűsített adózási rendszer (USN, USN, egyszerűsített) Új cég átállása USN-re
Az egyszerűsített adózási rendszert választó adózók mentesülnek az áfa-, a jövedelemadó- és az ingatlanadó alól, néhány, az Adótörvénykönyvben meghatározott kivételtől eltekintve. Ezen adók helyett az egyszerűsített emberek csak egyet fizetnek
Az alkalmazottak részére kiadott bizonyítványok nyilvántartási naplója
Tisztelt kollégák, „üres" folyóiratot adtunk ki - üres fejlécekkel. Ha úgy dönt, hogy naplót indít / nyilvántartásba veszi az akciós nehezen fellelhető dokumentumokat, eseményeket, megvásárolhatja „üres" folyóiratunkat és kitöltheti a "sapkák"
Sztálin temetése: híradók és ritka fényképek Búcsú a vezértől
Enciklopédiai YouTube 1/2✪ Tragédia Sztálin temetésén. Hogyan haltak meg az emberek a tömegben ✪ Sztálin második temetése 1. rész Feliratok Búcsúpárt és kormányvezetők I. V. Sztálin koporsójánál. A Szakszervezetek Háza Oszlopterme 1953. március 6-án. L.P. B arca