Slik beregner du medianen av grupperte data

 

1.

Grupper datapunkter i intervaller, hvis de ikke allerede er. Bestem hvilket intervall som skal inneholde median datapunktet.

For instruksjonsformål, vurder datasett (1,2,4,5,6,7,7,7,9). Medianen her er 6. Du kan gruppere settet i intervaller med bredde 4. For eksempel kan frekvensfordelingen være for eksempel ,
1-4: 3
5-8: 5
9-12: 1
I ugrupperte data er medianen klart i 5-8 kategorien. Du kan fortell det selv uten å se det opprinnelige datasettet.

2.

Beregn forskjellen i antall datapunkter opp til midtintervallet og halvparten av det totale antall datapunkter.

For eksempelet ovenfor er dette lik 9/2 - 3 = 1.5. Dette anslår hvor langt i mellomintervallet skal ligge.

3.

Del opp med antall poeng i mellomintervallet.

Fortsetter med eksempelet, 1.5 / 5 = 0.3. Dette gir en andel for hvor langt inn i mellomintervallet medianen er.

< p> 4.

Multipliser med bredden på mellomintervallet.

Fortsetter med eksemplet, 0,3 x 4 = 1,2. Den omdanner andelen i intervallet til en faktisk økning av data.

5.

Legg det ovennevnte resultatet til verdien mellom mellomintervallet og intervallet under.

Siden cutoff mellom mellomintervallet og intervallet under er 4,5, gir dette deg 4,5 + 1,2 = 5,7, som du kan runde opp til 6, det riktige svaret.

Tips og varsler

  • Effektivt er beregningen ovenfor den samme som ved bruk av formelen L + (n / 2 - c) / fxw, hvor L er tallet mellom mellom- og neste nedre intervall , n er det totale antall datapunkter, c er det kumulative antallet poeng under midtintervallet, f er antall datapunkter i midtintervallet og w er dens bredde.
  • Medianen er midtpunktet til et bestilt datasett. For eksempel har setet (2,4,7,9,10) en median på 7. Gruppert data blir klumpet i kategorier, med den nøyaktige detalj av hvert datapunkt som er tapt. Derfor kan den eksakte medianen ikke være kjent fra grupperte data alene. Men hvis du vet antall datapunkter i hvert intervall, kan du fortelle hva som er 'midtintervallet', det vil si den som inneholder datapunktet som er medianen. Du kan viderefinere estimatet av medianpunktet ved hjelp av en formel, basert på antagelsen om at midtintervallets datapunkter er jevnt fordelt.