Centrale trendmaatregelen voor gegroepeerde gegevens



de maten van centrale neiging van gegroepeerde gegevens Zij worden gebruikt in de statistiek bepaalde gedragingen van een groep verstrekte gegevens beschrijven bijvoorbeeld welke waarde dicht, die het gemiddelde van de verzamelde gegevens, onder andere.

Wanneer een grote hoeveelheid gegevens wordt genomen, is het nuttig om ze te groeperen om ze beter te kunnen ordenen en zo bepaalde maatregelen van centrale tendentie te kunnen berekenen.

Onder de meest gebruikte maten van centrale tendentie zijn het rekenkundig gemiddelde, de mediaan en de modus. Deze cijfers vertellen bepaalde kwaliteiten over de gegevens die in een bepaald experiment zijn verzameld.

Om deze maatregelen te kunnen gebruiken, moet u eerst weten hoe u een gegevensset moet groeperen.

Gegroepeerde gegevens

Om gegevens eerst te groeperen, moet u het bereik van de gegevens berekenen, dat wordt verkregen door de hoogste waarde minus de laagste waarde van de gegevens af te trekken.

Kies vervolgens een getal "k", het aantal klassen waarin u de gegevens wilt groeperen.

We gaan verder met het delen van het bereik tussen "k" om de amplitude van de te groeperen klassen te verkrijgen. Dit aantal is C = R / k.

Ten slotte wordt de groepering gestart, waarvoor een kleiner aantal dan de kleinste waarde van de verkregen gegevens wordt gekozen..

Dit aantal is de ondergrens van de eerste klas. Hieraan wordt toegevoegd C. De verkregen waarde is de bovengrens van de eerste klasse.

Dan wordt C toegevoegd aan deze waarde en wordt de bovengrens van de tweede klasse verkregen. Op deze manier ga je door tot je de bovengrens van de laatste klas hebt bereikt.

Nadat de gegevens zijn gegroepeerd, kunt u doorgaan met het berekenen van het gemiddelde, de mediaan en de mode.

Om te illustreren hoe het rekenkundig gemiddelde, de mediaan en de modus worden berekend, zullen we doorgaan met een voorbeeld.

voorbeeld

Daarom krijgt u bij het groeperen van de gegevens een tabel zoals de volgende:

De 3 belangrijkste centrale tendens meet

Nu gaan we verder met het berekenen van het rekenkundig gemiddelde, de mediaan en de modus. Het bovenstaande voorbeeld zal worden gebruikt om deze procedure te illustreren.

1- Rekenkundig gemiddelde

Het rekenkundig gemiddelde bestaat uit het vermenigvuldigen van elke frequentie met het gemiddelde van het interval. Vervolgens worden al deze resultaten toegevoegd en uiteindelijk gedeeld door de totale gegevens.

Met behulp van het vorige voorbeeld zouden we verkrijgen dat het rekenkundig gemiddelde gelijk is aan:

(4 * 2 + 4 * 4 + 6 * 6 + 4 * 8) / 18 = (8 + 16 + 36 + 32) / 18 = 5,11111

Dit geeft aan dat de gemiddelde waarde van de gegevens in de tabel 5.11111 is.

2- Gemiddeld

Om de mediaan van een dataset te berekenen, worden eerst alle gegevens van de minst tot de hoogste geordend. Er kunnen twee cases worden gepresenteerd:

- Als het gegevensnummer oneven is, is de mediaan de gegevens die zich in het midden bevinden.

- Als het gegevensnummer even is, is de mediaan het gemiddelde van de twee gegevens die nog in het midden staan.

Als het gaat om gegroepeerde gegevens, wordt de berekening van de mediaan op de volgende manier gedaan:

- N / 2 wordt berekend, waarbij N de totale gegevens is.

- Het eerste interval wordt doorzocht waarbij de geaccumuleerde frequentie (de som van de frequenties) groter is dan N / 2 en de onderste limiet van dit interval, Li genaamd, is geselecteerd..

De mediaan wordt gegeven door de volgende formule:

Me = Li + (Ls-Li) * (N / 2 - Geaccumuleerde frequentie vóór Li) / Frequentie van [Li, Ls)

Ls is de bovengrens van het hierboven genoemde bereik.

Als de bovenstaande gegevenstabel wordt gebruikt moet het N / 2 = 18/2 = 9. cumulatieve frequenties 4, 8, 14 en 18 (één voor elke rij van de tabel).

Daarom moet het derde interval worden geselecteerd, omdat de geaccumuleerde frequentie groter is dan N / 2 = 9.

Dus Li = 5 en Ls = 7. Als u de hierboven beschreven formule toepast, moet u:

Me = 5 + (7-5) * (9-8) / 6 = 5 + 2 * 1/6 = 5 + 1/3 = 16/3 ≈ 5.333.

3- Mode

Mode is de waarde die de meeste frequentie heeft tussen alle gegroepeerde gegevens; dat wil zeggen, het is de waarde die de meeste keren in de initiële dataset wordt herhaald.

Wanneer u een zeer grote hoeveelheid gegevens hebt, wordt de volgende formule gebruikt om de modus van de gegroepeerde gegevens te berekenen:

Mo = Li + (Ls-Li) * (frequentie Li - Frequentie L (i-1)) / ((frequentie Li - Frequentie L (i-1)) + (frequentie Li - Frequentie L ( i + 1)))

Het interval [Li, Ls) is het interval waarin de hoogste frequentie wordt gevonden. Voor het voorbeeld in dit artikel hebben we die mode gegeven door:

Mo = + 5 (7-5) * (6-4) / ((6-4) + (6-4)) = 5 + 2 * 2/4 = 5 + 1 = 6.

Een andere formule die wordt gebruikt om een ​​benaderende waarde voor mode te verkrijgen, is de volgende:

Mo = Li + (Ls-Li) * (frequentie L (i + 1)) / (frequentie L (i-1) + frequentie L (i + 1)).

Met deze formule zijn de accounts als volgt:

Mo = 5 + (7-5) * 4 / (4 + 4) = 5 + 2 * 4/8 = 5 + 1 = 6.

referenties

  1. Bellhouse, D. R. (2011). Abraham De Moivre: het podium bepalen voor klassieke waarschijnlijkheid en de toepassingen ervan. CRC Press.
  2. Cifuentes, J.F. (2002). Inleiding tot de waarschijnlijkheidstheorie. Univ Nationaal van Colombia.
  3. Daston, L. (1995). Klassieke kans in de Verlichting. Princeton University Press.
  4. Larson, H.J. (1978). Introductie tot waarschijnlijkheidstheorie en statistische gevolgtrekking. Redactioneel Limusa.
  5. Martel, P. J., & Vegas, F.J. (1996). Kansberekening en wiskundige statistiek: toepassingen in de klinische praktijk en gezondheidsmanagement. Ediciones Díaz de Santos.
  6. Vázquez, A. L., & Ortiz, F. J. (2005). Statistische methoden voor het meten, beschrijven en beheersen van variabiliteit. Ed. Universiteit van Cantabrië.
  7. Vázquez, S.G. (2009). Wiskundehandleiding voor toegang tot de universiteit. Redactiecentrum van studies Ramon Areces SA.