Klasse merk voor wat het dient, hoe het wordt gebruikt en voorbeelden



de klasse merk, ook bekend als het middelste punt, is de waarde die zich in het midden van een klasse bevindt, die alle waarden vertegenwoordigt die in die categorie zijn. Fundamenteel wordt het klassenkenmerk gebruikt voor de berekening van bepaalde parameters, zoals het rekenkundig gemiddelde of de standaarddeviatie.

Dan is de klassemarkering het middelpunt van elk interval. Deze waarde is ook erg handig om de variantie te vinden van een set gegevens die al in klassen is gegroepeerd, wat ons op zijn beurt in staat stelt om te begrijpen hoe ver van het centrum deze bepaalde gegevens worden gevonden.

index

  • 1 Frequentieverdeling
    • 1.1 Hoeveel lessen te overwegen?
  • 2 Hoe krijg je dat?
    • 2.1 Voorbeeld
  • 3 Waar is het voor??
    • 3.1 Voorbeeld
  • 4 Referenties

Frequentie distributie

Om te begrijpen wat een merk van klassen is, is het concept van frequentieverdeling noodzakelijk. Gegeven een dataset, is een frequentieverdeling een tabel die dergelijke gegevens verdeelt in een aantal categorieën die klassen worden genoemd.

Deze tabel laat zien wat het aantal elementen is dat bij elke klasse hoort; de laatste staat bekend als frequentie.

In deze tabel wordt een deel van de informatie die we verkrijgen uit de gegevens opgeofferd, omdat we in plaats van de individuele waarde van elk element te weten alleen dat het tot die klasse behoort.

Aan de andere kant krijgen we een beter begrip van de gegevensverzameling, omdat op deze manier gevestigde patronen gemakkelijker kunnen worden gewaardeerd, wat de manipulatie van die gegevens vergemakkelijkt..

Hoeveel lessen te overwegen?

Om een ​​frequentieverdeling te maken, moeten we eerst het aantal klassen bepalen dat we willen nemen en de klassenlimieten ervan kiezen.

De keuze van het aantal te volgen klassen moet handig zijn, rekening houdend met het feit dat een klein aantal klassen informatie kan verbergen over de gegevens die we willen bestuderen en een zeer groot aantal te veel gegevens kan genereren die niet noodzakelijkerwijs nuttig zijn.

De factoren waarmee we rekening moeten houden bij het kiezen van het aantal te volgen klassen zijn er verschillende, maar deze vallen op: de eerste is om rekening te houden met hoeveel gegevens we in overweging moeten nemen; de tweede is om te weten welke maat het bereik van de verdeling is (dat wil zeggen, het verschil tussen de grootste en de kleinste waarneming).

Nadat de klassen al zijn gedefinieerd, gaan we verder met het tellen van de gegevens in elke klas. Dit nummer wordt class-frequentie genoemd en wordt aangeduid met fi.

Zoals we eerder al zeiden, hebben we dat een frequentieverdeling de informatie verliest die individueel uit elke data of waarneming komt. Daarom wordt er naar een waarde gezocht die de volledige klasse vertegenwoordigt waartoe deze behoort; deze waarde is het merk van klassen.

Hoe krijg je dat?

Het klassenmerk is de centrale waarde die een klasse vertegenwoordigt. Het wordt verkregen door de limieten van het interval toe te voegen en deze waarde door twee te delen. Dit kunnen we wiskundig als volgt uitdrukken:

Xik= (Onderlimiet + bovenlimiet) / 2.

In deze uitdrukking xik geeft het cijfer van de i ste klasse aan.

voorbeeld

Gegeven de volgende dataset, geef een representatieve frequentieverdeling en verkrijg het bijbehorende classmark.

Omdat de gegevens met de hoogste numerieke waarde 391 zijn en de kleinste 221, hebben we dat het bereik 391 -221 = 170 is.

We zullen 5 klassen kiezen, allemaal met dezelfde grootte. Een manier om de klassen te kiezen is als volgt:

Houd er rekening mee dat elke gegevens zich in een klasse bevinden, ze zijn niet-gekoppeld en hebben dezelfde waarde. Een andere manier om de klassen te kiezen is om de gegevens te beschouwen als onderdeel van een continue variabele, die elke echte waarde zou kunnen bereiken. In dit geval kunnen we klassen van de vorm beschouwen:

205-245, 245-285, 285-325, 325-365, 365-405

Deze manier van groeperen van gegevens kan echter bepaalde ambiguïteiten met grenzen vertonen. Bijvoorbeeld, in het geval van 245, rijst de vraag: tot welke klasse behoort het, tot de eerste of de tweede??

Om deze verwarring te voorkomen, wordt een conventie van extreme punten gemaakt. Op deze manier is de eerste klas het interval (205,245), het tweede (245,285), enzovoort.

Nadat de klassen zijn gedefinieerd, gaan we verder met het berekenen van de frequentie en hebben we de volgende tabel:

Na het verkrijgen van de frequentieverdeling van de gegevens gaan we verder met het vinden van de klassenmerken van elk interval. In feite moeten we:

X1= (205+ 245) / 2 = 225

X2= (245+ 285) / 2 = 265          

X3= (285 + 325) / 2 = 305

X4= (325+ 365) / 2 = 345

X5= (365+ 405) / 2 = 385

We kunnen dit weergeven door de volgende afbeelding:

Waar is het voor??

Zoals eerder vermeld, is het klassenmerk zeer functioneel om het rekenkundig gemiddelde en de variantie van een groep gegevens te vinden die al in verschillende klassen is gegroepeerd.

We kunnen het rekenkundig gemiddelde definiëren als de som van de waarnemingen tussen de steekproefomvang. Vanuit fysiek oogpunt is de interpretatie ervan als het evenwichtspunt van een gegevensverzameling.

Het identificeren van een hele reeks gegevens door een enkel nummer kan riskant zijn, dus we moeten ook rekening houden met het verschil tussen dit punt van evenwicht en de echte gegevens. Deze waarden staan ​​bekend als afwijkingen van het rekenkundig gemiddelde en hiermee willen we bepalen hoeveel het rekenkundig gemiddelde van de gegevens varieert..

De meest gebruikelijke manier om deze waarde te vinden is door de variantie, het gemiddelde van de vierkanten van de afwijkingen van het rekenkundig gemiddelde.

Om het rekenkundig gemiddelde en de variantie van een reeks gegevens gegroepeerd in een klasse te berekenen, gebruiken we respectievelijk de volgende formules:

In deze uitdrukkingen xik  is het i-de klassemerk, fik vertegenwoordigt de overeenkomstige frequentie en k het aantal klassen waarin de gegevens zijn gegroepeerd.

voorbeeld

Met behulp van de gegevens die in het vorige voorbeeld zijn gegeven, kunnen we de gegevens van de frequentieverdelingstabel iets meer uitbreiden. Je krijgt het volgende:

Vervolgens hebben we bij het vervangen van de gegevens in de formule nagelaten dat het rekenkundig gemiddelde is:

De variantie en standaardafwijking zijn:

Hieruit kunnen we concluderen dat de oorspronkelijke gegevens een rekenkundig gemiddelde van 306.6 en een standaarddeviatie van 39.56 hebben.

referenties

  1. Fernandez F. Santiago, Cordoba L. Alejandro, Cordero S. Jose M. Beschrijvende statistiek. Esic Editorial.
  2. Jhonson Richard A.Miller en Freund Waarschijnlijkheid en staatslieden voor ingenieurs. Polarson Education.
  3. Miller I & Freund J. Waarschijnlijkheid en staatslieden voor ingenieurs. Reverte.
  4. Sarabia A. Jose Maria, Pascual Marta. Basiscursus statistiek voor bedrijven
  5. Llinás S. Humberto, Rojas A. Carlos Beschrijvende statistiek en kansverdelingen. Universal del Norte Editorial