Steel-en-blad weergave

A-stam en blad weergave is van een inrichting voor het presenteren van kwantitatieve gegevens in grafische vorm, vergelijkbaar met een histogram, om te helpen bij het visualiseren van de vorm van een verdeling. Ze geëvolueerd van Arthur Bowley het werk in de vroege jaren 1900, en zijn waardevolle instrumenten bij exploratieve data-analyse. Stemplots werd vaker gebruikt in de jaren 1980 na de publicatie van het boek van John Tukey op verkennende analyse van gegevens in 1977. De populariteit in die jaren is toe te schrijven aan hun gebruik van monospaced typografische stijl die manier konden computertechnologie van de tijd om gemakkelijk te produceren de graphics. Superieure grafische mogelijkheden van moderne computers 'hebben betekend deze technieken worden minder vaak gebruikt.

Een stam-en-blad weergave wordt vaak een stemplot, maar de laatste term verwijst vaak naar een ander type grafiek. Een eenvoudige stam perceel kan verwijzen naar het uitzetten van een matrix van de y-waarden op een gemeenschappelijke x-as, en het identificeren van de gemeenschappelijke x-waarde met een verticale lijn, en de individuele y-waarden met symbolen op de lijn.

Unlike histogrammen, stam-en-leaf displays aan de originele gegevens ten minste twee significante cijfers, en zet de gegevens om, waardoor de overgang naar het verlichten orde-inferentie en niet-parametrische statistiek.

Een basis steel-en-blad weergave bevat twee kolommen van elkaar gescheiden door een verticale lijn. De linkerkolom bevat de stengels en de rechterkolom bevat de bladeren.

De bouw van een steel-en-blad weergave

Een steel-en-blad scherm te bouwen, moet de opmerkingen eerst gesorteerd worden in oplopende volgorde: dit kan het gemakkelijkst worden gedaan als het werken met de hand door de aanleg van een ontwerp van de steel-en-blad weergave met de bladeren ongesorteerd, dan is het sorteren van de laat aan de uiteindelijke steel-en-blad weergave te produceren. Hier is de gesorteerde verzameling van gegevenswaarden die worden gebruikt in het volgende voorbeeld:

Vervolgens moet worden vastgesteld wat de stengels zal vertegenwoordigen en wat de bladeren zal vertegenwoordigen. Gewoonlijk bevat het blad het laatste cijfer van het nummer en de steel bevat alle andere cijfers. Bij zeer grote aantallen kunnen de datawaarden worden afgerond op een bepaalde plaats waarde die wordt gebruikt voor de blaadjes. De resterende cijfers links van de afgeronde plaatswaarde worden gebruikt als de stengel.

In dit voorbeeld is het blad is de plaats die de steel de rest van het getal vertegenwoordigen.

De steel-en-leaf display is getekend met twee kolommen gescheiden door een verticale lijn. De stengels staan ​​links van de verticale lijn. Het is belangrijk dat elke stam eenmaal is opgenomen en er geen cijfers worden overgeslagen, zelfs als dat betekent dat sommige stammen geen blad. De bladeren zijn gerangschikt in oplopende volgorde in een rij rechts van de stengel.

Het is belangrijk op te merken dat wanneer er herhaalde getal in de data dan de plot dient zodanig weerspiegelen

Afronding kan nodig zijn om een ​​stam-en-leaf weergave maken. Gebaseerd op de volgende set van gegevens, de steel plot hieronder zouden worden gemaakt:

Voor negatieve getallen wordt een negatief geplaatst voor de stuweenheid, die nog steeds de waarde X / 10. Niet-gehele getallen zijn afgerond. Dit liet de stengel en blad plot om zijn vorm te behouden, zelfs voor meer complexe datasets. Zoals in het onderstaande voorbeeld:

Gebruik

Stem-and-leaf displays zijn nuttig voor het weergeven van de relatieve dichtheid en vorm van de data, waardoor de lezer snel een overzicht van de distributie. Zij behouden de ruwe numerieke gegevens, vaak met een perfecte integriteit. Ze zijn ook bruikbaar voor het markeren outliers en het vinden van de modus. Echter, steel-en-blad displays zijn alleen nuttig voor middelgroot datasets. Bij zeer kleine datasets een steel-en-leaf displays kan van weinig nut, een redelijk aantal datapunten moeten definitieve verdeling eigenschappen vast te stellen. Een dot plot kan beter geschikt voor dergelijke gegevens. Met zeer grote datasets, zal een steel-en-blad weergave zeer onoverzichtelijk geworden, omdat elk datapunt numeriek moet worden vertegenwoordigd. Een doos of histogram kan meer geschikt als de data wordt groter geworden.

Het gemak waarmee histogrammen nu worden gegenereerd op computers heeft ertoe geleid dat stam-en-leaf displays zijn tegenwoordig minder gebruikt dan in de jaren 1980, toen zij eerst werd wijd toegepast als een snelle werkwijze voor het weergeven van informatie grafisch hand.

(0)
(0)
Commentaren - 0
Geen commentaar

Voeg een reactie

smile smile smile smile smile smile smile smile
smile smile smile smile smile smile smile smile
smile smile smile smile smile smile smile smile
smile smile smile smile
Tekens over: 3000
captcha