Agrupación de datos cuantitativos

Versión para impresión

En este post grupal vamos a explicar el método de agrupación de datos con un ejemplo (tomado de la Web). El método de agrupación de datos es el siguiente:

1. Se parte de una lista de datos cuantitativos.
2. Se ordenan los datos de menor a mayor.
3. Se calcula el rango (=dato máximo-dato mínimo).
4. Se divide el rango en intervalos de igual tamaño (al menos 5). Estos intervalos serán las clases.

Nota: Este es el paso difícil, pues hay que decidir cuántos y, a veces, se requiere hacer ajustes. Pero resolviendo varios ejercicios y estudiando ejemplos se adquiere el feeling necesario para hacer una buena división de clases.

5. Las clases y sus frecuencias se escriben en una tabla de dos columnas como se muestra en el ejemplo. Esta tabla es la distribución o tabla de frecuencias y es el resultado de la agrupación.

Ejemplo


1. Supongamos que los siguientes datos son el resultado de un test de habilidades en un grupo de 30 alumnos:


10     10     12     12     14     16     16     16     17     17
17     17     18     18     18     18     20     20     21     21
22     23     23     24     25     26     27     27     28     29

2. Los datos ya están ordenados leyendo por renglones.

3. Calculamos el rango (o amplitud total) de los datos: el dato mínimo  es 10, el dato máximo es 29.

Entonces el rango es 29-10=19.  Se agrega un 1 para cubrir errores de redondeo. Por tanto el rango se toma como 20.

Nota: Se acostumbra agregar una unidad (si los datos son enteros)  para tomar en cuenta los errores de redondeo. Además, con el propósito de agrupar los datos, el rango lo podemos agrandar un poco más. De nuevo, con ejemplos se llega a dominar esta técnica un tanto subjetiva.

4. Elegimos dividir el rango en 5 intervalos. Entonces 20/5=4, y esta longitud es el tamaño de clase o amplitud. Se acostumbra escribir los intervalos separando con un guión sus límites.

Los intervalos de clase son entonces: 10-13; 14-17; 18-21; 22-25;  26-29.

Nota: Los intervalos  están separados por una unidad para evitar el problema de contar los datos que caen en cada clase. Sin embargo, considerando los errores de redondeo en las mediciones, los intervalos reales son 9.5-10.5, etc.

5. Los datos quedan agrupados en la distribución de frecuencias que se muestra en la siguiente tabla (las dos primeras columnas):

Clase   frecuencia    Explicación del conteo de frecuencias
10-13     4                 (4 son los  datos 10, 10, 12, 12)
14-17     8                 (14, 16, 16, 16, 17, 17, 17, 17)
18-21     8                 (18, 18,  18, 18, 20, 20, 21, 21)
22-25     5                 (22, 23, 23, 24, 25)
26-29     5                 (26, 27, 27, 28, 29)
 

Los saluda

jmd
 

AdjuntoDescripciónTamaño
3_ejemplos_estadistica.docEl documento incluye un ejemplo de datos nominales, uno de datos cuantitativos discretos y el tercero de datos continuos; en los dos últimos se ilustra el diagrama de caja y bigotes.)98.5 KB