Resumen de Estadística: Representaciones Grafícas y Medidas de Tendencia Central (Medidas de Centralizacion)
Representaciones Graficas
En general,
la representación gráfica de una tabla de frecuencias permite percibir con
mayor claridad algunas características de la masa de datos que se investiga.
Por ello, resulta bastante más fácil transmitir conclusiones a personas no
habituadas a la interpretación de distribuciones de frecuencias cuando se
utilizan gráficos.
Gráfico de Barras
En los
gráficos de barras, en el eje vertical se representan los valores de la
variable observada y en el eje vertical las frecuencias absolutas o relativas.
Histograma de áreas variable cuantitativa continua
El histograma
es un gráfico de barras en donde la escala horizontal representa clases de
valores de datos y la escala vertical representa frecuencias- Las alturas de
las barras corresponden a los valores de frecuencia, en tanto que las barras se
dibujan de manera adyacente (sin espacio entre ellas).
Gráfico de barras adosadas o múltiples
Consiste en
representar mediante barras separadas la magnitud de las frecuencias y las sub clasificaciones
de cada clase (por ejemplo total varones y mujeres) suelen representarse las
barras correspondientes a cada clase en forma adosada.
Gráfico de barras proporcionales
Se usa cuando se desea resaltar las relaciones proporcionales. Se usa una o varias barras de la misma longitud que representan el 100% de las observaciones y se las divide según las proporciones correspondientes.
Gráfico de sectores
Aquí las comparaciones se hacen mediante sectores de un círculo en vez de partes de un rectángulo. Se usa para representar las distribuciones de frecuencias de una serie cualitativa o para expresar porcentajes. El total de observaciones o el 100% corresponde al total del círculo y la frecuencia o porcentaje de cada clase se representa mediante un sector cuyo ángulo central es proporcional a la medida de la clase.
Gráficos lineales
Se usan
habitualmente para representar series cronológicas. Se constituyen marcando
cada valor de la serie de tiempo en el eje de las abscisas. El valor
correspondiente a la ordenada en cada punto está registrado en el eje de la Y.
Cada anotación corresponde al punto de intersección de la abscisa y ordenada
propia de cada valor. Luego de consignados todos los puntos en el cuadrante del
gráfico se procede a unirlos por una raya de tal modo que queda construida una línea quebrada que expresa la
característica del fenómeno registrado.
Polígono de frecuencias
Se utiliza
también para representar las distribuciones de frecuencias de variables
cuantitativas continuas. Consiste en una línea quebrada que une los puntos
determinados por los puntos medios de cada intervalo y su frecuencia.
Empieza y
termina en el eje de abscisas (eje horizontal) en los puntos medios de los
intervalos anterior y posterior a los del histograma.
Ojiva
Se emplea para representar la distribución de las frecuencias acumuladas. La ojiva se construye tomando los ejes (abscisa y ordenada) horizontal y vertical del mismo que es el histograma con la diferencia que en este caso señalamos la frecuencia relativa acumulada en el eje vertical, por esto tomamos como punto máximo 1 (uno) y como mínimo 0 (cero). Una vez construidos los ejes debemos señalar la frecuencia relativa acumulada de cada intervalo elevando líneas perpendiculares al eje horizontal a partir de los puntos que señalan los límites exactos superiores cortándolos en el punto que este a la altura que marca la frecuencia relativa acumulada que corresponde a cada clase. Luego unimos los puntos indicados por estas líneas con una línea recta, que en general tendrá forma de “S” con una inclinación mayor en la proximidad de los intervalos de clase que contiene el mayor número de casos. Este gráfico puede ser empleado para estimar el porcentaje por debajo o por encima de cierto valor.
Pictogramas
En este tipo
de gráficos se representan los datos mediante símbolos figurativos de la
variable de análisis. Su aplicación está condicionada al hecho de que los
valores de la variable deben ser susceptibles de adecuarse a formas
gráfico-simbólicas.
Medidas
de Tendencia Central o Medidas de Centralización
Concepto
- Son índices estadísticos que nos dan el valor de la variable hacia la cual tienden a agruparse los datos.
- Son diferentes clases de promedios que pueden servir como resúmenes numéricos en un conjunto de datos. Debe:
- Basarse en las observaciones efectuadas
- Ser sencilla y fácil de calculare interpretar
Las más comunes son:
Media aritmetica
Obtenemos la
media al dividir la suma de las mediciones entre el número de ellas en el
conjunto. Si calculamos la media de una población lo simbolizamos (m), y si es de muestra (x)ßcon rayita arriba
Calculo de la
media:
Propiedades de la media:
- La media aritmética es un valor de la variable comprendido entre el máximo y el minimo valor observado de la misma
- La unidad de medida de la media aritmética es igual a la unidad de medida de la variable.
- Si la variable toma siempre el mismo valor, la media aritmética es igual a dicho valor.
- La suma de los desvíos de cada valor de la variable a la media aritmética es igual a 0.
- Si a los valores de una variable se les suma o se les resta una constante, la media aritmética de la nueva variable es igual a la media aritmética de la variable anterior multiplicada por dicha constante.
NOTA: de las dos
propiedades anteriores se deduce que la resta y la división se realzarian de
igual manera para la propiedad 3 y 4 respectivamente.
IMPORTANTE: Hay que
tener en cuenta que la media aritmética es muy sensible a los valores extremos,
es decir, a valores numéricos muy diferentes, (tanto por lo grandes, o pequeños
que sean), al resto de la muestra. Esto puede resultar un problema.
Mediana
Es el número
a la mitad en un conjunto ordenado de mediciones. Si hay un número impar de
mediciones en el conjunto, existe un y sólo un número colocado a la mitad, al
cual nombramos mediana y simbolizamos Me. Si hay un número par de mediciones en
el conjunto, entonces existen dos números a la mitad y la mediana será el
promedio de ellos.
Calculo de la mediana
Datos sin agrupar:
- Si la cantidad total de datos es impar, la mediana será el valor central en datos ordenados.
- Si la cantidad es par, la mediana será el promedio de los dos valores centrales en datos.
Ejemplo:
Datos agrupados: Es el valor de la variable cuya primera
frecuencia acumulada contenga n/2.
Ejemplo
Es decir que la mitad
de los estudiantes tiene 3 o menos hermanos
Datos agrupados en
intervalos: para determinar un único
representante de dicho intervalo como mediana, determinaremos el elemento que
toma de frecuencia n/2.
Por lo tanto:
Es decir que el 50% de
los alumnos obtuvo una puntuación de 78 o menos
Moda
La Moda en un
conjunto de mediciones es aquel valor que se presenta con la mayor frecuencia,
es decir es el valor más común. Se simboliza Mo. La moda puede no existir,
incluso si existe puede no ser única. La distribución que tiene una sola moda
se llama unimodal. En la tabla 1 la frecuencia más alta es 10, por lo tanto la
moda es tener 3 hermanos.
Por lo tanto:
Comentarios
Publicar un comentario