Resumen de Estadística : Conceptos, Tipos de muestra, Etapas de la Investigación y representación de datos

Continuando con este tema,  que si no leiste la parte 1 haz Clic Aqui. Bueno prosigue a lo que viniste.

¿Que es un Dato Estadístico?

Es el valor de la variable asociada a un elemento de una población o muestra. Este valor puede ser un número, una palabra o un símbolo  de Inferencia estadística, que es una conclusión obtenida de una población completa, desde la información tomada de una muestra. Dicho proceso no es infalible, pero en la mayoría de los casos, podemos predecir un margen de error y asignar toda la validez al estudio. Por ejemplo:
Supongamos que un sociólogo desea hacer un estudio de la relación entre la salud y el ingreso. La población en estudio podría estar constituida por todos los matrimonios con hijos o sin ellos. Después de seleccionar una muestra de parejas, el sociólogo mide en cada una el ingreso total anual y su estado de salud del momento, la mortalidad infantil, las condiciones sanitarias, el registro de vacunación, las visitas al médico, el número de ausencias a la escuela provocadas por enfermedades, etc. El sociólogo con los resultados de estas mediciones, aplicará los mismos haciendo una inferencia estadística para informar acerca de la población completa.

Tipos de muestra

En la práctica se han encontrado varias clases o tipos de muestras. Las características que distinguen a un tipo de otro son:

  1. la manera de obtención de la muestra
  2. el número de variables considerada
  3. el fin para el que fue extraída la muestra.

Las dos últimas características mencionadas se entienden fácilmente en cualquier situación práctica. La manera de obtener la muestra es muy importante y pueden agruparse en dos grandes clases cuando se considera su método de selección:

  • Las muestras elegidas de acuerdo con un mecanismo casual, son llamadas muestras de probabilidad
  • Si cada elemento de la población tiene una probabilidad conocida de pertenecer a la muestra, entonces ésta es conocida como una muestra al azar.

¿Por qué se prefieren las muestras al azar a las muestras elegidas subjetivamente? Debido a que la muestra al azar será aquella de la cual pueden hacerse generalizaciones respecto a la población, para esto necesitamos estar capacitados para deducir, a partir de cualquiera de las suposiciones respecto a la población, cuándo la muestra observada está dentro del rango de variación del muestreo que puede ocurrir para dicha población.

El objetivo de la naturaleza al azar de este tipo de muestreo, es asegurar que esas leyes son aplicables. Si tuviésemos leyes igualmente estables y bien definidas de las tendencias personales, se podría usar el muestreo subjetivo. El muestreo de diferentes poblaciones puede hacerse de varias maneras:

  • Muestreo aleatorio Simple: Se obtiene al azar y todos los elementos de la población tienen la misma probabilidad de salir. Métodos: enumerar todos los elementos de una población., tabla de números aleatorios, función random de la calculadora, etc.
  • Muestreo Sistemático: El procedimiento comienza al azar y luego se seleccionan los elementos cada k-ésimo unidad de la población.
  • Muestreo estratificado: Se divide la población en grupos o clases llamados estratos, dentro de cada uno de tales estratos, están los elementos situados de manera más homogénea con respecto a las características que estén en estudio. Para cada estrato se toma una submuestra mediante el procedimiento aleatorio simple. Es frecuente que se tome la misma proporción para cada estrato.
  • Muestreo por conglomerado: Se selecciona primero al azar los grupos, llamados conglomerados y se toma luego todos los elementos o una submuestra de ellos dentro de cada conglomerado. Se puede llevar a cabo en varias etapas.

CENSO

 Es un método estadístico en el cual la información se obtiene de la totalidad de los elementos o de las unidades de análisis que componen la población o universo por investigar. Debe cumplir las condiciones de:

  • Universalidad: censar a todos los elementos de la población o universo
  • Simultaneidad: realizarse en un momento determinado
Un censo es equivalente a una fotografía de la población en un momento dado.

ETAPAS DE UNA INVESTIGACIÓN ESTADÍSTICA

Para el planeamiento de una investigación, por norma general, se siguen las siguientes etapas:

  1. PLANTEAMIENTO DEL PROBLEMA
    Al abordar una investigación se debe tener bien definido qué se va a investigar y por qué se pretende estudiar algo. Es decir, se debe establecer una delimitación clara, concreta e inteligible sobre el o los fenómenos que se pretenden estudiar.

  2. FIJACIÓN DE LOS OBJETIVOS
    Luego de tener claro lo que se pretende investigar, Debemos presupuestar hasta dónde queremos llegar; en otras palabras, debemos fijar cuales son nuestras metas y objetivos.

  3. DEFINICIÓN DE LA UNIDAD DE OBSERVACIÓN Y DE LA UNIDAD DE MEDIDA
    La Unidad de Observación, entendida como cada uno de los elementos constituyentes de la población estudiada, debe definirse previamente, resaltando todas sus características; pues, al fin de cuentas, es a ellas a las que se les hará la medición. También debe establecerse las variables que se medirán.

  4. DETERMINACIÓN DE LA POBLACIÓN Y DE LA MUESTRA.

  5. OBTENCIÓN DE LOS DATÓS
    Esta puede ser realizada mediante la observación directa de los elementos, la aplicación de encuestas y entrevistas, y la realización de experimentos.

  6. CLASIFICACIÓN, TABULACIÓN Y ORGANIZACIÓN DE LOS DATOS
    La clasificación incluye el tratamiento de los datos considerados anómalos que pueden 1)      en un momento dado, falsear un análisis de los indicadores estadísticos. La tabulación implica el resumen de los datos en tablas y gráficos estadísticos.

  7. ANÁLISIS DESCRIPTIVO DE LOS DATÓS
    El análisis se complementa con la obtención de indicadores estadísticos como las medidas: de tendencia central, dispersión, posición y forma.

  8. ANÁLISIS INFERENCIAL DE LOS DATÓS
    Se aplican técnicas de tratamiento de datos que involucran elementos probabilísticos que permiten inferir conclusiones de una muestra hacia la población (opcional).

  9. ELABORACIÓN DE CONCLUSIONES
    Se construye el informe final.

REPRESENTACIÓN DE DATOS ESTADÍSTICOS

Los datos estadísticos deben ser representados en forma efectiva, tanto como una ayuda para el análisis como para comunicar los resultados de éste. Sin una presentación efectiva, los datos estadísticos pierden mucho de su valor y de su impacto. Los datos pueden ser organizados en:

Serie simple

Un conjunto de datos ordenados en forma ascendente o descendente. Supongamos que los siguientes datos corresponden al resultado de un test de razonamiento.

62 88 79 92 86 87 83 78 41 67 68 76 46 81 92 77 84 76 70  66

77 75 98 81 82 81 87 78 70 60 99 79 52 82 77 81 77 70 74 61

La serie simple seria:

41 61 68 74 77 78 81 82 86 92

46 62 70 75 77 78 81 82 87 92

52 66 70 76 77 79 81 83 87 98

60 67 70 76 77 79 81 84 88 99

Arreglo tronco y hojas

Técnica que resumen simultáneamente los datos numéricos y presenta una ilustración gráfica de la distribución. En el ejemplo anterior las decenas serán los troncos y las unidades formarán las hojas:


Tablas

Las tablas de frecuencia sirven para ordenar los datos de una muestra y permitir que se pueda leer la información en forma más clara. Podemos construir una tabla de frecuencias o distribución de frecuencias ya sea que los datos sean cualitativos o cuantitativos. En una tabla de frecuencias podemos encontrar las siguientes simbolizaciones:

  • Tamaño de población (N)
  • Tamaño de muestra (n)
  • Variable (xi)
  • frecuencia absoluta, que indica la cantidad de veces que ocurre el valor de la variable (fi)
  • frecuencia relativa, que indica la fracción del total de la muestra o población que corresponde a cada valor de la variable, que se calcula mediante la fórmula (hi).
  • Frecuencia absoluta acumulada, que indica la frecuencia absoluta que se acumula hasta esa fila de la tabla y se calcula, para una fila k cualquiera (Fi).
  • Frecuencia relativa acumulada, que indica la frecuencia relativa que se acumula hasta esa fila de la tabla y se calcula, para una fila k cualquiera (Hi)
  • Marca de clase (Xm), que es igual al Limite inferior (Li) mas el Limite superior (Ls) del intervalo dividido 2 .
Para la construcción de tablas de frecuencias de una variable se debe tener en cuenta el tipo de variable y a veces la cantidad de datos.

Criterios para armar una tabla de Frecuencias:

  • Para datos medidos en escala nominal, la organización de las categorías es indistinta.
  • Para datos medidos en escala ordinal, hay que respetar el orden intrínseco de las categorías que toma la variable.
  • Para datos cuantitativos hay que agrupar los datos en frecuencias simples o en intervalos de clase, con algún criterio y teniendo en cuenta el número de datos y el recorrido de la variable

Ejemplos:

    Tablas para datos cualitativos Nominales: 
    A un grupo de 28 alumnos se les pregutna cual es su deporte preferido
    interpretacion:
    el 11% de los alumnos prefieren natacion

    Tablas para datos cualitativos Ordinales:
    Se le pregunta a 30 docentes de un turno la opinión acerca de una película que vieron relacionado con educación sexual, las respuestas se clasificaron como (muy mala, mala, buena, muy buena)
    interpretacion:
    Solo a 3 personas les pareció buena la película
     El 33% de las personas opinan que la película es buena
    A 17 personas no les gusto la película
    Al 57% de las personas encuestadas calificaron a la película como muy mala o mala

    Tablas para datos cuantitativos discretos:
    Se le pregunto a los niños que asisten al comedor de la escuela cuantos hermanos tienen
    interpretacion:
    5 niños tienen 1 hermano
    El 31% de los niños tiene 3 hermanos
    19 niños tienen menos de 4 hermanos
     El 28% de los niños tienen 1 o 2 hermanos


    Tablas para datos cuantitativos Continuos:
    Puntuación obtenida por los alumnos en un test de razonamiento del apartado sobre serie simple, para estos datos es conveniente agruparlo en intervalos de clases. Pero ¿Cuántos? Debemos usar los suficientes para mostrar la forma básica de los datos.
    Una regla empírica aconseja que el número de clases o intervalos de clase sea igual a la raíz cuadrada del número de observaciones(parte entera), pero para aproximar la amplitud de los intervalos, es necesario identificar las mediciones mayores y menores, encontrar su diferencia para dividirla entre el número de clases:


    Propiedades a tener en cuenta:
    -   Los valores tienen que ser mayor que A y menores B 
    -   El punto medio
     llamado marca de clase (Xm), tiene que ser representativo del intervalo de clase.
    -   Siempre de ser posible que las amplitud sea igual en cada intervalo
    -   No puede haber un intervalo de clase que tenga 0 en la columna 
    supongamos que queremos tener 6 intervalos es decir 6 sera el numeros de clases, donde 99 es la mayor medicion y 41 la menor,  obtenemos que la amplitud es de 9,6...., osea un 10 redondeado.

    interpretacion:
    6 alumnos obtuvieron un puntaje entre 61 y 71
    el 30% de los alumnos obtuvo un puntaje entre 81-91
    24 alumnos obtuvieron un puntaje inferior a 81 pero superior a 40
    el 22% de los alumnos obtuvo un puntaje entre 41 y 71.

    Bueno es todo por ahora, si quieres saber mas te dejo la continuacion solo haz Clic Aqui, sin mas que decir, hasta la proxima.

    Comentarios