ESTADISTICA

 

 

 

 

 

 

ESTADISTICA Y DISEÑOS EXPERIMENTALES

INTRODUCCION | PROBABILIDAD | DISTRIBUCIONES | ESTIMACION | HIPOTESIS

 

INTRODUCCION

INTRODUCCIÓN

Los profesionales de la educación, como parte de su quehacer profesional, realizan
investigación científica: evaluación de la calidad de la educación, someten a prueba
diferentes métodos de comprensión lectora, estudian problemas del aprendizaje, entre
otros. Es así, que contamos con Internet, como fuente general de información, que
permite disponer de información educativa, por ejemplo, sobre evaluaciones muestrales,
que realiza el Ministerio de Educación y que está disponible en la página web:
http://www2.minedu.gob.pe/umc/index2.php?v_codigo=47&v_plantilla=2, (de
fecha 23 de marzo de 2008), que a la letra dice:
“Dentro de las evaluaciones nacionales que ha realizado la Unidad de Medición de la
Calidad (UMC) podemos distinguir dos tipos: las muestrales y las censales. A la fecha la
UMC ha realizado cuatro evaluaciones muestrales y dos evaluaciones censales. En una
evaluación muestral se selecciona a un conjunto de estudiantes de una población
(objetivo). Las evaluaciones muestrales realizadas por la UMC son representativas de la
población objetivo planteadas en los distintos estudios (p. e. estudiantes peruanos de
sexto grado de primaria, estudiantes peruanos de Instituciones Educativas Estatales de
quinto grado de secundaria, etc.). La selección de una muestra representativa de
estudiantes permite hacer inferencias de las poblaciones a partir de la información
recogida”.
Para Castillo Arredondo (2003), evaluar “es el acto de valorar una realidad que forma
parte de un proceso cuyos momentos previos son la fijación de las características de la
realidad a valorar y la recogida de información sobre las misma, y cuyas etapas posteriores
son la información y/o toma de decisiones en función del juicio de de valor emitido”.

Por tanto, si el educador desea evaluar el rendimiento escolar, es necesario conocer las
características de esta realidad escolar llamada, estadísticamente, población. Si está en
condiciones de recolectar los datos de toda la población se denomina censo, es decir
datos de todos y cada uno de los escolares para lograr los objetivos propuestos, o por el
contrario, si toma o selecciona un grupo de escolares, se denomina una muestra
representativa (muestra probabilística o aleatoria) de escolares, y a través de la muestra
intentará conocer la realidad de la población escolar.
Cuando se trabaja con una muestra probabilística y queremos conocer la población, a
partir de los datos muestrales, empleamos los métodos que ofrece la estadística
inferencial, que en el presente libro nos ocupará varios capítulos.
Este libro es a nivel básico, tratando de ser lo más amigable posible, tomando en cuenta
que nos dirigimos a profesionales no estadísticos, en particular de la educación.
Amigable en el sentido que obviaremos las demostraciones matemático-estadísticas, pero
si será necesario tomar en cuenta las definiciones de la estadística así como la rigurosidad
para aplicar los métodos estadísticos de la inferencia.
Pero antes es necesario que se conozca la naturaleza de la estadística, en particular de la
estadística inferencial.


SUBIR

PROBABILIDAD

La estadística es comúnmente considerada como una colección de hechos numéricos expresados en términos de una relación sumisa, y que han sido recopilados a partir de otros datos numéricos.
Kendall y Buckland (citados por Gini V. Glas / Julian C. Stanley, 1980) definen la estadística como un valorresumido, calculado, como base en una muestra de observaciones que generalmente, aunque no por necesidad, se considera como una estimación de parámetro de determinada población; es decir, una función de valores de muestra.
"La estadística es una técnica especial apta para el estudio cuantitativo de los fenómenos de masa o colectivo, cuya mediación requiere una masa de observaciones de otros fenómenos más simples llamados individuales o particulares". (Gini, 1953).
Murria R. Spiegel, (1991) dice: "La estadística estudia los métodos científicos para recoger, organizar, resumir y analizar datos, así como para sacar conclusiones válidas y tomar decisiones razonables basadas en tal análisis.
"La estadística es la cienciaque trata de la recolección, clasificación y presentación de los hechos sujetos a una apreciación numérica como base a la explicación, descripción y comparación de los fenómenos". (Yale y Kendal, 1954).
Cualquiera sea el punto de vista, lo fundamental es la importancia científica que tiene la estadística, debido al gran campo de aplicación que posee.
Definición de estadística. El término estadística tiene su raíz en la palabra Estado. Surge cuando se hace necesario para sus intereses cuantificar conceptos. En la mayoría de los casos esta cuantificación se hará en función de unos fines económicos o militares. El estado quiere conocer censo de personas, de infraestructura, de recursos en general, para poder obtener conclusiones de esta información.
Actualmente la estadística es una cienciaque se desarrolló principalmente en el siglo XX en las Universidades y centros de investigación prestigiosos alrededor del mundo, dedicados a la investigación en ciencias biológicas y agropecuarias, como la Estación experimental de Rothamstead en Gran Bretaña o la UniversidadEstatal de Iowa y la Universidad de Carolina del Norte en EE.UU. No es ya una cuestión reservada al estado. Podríamos decir que ha permeado la mayoría de las ciencias, desde la Biología (en especial, la Genética), la Física, la Química y las relacionadas con la Ingeniería en general, así como las Finanzas, Economía y Ciencias Sociales. La razón es clara: por una parte la estadística proporciona técnicas precisas para obtener información, (recolección y descripción de datos) y por otra parte proporciona métodos para el análisis de esta información (inferencia).
INFERENCIA ESTADÍSTICA
Se basa en las conclusiones a la que se llega por la ciencia experimental basándose en información incompleta (de una parte de la población). La inferencia estadística es una parte de la Estadística que permite generar modelos probabilísticos a partir de un conjunto de observaciones. Del conjunto se observaciones que van a ser analizadas, se eligen aleatoriamente sólo unas cuantas, que es lo que se denomina muestra, y a partir de dicha muestra se estiman los parámetros del modelo, y se contrastan las hipótesis establecidas, con el objeto de determinar si el modelo probabilístico es el adecuado al problema real que se ha planteado.
La utilidad de la inferencia estadística, consiste en que si el modelo se considera adecuado, puede usarse para la toma de decisiones o para la realización de las previsiones convenientes.
En el desarrollo del tema se utilizarán variables aleatorias, que son variables determinadas por el azar. La  inferencia estadística parte de un conjunto de observaciones de una variable, y a partir de estos datos "infiere" o genera un modelo probabilístico; por tanto es la consecuencia de la investigación empírica, cuando se está llevando a cabo, y como consecuencia de la ciencia teórica, cuando se están generando estimadores, o métodos, con tal o cual característica para casos particulares. La inferencia estadística es, en consecuencia, un planteamiento inductivo.

SUBIR

DISTRIBUCIUONES

Distribuciones de probabilidad para variables discretas
Recordemos inicialmente que existen las variables aleatorias, siendo aquellas que se asocian a la ocurrencia de un fenómeno aleatorio. Cuando una de estas variables aleatorias toma diversos valores, la probabilidad asociada a cada uno de tales valores puede ser organizada como una distribución de probabilidad, la cual es la distribución de las probabilidades asociadas a cada uno de los valores de la variable aleatoria.Las distribuciones de probabilidad pueden representarse a través de una tabla, una gráfica o una fórmula, en cuyo caso tal regla de correspondencia se le denomina función de probabilidad.
Consideraremos primero las distribuciones de probabilidad para variables discretas.Por ejemplo: Consideremos a la variable aleatoria X como la cantidad de águilas observadas cuando se lanzan dos volados. El espacio muestral es el conjunto {AA, AS, SA, SS} y se puede ver que la variable X puede tomar como valores 0, 1 y 2.
Calculando las probabilidades tenemos:
P(de no observar águilas)           =             P(SS)     =             P(X=0)  =             ¼
P(de observar una águila)           =             P(SA  AS)          =             P(X=1)  =             2/4
P(de observar dos águilas)         =             P(AA)    =             P(X=2)  =             ¼
Si ahora se organizan estos resultados con el siguiente formato
X             P(X=x)
0             ¼
1             2/4
2             ¼
se podrá explicar por qué se usa el nombre "distribución de probabilidad". E, incluso, con esta información se puede construir una gráfica de barras o un histograma como el que sigue:
Las propiedades de las distribuciones de variables discretas son dos, y que posteriormente, al hablar de las distribuciones de variables continuas, se repetirán de manera muy similar:
1.            0  P(X=x)  1.
2.            P(X=x) = 1, o que es lo mismo: la suma de todas las probabilidades de los eventos posibles de una variable aleatoria es igual a la unidad.
Hay que hacer notar que estas propiedades se enuncian suponiendo que conocemos el valor de la probabilidad, pero en la realidad ésto no ocurre, es decir que no sabemos la probabilidad y lo que se hace es trabajar con estimaciones. Precisamente esto nos lleva a modelos teóricos que estiman los resultados, los principales son los que a continuación se presentan.
7.2 Modelos de distribuciones de probabilidad de variables discretas• Uniforme. Es la distribución donde todos los eventos elementales tienen la misma probabilidad. Por ejemplo: tirar un dado, donde la función P(X=x)=1/6 para valores de x=1,2,3,4,5,6.
•             Binomial. Es la que maneja la distribución de la probabilidad de obtener cierta cantidad de éxitos al realizar una cantidad de experimentos con probabilidad de éxito constante y con ensayos independientes. •         Geométrica. Es la distribución de la probabilidad de realizar cierto número de experimentos antes de obtener un éxito.
•             Hipergeométrica. Es similar a la binomial, pero con un tamaño de muestra grande en relación al tamaño de la población. La función de Excel que proporciona sus valores es DISTR.HIPERGEOM
•             De Poisson. Es la distribución de la probabilidad de que ocurra un evento raro en un periodo de tiempo, un espacio o un lugar. La función de Excel que da los valores de la distribución es POISSON
La que más nos interesará de estas será la distribución binomial que comentaremos un poco más adelante.
7.3 Media y desviación estándar de una distribución de probabilidad para variables discretas
En una *a href*distribución de frecuencias para datos agrupados se calculaba la media utilizando la fórmula  , la cual puede expresarse como
Considerando la definición de probabilidad de un evento, P(X) es el cociente de la frecuencia entre el número total de eventos (probabilidad frecuencial de ocurrencia), por lo que la media de una distribución de probabilidad de una variable discreta es:
Por ejemplo: Consideremos la variable X del ejemplo de águilas observadas en dos lanzamientos de monedas. Es decir, X tal que su distribución de probabilidad sea:
X             P(X=x)
0             ¼
1             ½
2             ¼
Entonces, para calcular su media  se realiza:

http://www.vitutor.com/estadistica/inferencia/estimaciones.html

http://www.ame-web.org/JORNADAS/1B_Terradellas.pdf

ESTIMACION

ESTIMACION1

 

SUBIR

ESTIMACION

Estimación de parámetros

En general, de las variables experimentales u observacionales no conocemos la fpd. Podemos conocer la familia (normal, binomial,...) pero no los parámetros. Para calcularlos necesitaríamos tener todos los posibles valores de la variable, lo que no suele ser posible.
La inferencia estadística trata de cómo obtener información (inferir) sobre los parámetros a partir de subconjuntos de valores (muestras) de la variable.
Estadístico: variable aleatoria que sólo depende de la muestra aleatoria elegida para calcularla.
Estimación: Proceso por el que se trata de averiguar un parámetro de la población representado, en general, por q a partir del valor de un estadístico llamado estimador y representado por
El problema se resuelve en base al conocimiento de la "distribución muestral" del estadístico que se use.
¿Qué es esto? Concretemos, p.e. en la media (m). Si para cada muestra posible calculamos la media muestral () obtenemos un valor distinto ( es un estadístico: es una variable aleatoria y sólo depende de la muestra), habrá por tanto una fpd para , llamada distribución muestral de medias. La desviación típica de esta distribución se denomina error típico de la media. Evidentemente, habrá una distribución muestral para cada estadístico, no sólo para la media, y en consecuencia un error típico para cada estadístico.
Si la distribución muestral de un estadístico estuviera relacionada con algún parámetro de interés, ese estadístico podría ser un estimador del parámetro

SUBIR

 

HIPOTESIS

Una hipótesis puede definirse como una solución provisional (tentativa) para un problema dado. El nivel de verdad que se le asigne a tal hipótesis dependerá de la medida en que los datos empíricos recogidos apoyen lo afirmado en la hipótesis. Esto es lo que se conoce como contrastación empírica de la hipótesis o bien proceso de validación de la hipótesis. Este proceso puede realizarse de uno o dos modos: mediante confirmación (para las hipótesis universales) o mediante verificación (para las hipótesis existenciales).

En general, en un trabajo de investigación se plantean dos hipótesis mutuamente excluyentes: la hipótesis nula o hipótesis de nulidad ( ) y la hipótesis de investigación ( ). Además, es posible plantear hipótesis alternas o hipótesis alternativas. El análisis estadístico de los datos servirá para determinar si se puede o no aceptar Ho. Cuando se rechaza Ho, significa que el google_protectAndRun("render_ads.js::google_render_ad", google_handleError, google_render_ad); google_protectAndRun("ads_core.google_render_ad", google_handleError, google_render_ad); factor estudiado ha influido significativamente en los resultados y es información relevante para apoyar la hipótesis de investigación planteada. Es muy importante tener presente que la hipótesis de investigación debe coincidir con la hipótesis alternativa. Plantear hipótesis de investigación que coincidan con Ho supondría una aplicación incorrecta del razonamiento estadístico.

Las hipótesis son proposiciones provisionales y exploratorias y, por tanto, su valor de veracidad o falsedad depende críticamente de las pruebas empíricas. En este sentido, la replicabilidad de los resultados es fundamental para confirmar una hipótesis como solución de un problema. La hipótesis es el elemento que condiciona el diseño de la investigación y responde provisionalmente al problema, verdadero motor de la investigación.

El propósito de la prueba de hipótesis es determinar si el valor supuesto (hipotético de un parámetro poblacional, como la medida de la población, debe aceptarse como verosímil con base en evidencia muéstrales. Recuerda que sobre la distribución de muestreo, se dijo que, en general, una media muestral diferirá en valor de la media poblacional. Si el valor observado de una estadística muestral, como la media muestral, el valor de la media poblacional.

Si el valor observado de una estadística muestral, muestral, se acerca al valor para métrico supuesto y solo difiere de él en un monto que cabria esperar del muestreo aleatorio, el valor hipotético no se rechaza. Si la estadística muestral difiere de la supuesta en un monto que no es posible atribuir al azar, la hipótesis se rechaza por inverosímil.

Se han desarrollado tres procedimientos distintos para la prueba de hipótesis, todos los cueles conducen a las mismas decisiones cuando se emplean los mismos estándares de probabilidad (y riesgo). En este capítulo describiremos primeramente el método del valor crítico para la prueba de hipótesis. De acuerdo con este método, se determinan los así llamados valores críticos de la estadística de prueba que dictarían el rechazo de una hipótesis, tras de lo cual la estadística de prueba observada se compara con los valores críticos.

Este fue el primer método en desarrollarse, motivo por la cual buena parte de la terminología de las pruebas de hipótesis se derivan de él. Más recientemente, el método del valor P ha cobrado popularidad a causa de ser el más fácilmente aplicable a software de computo. Este método se basa en la determinación de la probabilidad condicional de que el valor observado de una estadística muestral pueda ocurrir al zar, dado que su supuesto particular sobre el valor del parámetro poblacional asociado sea en efecto correcto.

Finalmente, el método d intervalos de confianza se basa en la observación de si el valor supuesto de un parámetro poblacional está incluido en el rango de valores que define a un intervalo de confianza para ese parámetro.

Redactado por Castillo Ceron Manuel del Tecnologico de Cancun.

SUBIR