domingo, 4 de junio de 2017

Reflexión final

Para mi, la asignatura de estadística ha resultado muy interesante, además de un alivio, ya que ha sido mi reencuentro con las amadas matemáticas.

Esta asignatura nos da a entender la importancia de la investigación y su estrecha relación con la enfermería y con sus cuidados, tratamientos,...

Ahora solo quedan días para los exámenes, y les deseo mucha suerte a todos mis compañeros (pero más a mi mismo). Espero haberos hecho interesaros por la estadística con los resúmenes que he ido publicando. 

Como dije, continuaré con el blog, ya con contenido ajedrecístico, cuando acaben los exámenes, y espero dar jaque mate en todos ellos. ¡Hasta otra!

Seminario 5 ETIC's

En la sesión de pequeños grupo número 5, cada subgrupo ha expuesto su trabajo de investigación, con los resultados obtenidos.

sábado, 3 de junio de 2017

Tema 10 ETIC's: Test estadísticos

1.       CONTRASTES DE HIPÓTESIS

Para controlar los errores aleatorios, además del cálculo de intervalos de confianza, contamos con una segunda herramienta en el proceso de inferencia estadística: los test o contrastes de hipótesis.
Con los intervalos nos hacemos una idea de un parámetro de una población dado un par de números entre los que confiamos que esté el valor desconocido.
Con los contrastes (test) de hipótesis la estrategia es la siguiente:

-          Establecemos a priori una hipótesis cerca del valor del parámetro.
-          Realizamos la recogida de datos.
-          Analizamos la coherencia de entre la hipótesis previa y los datos obtenidos.

Son herramientas estadísticas para responder a preguntas de investigación: permite cuantificar la compatibilidad entre una hipótesis previamente establecida y los resultados obtenidos.
Sean cuales sean los deseos de los investigadores, el test de hipótesis siempre va a contrastar la hipótesis nula (la que establece igualdad entre los grupos a comparar, o lo que es lo mismo, la que no establece relación entre las variables de estudio).
Tipo de análisis estadísticos según el tipo de variables implicadas en el estudio

DEPENDIENTE

INDEPENDIENTE
Cualitativa
2 Grupos
Cualitativa >
2 Grupos
Cuantitativa
Cualitativa 2 Grupos
Chi cuadrado
T comparación proporciones
P. exacta de Fisher
P. Mc Nemar
Chi cuadrado
Q de Cochran
T student
U. de Mann- Whitney
T. Wilcoxon
Cualitativa > 2 Grupos
Chi cuadrado
Q. de Cochran
Chi cuadrado
Q. de Cochrann
A. varianza
Kruskall-Wallis
F. Friedman
Cuantitativa
Regresión logística
Regresion logística
Regression lineal:
Correl. Pearson
Correl. Spearman

2.       ERRORES DE HIPÓTESIS.

El test de hipótesis mide la probabilidad de error que cometo si rechazo la hipótesis nula.
Con una misma muestra podemos aceptar o rechazar la hipótesis nula. Todo depende de una error, al que llamamos α.
El error α es la probabilidad de equivocarnos al rechazar la hipótesis nula.
El error α más pequeño al que podemos rechazar H0 es el error p. (p es sinónimo de α minimizada)
Habitualmente rechazamos H0 para un nivel α máximo del 5% (p< 0.05). Por encima del 5% de error, aceptamos la hipótesis nula. Es lo que llamamos “significación estadística”.

3.       TIPOS DE ERRORES EN TEST DE HIPÓTESIS.
RESULTADO DEL TEST
REALIDAD
Rechazo H0
Acepto H0
H0 cierta
Error tipo 1 (error α)
No error (1-α)
H0 falsa
No error (1-β)
Error tipo 2 (error β)

El error más importante para nosotros es el tipo alfa. Aceptamos que podemos equivocarnos hasta un 5%.

Tema 9 ETIC's: Estadística inferencial

1.       INFERENCIA ESTADÍSTICA

Cuando planteamos un estudio en el ámbito sanitario para establecer relaciones entre variables, nuestro interés no suele estar exclusivamente en los pacientes concretos a los que hemos tenido acceso, sino más bien en todos los pacientes similares a estos. (Inferir)
Al inferir nunca tienes el dato seguro de toda la población sobre la que deduces los resultados de un estudio realizado anteriormente sobre la población que nos interesa, al inferir siempre hay error aleatorio.
Ø  Al conjunto de pacientes sobre los que queremos estudiar alguna cuestión (sacar conclusiones) le llamamos población de estudio.
Ø  Al conjunto de individuos concretos que participan en el estudio le denominamos muestra.
Ø  Al número de individuos de la muestra le denominamos tamaño muestral.
Ø  Al conjunto de procedimientos estadísticos que permiten pasar de lo particular, la muestra, a lo general, la población, le denominamos inferencia estadística.
Ø  Al conjunto de procedimientos que permiten elegir muestras de tal forma que éstas reflejen las características de la población le llamamos Técnicas de muestreo, esto se hace para evitar sesgos.
Siempre que trabajamos con muestras, aunque sean representativas, (no estudiamos el problema en toda la población sino en una parte de ella), hay que asumir un cierto error.
Ø  Si la muestra se elige por un procedimiento de azar, se puede evaluar ese error. La técnica de muestreo en ese caso se denomina muestreo probabilístico o aleatorio y el error asociado a esa muestra elegida al azar se llama error aleatorio.
Ø  En los muestreos no probabilísticos (Ej: estudios de conveniencia. Utilizar a los pacientes de mi hospital como muestra), no es posible evaluar el error. En los muestreos probabilísticos, el error aleatorio es inevitable pero es evaluable gracias a las leyes de la probabilidad.
Ø  Cuanto mayor sea el tamaño de la muestra, favorezco la reducción del error aleatorio por probabilidad.n las distintas muestras de un determinado tamaño que pudiésemos tomar de una población.
Ø  Cuanto más pequeño es el error estándar de un estimador, más nos podemos fiar del valor de una muestra concreta.
s=desviación típica
n=tamaño de la muestra
p= proporción estimada en la muestra.

Si en lugar de variar el valor de la media en las muestras entre 52 y 64 días, variara entre 20 y 90 días, sería menos probable que al seleccionar una muestra y calcular su media, ésta estuviera cercana a 57,46, que es el valor de la media en la población.

2.       ERROR ESTÁNDAR.

Ø  Es la medida que trata de captar la variabilidad de los valores del estimador (en este caso la media de los días de curación de la úlcera).
Ø  El error estándar de cualquier estimador mide el grado de variabilidad en los valores del estimador en las distintas muestras de un determinado tamaño que pudiésemos tomar de una población.
Ø  Cuanto más pequeño es el error estándar de un estimador, más nos podemos fiar del valor de una muestra concreta.
s=desviación típica
n=tamaño de la muestra
p= proporción estimada en la muestra.

Si en lugar de variar el valor de la media en las muestras entre 52 y 64 días, variara entre 20 y 90 días, sería menos probable que al seleccionar una muestra y calcular su media, ésta estuviera cercana a 57,46, que es el valor de la media en la población.

3.       TEOREMA CENTRAL DEL LÍMITE

Para estimadores que pueden ser expresados como suma de valores muestrales, la distribución de sus valores sigue una distribución normal con media de la población y desviación típica igual al error estándar del estimador de que se trate.
Si en vez de una muestra, seleccionara 100 muestras y calculara las medias y las pusiera en un histograma, tendría una distribución normal, en la cual el error estándar coincide con la desviación estándar del histograma, por lo tanto si le sumo y le resto a la media una vez la desviación estándar, es decir, el error estándar, tendré el 68.26% de las observaciones.
Si sigue una distribución normal, sigue los principios básicos de ésta:
-           1S                                     68,26% de las observaciones (muestras).
-           2S                                     95,45% de las observaciones.
-           1,95S                               95% de las observaciones
-           3S                                     99,73% de las observaciones.
-           2,58S                                99% de las observaciones.

4.       INTERVALOS DE CONFIANZA:

Ø  Son un medio de conocer el parámetro en una población midiendo el error que tiene que ver con el azar (error aleatorio).
Ø  Se trata de un par de números tales que, con un nivel de confianza determinados, podamos asegurar que el valor del parámetro es mayor o menor que ambos números.
Ø  Se calcula considerando que el estimador muestral sigue una distribución normal, como establece la teoría central del límite.

Cálculo:

-         
-          Z es un valor que depende del nivel de confianza 1-α con que se quiera dar el intervalo (α=error máximo admisible: 5%). Por lo tanto Z tiene que ver con el valor que va delante de S en el teorema central del límite. Si I.C es más alto, más probabilidad de que el intervalo esté dentro y por tanto la horquilla será mayor.
-          Para nivel de confianza 68% z=1 (No suele utilizarse un intervalo de confianza del 68% porque asumimos un error máximo del 5%)
-          Para nivel de confianza 95% z=1,96à2.
-          Para nivel de confianza 99% z=2,58à3.
-          El signo  significa que cuando se elija el signo negativo se conseguirá el extremo inferior del intervalo y cuando se elija el positivo se tendrá el extremo superior.
Mientras mayor sea la confianza que queramos otorgar al intervalo, éste será más amplio, es decir, el extremo inferior y el superior del intervalo estarán más distanciados y, por tanto, el intervalo será menos preciso.
Se puede calcular intervalos de confianza para cualquier parámetro: medias aritméticas, proporciones, riesgos relativos, odds ratio…

        en las formulas cada vez que usamos proporcion la expresamos en la formula en tantos por 1 y no en tantos por 100 (%)

5.       PROCEDIMIENTO MUESTRAL. (Técnica De Muestreo).

-          Un muestreo es un método tal que al escoger un grupo pequeño de una población podamos tener un grado de probabilidad de que ese pequeño grupo posea las características de la población que estamos estudiando.
-          La población general de la queremos obtener conclusiones la vamos a elegir al azar (aleatoriamente), para obtener la muestra y a partir de esta hacer inferencia de la población entera à (confianza (intervalo de confianza) en %).

6.       TIPOS DE MUESTREO. 

-          Probabilístico. Todos los sujetos de la población tienen una probabilidad distinta de cero en la selección de la muestra y conocida. Existe una probabilidad conocida de seleccionar a los sujetos. Por ejemplo, si vamos a seleccionar 5 sujetos de la clase, y somos un total de 50, tendré un 10 % de probabilidad de ser elegida. Sin embargo si lo hacemos a cualquier persona que pase por la calle, no sabemos a quién vamos a encontrarnos para incluir en la selección.
1.       Aleatorio simple. P=1/nà por azar (que azar no es ponerme en una esquina y el que pase por aquí)
2.       Aleatorio sistemático.à estas tres son variaciones del muestreo aleatorio simple.
3.       Estratificado.
4.       Conglomerados.
-          No probabilístico o de conveniencia del investigador. Puede haber personas en la población que no tengan probabilidad o que se desconozca,  de ser seleccionado en la muestra. No existe probabilidad conocida, es una selección arbitraria. (“Muestreo de lo que tengo a mano”)
1.       Accidental. Son aquellos en los que los sujetos de la población no tienen una probabilidad conocida o distinta de 0.
2.       Por cuotas. Me pongo a pasar un cuestionario en una esquina pero el 50% a mujeres y 50% a hombres, despreciando a la mujer 51 que pasa por la esquina.

v  MUESTREO PROBABILÍSTICO.

Todos y cada uno de los elementos tienen la misma probabilidad de ser elegidos para la muestra.  Es el método que consiste en extraer una parte (o muestra) de una población o universo, de tal forma que todas las muestras posibles de tamaño fijo, tengan la misma posibilidad de ser seleccionados.
-          Aleatorio Simple. (Es el más fiable y equitativo)
1.       Se caracteriza porque cada unidad tiene la probabilidad equitativa de ser incluida en la muestra:
·         De sorteo o rifa: Asignamos un nº a cada miembro de la población, calculamos el tamaño muestral y seleccionamos aleatoriamente ese nº. Este tipo de método no es fácil cuando la población es muy grande, pasando a usar el sistema que continua.
·         Tabla de números aleatorios: más económico y requiere menor tiempo. Se hace cuando disponemos de una lista informatizada en una base de datos de la población de estudio.
-          Aleatorio Sistemático.
1.       Similar al aleatorio simple, en donde cada unidad del universo tiene la misma probabilidad de ser seleccionada.
Ejemplo: si N:500 (población) y n:100 (personas que queremos en la muestra N/n=5         
5 será el intervalo para la selección de cada unidad muestral.  Si tengo las personas por número seria así: saco un número aleatorio de la población y a partir de ahí cada 5 elijo al sujeto de estudio. Si saco el 320 a partir de 325, 330, 335... Hasta llegar a 100. Si termino la lista y no he llegado al 100, vuelvo a empezar de nuevo, pero siempre con el intervalo que me ha salido.
-          Estratificado.
1.       Se caracteriza por la subdivisión de la población de estudio en subgrupos o estratos, debido a que las variables principales que deben someterse a estudio presentan cierta variabilidad o distribución conocida que puede afectar a los resultados. Si quiero hacer un estudio sobre cifras de presión arterial, si la población de estudio el 25% son menores de 15 años, el 50% entre 15-65 años y el 25% mayor de 65. Si la muestra que necesito es de 200 personas. Seleccionare aleatoriamente siguiendo el procedimiento anterior 100 personas de entre 15-65 años, 50 menores de 15 años, y 50 mayores de 65.  Se usa principalmente por motivos de edad y sexo.
-          Conglomerado.
1.       Se usa cuando no se dispone de una lista detallada y enumerada de cada una de las unidades que conforman el universo y resulta muy complejo elaborarla. En la selección de la muestra en lugar de escogerse cada unidad se toman los subgrupos o conjuntos de unidades conglomerados. Por ejemplo, quiero hacer un estudio de Andalucía (poblaciones amplias sobre las que se usa este método), calculo el tamaño muestral, pero si hago un muestreo aleatorio me puede salir cada sujeto en un pueblo distinto de la población andaluza, para evitarlo se seleccionan un grupo de municipios y dentro de ese municipio se hacen muestreo aleatorio simple.
2.       En este tipo de muestreo el investigador no conoce la distribución de la variable.
3.       Las inferencias que se hacen en una muestra conglomerada no son tan confiable como las que se obtienen en un estudio hecho por muestreo aleatorio, excluyendo directamente grandes municipios. El municipio se elige por estratificación a su vez.

v  MUESTREO NO PROBABILÍSTICO.

-          No se sigue el proceso aleatorio.
-          No puede considerarse que la muestra sea representativa de una población.
-          Se caracteriza porque el investigador selecciona la muestra siguiendo algunos criterios identificados para los fines del estudio que realiza.
-          Tipos:
1.       Por cuotas: en el que el investigador selecciona la muestra considerando algunos fenómenos o variables a estudiar, como: Sexo, raza, religión, etc. (No hay aleatoriedad)
2.       Accidental: consiste en utilizar para el estudio las personas disponibles en un momento dado, según lo que interesa estudiar. De las tres es la más deficiente.
3.       Por conveniencia o intencional. En el que el investigado, decide según sus objetivos, los elementos que integraran la muestra, considerando las unidades “típicas” de la población que se desea conocer. (En función de nuestro interés, nuestra accesibilidad…).

7.       TAMAÑO DE LA MUESTRA.

El tamaño de la muestra a tomar va  a depender de
-         - Error estándar.
-      - De la mínima diferencia entre los grupos de comparación que se considera importante en los valores de la variable a estudiar. Más grande debe ser la muestra para que más pequeño sea el error.
-          - De la variabilidad de la variable a estudiar (varianza en la población).