1.
INFERENCIA ESTADÍSTICA
Cuando planteamos un estudio en el ámbito sanitario para
establecer relaciones entre variables, nuestro interés no suele estar
exclusivamente en los pacientes concretos a los que hemos tenido acceso, sino
más bien en todos los pacientes similares a estos. (Inferir)
Al inferir nunca tienes el dato seguro de toda la población
sobre la que deduces los resultados de un estudio realizado anteriormente sobre
la población que nos interesa, al inferir siempre hay error aleatorio.
Ø Al conjunto de pacientes sobre los
que queremos estudiar alguna cuestión (sacar conclusiones) le llamamos población de estudio.
Ø Al conjunto de individuos concretos
que participan en el estudio le denominamos muestra.
Ø Al número de individuos de la muestra
le denominamos tamaño muestral.
Ø Al conjunto de procedimientos
estadísticos que permiten pasar de lo particular, la muestra, a lo general, la
población, le denominamos inferencia
estadística.
Ø Al conjunto de procedimientos que
permiten elegir muestras de tal forma que éstas reflejen las características de
la población le llamamos Técnicas de muestreo,
esto se hace para evitar sesgos.
Siempre que trabajamos con muestras, aunque sean
representativas, (no estudiamos el problema en toda la población sino en una
parte de ella), hay que asumir un cierto error.
Ø Si la muestra se elige por un
procedimiento de azar, se puede evaluar ese error. La técnica de muestreo en
ese caso se denomina muestreo
probabilístico o aleatorio y el error asociado a esa muestra elegida al
azar se llama error aleatorio.
Ø En los muestreos no probabilísticos
(Ej: estudios de conveniencia. Utilizar a los pacientes de mi hospital como
muestra), no es posible evaluar el error. En los muestreos probabilísticos, el
error aleatorio es inevitable pero es evaluable gracias a las leyes de la
probabilidad.
Ø Cuanto mayor sea el tamaño de la
muestra, favorezco la reducción del error aleatorio por probabilidad.n las
distintas muestras de un determinado tamaño que pudiésemos tomar de una
población.
Ø Cuanto más pequeño es el error
estándar de un estimador, más nos podemos fiar del valor de una muestra
concreta.
s=desviación
típica
n=tamaño
de la muestra
p=
proporción estimada en la muestra.
|
Si en lugar de variar
el valor de la media en las muestras entre 52 y 64 días, variara entre 20 y 90
días, sería menos probable que al seleccionar una muestra y calcular su media,
ésta estuviera cercana a 57,46, que es el valor de la media en la población.
2.
ERROR ESTÁNDAR.
Ø Es la medida que trata de captar la
variabilidad de los valores del estimador (en este caso la media de los días de
curación de la úlcera).
Ø El error estándar de cualquier
estimador mide el grado de variabilidad en los valores del estimador en las
distintas muestras de un determinado tamaño que pudiésemos tomar de una
población.
Ø Cuanto más pequeño es el error
estándar de un estimador, más nos podemos fiar del valor de una muestra
concreta.
s=desviación
típica
n=tamaño
de la muestra
p=
proporción estimada en la muestra.
|
Si en lugar de variar
el valor de la media en las muestras entre 52 y 64 días, variara entre 20 y 90
días, sería menos probable que al seleccionar una muestra y calcular su media,
ésta estuviera cercana a 57,46, que es el valor de la media en la población.
3.
TEOREMA CENTRAL DEL LÍMITE
Para estimadores que pueden ser expresados como suma de
valores muestrales, la distribución de sus valores sigue una distribución
normal con media de la población y desviación típica igual al error estándar
del estimador de que se trate.
Si en vez de una muestra, seleccionara 100 muestras y
calculara las medias y las pusiera en un histograma, tendría una distribución
normal, en la cual el error estándar coincide con la desviación estándar del
histograma, por lo tanto si le sumo y le resto a la media una vez la desviación
estándar, es decir, el error estándar, tendré el 68.26% de las observaciones.
Si sigue una distribución normal, sigue los principios básicos
de ésta:
-
1S 68,26%
de las observaciones (muestras).
-
2S 95,45%
de las observaciones.
-
1,95S 95%
de las observaciones
-
3S 99,73% de las
observaciones.
-
2,58S 99% de las observaciones.
4.
INTERVALOS DE CONFIANZA:
Ø Son un medio de conocer el parámetro
en una población midiendo el error que tiene que ver con el azar (error
aleatorio).
Ø Se trata de un par de números tales
que, con un nivel de confianza determinados, podamos asegurar que el valor del
parámetro es mayor o menor que ambos números.
Ø Se calcula considerando que el
estimador muestral sigue una distribución normal, como establece la teoría
central del límite.
Cálculo:
-
-
Z
es un valor que depende del nivel de confianza 1-α con que se quiera dar el intervalo (α=error máximo
admisible: 5%). Por lo tanto Z tiene que ver con el valor que va delante de S
en el teorema central del límite. Si I.C es más alto, más probabilidad de que
el intervalo esté dentro y por tanto la horquilla será mayor.
-
Para
nivel de confianza 68% z=1 (No suele utilizarse un intervalo de confianza del
68% porque asumimos un error máximo del 5%)
-
Para
nivel de confianza 95% z=1,96à2.
-
Para
nivel de confianza 99% z=2,58à3.
-
El
signo
significa que cuando se elija el signo
negativo se conseguirá el extremo inferior del intervalo y cuando se elija el
positivo se tendrá el extremo superior.
Mientras mayor sea la confianza que queramos otorgar al
intervalo, éste será más amplio, es decir, el extremo inferior y el superior
del intervalo estarán más distanciados y, por tanto, el intervalo será menos
preciso.
Se puede calcular intervalos de confianza para cualquier
parámetro: medias aritméticas, proporciones, riesgos relativos, odds ratio…
en las formulas
cada vez que usamos proporcion la expresamos en la formula en tantos por 1 y no
en tantos por 100 (%)
5.
PROCEDIMIENTO MUESTRAL. (Técnica De Muestreo).
-
Un
muestreo es un método tal que al escoger un grupo pequeño de una población
podamos tener un grado de probabilidad de que ese pequeño grupo posea las
características de la población que estamos estudiando.
-
La
población general de la queremos obtener conclusiones la vamos a elegir al azar
(aleatoriamente), para obtener la muestra y a partir de esta hacer inferencia
de la población entera à (confianza (intervalo de confianza) en %).
6.
TIPOS DE MUESTREO.
-
Probabilístico. Todos los
sujetos de la población tienen una probabilidad distinta de cero en la selección
de la muestra y conocida. Existe una probabilidad conocida de seleccionar a los
sujetos. Por ejemplo, si vamos a seleccionar 5 sujetos de la clase, y somos un
total de 50, tendré un 10 % de probabilidad de ser elegida. Sin embargo si lo
hacemos a cualquier persona que pase por la calle, no sabemos a quién vamos a
encontrarnos para incluir en la selección.
1.
Aleatorio simple. P=1/nà por azar (que azar no es ponerme en una esquina y el
que pase por aquí)
2.
Aleatorio sistemático.à estas tres son variaciones del muestreo aleatorio
simple.
3.
Estratificado.
4.
Conglomerados.
-
No probabilístico o de conveniencia
del investigador. Puede
haber personas en la población que no tengan probabilidad o que se
desconozca, de ser seleccionado en la
muestra. No existe probabilidad conocida, es una selección arbitraria.
(“Muestreo de lo que tengo a mano”)
1.
Accidental. Son aquellos en los que los sujetos
de la población no tienen una probabilidad conocida o distinta de 0.
2.
Por cuotas. Me pongo a pasar un cuestionario en
una esquina pero el 50% a mujeres y 50% a hombres, despreciando a la mujer 51
que pasa por la esquina.
v
MUESTREO PROBABILÍSTICO.
Todos y cada uno de los elementos tienen la misma
probabilidad de ser elegidos para la muestra. Es el método que consiste en extraer una parte
(o muestra) de una población o universo, de tal forma que todas las muestras
posibles de tamaño fijo, tengan la misma posibilidad de ser seleccionados.
-
Aleatorio Simple. (Es el más fiable y equitativo)
1. Se caracteriza porque cada unidad
tiene la probabilidad equitativa de ser incluida en la muestra:
·
De sorteo o rifa: Asignamos un nº a cada miembro de la
población, calculamos el tamaño muestral y seleccionamos aleatoriamente ese nº.
Este tipo de método no es fácil cuando la población es muy grande, pasando a
usar el sistema que continua.
·
Tabla de números aleatorios: más económico y requiere menor
tiempo. Se hace cuando disponemos de una lista informatizada en una base de
datos de la población de estudio.
-
Aleatorio Sistemático.
1. Similar al aleatorio simple, en donde
cada unidad del universo tiene la misma probabilidad de ser seleccionada.
Ejemplo: si N:500 (población) y n:100
(personas que queremos en la muestra N/n=5
5 será el intervalo para la selección de cada unidad
muestral. Si tengo las personas por número
seria así: saco un número aleatorio de la población y a partir de ahí cada 5 elijo
al sujeto de estudio. Si saco el 320 a partir de 325, 330, 335... Hasta llegar
a 100. Si termino la lista y no he llegado al 100, vuelvo a empezar de nuevo,
pero siempre con el intervalo que me ha salido.
-
Estratificado.
1. Se caracteriza por la subdivisión de
la población de estudio en subgrupos o estratos, debido a que las variables
principales que deben someterse a estudio presentan cierta variabilidad o
distribución conocida que puede afectar a los resultados. Si quiero hacer un
estudio sobre cifras de presión arterial, si la población de estudio el 25% son
menores de 15 años, el 50% entre 15-65 años y el 25% mayor de 65. Si la muestra
que necesito es de 200 personas. Seleccionare aleatoriamente siguiendo el
procedimiento anterior 100 personas de entre 15-65 años, 50 menores de 15 años,
y 50 mayores de 65. Se usa
principalmente por motivos de edad y sexo.
-
Conglomerado.
1. Se usa cuando no se dispone de una
lista detallada y enumerada de cada una de las unidades que conforman el
universo y resulta muy complejo elaborarla. En la selección de la muestra en
lugar de escogerse cada unidad se toman los subgrupos o conjuntos de unidades conglomerados. Por ejemplo, quiero
hacer un estudio de Andalucía (poblaciones amplias sobre las que se usa este
método), calculo el tamaño muestral, pero si hago un muestreo aleatorio me
puede salir cada sujeto en un pueblo distinto de la población andaluza, para
evitarlo se seleccionan un grupo de municipios y dentro de ese municipio se
hacen muestreo aleatorio simple.
2. En este tipo de muestreo el
investigador no conoce la distribución de la variable.
3. Las inferencias que se hacen en una
muestra conglomerada no son tan confiable como las que se obtienen en un estudio
hecho por muestreo aleatorio, excluyendo directamente grandes municipios. El
municipio se elige por estratificación a su vez.
v
MUESTREO NO PROBABILÍSTICO.
-
No
se sigue el proceso aleatorio.
-
No
puede considerarse que la muestra sea representativa de una población.
-
Se
caracteriza porque el investigador selecciona la muestra siguiendo algunos
criterios identificados para los fines del estudio que realiza.
-
Tipos:
1. Por cuotas: en
el que el investigador selecciona la muestra considerando algunos fenómenos o
variables a estudiar, como: Sexo, raza, religión, etc. (No hay aleatoriedad)
2. Accidental:
consiste en utilizar para el estudio las personas disponibles en un momento
dado, según lo que interesa estudiar. De las tres es la más deficiente.
3. Por conveniencia o intencional. En el que el investigado, decide según sus objetivos, los
elementos que integraran la muestra, considerando las unidades “típicas” de la
población que se desea conocer. (En función de nuestro interés, nuestra
accesibilidad…).
7.
TAMAÑO DE LA MUESTRA.
El
tamaño de la muestra a tomar va a
depender de
- - Error
estándar.
- - De
la mínima diferencia entre los grupos de comparación que se considera
importante en los valores de la variable a estudiar. Más grande debe ser la
muestra para que más pequeño sea el error.
- - De
la variabilidad de la variable a estudiar (varianza en la población).