- Explique qué es la investigación cuasi-experimental y distinga claramente de la investigación tanto experimental como correlacional.
- Describa tres tipos diferentes de diseños de investigación cuasi-experimentales (grupos no equivalentes, pretest-postest y series de tiempo interrumpido) e identifique ejemplos de cada uno.
El prefijo cuasi significa «parecido». Por lo tanto, la investigación cuasiexperimental es una investigación que se asemeja a la investigación experimental, pero no es una verdadera investigación experimental. Aunque se manipula la variable independiente, los participantes no se asignan al azar a condiciones o órdenes de condiciones (Cook & Campbell, 1979). Debido a que la variable independiente se manipula antes de medir la variable dependiente, la investigación cuasi-experimental elimina el problema de la direccionalidad. Pero debido a que los participantes no se asignan al azar, lo que hace que sea probable que haya otras diferencias entre las condiciones, la investigación cuasi-experimental no elimina el problema de las variables de confusión. En términos de validez interna, por lo tanto, los cuasi-experimentos generalmente se encuentran en algún lugar entre los estudios correlacionales y los experimentos verdaderos.
Es más probable que los cuasi-experimentos se realicen en entornos de campo en qué asignación aleatoria es difícil o imposible. A menudo se realizan para evaluar la efectividad de un tratamiento — pe tal vez un tipo de psicoterapia o una intervención educativa. Hay muchos tipos diferentes de cuasi-experimentos, pero discutiremos solo algunos de los más comunes aquí.
Recuerde que cuando los participantes en un experimento entre sujetos se asignan al azar a condiciones, los grupos resultantes es probable que sean bastante similares. De hecho, los investigadores los consideran equivalentes. Sin embargo, cuando los participantes no se asignan al azar a las condiciones, es probable que los grupos resultantes sean diferentes de alguna manera. Por esta razón, los investigadores los consideran no equivalentes. Un diseño de grupos no equivalentes, entonces, es un diseño entre sujetos en el que los participantes no han sido asignados aleatoriamente a condiciones.
Imagine, por ejemplo, un investigador que quiere evaluar un nuevo método de enseñar fracciones a terceros. clasificadores. Una forma sería realizar un estudio con un grupo de tratamiento que consta de una clase de estudiantes de tercer grado y un grupo de control que consta de otra clase de estudiantes de tercer grado. Este diseño sería un diseño de grupos no equivalentes porque los estudiantes no son asignados aleatoriamente a clases por el investigador, lo que significa que podría haber diferencias importantes entre ellos. Por ejemplo, los padres de estudiantes con mayores logros o más motivados podrían haber sido más propensos a solicitar que sus hijos fueran asignados a la clase de la Sra. Williams. O el director podría haber asignado a los «alborotadores» a la clase del Sr. Jones porque él es un disciplinario más fuerte. Por supuesto, los estilos de los maestros, e incluso los entornos del aula, pueden ser muy diferentes y pueden causar diferentes niveles de logro o motivación entre Si al final del estudio hubo una diferencia en el conocimiento de las fracciones de las dos clases, podría haber sido causada por la diferencia entre los métodos de enseñanza, pero podría haber sido causada por cualquiera de estas variables de confusión.
Por supuesto, los investigadores que utilizan un diseño de grupos no equivalentes pueden tomar medidas para garantizar que sus grupos sean lo más similares posible. En el ejemplo actual, el investigador podría intentar seleccionar dos clases en la misma escuela, donde los estudiantes en las dos clases tienen puntajes similares en una prueba de matemáticas estandarizada y los maestros son del mismo sexo, tienen una edad similar y tienen estilos de enseñanza similares. Tomar tales medidas aumentaría la validez interna del estudio porque eliminaría algunas de las variables de confusión más importantes. Pero sin una verdadera asignación aleatoria de los estudiantes a las condiciones, existe la posibilidad de otras importantes variables de confusión que el investigador no pudo controlar.
Diseño de prueba previa y posterior
En una prueba previa -En el último diseño, la variable dependiente se mide una vez antes de la implementación del tratamiento y una vez después de la implementación. Imagine, por ejemplo, un investigador interesado en la eficacia de un programa de educación antidrogas sobre las actitudes de los estudiantes de la escuela primaria hacia las drogas ilegales. El investigador pudo medir las actitudes de los estudiantes de una escuela primaria en particular durante una semana, implementar el programa antidrogas durante la semana siguiente y, finalmente, medir sus actitudes nuevamente la semana siguiente. El diseño preprueba-posprueba es muy parecido a un experimento intra-sujetos en el que cada participante es evaluado primero bajo la condición de control y luego bajo la condición de tratamiento.Sin embargo, es diferente a un experimento intra-sujetos, en el sentido de que el orden de las condiciones no está contrabalanceado porque típicamente no es posible que un participante sea evaluado en la condición de tratamiento primero y luego en una condición de control «sin tratar».
Si el puntaje promedio posterior a la prueba es mejor que el puntaje promedio previo a la prueba, entonces tiene sentido concluir que el tratamiento podría ser responsable de la mejora. Desafortunadamente, a menudo no se puede concluir esto con un alto grado de certeza porque puede haber Otras explicaciones de por qué los puntajes posteriores a la prueba son mejores. Una categoría de explicaciones alternativas se conoce con el nombre de historia. Es posible que hayan sucedido otras cosas entre la prueba previa y la prueba posterior. Tal vez un programa antidrogas se transmitió por televisión y muchos de los estudiantes lo vieron, o tal vez una celebridad murió de una sobredosis de drogas y muchos de los estudiantes se enteraron. Otra categoría de explicaciones alternativas se conoce con el nombre de maduración. Los participantes pueden han cambiado entre la prueba previa y la prueba posterior en la forma en que iban a hacerlo de todos modos porque están creciendo y aprendiendo. Si fuera un programa de un año, los participantes podrían volverse menos impulsivos o mejores razonadores y esto podría ser responsable del cambio.
Otra explicación alternativa para un cambio en la variable dependiente en un diseño pretest-postest es la regresión a el significado. Esto se refiere al hecho estadístico de que un individuo que puntúa extremadamente en una variable en una ocasión tenderá a puntuar menos en la próxima ocasión. Por ejemplo, un jugador de bolos con un promedio a largo plazo de 150 que de repente lanza un 220 obtendrá una puntuación más baja en el próximo juego. Su puntuación «retrocederá» hacia su puntuación media de 150. La regresión a la media puede ser un problema cuando los participantes se seleccionan para estudios posteriores debido a sus puntuaciones extremas. Imagine, por ejemplo, que solo los estudiantes que obtuvieron puntuaciones especialmente bajas en una prueba de a las fracciones se les da un programa de entrenamiento especial y luego se vuelven a probar. La regresión a la media casi garantiza que sus puntajes serán más altos incluso si el programa de entrenamiento no tiene ningún efecto. Un concepto estrechamente relacionado, y uno extremadamente importante en la investigación psicológica, es la remisión espontánea . Esta es la tendencia de muchos problemas médicos y psicológicos a mejorar con el tiempo sin ningún tipo de tratamiento. El resfriado común es un buen ejemplo. Si se midiera la gravedad de los síntomas en 100 personas que padecen un resfriado común hoy en día, déles un plato de sopa de pollo todos los días, y luego medir la gravedad de sus síntomas nuevamente en una semana, probablemente mejorarían mucho. Esto no significa que la sopa de pollo fue responsable de la mejora, sin embargo ver, porque habrían mejorado mucho sin ningún tratamiento en absoluto. Lo mismo ocurre con muchos problemas psicológicos. Es probable que un grupo de personas con depresión grave hoy en día esté menos deprimido en promedio en 6 meses. Al revisar los resultados de varios estudios de tratamientos para la depresión, los investigadores Michael Posternak e Ivan Miller encontraron que los participantes en condiciones de control en lista de espera mejoraron un promedio de 10 a 15% antes de recibir ningún tratamiento (Posternak & Miller, 2001). Por lo tanto, en general, se debe tener mucho cuidado al inferir causalidad a partir de diseños preprueba-posprueba.
Los primeros estudios sobre la eficacia de la psicoterapia tendían a utilizar diseños preprueba-posprueba. En un artículo clásico de 1952, el investigador Hans Eysenck resumió los resultados de 24 estudios de este tipo que muestran que alrededor de dos tercios de los pacientes mejoraron entre la prueba previa y la prueba posterior (Eysenck, 1952). Pero Eysenck también comparó estos resultados con datos de archivo de hospitales estatales y seguros. registros de la empresa que muestran que pacientes similares se recuperaron aproximadamente al mismo ritmo sin recibir psicoterapia. Este paralelo sugirió a Eysenck que la mejoría que los pacientes mostraron en los estudios pretest-postest podría no ser más que una remisión espontánea. Tenga en cuenta que Eysenck no llegó a la conclusión de que la psicoterapia fuera ineficaz. Simplemente concluyó que no había evidencia de que lo fuera, y escribió sobre «la necesidad de estudios experimentales debidamente planificados y ejecutados en este importante campo» (p. 323). Puede leer el artículo completo aquí: Classics in the History of Psicología.
Afortunadamente, muchos otros investigadores aceptaron el desafío de Eysenck, y para 1980 se habían realizado cientos de experimentos en los que los participantes fueron asignados aleatoriamente a condiciones de tratamiento y control, y Los resultados se resumieron en un libro clásico de Mary Lee Smith, Gene Glass y Thomas Miller (Smith, Glass, & Miller, 1980). Descubrieron que la psicoterapia general era bastante eficaz, con Aproximadamente el 80% de los participantes del tratamiento mejoran más que el participante de control promedio Las investigaciones posteriores se han centrado más en las condiciones en las que los diferentes tipos de psicoterapia son más o menos efectivos.
Diseño de serie de tiempo interrumpido
Una variante del diseño de preprueba-posprueba es el diseño de serie de tiempo interrumpido. Una serie de tiempo es un conjunto de medidas tomadas a intervalos durante un período de tiempo. Por ejemplo, una empresa de fabricación podría medir la productividad de sus trabajadores cada semana durante un año. En un diseño de series de tiempo interrumpido, una serie de tiempo como esta es «interrumpida» por un tratamiento. En un ejemplo clásico, el tratamiento fue la reducción de los turnos de trabajo en una fábrica de 10 horas a 8 horas (Cook & Campbell, 1979). Debido a que la productividad aumentó bastante rápido después del acortamiento de los turnos de trabajo, y debido a que se mantuvo elevada durante muchos meses después, el investigador concluyó que el acortamiento de los turnos provocó el aumento de Tenga en cuenta que el diseño de series de tiempo interrumpido es como un diseño preprueba-posprueba en el sentido de que incluye mediciones de la variable dependiente antes y después del tratamiento. Sin embargo, es diferente al diseño preprueba y mediciones posteriores a la prueba.
La Figura 7.3 muestra datos de un estudio hipotético de series de tiempo interrumpidas. La variable dependiente es el número de ausencias de los estudiantes por semana en un curso de métodos de investigación. El tratamiento es que el El instructor comienza a tomar la asistencia públicamente todos los días para que los estudiantes sepan que el instructor sabe quién está presente y quién está ausente. El panel superior de la Figura 7.3 muestra cómo se verían los datos si este tratamiento funcionara. Hay un número constantemente elevado de ausencias antes del tratamiento, y hay una disminución inmediata y sostenida de las ausencias después del tratamiento. El panel inferior de la Figura 7.3 muestra cómo se verían los datos si este tratamiento no funcionara. En promedio, el número de ausencias después del tratamiento es aproximadamente el mismo que el número anterior. Esta figura también ilustra una ventaja del diseño de series de tiempo interrumpido sobre un diseño más simple de preprueba-posprueba. Si hubiera habido solo una medición de ausencias antes del tratamiento en la semana 7 y una después en la semana 8, entonces habría parecido que el tratamiento fue el responsable de la reducción. Las múltiples mediciones antes y después del tratamiento sugieren que la reducción entre las semanas 7 y 8 no es más que una variación normal de una semana a otra.
Diseños combinados
Un tipo de diseño cuasi-experimental que generalmente es mejor que el diseño de grupos no equivalentes o el pretest-postest El diseño es aquel que combina elementos de ambos. Hay un grupo de tratamiento que recibe una prueba previa, recibe un tratamiento y luego recibe una prueba posterior. Pero al mismo tiempo, hay un grupo de control al que se le da una prueba previa, no recibe el tratamiento y luego se le administra una prueba posterior. Entonces, la pregunta no es simplemente si los participantes que reciben el tratamiento mejoran, sino si mejoran más que los participantes que no reciben el tratamiento.
Imagine, por ejemplo, que los estudiantes de una escuela reciben una prueba previa sobre sus actitudes hacia las drogas, luego se exponen a un programa antidrogas y finalmente se les hace una prueba posterior. Los estudiantes de una escuela similar reciben la prueba preliminar, no están expuestos a un programa antidrogas y, finalmente, reciben una prueba posterior. Nuevamente, si los estudiantes en la condición de tratamiento se vuelven más negativos hacia las drogas, este cambio de actitud podría ser un efecto del tratamiento, pero también podría ser una cuestión de historia o maduración. Si realmente es un efecto del tratamiento, entonces los estudiantes en la condición de tratamiento deberían volverse más negativos que los estudiantes en la condición de control. Pero si se trata de una cuestión de historia (por ejemplo, noticias de una sobredosis de drogas de celebridades) o de maduración (por ejemplo, razonamiento mejorado), entonces es probable que los estudiantes en las dos condiciones muestren cantidades similares de cambio. Sin embargo, este tipo de diseño no elimina por completo la posibilidad de confusión de variables. Algo podría ocurrir en una de las escuelas pero no en la otra (p. Ej., Una sobredosis de drogas por parte de un estudiante), por lo que los estudiantes de la primera escuela se verían afectados y los estudiantes de la otra no.
Finalmente, si los participantes en este tipo de diseño se asignan aleatoriamente a condiciones, se convierte en un verdadero experimento en lugar de un cuasi experimento. De hecho, es el tipo de experimento que Eysenck pidió, y que ahora se ha realizado muchas veces, para demostrar la eficacia de la psicoterapia.
- Investigación cuasi-experimental implica la manipulación de una variable independiente sin la asignación aleatoria de participantes a condiciones u órdenes de condiciones.Entre los tipos importantes se encuentran los diseños de grupos no equivalentes, pretest-postest y diseños de series de tiempo interrumpidas.
- La investigación cuasi-experimental elimina el problema de la direccionalidad porque involucra la manipulación de la variable independiente. Sin embargo, no elimina el problema de las variables de confusión porque no implica la asignación aleatoria a las condiciones. Por estas razones, la investigación cuasi-experimental es generalmente más alta en validez interna que los estudios correlacionales pero más baja que los experimentos verdaderos.
- Práctica: Imagine que dos profesores deciden probar el efecto de dar cuestionarios diarios sobre el desempeño de los estudiantes en un curso de estadística. Deciden que el profesor A dará pruebas, pero el profesor B no. Luego compararán el desempeño de los estudiantes en sus dos secciones en un examen final común. Enumere otras cinco variables que podrían diferir entre las dos secciones que podrían afectar los resultados.
- Discusión: Imagine que un grupo de niños obesos es reclutado para un estudio en el que se mide su peso, luego participan durante 3 meses en un programa que los anima a ser más activos, y finalmente se vuelve a medir su peso. Explique cómo cada uno de los siguientes podría afectar los resultados:
- regresión a la media
- remisión espontánea
- historial
- maduración
Descripciones de imágenes
Figura 7.3 Descripción de la imagen: Gráficos de dos líneas que muestran el número de ausencias por semana durante 14 semanas . Las primeras 7 semanas son sin tratamiento y las últimas 7 semanas con tratamiento. En el gráfico de la primera línea, hay entre 4 y 8 ausencias por semana. Después del tratamiento, las ausencias caen de 0 a 3 por semana, lo que sugiere que el tratamiento funcionó. En el gráfico de la segunda línea, no hay un cambio notable en el número de ausencias por semana después del tratamiento, lo que sugiere que el tratamiento no funcionó.
Un diseño entre sujetos en el que los participantes no han sido asignados aleatoriamente a condiciones.
La variable dependiente se mide una vez antes el tratamiento se implementa y una vez que se implementa.
Una categoría de explicaciones alternativas para las diferencias entre las puntuaciones, como los eventos que ocurrieron entre la prueba previa y la prueba posterior, no relacionados con el estudio.
Una explicación alternativa que se refiere a cómo los participantes podrían haber cambiado entre la prueba previa y la prueba posterior en las formas en que iban a hacerlo de todos modos porque están creciendo y aprendiendo.
El hecho estadístico de que un individuo que puntúa extremadamente en una variable en una ocasión tenderá a puntuar menos en la próxima ocasión.
La tendencia de muchos problemas médicos y psicológicos a mejorar con el tiempo sin ningún tipo de tratamiento.
Un conjunto de medidas tomadas a intervalos durante un período de tiempo que son interrumpidos por un tratamiento.