Artículos
Artículos anteriores, para verlos pulsar en el título:
Artículo mes de Septiembre 2008
Importancia del Factor Humano XIII
Importancia del Factor Humano XII
Importancia del Factor Humano XI
Importancia del Factor Humano X
Importancia del Factor Humano IX
Importancia del Factor Humano VIII
Importancia del Factor Humano VII
Importancia del Factor Humano VI
Importancia del Factor Humano V
Importancia del Factor Humano IV
Importancia del Factor Humano III
Importancia del Factor Humano II Importancia
del Factor Humano I Características
de una Tripulación de Vuelo.
La Seguridad Aérea Militar III
Seguridad de las Organizaciones IV.
Seguridad de las Organizaciones III.
Seguridad de las Organizaciones II
Seguridad de las Organizaciones I
Responsabilidades Comandante Líneas Aéreas.
Gestión de los Recursos de Cabina CRM
El Objeto de la Seguridad de Vuelo
Articulo
Octubre 2008 UNA TÉCNICA PARA ELABORAR ESCALAS DE ACTITUDES
(I)
En
artículos anteriores, se ha pasado revista a varios de los métodos que
se siguen para elaborar escalas de actitudes; el método de intervalos
aparentemente iguales, desarrollado por Thurstone; el método de
estimaciones sumatorias, desarrollado por Likert y el método de análisis
escalar creado por Guttman. El método de intervalos aparentemente iguales y
el de estimaciones sumatorias son similares en cuanto que suministran técnicas
para seleccionar, de un numero grande de reactivos, un conjunto que constituye
el instrumento de medida. El análisis escalar difiere de estos dos métodos en
que se ocupa de la evaluación de un conjunto de reactivos, después de que estos,
de uno u otro modo, ya han sido seleccionados.
En el método de intervalos aparentemente iguales, un grupo de peritos clasifica
reactivos de opinión en 9 u 11 categorías que constituyen un continuo que varia
de desfavorable a favorable. El valor escalar de cada reactivo se determina por
el punto del continuo, por encima y por debajo, en el cual el 50% de los peritos
colocan tal reactivo. La dispersión de las estimaciones de los peritos se mide
por Q, la amplitud intercuartilar. Un valor de Q alto para un reactivo indica
que los peritos están en desacuerdo con la ubicación del reactivo en el
continuo, lo que a su vez significa que el reactivo es ambiguo. Tanto los
valores de Q como los escalares se usan en la selección de reactivos para el
test de actitud. Con tal propósito se seleccionan aproximadamente 20 reactivos
con valores escalares espaciados igualmente a lo largo del continuo y con
valores de Q pequeños. Se determinan las puntuaciones del test hallando la
mediana de los valores escalares de los reactivos con los que esta de acuerdo el
sujeto.
En el método de estimaciones sumatorias se seleccionan reactivos con un criterio
de consistencia interna. Los sujetos indican si están: completamente de acuerdo,
de acuerdo, en duda, en desacuerdo o completamente en desacuerdo, con cada
reactivo. Se asignan valores numéricos a estas categorías de respuesta usando
los enteros sucesivos de 0 a 4; el valor más alto se asigna consecuentemente a
la categoría que indica la actitud más favorable. Se selecciona un grupo
superior y uno inferior, con base en las puntuaciones totales obtenidas de la
suma de los valores de los reactivos. Después se comparan las respuestas de
estos dos grupos en los reactivos individuales; y los 20 reactivos más
discriminantes o poco más o menos se seleccionan para el test de actitud. Una
puntuación de actitud en este test se determina sumando los valores asignados a
las respuestas del sujeto a los 20 reactivos.
En el análisis escalar, se prueba un conjunto completo de reactivos para
determinar si, como grupo, constituyen una escala en el sentido de que a partir
de la puntuación de orden jerárquico sea posible reproducir la respuesta de un
sujeto a los reactivos individuales. El grado en que esto es posible se expresa
por el coeficiente de reproductibilidad. Aunque ordinariamente Guttman emplea
de 10 a 12 reactivos, para explicar con claridad ate coeficiente supongamos que
tenemos tres reactivos, cada uno con sólo dos categorías de respuesta: de
acuerdo y en desacuerdo. Supondremos que la respuesta "de acuerdo", en cada
caso, representa una actitud favorable y la respuesta "en desacuerdo" una
actitud desfavorable. Se asigna el valor 0 a la respuesta en desacuerdo y el
valor 1 a la respuesta de acuerdo. Supongamos también que con respecto al primer
reactivo tenemos en nuestra muestra 10 sujetos con valor 1, y 90 con valor 0;
con respecto al segundo reactivo tenemos 20 sujetos con valores de 1, y 80 con
valores de 0; y para el tercer reactivo tenemos 40 con valores de 1, y 60 con
valores de 0.
En el caso de reproductibilidad perfecta, los 10 sujetos con valor 1 en el
primer reactivo serán los 10 sujetos con las puntuaciones de orden jerárquico
más altas. Estos 10 sujetos también estarán comprendidos en los 20 que tienen
valor 1 en el segundo reactivo; y estos
Además del coeficiente de reproductibilidad (10, 12), existen
otros criterios que se aplican para determinar si un conjunto de reactivos
constituye una escala. Sin embargo, poco se ha publicado tocante a los casos en
que se han aplicado empíricamente estos criterios a un conjunto concreto de
datos. El coeficiente de reproductibilidad ha sido destacado en todas las
publicaciones de Guttman, quizá porque se considera una condición primaria e inevitable, pero
insuficiente, de una escala.
El análisis escalar, en el sentido antes mencionado, se
convierte entonces en una técnica secundaria dentro del problema de la selección
de reactivos; esto no niega la importancia de la teoría que fundamenta el
análisis escalar. Lo importante es obtener un conjunto de reactivos que den
alguna seguridad al investigador de que formarán una escala cuando se aplique
una técnica particular para probar su adaptabilidad a una escala. Hasta época
reciente, el problema de la selección de reactivos en el análisis escalar parece
haberse dejado a la intuición y experiencia del investigador. Las únicas reglas
prácticas sugieren que uno debe expresar, sencillamente, la misma pregunta, de
maneras ligeramente diferentes, o que uno debe buscar reactivos cuyo contenido
sea lo más homogéneo posible.
Esta última recomendación implica que, si estuviéramos
interesados en el problema de la actitud hacia los negros, deberíamos dividir
este universo de contenido en subuniversos que constituyeran tal vez áreas tales
como la actitud hacia los negros en restaurantes; la actitud hacia los negros
como residente en la comunidad, como votantes y como patrones; la actitud hacia
los negros en los transportes públicos y así sucesivamente. Pero aún aquí
encontramos que la actitud hacia los negros, digamos en los transportes
públicos, puede dividirse en áreas de contenido aún más homogéneas al
especificar los transportes: tranvías, autobuses, trenes, aviones, etc. Cada una
de estas áreas de contenido quizás pueda dividirse en otras aún más homogéneas y
vendríamos a terminar seguramente como !o indica Festinger, con múltiples
expresiones de la misma pregunta; y así nuestras dos reglas no son sino una.
Cualquier técnica que nos permitiera seleccionar un conjunto
de reactivos del conjunto más grande de posibles reactivos, con cierta seguridad
en que el conjunto seleccionado llenaría los requisitos del análisis escalar,
sería de gran valor. En este artículo se describe una técnica que ha tenido
éxito en la tarea. Por razones que se conocerán más adelante, hemos llamado a
esta técnica "método de discriminación escalar para elaborar escalas de
actitud".
LA TÉCNICA DE DISCRIMINACIÓN ESCALAR
El método de discriminación escalar se basa en
investigaciones previas que mostraron que el punto de corte (el punto de corte
de un reactivo indica el lugar de las puntuaciones de orden jerárquico de los
sujetos donde la respuesta más común cambia de una categoría (de acuerdo) a la
siguiente (en desacuerdo). Entre los puntos de corte de una escala perfecta,
todas las respuestas caen en la misma categoría.), de un reactivo está
relacionado con el valor escalar thurstoniano del reactivo; y que su
reproductibilidad (la reproductibilidad de un reactivo se mide por el grado en
que pueden reproducirse las respuestas al reactivo a partir de las puntuaciones
de orden jerárquico de los sujetos) se vincula con su poder discriminativo.
Este, como ya se hizo notar, no es, contra lo que pudiese
parecer a primera vista, solamente una función del valor escalar del reactivo.
Puede demostrarse expeditamente que reactivos con valores escalares
thurstonianos y valores de Q semejantes pueden diferir grandemente en su
eficacia para diferenciar los que tienen actitudes favorables de los de
actitudes desfaborables. Por ejemplo, el reactivo extremo: "Todos los xxxx deben
ser ejecutados" indudablemente presentaría un valor escalar en un extremo del
continuo y un valor Q claramente pequeño. Pero este reactivo no establecerá
diferencia entre los que tienen actitudes favorables o desfavorables hacia los
xxxx por la evidente razón de que ambos grupos probablemente reaccionarían a él
del mismo modo.
Se reunieron aseveraciones de opinión sobre ciencia, de muy
diversas fuentes. Se consultaron libros y ensayos. Se pidió a individuos que
expresaran sus opiniones en breves afirmaciones escritas; y se lograron reunir
266 aseveraciones sobre el particular. En la edición de estos reactivos, se
atendió especialmente a la eliminación de aquellos reactivos que: eran propensos a ser ratificados
por individuos con actitudes opuestas; se referían a hechos precisos o
podían interpretarse como tales; obviamente no tenían relación con
el asunto considerado; parecía probable que todos o
ninguno los ratificara; parecían estar sujetos a varias
interpretaciones por alguna razón; contenía una o varias palabras no
corrientes en el vocabulario de los estudiantes universitarios.
Gracias al cuidado con que se realizó la recolección y la
edición de las aseveraciones, la mayoría de las 155 seleccionadas finalmente
expresaron una opinión claramente favorable o desfavorable hacia la ciencia.
Otros 13 reactivos, que pudiésemos llamar de control, se
agregaron a los 155 originales. Estos 13 últimos se agregaron para determinar lo
que les sucedía a lo largo de las diferentes etapas del método de discriminación
escalar. De los 13 reactivos, 7 se juzgaron "neutrales", en el sentido de
Thurstone; 2 podían interpretarse como relativos a hechos precisos; uno se
consideró demasiado extremo para recibir muchas ratificaciones, otro se juzgó
ambiguo porque las palabras "scientific holiday" (festividad científica) podrían
interpretarse como una moratoria o como una celebración; otro más se consideró
ambiguo porque comprendía más de una dimensión; y un último se consideró
inadecuado. Había, en consecuencia, 168 reactivos que se emplearon para probar
el método de discriminación escalar de elaboración de escalas. Debe recalcarse
que la inclusión de reactivos de "control" no se considera parte del
procedimiento de discriminación escalar
Determinación de los valores escalares y valores Q de los
reactivos
Se prepararon sobres numerados del 1 al 110. En cada sobre se
colocó un conjunto de tarjetas de 8 x 12 cm. marcadas con las letras A, B, C, D,
E, F, G, H, I y un paquete de tiras de papel de 5 X 10 cm aproximadamente. En
cada tira de papel, se imprimió uno de los 168 reactivos junto con el número del
reactivo. En cada caso se barajó el paquete de tiras de modo que los reactivos
quedaran absolutamente desordenados. Se entregaron los sobres a un grupo de
estudiantes de la clase de psicología elemental, junto con las instrucciones que
describen el procedimiento de clasificación de Thurstone, y se les pidió que
clasificaran los reactivos de acuerdo con las instrucciones.
Se examinaron las clasificaciones de cada sujeto y se
descartaron aquéllos cuyas clasificaciones presentaban inversiones obvias del
continuo o que no atendieron las instrucciones. Sobre esta base se quedaron con
82 grupos de juicios.
Se tabularon las frecuencias de juicio en cada una de las 9
categorías con respecto a cada reactivo; se transformaron en frecuencias
acumulativas y después en proporciones acumulativas, ( Esta tarea fue muy
laboriosa. Casi 14000 tiras de papel tuvieron que clasificarse para después ser
tabuladas. Algunas técnicas de juicio similares a las empleadas por Ballin y
Famworth o Seashore y Hevner reducirían mucho este trabajo, pero aún así
la tarea no es sencilla. Varios métodos que simplifican el proceso de juicio se
están usando actualmente).
Se dibujó la ojiva correspondiente a cada reactivo; las
proporciones acumulativas se colocaron en el eje de las ordenadas y los valores
escalares en el eje de las abscisas. Estos valores se escribieron con dos cifras
decimales (el segundo decimal fue solamente una aproximación) las cuales se
obtuvieron trazando una perpendicular a la línea base de los valores escalares
en el punto donde la curva de proporción acumulativa cruzó la marca del 50%. De
manera similar se determinaron valores Q trazando perpendiculares en los niveles
del 25 y 75%; Q era la distancia entre estos dos puntos, o sea la amplitud
intercuartilar; (Esta operación se simplificó estableciendo una gráfica maestra
con las proporciones acumulativas en el eje Y y los valores escalares en el eje
X. Se enrolló la gráfica en una placa de vidrio granulado que se adaptó a una
caja de madera cerrada que contenía un bulbo de 100 vatios. Luego se colocó
papel para dibujar sobre dicha gráfica y se representaron rápidamente las ojivas
de los reactivos individuales.)
Posteriormente se dibujaron los 168 reactivos en una
distribución bivariada de acuerdo con los valores escalares y de Q; los valores
escalares se representaron en la línea base. La distribución de estos adquirió
la forma bimodal. Hubo muy pocos reactivos en la zona "neutral" (ninguno entre
5.0 y 5.9); las categorías modales iban de 1.0 a 1.9 y de 7.0 a 7.9. Los valores
Q de los 7 reactivos que cayeron en el intervalo escalar "neutral" (de 4.0 a
4.9) fueron muy bajos; 6 de ellos cayeron por debajo del valor Q mediano de los
168 reactivos. Estos 7 reactivos fueron los de "control", descritos
anteriormente.
Se dibujó una línea a través de la distribución
aproximadamente en la mediana de los valores Q de todos los reactivos, en 1.29.
Todos los reactivos con valores Q por encima de este punto fueron rechazados. A
partir de este momento trabajamos solamente con los 83 reactivos restantes, o
sea aproximadamente el 50% del conjunto inicial de reactivos con el menor grado
de ambigüedad según es medida por Q. Uno de los reactivos de control "neutral"
se eliminó por medio de este estándar; pero 6 fueron aceptables. Estos 6
reactivos tuvieron valores escalares entre 4.0 y 4.9. Ningún reactivo se
encontró en el intervalo escalar de 5.0 a 5.9 y el criterio de Q eliminó a todos
los que estuvieran dentro del intervalo de 3.0 a 3.9. Uno de los 2 reactivos
referente a hechos precisos fue eliminado por el criterio de Q y también se
eliminó el reactivo ambiguo con las palabras "scientific holiday". Los 10
reactivos restantes de control se consideraron aceptables por medio del criterio
Q.
20 a su vez estarán comprendidos en los
40 que tienen valor 1 en el tercer reactivo. En la misma forma sería cierto que
solamente se presentarían 4 patrones de respuesta de reactivo, si el conjunto de
estos fuera perfectamente reproductible. Tocante a la muestra disponible, los
patrones y puntuaciones asociadas a ello; serían: AAA-3; DAA-2; DDA-1; DDD-0.
Establecido que todas las respuestas podrían predecirse perfectamente a partir
de las puntuaciones, en este caso, el coeficiente de reproductibilidad sería del
100%. Sin embargo, rara vez se obtiene una reproductibilidad perfecta y en la
práctica se considera satisfactorio un coeficiente del 85% o más, para que un
conjunto de reactivos constituya una escala. Se han desarrollado varias técnicas
para computar el coeficiente de reproductibilidad, que han sido documentadas por Festinger, Clark y Kreidt y Guttman.
