Design Toolkit | Cuestionarios

Antes de comenzar

Esta guía amplía la ficha de Cuestionarios. Los cuestionarios son una técnica exploratoria que nos permite recoger información mediante las respuestas que proporcionan las personas usuarias. Se trata, pues, de una batería de preguntas diseñadas para obtener información sobre una realidad que queremos descubrir con cierto nivel de profundidad y detalle.

Por este motivo se pueden inscribir en diferentes fases dentro de un proceso de diseño centrado en las personas, puesto que ofrecen respuestas sobre cómo utilizan los usuarios un producto interactivo.

Por lo tanto, el uso de cuestionarios puede venir dado por diferentes aspectos que pueden situarse en las diferentes fases del proceso de diseño centrado en las personas. Por ejemplo, se pueden utilizar cuestionarios en las fases más iniciales de investigación para recoger datos sobre las personas para las que estamos diseñando una solución o para contrastar cuantitativamente datos obtenidos mediante el uso de alguna técnica cualitativa como puede ser la entrevista. Aun así, su uso más habitual es durante la fase de evaluación, ya sea para descubrir la satisfacción global del uso del producto/servicio por parte de la persona usuaria o para recoger aspectos relacionados con la utilidad, uso y usabilidad.

Preparación

Definir los objetivos de la investigación

Antes de iniciar el diseño de las preguntas hay que tener claro cuáles son los objetivos de la investigación que se llevará a cabo, es decir, qué información necesitamos obtener. Esta reflexión inicial determina el tipo de cuestionario que se deberá usar, la tipología de preguntas a utilizar, la redacción de estas, la orden, la distribución y la muestra que debe responder a nuestras preguntas.

Así pues, lo primero que debemos hacer es definir la hipótesis de la investigación y, a partir de esta, responder a las siguientes preguntas:

¿Cuál es el objetivo de la investigación?
¿Cuál es la información necesaria para comprobar la hipótesis?
¿Cuáles son los datos más relevantes que necesitamos obtener?
¿Cuáles son los datos complementarios que necesitamos o podemos obtener?

Definición de la muestra, la logística y la distribución del cuestionario

Una vez está bien definido el punto anterior, hay que definir quién debe responder a las preguntas del cuestionario, tener claro cuál es el margen de error que puede tener nuestro cuestionario en función del número de personas que lo tengan que responder y planificar cuál será el medio por el cual responderán las personas usuarias, así como cuándo lo harán y cómo se les hará llegar.

No tiene sentido, por ejemplo, preguntar a la persona usuaria si le gusta una aplicación justo cuando la acaba de descargar o pedirle que valore el proceso de compra de un comercio electrónico si todavía no lo ha utilizado. Del mismo modo que hay que decidir en qué momento se presentará el cuestionario a la persona usuaria, hay que decidir el formato en el que se le hará llegar: correo electrónico, notificación automática, llamada telefónica, etc.

Todos estos detalles determinarán el diseño posterior de las preguntas, puesto que afectarán a la duración y longitud del cuestionario, así como a la redacción de los enunciados e, incluso, la elección de software específico para crear y distribuir el cuestionario. ¿Cuáles son los datos complementarios que necesitamos o podemos obtener?

Elegir el cuestionario que utilizaremos

Cuestionarios estandarizados

Para la medición de la usabilidad y la satisfacción subjetiva de la usabilidad, hay cuestionarios estandarizados que facilitan la tarea de evaluación de una interfaz. Generalmente estos cuestionarios se utilizan después de la realización de un test con personas usuarias, sea para orientar un rediseño o para evaluar un nuevo diseño antes de sacarlo al mercado.

Las ventajas de estos cuestionarios es que ya tienen preestablecidas las preguntas y las métricas que se usan para analizarlos. Por el contrario, no nos permiten adaptar las preguntas al producto/servicio concreto que estemos investigando, por lo cual debemos reflexionar bien sobre el momento exacto en que merece la pena apostar por un cuestionario estandarizado.

SUS (System Usability Scale)
El cuestionario SUS tiene como propósito proporcionar un test rápido y fácil de completar y puntuar que permita evaluar la usabilidad percibida por parte de las personas usuarias. De este modo también es posible establecer comparaciones entre sistemas. El cuestionario SUS es de los más utilizados para recoger información después de un test de tareas, puesto que sus diez preguntas están orientadas a descubrir las sensaciones percibidas por la persona usuaria durante el uso de un sistema interactivo. Cada pregunta tiene una escala del 1 al 5 como respuesta, donde 1 es «Completamente de acuerdo» y 5 «Completamente en desacuerdo». La persona usuaria debe responder a todas las preguntas.

Preguntas del cuestionario SUS:

Creo que me gustará usar a menudo este sistema.
He encontrado el sistema innecesariamente complejo.
He pensado que el sistema es fácil de utilizar.
Creo que necesitaría el apoyo de un experto para recorrer el sistema.
He encontrado las variadas posibilidades del sistema bastante integradas.
He pensado que había demasiada inconsistencia en el sistema.
Imagino que la mayoría de las personas aprenderían muy rápidamente a usar el sistema.
He encontrado el sistema muy incómodo de usar.
Me he sentido muy confiado en el manejo del sistema.
Necesito aprender muchas cosas antes de manejar con comodidad el sistema.

La escala del cuestionario SUS, basada en el estilo Likert, permite tratar los datos de forma que el resultado final es un valor único que representa una medida compuesta de la usabilidad del sistema global estudiado. De este modo, cabe destacar que las puntuaciones independientes no son significativas por sí mismas, puesto que hay que calcular la puntuación global.

Para calcular el resultado debe hacerse una suma de las contribuciones de cada punto, teniendo en cuenta que cada punto valdrá entre 0 y 4. Hay que aplicar esta regla para obtener las contribuciones de cada punto:

Para los puntos 1, 3, 5, 7 y 9 debe restarse 1 a la posición de la escala.

Para los puntos 2, 4, 6, 8 y 10 debe sumarse 1 a la posición de la escala.

Una vez tenemos el valor total mediante la suma de todas las contribuciones, multiplicamos el resultado por 2,5 y así obtendremos el valor global del SUS, un resultado entre 0 y 100.

La escala de usabilidad del sistema no es diagnóstica; por lo tanto, solo aporta una puntuación para entender si la usabilidad global de un sistema se ha percibido como buena o no.

La puntuación mediana de la escala es de 68. Si la puntuación es inferior a 68, significa que es muy probable que haya problemas graves con la usabilidad que deben identificarse y solucionarse. Una puntuación superior a 68 se considera positiva, pero denota que hay alguna carencia en la usabilidad. Así pues, siempre hay que acompañar el SUS de un análisis cualitativo para contextualizar y entender los datos.

El SUS es de uso libre siempre que se mencione su fuente: Copyright Digital Equipment Corporation, 1986.

Otros cuestionarios
Hay otros muchos cuestionarios estandarizados centrados en la usabilidad y la satisfacción, algunos con licencias libres y gratuitas y otros que hay que adquirir para poder ser utilizados:

SUMI (Software Usability Measurement Inventory). El SUMI es un cuestionario que permite evaluar la calidad de un conjunto de software. Es muy útil para evaluar productos y compararlos con versiones anteriores. El inconveniente que presenta es que se compone de un total de cincuenta preguntas. La ventaja principal es que con la respuesta de entre doce y treinta personas usuarias ya muestra suficiente para obtener resultados interesantes.
MUMMS (Measuring The Usability of Multi-Media Systems). El MUMMS tiene el mismo objetivo que el SUMI, pero la diferencia principal es que incluye cinco subescalas:
- Una centrada en la medida de las respuestas emocionales de la persona usuaria.
- Una centrada en el grado del control que siente la persona usuaria.
- Una centrada en el grado de eficiencia con la que la persona usuaria cree que puede conseguir sus objetivos mediante la interacción.
- El nivel de ayuda y asistencia que proporciona el sistema.
- La facilidad de aprendizaje que percibe la persona usuaria.
SUPRQ (Standardized Used Experience Percentile Rank Questionnaire). El SUPRQ es un cuestionario de ocho preguntas que permite medir la calidad de la experiencia de la persona usuaria de un producto interactivo. Para hacerlo, se centra en cuatro dimensiones del producto interactivo: usabilidad, credibilidad, satisfacción y apariencia. Las respuestas también se configuran en una escala Likert del 1 al 5, donde 1 es «Muy en desacuerdo» y 5 «Muy de acuerdo». Dispone de una herramienta que se incluye con la licencia (no es un cuestionario de acceso libre) que permite calcular los valores para cada dimensión y hacer comparativa dentro de su base de datos.

Hay otros cuestionarios estandarizados que merece la pena conocer:

CSUQ (Computer System Usability Questionnaire).
ASQ (After-Scenario Questionnaire).
CUSI (Computer User Satisfaction Inventory).
USE (Usefulness, Satisfaction, and Ease of Use).
ISONORM 9241/10.
PUEU (Perceived Usefulness and Ease of Use).

Diseñar nuestro propio cuestionario: tipología de preguntas

Cabe destacar que el uso de los cuestionarios suele responder a la necesidad de obtener información que queremos tratar de forma prácticamente automática. Así pues, es relevante conocer las características que deben tener las preguntas que hay que formular y tener capacidad para elegir en cada momento la tipología de pregunta que mejor cuadra con el tipo de información que se quiere obtener.

Preguntas abiertas
Son las preguntas en las que permitimos que las personas usuarias escriban sus respuestas. Permiten obtener matices y detalles, pero a la vez resultan difíciles de automatizar, puesto que no se pueden tabular.

Preguntas cerradas
Son preguntas que ofrecen opciones de respuestas cerradas, es decir, ofrecen las diferentes alternativas que puede responder la persona usuaria. Permiten el tratamiento automático de los datos obtenidos, pero si no se diseñan las respuestas posibles pensando en todas las opciones existentes, pueden provocar sesgos y pérdida de riqueza. Hay que tener presente que si son respuestas de opción única, las alternativas deben ser excluyentes entre ellas. En cambio, si son preguntas de opción múltiple, hay que delimitar el número mínimo y máximo de opciones que puede seleccionar la persona usuaria. Otro aspecto que debe tenerse en cuenta cuando se diseñan las respuestas es que no deben seguir ningún orden concreto, puesto que las personas usuarias tienen tendencia a responder las primeras opciones que leen que se adecúen a lo que buscan. Por lo tanto, se debe evitar el uso del orden alfabético y se tiene que intentar usar un software que permita mezclar las respuestas en los diferentes participantes del cuestionario (opciones aleatorias). Por último, un número demasiado elevado de respuestas posibles también comportará problemas a las personas usuarias. Idealmente no tendrían que haber más de siete posibles alternativas.

Preguntas en batería
Son preguntas que se formulan para realizarlas de forma secuencial en función de la respuesta que la persona usuaria seleccione en la pregunta anterior. De este modo se puede profundizar en un tema concreto. Hay que plantearlas bien para evitar que la persona usuaria se sienta perdida o llegue a un punto de no regreso. Los saltos lógicos y las diferentes ramificaciones que puedan existir en una sucesión se tienen que planificar y probar antes de lanzar el cuestionario al público.

Preguntas de evaluación
Son preguntas en las que pedimos a la persona usuaria que valore un aspecto o la totalidad de un producto o servicio. Generalmente se utiliza una escala de carácter numérico o una valoración cualitativa. En estas preguntas hay que evitar ofrecer un valor numérico u opción cualitativa intermedia, puesto que las personas usuarias tenderán a dar aquel valor. Así pues, es preferible una escala del 0 al 5 que del 1 al 5, por ejemplo.

Método de Likert
También se denomina método de evaluaciones sumarias. La escala de Likert es aquella donde la persona usuaria indica su grado de acuerdo o desacuerdo sobre un conjunto de enunciados o declaraciones. Es una de las escalas más utilizadas en el diseño de cuestionarios en investigaciones de ciencias sociales, puesto que permite ir más allá de la dicotomía «Sí/No» y con ella se puede obtener información sobre opiniones, percepciones y comportamientos. Las escalas Likert se pueden utilizar para recoger información relacionada con la satisfacción, la usabilidad, la opinión sobre una novedad, las percepciones sobre el uso de un producto o servicio, etc.

Para elaborar preguntas con elementos Likert de respuesta, hay que plantear enunciados positivos y negativos sobre la misma temática, puesto que así podremos detectar si se dan incongruencias en las respuestas. Debe tenerse en cuenta en este punto que es recomendable convertir los enunciados en preguntas, puesto que las declaraciones tienen el riesgo de provocar que las personas usuarias respondan que están de acuerdo, para no provocar el sesgo de consentimiento. Este fenómeno es común en encuestas y cuestionarios cuando hay declaraciones absolutas o muy obvias y provoca que las personas usuarias tengan tendencia a responder que están de acuerdo con un aspecto.

Ejemplo:

«¿Ha resultado fácil utilizar el buscador de aeropuertos?»

«¿Ha sido difícil seleccionar los aeropuertos?»

Generalmente, se utilizan cinco elementos de respuesta: «Totalmente en desacuerdo», «En desacuerdo», «Ni de acuerdo ni en desacuerdo», «De acuerdo» y «Totalmente de acuerdo». De este modo se mide la actitud positiva, negativa y neutral que tienen las personas usuarias hacia una situación o elemento explicitado en un enunciado.

Para obtener información tan concreta y cuidadosa como sea posible cuando se utiliza una escala de este tipo hay que tener presente que los enunciados y/o las preguntas deben ser tan específicas como se pueda. Por ejemplo, si se quiere preguntar sobre el proceso de reserva de un vuelo en una aplicación, es más recomendable hacer preguntas específicas por cada fase del proceso que no una genérica sobre el proceso en conjunto.

Del mismo modo, hay que elegir con mucho cuidado los adjetivos que formarán parte de la escala, si es que se opta por utilizar palabras textuales. Las respuestas tienen que incluir palabras descriptivas que faciliten la comprensión de cada elemento de la escala. De hecho, aunque se usen valores numéricos para la escala, es recomendable incluir una referencia textual con la que las personas usuarias identifiquen claramente el rango positivo, negativo y neutro de cada opción de respuesta.

Desarrollo / ejecución

Aspectos que deben tenerse en cuenta en la construcción de cuestionarios

A pesar de existir cuestionarios estandarizados, ya hemos visto que no siempre responden a las necesidades de investigación concretas; por lo tanto, es importante saber qué cuestionario elegir en cada momento, así como diseñar nuestros propios cuestionarios.

Hay algunos aspectos que hay que considerar en el momento de diseñar un cuestionario, dado que pueden afectar al éxito o fracaso en el momento de conseguir respuestas. Se debe tener presente que durante la respuesta de la persona usuaria no tenemos visibilidad; así que hay que plantear cuestionarios que resulten fáciles y no requieran un esfuerzo más elevado del que ya supone. Además, hay que tener presente que las personas usuarias, cuando responden cuestionarios, generalmente quieren dar las respuestas tan cuidadosas como sea posible a su experiencia.

A continuación, se detallan algunas recomendaciones:

Es necesario que el cuestionario sea tan breve y concreto como sea posible, ajustado a la cantidad de información que necesitamos y que puede tener la persona usuaria.

Se tiene que diseñar el cuestionario pensando en la persona que lo tiene que completar. Así pues, las preguntas deben ser claras y concisas, así como las posibles respuestas.

Hay que indicar siempre si las preguntas son obligatorias u opcionales, preferentemente con un texto y no solo con el símbolo estándar del asterisco (*). Del mismo modo, hay que especificar si las preguntas tienen respuesta múltiple y cuál es el número máximo de opciones que se pueden elegir en estos casos.

Las preguntas serán válidas siempre que no den lugar a sesgos mediante inducciones o valoraciones en el mismo enunciado. Tienen que ser neutrales. Por este motivo los enunciados no deben presentar palabras que después se incluyan en las posibles respuestas o dobles negaciones. La mejor manera de empezar una pregunta que puede tener este tipo de problemáticas es «¿Que piensas de…?».

Tanto los enunciados de las preguntas como las diferentes opciones de respuesta deben ser cortas. Las personas usuarias no tendrían que leerlos dos veces para recordar ni la pregunta ni las opciones.

Si el cuestionario es puramente cuantitativo, merece la pena incluir preguntas negativas para evitar el fenómeno del quick finger, es decir, la respuesta rápida de la persona usuaria.

Para conseguir un número elevado de respuestas hay que limitar el número de preguntas; no es recomendable que un cuestionario requiera más de siete minutos para ser contestado.

Si el número de preguntas a plantear es muy extenso, vale la pena reflexionar sobre si se puede dividir el cuestionario en dos. Es mejor dos cuestionarios de diez preguntas rápidas de responder en dos momentos diferentes de la experiencia de la persona usuaria que un solo formulario de veinte preguntas.

Se recomienda plantear una secuencia de preguntas en que las preguntas más sencillas para la persona usuaria estén al inicio y la dificultad crezca a medida que se avanza.

El orden de las preguntas tiene que ser lógico según las temáticas o categorías que se planteen. Se recomienda agrupar por categorías y afinidades para situar a la persona usuaria y reducirle el esfuerzo cognitivo.

Hay que equilibrar el número de preguntas abiertas y cerradas que se incluyen. Las personas usuarias tienen tendencia a abandonar los cuestionarios que solo incluyen preguntas abiertas.

Hay que identificar cuáles son los mejores puntos para hacer un salto de página.

Es recomendable mostrar en todo momento el progreso del cuestionario, ya sea ofreciendo el número total de preguntas y el número de la pregunta que se está respondiendo u ofreciendo el porcentaje de preguntas completadas.

Hay que introducir opciones de «Prefiero no responder» para aquellas preguntas que pueden afectar temas personales o delicados, sobre todo si se trata de preguntas obligatorias, dado que la no existencia de esta opción puede provocar que haya personas que abandonen el proceso de respuesta.

Hay que introducir opciones abiertas de «Otros» para garantizar que cubrimos todas las respuestas posibles.

Hay que introducir opciones de «No aplica» o «No lo utilizo» en aquellas preguntas que lo puedan requerir, para evitar que las personas usuarias den respuestas falsas porque no tienen la opción que realmente necesitan.

Si hay que introducir párrafos explicativos o introductorios, hay que destacarlos de forma que la persona usuaria los identifique como información relevante. Si no, lo más probable es que no los lean.

Se recomienda probar el cuestionario y revisarlo antes de distribuirlo entre las personas usuarias.

Si se utiliza software específico, se recomienda emplear una herramienta que permita registrar las respuestas no finalizadas. De este modo, aparte de conseguir información, se puede valorar en qué punto del cuestionario hay más abandonos.

Del mismo modo que hay que diseñar muy bien las preguntas, se debe tener presente el aspecto gráfico del cuestionario. Un cuestionario atractivo gráficamente tiene más posibilidades de obtener respuestas.

Análisis / Resultados

Problemas habituales

Los problemas habituales que se pueden encontrar en el momento de analizar los resultados de un cuestionario se suelen evitar si se realiza un buen pretest que permita comprobar la viabilidad y efectividad del cuestionario.

A continuación, se detallan las tipologías de los problemas más comunes:

Errores de estructura
Se dan errores de estructura cuando el cuestionario es demasiado largo o el diseño visual de este dificulta su legibilidad e interacción. Debemos tener presente desde qué dispositivos pretendemos que las personas usuarias respondan a nuestras preguntas y asegurarnos de que la totalidad del cuestionario se puede responder correctamente. También hay que calcular el tiempo que requiere completarlo en su totalidad. Estos aspectos relativos al formato y la duración son los que pueden provocar más abandono durante el proceso de respuesta.

Errores de especificidad
Los errores de especificidad tienen relación con los objetivos de la investigación y ocurren cuando un aspecto clave de la información que queremos obtener no está incluido en el cuestionario. Así, obviando aquella temática o dimensión, estamos obteniendo información imprecisa sobre un punto concreto que puede provocar que lleguemos a conclusiones sesgadas. Por ejemplo, si nuestro cuestionario hace referencia al proceso de reserva de una habitación de hotel y no preguntamos sobre la política de cancelación, no estamos midiendo un aspecto que es clave para las personas usuarias.

Errores de medición
Los errores de medición están generalmente provocados por un mal diseño de las preguntas del cuestionario, ya sea por el uso del lenguaje utilizado o por aspectos relacionados con el orden de las preguntas y las respuestas. Muchos de los errores de medición se pueden evitar si se tienen en cuenta los consejos comentados en el apartado anterior sobre la construcción de preguntas: neutralidad de las preguntas, ordenación lógica, evitar sesgos relacionados con aspectos sociales y personales, ofrecer todas las opciones de respuesta posibles, etc. También hay que tener en cuenta aspectos relacionados con la usabilidad.

Interpretación de los resultados

Debe tenerse en cuenta que los resultados que se obtienen en un cuestionario, por sí mismos, no pueden aportar una significación lo suficientemente válida para extraer conclusiones, por lo que siempre hay que comparar los datos con otras mediciones o con información extraída de otras técnicas de investigación.

Mediante los cuestionarios, generalmente obtendremos información cuantitativa sobre satisfacción, uso, opiniones y comportamiento y también podemos obtener información cualitativa si hemos dado opciones de preguntas abiertas.

La interpretación de los datos nos permite encontrar patrones de comportamiento y buscar los porqués existentes detrás de estos. Generalmente hace falta un ojo entrenado, conocedor de los modelos mentales asociados a la investigación que estamos llevando a cabo.

Ejemplos

Typeform
Dispone de versión gratuita que permite hacer encuestas y cuestionarios variados. Para opciones más elaboradas (saltos lógicos, concatenación de preguntas, etc.), hay que tener una licencia de pago. Destaca su diseño y adaptación multidispositivo (https://www.typeform.com/).

Surveymonkey
También dispone de versión gratuita e incluye la posibilidad de utilizar cuestionarios plantilla. Aun así, en la versión gratuita hay restricciones que dificultan el trabajo posterior con los datos obtenidos (https://www.surveymonkey.com/).

Google Forms
La herramienta de Google es de las más conocidas y utilizadas y tiene como principal ventaja la integración con las hojas de cálculo, así como con otras herramientas. Aun así, en cuanto al diseño y configuración es una de las herramientas más limitadas y presenta algunas dificultades para la elaboración de buenos cuestionarios (https://www.google.es/intl/ca/forms/about/).

Hotjar
Hotjar es una solución de analítica web que tiene como ventaja principal la integración de toda la información en una sola plataforma: mapas de calor, estudios de conversión y seguimiento de navegación, encuestas, formularios, etc. Se trata de una de las herramientas más utilizadas profesionalmente. Hay una versión gratuita para estudiantes (https://www.hotjar.com/).

Referencias

Calvo-Fernández Rodríguez, A.; Ortega Santamaría, S.; Valls Sáez, A. «Métodos de evaluación cono usuarios». <http://openaccess.uoc.edu/webapps/o2/bitstream/10609/12922/9/usabilidad_módulo3_métodos%20de%20evaluación%20cono%20usuarios.pdf>. [Fecha de consulta: 25 de enero de 2021].

Farrell, S. (2016). «28 Tips for creating great qualitative surveys». Nielsen Norman Group. <https://www.nngroup.com/articles/qualitative-surveys/>. [Fecha de consulta: 25 de enero de 2021].

Gimeno Artigas, S. (2018). «Errores en las preguntas de los cuestionarios». Torres Burriel Estudio. <http://www.torresburriel.com/weblog/2018/12/18/errores-las-preguntas-los-cuestionarios/>. [Fecha de consulta: 25 de enero de 2021].

Gimeno Artigas, S. (2018). «Preguntas abiertas y cerradas en encuestas online». <http://www.torresburriel.com/weblog/2018/10/23/preguntas-abiertas-cerradas-encuestas-online/>. [Fecha de consulta: 25 de enero de 2021].

Martín, R. (2018).«Errores en la elaboración de cuestionarios online». Legridd. <https://www.legridd.com/ux-errores-en-cuestionarios-online-i-2/>. [Fecha de consulta: 25 de enero de 2021].

Sauro, J. «SUPR-Q: A Comprehensive Measure of the Quality of the Website User Experience». Journal of Usability Studies. <http://uxpajournal.org/supr-q-a-comprehensive-measure-of-the-quality-of-the-website-user-experience/>. [Fecha de consulta: 25 de enero de 2021].

«What is a Likert scale?». SurveyMonkey. <https://www.surveymonkey.com/mp/likert-scale/>. [Fecha de consulta: 25 de enero de 2021].