U.S. flag

Un sitio oficial del Gobierno de Estados Unidos

Saltar encabezado


Revisión de los datos del Censo del 2020

Written by:

Muchas partes del censo están a la vista de los estadounidenses: las invitaciones y los recordatorios para participar que llegan por correo, los anuncios multilingües, la extensión comunitaria que realizan los líderes de la comunidad y los censistas que tocan a las puertas para recopilar las respuestas.

Hoy continuaremos hablando sobre algunas de las tareas que no están tan a la vista, pero tienen la misma importancia para producir resultados del censo de calidad: las personas que hacen los cálculos numéricos y analizan las tendencias, los mapas, y los datos atípicos para asegurar que los datos sin procesar sobre nuestra población se conviertan en estadísticas de calidad.

Para el Censo del 2020, estamos realizando una de las revisiones más completas en la historia reciente del censo. Mediante esta revisión hemos identificado y corregido problemas de procesamiento de datos, hecho esfuerzos para corregir problemas de recopilación de datos, y hemos comenzado a desarrollar un entendimiento de cómo ha cambiado la población de la nación durante la última década.

Resumen del procesamiento de datos

Antes de hablar sobre la revisión, nos gustaría proporcionar un breve resumen de cómo funciona el procesamiento de datos. (El último blog sobre Información básica sobre el procesamiento de datos del Censo describe esto en más detalle.)

Tratamos de obtener información de todas las direcciones, incluso si esto significa aceptar múltiples respuestas sobre las mismas personas o el mismo lugar. En el blog hablamos más sobre por qué podría suceder esto Recibir la visita de un censista aunque usted ya haya respondido.

Una vez que finaliza la recopilación de datos:

  • Organizamos y estandarizamos los datos.
  • Nos aseguramos de que los datos estén vinculados a la ubicación geográfica correcta.
  • Identificamos las respuestas duplicadas.
  • Corregimos las respuestas no válidas, tales como cuando las personas indicaron una fecha de nacimiento que no coincide con la edad que dijeron tener.
  • Completamos la información que falta usando un método estadístico llamado imputación. (Hablamos más sobre esta técnica en un blog reciente.)

Cada fase del procesamiento de datos produce un archivo de datos. Nuestros expertos en el tema revisan los datos para identificar problemas sistemáticos o generalizados en la recopilación o el procesamiento de datos. Si identificamos problemas que necesitan corregirse, desarrollamos ajustes y los probamos. Después de implementar un ajuste, revisamos el archivo de datos nuevamente y continuamos el proceso hasta que se hayan solucionado todos los problemas identificados. Explicamos este proceso en más detalle en un blog reciente, Encontrar ‘anomalías’ demuestra que los controles de calidad del Censo del 2020 funcionan.

Estos pasos de procesamiento y revisión son habituales en cada censo, y el Censo del 2020 no es diferente.

Uso de tecnología para identificar posibles problemas rápidamente

Aunque varía el tamaño de cada uno de los archivos de datos que se producen sucesivamente, todos son muy grandes, aun para los estándares del censo, e incluyen cientos de millones de registros con muchas variables.

Gracias a las mejoras en hardware y software de esta década, hemos podido convertir estos grandes archivos de datos en diagnósticos (métricas que nos ayudan a diagnosticar posibles problemas) y tabular los resultados que necesitamos para la revisión. Al producir esta información más rápido, hemos podido dedicar más tiempo a revisar los resultados.

Para hacer más fácil la revisión de esta enorme cantidad de datos en cada archivo, cargamos los archivos en un software de visualización y análisis. Una de las herramientas que usamos es una que desarrollamos para el Censo del 2020. A esta herramienta la llamamos Aplicación para Revisión, Análisis y Visualización del Censo o “CRAVA”, por sus siglas en inglés CRAVA ha mejorado enormemente nuestra capacidad de realizar una revisión rigurosa.

Cargamos las tabulaciones de cada uno de los archivos nuevos en CRAVA. Luego, CRAVA genera gráficos y mapas que muestran los totales de población del censo junto con puntos de referencia, tales como el Censo del 2010, las estimaciones de población del 2020 y la Encuesta sobre la Comunidad Estadounidense. Esto les permite a los equipos de revisores buscar simultáneamente datos atípicos y patrones en los resultados.

Los expertos en el tema resuelven posibles problemas

Si bien la tecnología proporciona una visión de los datos, son los expertos en el tema encargados de la revisión quienes deben darle sentido a todo lo que ven. Ellos desarrollan los sistemas de revisión, diseñan los procesos de revisión y tienen el conocimiento y la experiencia que hacen posible la revisión.

Tenemos un equipo de más de 70 expertos que revisan sistemáticamente los archivos de cada una de las etapas del procesamiento. Estos expertos —muchos de los cuales han trabajado en dos o más censos— tienen una amplia experiencia en y un conocimiento de las operaciones del censo, geografía y las características demográficas y tendencias que se miden en el censo.

  • Trabajan durante la década en su área de especialización y tienen la experiencia y el conocimiento para investigar a fondo temas específicos, tales como raza, origen hispano, sexo y edad, para verificar que los datos se procesaron correctamente e identificar posibles problemas de recopilación de datos.
  • También tienen la experiencia necesaria para revisar los datos de todo el país y a niveles de zonas geográficas pequeñas en busca de datos atípicos y patrones en los datos.
  • Muchas de estas mismas personas ayudaron a diseñar y desarrollar los procesos y sistemas que se usaron para realizar el Censo del 2020.

Su dominio de un tema es lo que hace posible identificar posibles problemas con el procesamiento y la recopilación de datos y determinar si son problemas reales o si son mediciones precisas de cambios demográficos.

  • Ejemplo de un problema — Durante el inicio del procesamiento de datos, nos dimos cuenta de que un proceso diseñado para estandarizar la edad, que se usa en etapas posteriores del procesamiento para identificar personas duplicadas, no estaba funcionando adecuadamente en algunas situaciones. Debido a que los expertos diseñan tanto los sistemas que se usan para procesar los datos como los diagnósticos para determinar si el proceso funciona correctamente, el experto que diseñó el proceso identificó el problema rápidamente y lo solucionamos.
  • Ejemplo de un cambio demográfico No todos los datos atípicos son un problema. Como ya mencionamos, algunos reflejan cambios reales en la población y no requieren un ajuste. Por ejemplo, cuando la población de un pueblo era considerablemente menor que las estimaciones, una mirada en detalle mostró que esa disminución tenía su origen en una diminución en la población de la prisión del pueblo. Luego de investigar más a fondo, determinamos que la disminución coincidía con el traslado de una parte de la población de la prisión que ocurrió antes del 1 de abril de 2020 (el día de referencia del censo), debido a la pandemia. Entonces, no se hizo nada más.

La revisión de datos se enfoca más en encontrar problemas sistemáticos y generalizados que en problemas en un determinado alojamiento de grupo o particulares de un área. Si un patrón de conteos es más alto o más bajo que los puntos de referencia, entonces investigamos más a fondo.

Vemos si el patrón puede estar relacionado con una operación o un proceso del censo para determinar el problema subyacente, y luego desarrollamos una acción correctiva, si es necesario. Si encontramos problemas exclusivos de un alojamiento de grupo o un área específicos, tales como cuando un alojamiento de grupo está en la ubicación incorrecta, también los corregimos.    

El blog reciente Encontrar ‘anomalías’ demuestra que los controles de calidad del Censo del 2020 funcionan describe los tipos de anomalías que hemos encontrado y proporciona varios ejemplos, incluyendo cómo las resolvimos. El blog sobre Alojamientos de grupo del Censo del 2020 describe un problema más generalizado en los alojamientos de grupo, que identificamos durante nuestra revisión y resolvimos mediante esfuerzos adicionales de recopilación de datos y procesamiento.

Por último, en un próximo blog hablaremos sobre esfuerzos adicionales para quitar personas duplicadas luego de que nuestra revisión dejó ver altos niveles de respuestas al censo duplicadas que no se habían quitado mediante otros procesos.

La revisión continúa

Hasta ahora hemos completado la tercera fase del procesamiento de datos, la revisión del archivo de datos conocido como Archivo sin Editar del Censo o CUF, por sus siglas en inglés. El CUF incluye el conteo final de la población de cada dirección del censo, que sumamos para determinar la población de cada estado. Estos conteos de las poblaciones de los estados se usan en la distribución proporcional de distritos congresionales para calcular el número de representantes que tiene cada estado en el Congreso de los EE. UU.

Al CUF lo llamamos ‘Archivo sin Editar del Censo’ porque aún no hemos realizado los pasos finales de aplicar las correcciones e imputaciones para completar las características que faltan, tales como edad, sexo, raza y origen hispano. Esos pasos tienen lugar en la siguiente fase a medida que creamos el CEF o Archivo Editado del Censo.

El CEF incluirá la información demográfica completa de cada registro del censo y proporcionará la primera oportunidad para realizar una revisión a fondo de la información sobre las características recopiladas en el censo. EL CEF es un paso crucial para proporcionar los datos para la redistribución legislativa que los estados esperan.

A medida que nos preparamos para la publicación en abril de los primeros resultados del Censo del 2020, lo hacemos con la confianza de que hemos revisado rigurosamente los conteos de la población y hemos hecho todos los esfuerzos razonables para resolver los problemas que hemos identificado para asegurar la calidad de estos resultados.

Al combinar una considerable experiencia en el tema con poderosas herramientas analíticas, estamos realizando una de las revisiones más completas en la historia reciente del censo.

Top

Regresar al encabezado