L
Control Legislativo

Metodología

De dónde vienen los datos, cómo los procesamos, qué hacemos y qué no.

La Control Legislativo de Liga publica datos del Congreso de la República (Senado + Cámara) tomados de fuentes públicas, con un compromiso explícito de transparencia sobre el origen y el nivel de verificación de cada pieza.

Fuentes consultadas

  • Congreso Visible (Universidad de los Andes) — fuente principal hoy. Listado de congresistas, proyectos de ley y autorías. congresovisible.uniandes.edu.co.
  • datos.gov.co (Socrata) — pendiente de integración ampliada. Algunos datasets requieren autenticación.
  • leyes.senado.gov.co y camara.gov.co — pendientes para estado vivo del trámite.
  • Gaceta del Congreso — pendiente para textos y votaciones nominales.
  • Registraduría Nacional — pendiente para resultados electorales y composición histórica.

Cómo obtenemos los datos

Las fuentes públicas son consultadas con un identificador honesto (User-Agent SoyLiga-Veeduria) y con pausas de varios segundos entre cada petición. No hay scraping agresivo: la sincronización se hace una sola vez al día y los datos se cachean internamente para evitar pedirle a la fuente lo mismo varias veces.

Si la fuente cambia su formato o se cae, los visitantes siguen viendo la última versión válida que tenemos en caché. La caché interna dura hasta 24 horas en caso de falla.

Niveles de verificación de identidades

Cada congresista del catálogo tiene uno de tres niveles:

Verificado por Liga — un humano de nuestro equipo confirmó que la persona del catálogo corresponde a la persona real, contrastando fotografía, partido y curul. Confianza ≥ 95.
Sin verificación humana — la identidad se infiere automáticamente porque tenemos una sola fuente externa. No ha sido contrastada contra una segunda fuente independiente. Mientras solo haya una fuente, este es el estado por defecto. Confianza 85.
Identidad pendiente — el matcheo automático no produjo certeza suficiente. Estos casos esperan revisión humana en el panel admin. Confianza < 80.

Qué hacemos con los datos

  • Los publicamos tal cual los recibe la fuente — sin editar título, sinopsis, fechas ni autorías.
  • Los hacemos buscables y navegables (filtros por corporación, partido, departamento, estado).
  • Los enlazamos entre sí: una ficha de congresista muestra los proyectos donde firma; una ficha de proyecto muestra los congresistas que firman.
  • Cuando esté listo, agregaremos un Índice Liga de Gestión Legislativa (ILGL) que evaluará producción, calidad, transparencia y alineación. Aún no está activo.
  • Resúmenes ciudadanos generados por IA, cuando aplique. Cada resumen estará marcado como tal y nunca reemplaza el texto oficial.

Qué no hacemos

  • No editamos el contenido oficial publicado por las fuentes.
  • No emitimos juicios morales automatizados sobre personas.
  • No recolectamos información privada: solo datos públicos.
  • No garantizamos exhaustividad histórica — la fuente principal cubre desde 1998 y nosotros priorizamos los cuatrienios vigentes.

Estado actual del catálogo

Total congresistas
315
Verif. humana
0
Auto-verificados
315
Sin verificar
0

Última sincronización exitosa: hace 2 semanas (2026-06-09 02:00).

Errores y correcciones

Si encuentras un dato incorrecto, escríbenos a veeduria@soyliga.co indicando la URL exacta. Si el error está en la fuente, también lo reportamos. Si está en nuestro procesamiento, lo corregimos en el siguiente sync.

Esta página de metodología evoluciona junto con el módulo. Cada fase nueva (proyectos de ley con estado vivo, votaciones nominales, ILGL) agregará una sección aquí explicando qué cambió y por qué.

Únete al movimiento

Sé parte de la Liga

Para necesitas una cuenta en la Liga de Gobernantes Anticorrupción. Es gratis y toma menos de un minuto.

Al unirte podrás

  • Apoyar publicaciones, comentar y compartir
  • Crear tus propias denuncias y propuestas
  • Sumarte a una red nacional anticorrupción
Crear mi cuenta gratis Ya tengo cuenta · Iniciar sesión