Interfaces habilitadas por IA que interactúan con ciudadanos y servidores públicos — invocando DPI Workflows, no actuando autónomamente. Restringidos, responsables y gobernados por diseño.
Un Public Agent es un asistente habilitado por IA — basado en software, asistido por IA por un humano o una combinación de ambos — que interactúa con ciudadanos o funcionarios dentro de límites definidos basados en derechos, y activa DPI Workflows para completar tareas.
Usa LLM/SLM para entender lo que solicita un ciudadano, en cualquier idioma y a través de cualquier canal
Activa flujos de trabajo preaprobados para prestar servicios — verificación de identidad, elegibilidad, beneficios, registro
Usa bloques fundamentales (traducción, OCR) y bloques sectoriales específicos (elegibilidad, detección de fraude)
Deriva los casos de baja confianza, excepciones y quejas a un gestor de casos humano con un ID de caso
Envía actualizaciones de estado por el canal preferido del ciudadano (SMS, WhatsApp, voz)
Cada extracción de datos requiere un token de consentimiento — verificado por el flujo de trabajo, no asumido
Las actualizaciones de registros requieren un paso de gobernanza en el flujo de trabajo — el agente no puede escribir directamente en los registros
Los agentes solo pueden activar flujos de trabajo que hayan sido preaprobados y auditados
Todas las decisiones que superen un umbral de confianza corresponden a las autoridades humanas
Un Public Agent debe funcionar para todos los ciudadanos — incluyendo quienes tienen conectividad o alfabetización limitadas. El diseño de canales es un principio de gobernanza, no un detalle técnico secundario.
Canal principal para usuarios urbanos y semiurbanos. Admite texto, notas de voz y envío de documentos.
Fundamental para usuarios con baja alfabetización. Los bloques speech_to_text() + translate() habilitan voz en dialectos locales.
Alternativa para teléfonos básicos y zonas de baja conectividad. No requiere conexión de datos. Cola asíncrona.
Para usuarios con conectividad estable. Interfaz más rica, carga de documentos y seguimiento de casos.
Notificaciones y confirmaciones. El mínimo común denominador para todos los usuarios móviles.
Modo asistido para ciudadanos sin dispositivos. El agente opera a través de un servidor público como intermediario.
Una especificación legible por máquina para un Public Agent, que incluye su configuración de modelo, canales, vinculaciones de flujo de trabajo y restricciones de gobernanza.
Los Public Agents pueden ejecutarse sobre cualquier modelo de lenguaje — desde grandes APIs de frontera hasta modelos pequeños en el dispositivo. La elección no es solo técnica; tiene implicaciones directas para la soberanía, el costo, la latencia y la inclusión. Ningún tipo es universalmente mejor. Cada uno tiene su lugar.
GPT-5 / o3 / o4-mini · Claude Opus 4 / Sonnet 4 · Gemini 2.5 Pro / 3 Pro · Llama 4
Conocimiento amplio — gestiona consultas abiertas, razonamiento complejo y casos extremos con menos ajuste fino
Base multilingüe sólida — rendimiento razonable en muchos idiomas sin entrenamiento especializado
Prototipado más rápido — buen comportamiento predeterminado listo para usar en pilotos y demostraciones
Riesgo de soberanía de datos — las APIs solo en la nube envían datos ciudadanos a servidores de terceros; requiere un manejo cuidadoso de la PII
Costo elevado a escala — el precio por token se vuelve significativo en millones de interacciones ciudadanas
Latencia y conectividad — depende de internet estable; no apto como modelo principal en contextos de baja conectividad
Salidas impredecibles — los contextos más amplios y la generalidad aumentan el riesgo de respuestas fuera del alcance en flujos de trabajo restringidos
Phi-4 Mini (3.8B) · Gemma 3 · Qwen2.5 / Qwen3 · Llama 3.2 3B · SmolLM3
Despliegue en infraestructura propia — opera completamente dentro de la infraestructura gubernamental; los datos ciudadanos nunca salen del país
Bajo costo a escala — costo fijo de infraestructura; sin facturación por token en millones de interacciones
Baja latencia — la inferencia local permite respuestas rápidas incluso en entornos de red restringidos
Ajuste fino orientado a tareas — los modelos pequeños especializados en una tarea específica (verificación de elegibilidad, extracción de documentos) superan a los grandes modelos generalistas en esa tarea
Comportamiento predecible — un alcance más estrecho genera menos respuestas fuera de tema o alucinaciones en los pasos gobernados del flujo de trabajo
Ajuste fino en idiomas locales — los SLM pueden afinarse con corpus en dialectos locales que los grandes proveedores no cubren
Mayor inversión inicial — requiere infraestructura GPU, pipelines de ajuste fino y capacidad técnica para evaluar y mantener modelos
La IA gubernamental no necesita ser brillante — necesita ser confiable, acotada y gobernable. Un Public Agent que ejecuta un flujo de trabajo de elegibilidad para beneficios no necesita debatir filosofía ni escribir poesía. Necesita entender la solicitud del ciudadano, extraer campos estructurados, llamar al paso correcto del flujo de trabajo y escalar cuando haya incertidumbre. Un modelo de 3 a 8 mil millones de parámetros ajustado fino para esa tarea específica, corriendo en infraestructura soberana, es más adecuado que un LLM de frontera accedido vía API de terceros — y será más barato, más rápido y más controlable en los 10 millones de interacciones que realmente importan.
Los datos permanecen dentro de la infraestructura nacional. Sin dependencia de la disponibilidad de APIs extranjeras, cambios de precios o términos de servicio. El gobierno es dueño del modelo y de sus resultados.
Los modelos más pequeños son más fáciles de cambiar. La especificación del DPI Workflow declara el adaptador del modelo — cambiar de Llama a Mistral o a un modelo desarrollado localmente no requiere reconstruir el flujo de trabajo.
Los SLM pueden ajustarse con corpus en dialectos de swahili, amhárico, bahasa o kinyarwanda que los grandes proveedores no priorizan. La inclusión es un imperativo de gobernanza, no una solicitud de funcionalidad.
Un modelo que controlas puede ser inspeccionado, reevaluado y sometido a pruebas adversariales por tu propio equipo. Los modelos de terceros de caja negra dificultan el cumplimiento de los requisitos de rendición de cuentas ante ciudadanos y legislaturas.
Con 5 millones de interacciones ciudadanas al mes, los costos de API por token se convierten en líneas de presupuesto significativas. Los costos fijos de infraestructura para SLM on-prem son predecibles y disminuyen por interacción a medida que crece el uso.
Los SLM en el rango de 1 a 3 mil millones de parámetros pueden correr en hardware de consumo, habilitando servicios asistidos por IA en oficinas distritales sin internet estable — extendiendo el alcance de los Public Agents hasta el último kilómetro.
adapter: "ollama", "openai", "vllm"). Comienza con lo que puedas desplegar hoy — incluso un LLM en la nube para un piloto — y migra a un SLM soberano conforme crezca la capacidad. El flujo de trabajo no cambia. Solo cambia el adaptador.
A medida que las capacidades modulares maduran, existe una progresión natural hacia la orquestación multi-agente — múltiples agentes colaborando al compartir contexto, coordinar flujos de trabajo y descomponer dinámicamente tareas complejas que un solo agente no podría lograr por sí solo.
La DPI proporciona los rieles digitales compartidos para cumplir estos requisitos: protocolos comunes, registros y marcos de gobernanza que garantizan que los agentes y flujos de trabajo operen de manera segura y transparente. Así evoluciona el marco — de agentes de un solo flujo de trabajo a prestación coordinada de servicios multisectoriales — sin sacrificar la rendición de cuentas.
→ Ver cómo construir un Public Agent con código o herramientas sin código
Los Agentes invocan Workflows, que a su vez llaman Blocks. El marco es una pila: los Agentes en la cima, la infraestructura en la base.