Skip to main content

¿Qué son los archivos DICOM y por qué importa su estructura?

Los archivos DICOM constituyen la columna vertebral del intercambio de datos de imágenes médicas fuera del entorno de red. Cuando hablamos de CDs de pacientes, memorias USB con estudios o incluso adjuntos de correo con imágenes radiológicas, estamos tratando con archivos DICOM — y comprender su anatomía interna resulta esencial para quienes trabajan con integración de sistemas de imagen.

Volcado hexadecimal de un archivo DICOM mostrando el preámbulo de 128 bytes, prefijo DICM y elementos del grupo 0002 de meta información
Vista binaria de un archivo DICOM con prefijo DICM y atributos de cabecera

En la práctica diaria, la mayoría de los profesionales interactúan con estos archivos sin pensar demasiado en lo que ocurre entre bastidores. Pero si alguna vez tuviste que lidiar con un CD de estudios que “no abre” en otro sistema, o intentaste importar datos que simplemente no fueron reconocidos por el PACS receptor, lo más probable es que el problema estuviera en la estructura del archivo. Para una visión completa del ecosistema DICOM, consulta nuestra guía completa sobre DICOM en la práctica clínica.

Anatomía de un archivo DICOM: del preámbulo al objeto de datos

Cada archivo DICOM sigue una estructura rigurosamente definida por las partes PS3.10, PS3.11 y PS3.12 del estándar. Esta estructura consta de cuatro secciones secuenciales, y entender cada una evita muchos dolores de cabeza.

Preámbulo y prefijo DICM

Los primeros 128 bytes de cualquier archivo DICOM constituyen el preámbulo. El estándar DICOM no define un contenido específico para esta área — cada aplicación puede utilizarlo como considere conveniente. En la práctica, la mayoría del software simplemente rellena estos 128 bytes con ceros. Inmediatamente después, en los bytes 129 a 132, encontramos las cuatro letras mayúsculas D I C M: el prefijo que identifica inequívocamente un archivo DICOM.

Este es, de hecho, el único método verdaderamente confiable para identificar si un archivo es DICOM o no. Olvídate de la extensión “.dcm” — es apenas una convención, y el propio estándar oscila entre prohibirla y exigirla en diferentes contextos. Si estás escribiendo software para identificar archivos DICOM, salta los primeros 128 bytes y verifica el prefijo DICM. Punto.

Grupo 0002: metadatos del archivo

Herramienta de validación DICOM mostrando verificación de atributos del General Study Module con errores de Type 2
Herramienta de validación DICOM verificando atributos obligatorios de cabecera

A partir del byte 133, encontramos la File Meta Information — un conjunto de atributos DICOM del grupo 0002. Estos elementos siempre se codifican con VR explícito, independientemente de la codificación del objeto de datos. Entre los atributos más importantes están:

  • Media Storage SOP Class UID (0002,0002): identifica el tipo de objeto almacenado (CT, MR, US, etc.)
  • Media Storage SOP Instance UID (0002,0003): identificador único de la instancia
  • Transfer Syntax UID (0002,0010): define cómo está codificado el objeto de datos — posiblemente el atributo más crítico del grupo
  • Implementation Class UID (0002,0012): identifica la implementación que creó el archivo

En mi experiencia, el Transfer Syntax UID es donde comienzan muchos problemas de interoperabilidad. En la comunicación de red DICOM, la Transfer Syntax se negocia durante el establecimiento de la asociación. En archivos, queda registrada en la cabecera — y si el software receptor no la interpreta correctamente, simplemente no puede decodificar las imágenes.

El objeto de datos

Después del grupo 0002, encontramos el objeto DICOM propiamente dicho — las mismas estructuras de datos utilizadas en la comunicación de red. La numeración de grupos comienza en 0008, facilitando la identificación de dónde termina la meta información y dónde comienzan los datos clínicos. Como se analiza en nuestro artículo sobre objetos DICOM y codificación de datos, la codificación VR define cómo se interpreta cada atributo.

Un cuidado fundamental: el grupo 0002 siempre usa VR explícito, pero el objeto de datos puede usar VR implícito, según la Transfer Syntax indicada en el campo (0002,0010). El software que no realiza este cambio durante la lectura fallará. Por esta razón, el estándar DICOM recomienda VR explícito para todo el archivo — aunque la Transfer Syntax predeterminada del DICOM sea Implicit Little Endian.

DICOMDIR: el índice que organiza (y complica) todo

Imagen DICOM de ultrasonido abdominal con mediciones de distancia mostrando datos del paciente y parámetros del equipo
Imagen DICOM de ultrasonido almacenada como archivo en medio removible

El DICOMDIR es un archivo DICOM especial que funciona como índice — una especie de base de datos en miniatura que lista todos los archivos DICOM presentes en un directorio determinado. Organiza la información en cuatro niveles jerárquicos: Patient → Study → Series → Image.

Cuando insertas un CD DICOM en una estación PACS, el software normalmente lee primero el DICOMDIR para presentar la lista de pacientes, estudios y series contenidos en el medio. Nombres de pacientes, fechas de estudio, modalidades — todo extraído de las claves de selección almacenadas en el DICOMDIR.

Internamente, el DICOMDIR utiliza una secuencia SQ (0004,1220) que contiene todos los registros del directorio. Cada entrada tiene dos tipos de datos: claves de selección para búsqueda (como modalidad y nombre del paciente) e información del Basic Directory Information Object (grupo 0004), que almacena IDs de archivo y relaciones entre registros.

Problemas prácticos del DICOMDIR

En la práctica, los DICOMDIRs presentan limitaciones significativas. Hay al menos tres razones concretas para desconfiar de ellos:

1. Utilidad cuestionable. Cualquier software DICOM bien diseñado debería escanear todos los archivos de una carpeta, identificando los que están en formato DICOM. Incluso un DVD lleno de datos puede ser escaneado con rapidez. Para importación en PACS o visualización — los dos usos más comunes — el DICOMDIR agrega eficiencia despreciable.

2. Fragilidad. Cuando exportamos datos a medios removibles, los usuarios inevitablemente copian, renombran y reorganizan archivos. Cualquiera de estas acciones invalida el DICOMDIR. Si el software receptor depende exclusivamente de él para importar, los resultados serán incorrectos. Existen incluso herramientas dedicadas a corregir DICOMDIRs inválidos — lo que por sí solo demuestra la magnitud del problema.

3. Complejidad de mantenimiento. El DICOMDIR necesita actualizarse cada vez que cualquier archivo del directorio cambia. En medios de grabación única (CD-R), debe ser el último archivo grabado para reflejar correctamente el contenido.

Servicios de archivo y roles de aplicación DICOM

Sala de servidores de data center con racks iluminados representando la infraestructura de almacenamiento PACS
Infraestructura de servidores para almacenamiento PACS — Foto: Brett Sayles/Pexels

El estándar DICOM define cinco servicios de medios para operaciones con archivos: M-WRITE (crear), M-READ (leer), M-DELETE (eliminar), M-INQUIRE FILE-SET (consultar espacio) y M-INQUIRE FILE (consultar fecha/hora de creación). A partir de estos servicios, cualquier Application Entity asume uno de tres roles:

  • File Set Creator (FSC): crea el DICOMDIR y los archivos DICOM
  • File Set Reader (FSR): solo lee, sin modificar ningún archivo
  • File Set Updater (FSU): puede leer, crear y eliminar — en la práctica funciona como FSC + FSR con capacidad de M-DELETE

La comparación con la comunicación de red DICOM es instructiva. En el modelo de red, los Application Profiles se negocian durante el establecimiento de la asociación. Con archivos, esta negociación simplemente no existe — los perfiles deben ser compatibles desde el inicio. Si una aplicación escribe imágenes de MR y la otra espera CT, no hay mecanismo de error amigable. Esto llevó al estándar a definir Application Profiles extremadamente detallados, como se explora en nuestro artículo sobre fundamentos DICOM: objetos, comunicación y datos.

Seguridad en archivos DICOM: cifrado y firmas

Una diferencia fundamental entre transmitir objetos DICOM por red e intercambiarlos como archivos es el alcance de los riesgos de seguridad. Interceptar mensajes de red requiere habilidades específicas; copiar, eliminar o modificar un archivo es algo que cualquier persona puede hacer.

El formato de archivo DICOM seguro ofrece tres propiedades de protección:

  • Confidencialidad: el archivo completo se cifra y resulta ilegible sin la clave correcta
  • Autenticación de origen: certificados y firmas digitales identifican quién creó o modificó el archivo
  • Integridad: checksums y firmas impiden alteraciones no detectadas en datos como nombre del paciente o fecha del informe

En la práctica, la adopción de archivos DICOM seguros sigue siendo bastante limitada. Pocos sistemas PACS implementan esta funcionalidad, y la definición en el estándar permanece superficial. Si la seguridad de los datos en medios removibles es una preocupación — y debería serlo, considerando regulaciones como HIPAA y GDPR — la mejor estrategia sigue siendo eliminar los medios físicos del proceso.

Errores comunes y cómo evitarlos

Portal web de teleradiología PatientSite con interfaz de carga de archivos DICOM y visor de imágenes integrado
Portal de teleradiología con carga DICOM — alternativa moderna al intercambio de CDs

A lo largo de años de integración DICOM, ciertos problemas se repiten con frecuencia preocupante:

1. Confiar en el nombre del archivo para identificación. La extensión “.dcm” no está estandarizada. Muchas implementaciones usan SOP UIDs como nombres de archivo, resultando en cadenas largas y potencialmente problemáticas. Siempre identifica archivos DICOM por el prefijo DICM en la cabecera.

2. No manejar el cambio de VR entre cabecera y datos. El grupo 0002 es siempre Explicit VR. Si la Transfer Syntax del objeto indica Implicit VR, el software debe realizar este cambio. Este es uno de los bugs más frecuentes en lectores DICOM.

3. Usar barras invertidas en File IDs. El separador de componentes del File ID usa backslash (\), que también es el carácter comodín DICOM para “O lógico”. Dividir nombres de archivo por backslash en componentes separados es uno de los bugs más comunes. Usa barras normales (/) como alternativa.

Cuándo NO usar medios DICOM

Médico visualizando imágenes DICOM de tomografía craneal en una tablet portátil conectada al PACS
Acceso remoto a imágenes DICOM vía tablet — alternativa al envío de medios físicos

El intercambio de medios físicos DICOM debería evitarse siempre que sea posible. Escenarios donde la red DICOM o soluciones web son preferibles:

  • Transferencias frecuentes entre instituciones: redes VPN con DICOM C-Store son infinitamente más eficientes que ciclos de grabación/envío/importación de CDs
  • Médicos referentes externos: soluciones de teleradiología web permiten acceso inmediato sin necesidad de software DICOM instalado
  • Cualquier escenario donde el reenvío es probable: grabar un CD, enviarlo por correo, descubrir que faltan cortes finos, regrabar… este ciclo es improductivo y costoso

El concepto de medialess ha ganado tracción en la comunidad: eliminar completamente CDs y DVDs del flujo de intercambio de datos. Si puedes adoptar este enfoque, hazlo. Sin medios = sin problemas de medios.

Para un análisis más profundo de la comunicación de red DICOM como alternativa al intercambio de medios, consulta nuestro artículo sobre comunicación DICOM: SOPs, DIMSE y red en la práctica. Para entender la codificación de los objetos almacenados en estos archivos, revisa nuestro post sobre objetos DICOM y estructura de datos.

El futuro: almacenamiento DICOM más allá de las limitaciones

Quiosco con pantalla táctil y visor WebPACS mostrando radiografía de tórax en punto de acceso público
Quiosco con acceso WebPACS — evolución del acceso a imágenes DICOM sin medios físicos

El modelo actual de almacenamiento DICOM en medios es, francamente, excesivamente detallado en aspectos que no debería controlar — como sectores de arranque y reglas de nombres de archivo específicas por tipo de medio. Al mismo tiempo, deja vacíos donde la flexibilidad sería más útil.

Una propuesta interesante sería crear una utilidad de empaquetado — algo como un “DICOMPack” que funcione de manera análoga a los compresores ZIP y RAR, pero con características específicas para imágenes médicas: compresión JPEG2000 o JPEG-LS (mucho más eficiente que ZIP para datos de imagen), soporte de cifrado, división de archivos e incluso anonimización integrada. Este enfoque eliminaría la dependencia de medios específicos, haciendo el intercambio de datos más portable y seguro.

El estándar DICOM ya permite el uso de ZIP para comprimir carpetas DICOM (Anexo L del PS3.11) y archivar file sets (Anexo V del PS3.12), pero con restricciones que limitan su utilidad práctica — nombres predefinidos, solo un file set por archivo, ausencia de compresión específica para imagen. La evolución natural pasa por abstraer la capa de medios y enfocarse en funcionalidad de empaquetado inteligente.

Mientras estas mejoras no se concreten, la recomendación práctica es clara: invierte en infraestructura de red y soluciones de acceso remoto, reservando los medios físicos solo para situaciones donde verdaderamente no hay alternativa.

Leave a Reply