¿Qué es lenguaje de marcas? | Lenguaje de marcado

Ya sea HTML, XML o YAML: los lenguajes de marcado hacen que los textos sean legibles para máquinas y humanos a través de su formateo. Para este propósito, un lenguaje de marcado utiliza códigos especiales que identifican el formato.

El lenguaje de marcado es un término que proviene originalmente de la impresión clásica y ya proporcionaba una definición clara de qué se imprimiría y cómo. Esto se refiere, por ejemplo, a la impresión de letras subrayadas o cursivas, pero también a la elección de colores y tamaños de fuente.

Un lenguaje de marcado en TI básicamente no significa nada más, solo que el lenguaje de marcado ahora se hace cargo del formato del texto y otros medios en lo digital. El ejemplo más conocido de un lenguaje de marcas es HTML (Hypertext Markup Language), la base de la Internet moderna.

¿Por qué un lenguaje de marcado en TI?

Son los lenguajes de marcado los que dan estructura al texto y marcan la diferencia entre un texto legible y una cadena caótica. Debe ser posible presentar el contenido de manera estructurada, y un lenguaje de marcado es la interfaz perfecta entre los autores, una máquina como interfaz y el destinatario humano.

Para organizar bloques de texto de una manera significativa y comprensible, se deben insertar los comandos de un lenguaje de marcado, lo que significa que se pueden usar diferentes propiedades de fuente y se crea una composición tipográfica real.

Los comienzos de los lenguajes de marcas

El término lenguaje de marcado para el formato digital fue utilizado públicamente por primera vez por William Tunnicliffe en 1967 y hasta el día de hoy caracteriza la imagen de un lenguaje de marcado que hace que el contenido sea más fácil de entender a través del formato.

En 1969, IBM desarrolló el primer lenguaje de marcado GML (Generalized Markup Language), que se desarrolló para mostrar documentación técnica. Posteriormente, GML se desarrolló y estandarizó aún más en 1986 como SGML (Lenguaje de marcado generalizado estructurado). En la forma utilizada en 1986, SGML es uno de los predecesores más importantes de HTML y XML.

Otros lenguajes de marcado (históricamente menos relevantes) incluyen, por ejemplo, TeX o Scribe. Scribe fue el primer lenguaje de marcado en separar archivos de texto y estilo, y TeX todavía se usa hoy en día para representar fórmulas matemáticas.

¿Cómo funcionan las marcas de texto?

En la práctica, un lenguaje de marcado por lo general funciona de manera bastante simple mediante el uso de marcado de texto para ciertas secciones y, por lo tanto, definiendo la sintaxis. Esto se hace usando etiquetas de inicio y fin, que se colocan alrededor de secciones de texto como marcadores de inicio y fin como corchetes.

Los marcadores de este tipo están estructurados jerárquicamente, por lo que se pueden «apilar» varios marcadores uno encima del otro. Un ejemplo: una cadena de texto puede ser un encabezado, cursiva y subrayado sin necesidad de un solo marcado. Basta marcar el texto como encabezado y cursiva y subrayado.

Cómo funcionan las marcas de texto
Cómo funcionan las marcas de texto

Presente en un lenguaje de marcas

Dado que HTML es actualmente el lenguaje de marcado más conocido, el Lenguaje de marcado de hipertexto también es ideal para ejemplos. El texto de un sitio web se puede escribir en un editor HTML de la misma manera que en un editor de texto. Este último solo requiere una cierta comprensión de la terminología en HTML para poder escribir un texto que los navegadores puedan leer sin errores.

Una sección normal de texto se identificaría con la etiqueta de inicio y final «body», y la etiqueta final «/body» se identificaría con la barra inclinada frontal. En este cuerpo de texto, las palabras individuales podrían enfatizarse, por ejemplo, en negrita y las marcas correspondientes «strong» y «/strong». Cualquier navegador puede leer y personalizar fácilmente los comandos. De esta forma, el texto continuo puede escalarse fácilmente con resolución y tamaño de ventana y mostrarse en diferentes dispositivos finales.

Mayores niveles de abstracción con XML

XML es uno de los lenguajes de marcado más utilizados. El lenguaje de marcado extensible se utiliza principalmente en el desarrollo de aplicaciones y desarrollo web y extiende el lenguaje de marcado clásico como formato de texto a niveles más altos de abstracción, en los que también se pueden mostrar diferentes tipos de medios.

Por lo tanto, XML no solo se usa para documentos y en software de procesamiento de texto, sino que también es la base de muchas bases de datos. Con XML, el formato de texto puro pasa a un segundo plano y la estructura se crea mediante el uso de diferentes componentes.

Serialización de datos con YAML

Otro lenguaje de marcado popular y simplificado, que a menudo se usa para almacenar la configuración del tiempo de ejecución en archivos de configuración, es YAML (originalmente «Yet Another Markup Language«, ahora «YAML Ain’t Markup Language»). YAML convierte los datos de un formulario interno del programa para que se puedan guardar como un archivo de texto. Los datos formateados deberían ser legibles tanto por máquinas como por humanos.

Hacer que el contenido sea legible

Los lenguajes de marcado son una de las piedras angulares del intercambio de información en TI. Los lenguajes de marcas por sí solos hacen posible que los usuarios lean textos de manera significativa y estructurada. Los lenguajes de marcado modernos pueden hacer mucho más e ir más allá del formato de texto puro. En lugar de formato puro, se hace una distinción entre medios y características semánticas.

Las tiendas en línea, por ejemplo, contienen diferentes formatos para nombres de productos, números o precios, que a su vez se pueden transferir fácilmente desde el sitio web a un formulario en el backend. Al mismo tiempo, los lenguajes de marcado se pueden escribir en un front-end gráfico (como funcionan la mayoría de los sistemas de administración de contenido), pero también se pueden escribir en el back-end en el lenguaje mismo.

Deja un comentario