Lenguaje de marcado

Los lenguajes de marcado se utilizan para describir propiedades, afiliaciones y formas de representación de secciones de un texto (caracteres, palabras, párrafos, etc. - " elementos ") o un conjunto de datos. Por lo general, esto se hace marcando las etiquetas .

El artículo trata en particular de la “separación de estructura y representación” recomendada por el Lenguaje de marcado estándar generalizado (SGML).

Origen e historia de la palabra

").

Cómo se ve un texto excelente

Principales características

.

Resultado y código en ejemplos

Ejemplo de representaciónsección
Ejemplo para ... HTML Látex MediaWiki - Wikitexto
titular
<
h2
>
Abschnitt
</
h2
>
\section
{
Abschnitt
}
==
Abschnitt
==
contar
  • Punto 1
  • Punto 2
  • punto 3
<
ul
>
<
li
>
Punkt 1
</
li
>
<
li
>
Punkt 2
</
li
>
<
li
>
Punkt 3
</
li
>
</
ul
>
\begin
{
itemize
}
\item
Punkt 1
\item
Punkt 2
\item
Punkt 3
\end
{
itemize
}

*
Punkt 1
*
Punkt 2

*
Punkt 3

Hipervínculo W3C
<
a
href
=
"http://www.w3.org/"
>
W3C
</
a
>
\href
{
https://www.w3.org
}{
W3C
}
[
http://www.w3.org/ W3C
]
texto en negrita grasa
<
b
>
fett
</
b
>
\textbf
{
fett
}
'''
fett
'''
texto en cursiva itálico
<
i
>
kursiv
</
i
>
\textit
{
kursiv
}
''
kursiv
''

El hipervínculo con LaTeX no funciona en general, pero al menos con el paquete adicional hyperrefy cuando se genera un resultado en formato PDF .

Ejemplos de distinción "representativa" versus "descriptiva"

Negrita ” y “ cursiva ” en la tabla anterior significan una determinada representación ( formato , aquí específicamente elegir un estilo de fuente ), mientras que “ Encabezado ” es una característica semántica y generalmente no define ninguna representación como negrita. En las obras impresas, los títulos se formatean con versalitas o cursiva en lugar de negrita.

de lo que significa expresar "importancia", por ejemplo:
HTML Resultado con la configuración predeterminada
<
strong
>
wichtig!
</
strong
>
¡importante!

El elemento HTML strongsuele estar representado por texto en negrita (en la configuración del navegador ).

La relación entre el elemento HTML y bel elemento HTML stronges análoga a la relación entre el elemento HTML iy em: Este elemento significa " énfasis ", su visualización predeterminada está en cursiva. En LaTeX también hay una "variante semántica" del

\emph
marcado de pantalla
\textit
:

, LaTeX tiene esto en cuenta:
HTML Látex Resultado con la configuración predeterminada
<
body
>
eine
<
em
>
Betonung
</
em
>
in normaler Umgebung
</
body
>
\begin
{
document
}
eine
\emph
{
Betonung
}
in normaler Umgebung
\end
{
document
}
un énfasis en un entorno normal
HTML Resultado con la configuración predeterminada
<
i
>
eine
<
em
>
Betonung
</
em
>
in kursiver Umgebung
</
i
>
un énfasis en cursiva
\textit
{
eine
\emph
{
Betonung
}
in kursiver Umgebung
}
un énfasis en cursiva
Látex Resultado

Wikitext se comporta aquí de una manera como LaTeX; En HTML, el comportamiento de LaTeX se puede lograr ( rudimentariamente ) a través de la declaración de "énfasis" en HTML solo se conocen para los casos más simples y en LaTeX solo para los casos más simples y los segundos más simples.

Sistemática interna - niveles de abstracción

"Representativo" frente a "descriptivo": descripción general

a "actuar" / "presentacional"
visual, físico, específico;
demasiado "descriptivo"

Al principio de su artículo explica Goldfarb, el marcado separa los elementos lógicos entre sí y da ("típicamente" - probablemente en relación con el marcado de procedimiento previamente conocido ), las funciones de procesamiento ("funciones de procesamiento") que se van a aplicar a estos elementos.

Premio descriptivo de popularidad (ventajas, desarrollo histórico)

).

William W. Tunnicliffe abogó por la separación de contenido y forma en el procesamiento de textos ya en 1967 en una conferencia, pero esto inicialmente tuvo poco efecto (después de todo, Goldfarb afirma haber sido influenciado por ello). En 1981 Brian Reid presentó su sistema de composición tipográfica Scribe en la misma sesión de la “Conferencia de Lausana” en la que Goldfarb presentó sus ideas. La separación de Scribe de contenido y forma (ating) fue particularmente impresionante. Durante los siguientes años, Leslie Lamport desarrolló el paquete de macros LaTeX para el programa TeX , particularmente con la motivación de ofrecer también a los autores un lenguaje de marcado descriptivo. Fue lanzado en 1985. LaTeX ya era muy popular en 1992, inicialmente entre los matemáticos norteamericanos, y en los próximos años en el campo científico-académico y en la industria. En los años siguientes, un equipo de desarrollo casi puramente europeo se hizo cargo del desarrollo posterior de LaTeX de Lamport y mejoró su flexibilidad con respecto al uso de diferentes "hojas de estilo" (archivos de definición de macro con terminaciones .stypara "estilo" como en Lamport y .clspara la declaración de la “clase de documento” con \documentclass) y con respecto al Uso con idiomas distintos al inglés, lo que hizo que LaTeX fuera aún más importante.

Tunnicliffe y Goldfarb, por otro lado, citaron el desarrollo posterior de IBM Generalized Markup Language a SGML como base para la definición de lenguajes de marcado puramente descriptivos, de los cuales surgió XML más tarde , que también juega un papel importante en el conjunto de trabajo .

Definición como "idioma"

Un lenguaje de marcado debe ser un lenguaje que también sea legible por máquina . Para ello, se debe especificar la sintaxis y semántica , que se aplica en los siguientes casos:

  • En el caso de lenguajes de marcado definidos de acuerdo con SGML o XML , la sintaxis está representada con precisión por una definición de tipo de documento . En determinadas circunstancias, el World Wide Web Consortium también especifica semántica (informal) que consiste en recomendaciones dirigidas a usuarios y desarrolladores.
  • Es un poco más difícil en el caso de TeX y LaTeX , donde las definiciones de macro (principalmente antes de leer en el código que representa el contenido de un documento) crean un lenguaje “procedimental” muy extenso (nos adelantamos a algo). La elección de nombres macro "hablados" crea una "ilusión" de una distinción puramente "descriptiva". Al ocultar (en el manual) o prohibir las posibilidades totalmente disponibles de marcado "procedimental" o "de presentación", se puede lograr un lenguaje de marcado "puramente descriptivo". Del mismo modo, HTML 4.01 estricto fue un lenguaje de marcas puramente descriptiva por “prohíben” presentación elementos y atributos que siguen fueron interpretados por los navegadores.

    "Procesal" y "presentacional"

    En un importante artículo de 1987, además de "procedimental" y "descriptivo", se describieron otros tipos de marcado, de los cuales el coautor de XML Tim Bray adoptó "presentacional" en su blog. Con este último se quería decir que el marcado de WYSIWYG - procesadores de texto - el documento de origen se insertó cuando los usuarios escribieron teclas específicas (llamado WordStar ). En lugar del código fuente, el usuario solo obtiene una vista previa de la salida impresa. "Presentacional" obviamente tiene un significado diferente, más especial que en las especificaciones HTML, que no mencionan los editores WYSIWYG. Sin embargo, una cosa que tienen en común es que el código de marcado es más conciso que el del "marcado de procedimiento visible" en el siguiente sentido:

    En el ejemplo dado por Goldfarb, una lista como la introducida en HTML está precedida por el siguiente código:

    tb 4 of 4 sk 1

    Las dos primeras líneas representan asignaciones de valores para los parámetros que controlan la sangría francesa del siguiente párrafo, la tercera línea crea su espacio vertical del párrafo anterior. El lenguaje de marcas utilizado es el ( troff- similares) GUIÓN . Obviamente, es parte de un programa de computadora en un lenguaje de programación imperativo . en HTML es más corto y elimina los detalles de formato. Sin embargo, el ejemplo solo es adecuado para insinuar la idea de Goldfarbs de "distinción de procedimiento", y solo ilustra la diferencia con la "distinción descriptiva".

    Bray ilustra el "marcado de procedimiento" con los comandos PostScript

    gsave
    y
    grestore
    . Estos dos comandos se relacionan entre sí como
    \begingroup
    y
    \endgroup
    en TeX . La instrucción tiene el
    \begingroup
    efecto de que con cada cambio de valor de parámetro subsiguiente, el valor de parámetro anterior se almacena en una pila . El comando correspondiente
    \endgroup
    restaura los valores de los parámetros antes que el correspondiente
    \begingroup
    . Ambos comandos no tienen un efecto directo sobre el formato; el efecto depende de los valores de los parámetros que se cambian entre ellos.

    %!
    /Courier
    72
    500
    moveto
    (Hallo Welt!)
    show
    showpage

    En general, las observaciones anteriores sugieren el siguiente ejemplo:

    Cursiva con HTML y LaTeX, este último con comandos de alto nivel frente a comandos de bajo nivel
    representación HTML LaTeX de alto nivel LaTeX con \begingroup LaTeX con en su {lugar\begingroup
    conjunto de
    <
    body
    >
    <
    i
    >
    kursiv
    </
    i
    >
    gesetzt
    </
    body
    >
    \begin
    {
    document
    }
    \textit
    {
    kursiv
    }
    gesetzt
    \end
    {
    document
    }
    \begin
    {
    document
    }
    \begingroup
    kursiv
    \/\endgroup\
    gesetzt
    \end
    {
    document
    }
    \begin
    {
    document
    }
    kursiv
    \/
    }
    gesetzt
    \end
    {
    document
    }

    Los dos ejemplos de bajo nivel a la derecha se acercan mucho a cómo LaTeX

    \textit
    realmente implementa el comando de alto nivel .
    \endgroup
    gesetzt
    daría como resultado "en cursiva ", por lo que se
    \endgroup\
    usa. La necesidad de este truco se evita en el ejemplo de la derecha, donde las llaves representan los comandos
    \begingroup
    y
    \endgroup
    , mientras que después
    \textit
    solo indican su alcance. El comando
    \/
    evita que la distancia entre “cursiva” y “set” sea demasiado estrecha debido a la inclinación derecha de la “v” (la llamada corrección de cursiva ).

    En los cuatro ejemplos hay una distinción descriptiva que varía el estilo de fuente. Una de las desventajas del marcado procedimental, que menciona Goldfarb, es que requiere el dominio de una gran cantidad de comandos de programación, como ejemplo menciona específicamente el TeX de Knuth . La corrección de la cursiva también es una sutileza tipográfica, cuya necesidad no es una cuestión de rutina para los autores cuando utilizan TeX. El comando LaTeX

    \textit
    evita que el usuario tenga que conocer algunos comandos de bajo nivel y corregir las cursivas. El ielemento en HTML es tan fácil de dominar. El punto de crítica de Goldfarb que se aborda aquí (a diferencia de otros) aparentemente no está dirigido contra ninguna decoración descriptiva , sino solo contra el etiquetado similar al lenguaje de programación como en los dos ejemplos de la derecha y contra los comandos PostScript anteriores.

    , en la que los algoritmos para alcanzar un estado descrito (aquí: cursiva) no se mencionan explícitamente.

    (con el LaTeX 2.09 válido en 1992). Quizás un lenguaje de marcado genérico (o descriptivo) es un lenguaje que ofrece una "cierta cantidad" de marcado genérico además del marcado de presentación.

    Niveles de representación

    Refiriéndose a un trabajo de 1988 en el que estuvo involucrado, Furuta habla de tres " representaciones " de un documento:

    1. un resumen de uno que se cambia mediante la edición con un editor ( representación abstracta ),
    2. un uno física que surge de un abstracto a través de formateo ( representación física ), y
    3. una apariencia de página requerida para un dispositivo de salida específico ( representación de página ).

    El artículo de Furuta está estructurado en consecuencia.

    o marcado tradicional como se describe al principio del artículo). se determina normalmente de forma automática (debería ser uniforme, pero a menudo mayor para fórmulas matemáticas con saltos). TeX también surgió con la especialidad de poner los caracteres en fórmulas matemáticas en diferentes tamaños y ordenarlos entre sí de tal manera que las proporciones cumplan con altos requisitos tipográficos. . Por lo general, esto también se deja al programa de composición tipográfica y, en ocasiones, el resultado automático se corrige manualmente. A la hora de diseñar la portada de un libro, en cambio, “no se deja nada al azar”. ). ") .

    Sin embargo, la “apariencia de la página” o la “presentación de la página” de un documento no tiene que estar disponible como un archivo de descripción de página separado. Con algunos "editores" puede / podría verlos "directamente" en la pantalla o imprimirlos. troff se ha ampliado a ditroff , que puede generar su propio archivo de descripción de página, otros programas de procesamiento de texto se han equipado con la capacidad de generar PDF.

    Con los navegadores web (más precisamente: renderizadores HTML ) y lectores de libros electrónicos (que muestran HTML o EPUB, por ejemplo), la visualización de la página (la ruptura de los párrafos de texto en ejecución) se adapta rápidamente a los cambios de ancho de ventana o tamaño de fuente.

    Implementación de la variación de estilo para etiquetado genérico

    Implementación de una representación

    Para el formateo de texto marcado genéricamente, las reglas generales para manejar las etiquetas individuales (posiblemente dependiendo de los " atributos " en lenguajes de marcado tipo SGML) se especifican en un lenguaje formal (en una especie de programa). Los "archivos de reglas" correspondientes se denominan "hojas de estilo" en el entorno SGML (no con LaTeX). En parte o como primer paso, el formateo consiste en “traducir” el lenguaje genérico a uno de presentación.

    En el caso de HTML, el formato de los elementos individuales se determina mediante las instrucciones correspondientes en código CSS . Por ejemplo, la línea CSS dice que un archivo HTML debe mostrarse con texto azul sobre un fondo amarillo y con el texto en elementos debe ser rojo. En el siguiente documento de muestra

    <
    head
    >
    <
    title
    >
    Hallo Welt!
    </
    title
    >
    <
    style
    type
    =
    "text/css"
    >
    body
    {
    color
    :
    blue
    ;
    background-color
    :
    yellow
    ;
    }
    em
    {
    color
    :
    red
    ;
    }
    </
    style
    >
    </
    head
    >
    <
    body
    >
    <
    em
    >
    Hallo,
    </
    em
    >
    Welt!
    <
    em
    >
    Hörst
    </
    em
    >
    du?
    </
    body
    >

    este código CSS aparece en un styleelemento dentro del headelemento. El resultado debería ser algo como

    Hola mundo

    Hace que se oye

    ser y lo mismo que con

    <
    head
    >
    <
    title
    >
    Hallo Welt!
    </
    title
    >
    </
    head
    >
    <
    body
    style
    =
    "color: blue; background-color: yellow; "
    >
    <
    em
    style
    =
    "color: red; "
    >
    Hallo,
    </
    em
    >
    Welt!
    <
    em
    style
    =
    "color: red; "
    >
    Hörst
    </
    em
    >
    du?
    </
    body
    >

    El segundo archivo ha sido reemplazado por, y cada etiqueta (marcado genérico) en el primer archivo ha sido reemplazada por la de presentación . Entonces, la declaración CSS funciona como si se insertara en todas las etiquetas iniciales. sí mismo y primero debe convertirse a un archivo PDF, por ejemplo. como el código fuente, las cadenas de tokens y otras listas internas en secciones lo más cortas posible. y se descarta después de que una página de impresión ha emitido en gran parte el contenido de memoria requerido para esto (por lo que era posible escribir volúmenes gruesos hace décadas). .

    Los ejemplos también deben mostrar dos ventajas del marcado genérico en comparación con el marcado de procedimiento: El código fuente marcado genéricamente requiere menos espacio de almacenamiento que el marcado de presentación (tan pronto como el número de elementos de texto correspondientes excede un número que depende de la complejidad de la regla de reemplazo, que aún no es el caso en el ejemplo ), y con el marcado genérico el texto real que se mostrará es más fácil de encontrar de nuevo en un editor de texto que con el marcado de procedimiento, es más intuitivo de leer. (Consulte también No se repita y la abstracción (informática)) .

    Hoy en día, los archivos con la extensión que se leen también determinan el método de visualización:
    HTML Látex
    <
    head
    >
    <
    title
    >
    Hallo Welt!
    </
    title
    >
    <
    link
    rel
    =
    "stylesheet"
    type
    =
    "text/css"
    href
    =
    "style.css"
    />
    </
    head
    >
    <
    body
    >
    <
    em
    >
    Hallo,
    </
    em
    >
    Welt!
    <
    em
    >
    Hörst
    </
    em
    >
    du?
    </
    body
    >
    \documentclass
    {
    abc-art
    }
    \begin
    {
    document
    }
    \emph
    {
    Hallo,
    }
    Welt!
    \emph
    {
    H
    \"
    orst
    }
    du?
    \end
    {
    document
    }

    Las dos líneas CSS de antes ahora podrían estar en el archivo style.cssque se vería así:

    body
    {
    color
    :
    blue
    ;
    background-color
    :
    yellow
    ;
    }
    em
    {
    color
    :
    red
    ;
    }

    Cambio de pantalla

    En el par de ejemplos anterior, ahora puede cambiar la visualización del código fuente de texto seleccionado cambiando el "encabezado":

    elemento tiene el mismo efecto. Aparte de la fuente, el resultado con HTML como LaTeX debería verse así:

    Hola mundo

    Hace que se oye

    Alternativamente, el código CSS podría style.csscambiarse a. Para los números de revistas , las partes enmarcadas y enmarcadas de los textos fuente enviados por los autores individuales se pueden combinar con el preámbulo del documento de la revista para que todos tengan el mismo formato según el “tipo de casa”.

    La representación de documentos XML se puede cambiar utilizando una transformación XSL diferente.

    tienen que insertar una presentación o algo similar.

    (En lugar de \"ousar LaTeX ö, si el documento contiene preámbulos , por ejemplo . El archivo leído de esta manera es un ejemplo del hecho de que, lamentablemente, el final ya no solo significa "estilo"; más bien, estos paquetes a menudo ofrecen posibilidades para hacer que el trabajar más fácilmente, generalmente a través de la extensión del conjunto de instrucciones).

    Conclusión: ¿Qué es la “separación de contenido y presentación”?

    elemento o entorno. La separación de estructura y presentación o similar consiste en el hecho de que los documentos fuente tienen dos componentes, uno de los cuales solo especifica reglas de formato y el otro solo contiene el texto del documento con marcado genérico.

    Las reglas de formato no tienen que estar ubicadas directamente en el encabezado; el encabezado generalmente incluye la mayoría de las reglas de formato de otros archivos ( transclusión ). En el caso de LaTeX, el archivo con la información sobre el formato (el "archivo de control") no tiene que contener todo el texto para ser mostrado; esto a menudo, especialmente en el caso de libros, también se incluye de otros (genéricamente etiquetados) archivos.

    En otros casos, el documento de origen no contiene ninguna información de formato (no incluye archivos con reglas de formato, por ejemplo, XML / XSL). La "separación de contenido y forma" - o para distinguirla de la sociología formal : de "contenido" y "formateo" - se logra entonces - incluso más claramente que en el caso anterior - por el hecho de que el contenido provisto con una distinción lógica es en archivos diferentes a las reglas de formato. Al elegir un estilo de visualización, no es necesario cambiar los archivos que contienen el texto que se mostrará ("contenido").

    Generación automática de código y código fuente original.

    Ya se ha mencionado que el “texto excelente”, que forma la base para la visualización de un documento en los dispositivos de salida (impresora, pantalla), se puede generar automáticamente a partir de otra forma de “texto excelente”. En la medida en que la forma de representación fija y orientada a la página todavía se puede ver como codificada en un lenguaje de marcado (¿es PostScript un lenguaje de marcado?, ¿PDF?), Prácticamente siempre se convierte automáticamente de un formato puramente físico (sin información semántico-estructural). a un stylelenguaje puramente genérico (sin referencias al método de presentación, como en HTML5 sin el atributo) o un lenguaje de marcado que mezcla información física y semántico-estructural (como en el uso "no purista" de LaTeX). Se puede generar directamente a partir de una apariencia puramente física del documento (PDF de XSL-FO), y se puede generar automáticamente una forma puramente física, no orientada a páginas, a partir de una apariencia puramente estructural (XHTML) (por ejemplo, mediante transformación XSL) .

    Cuando el trabajo se ha publicado o enviado a un destinatario, o cuando la impresión requerida para un archivo está disponible, los archivos subyacentes de ciertos formatos de marcado a menudo se olvidan y algunos usuarios los eliminan. Si el documento se va a reutilizar (parcialmente), p. Ej. B. para una edición de libro nueva y revisada, o si un artículo impreso hace años también se publicará en línea como HTML, es bueno si el marcado (parcialmente) semántico-estructural original - el código fuente original - todavía está disponible y no agotado debe ser "reconstruido" en un formato puramente descriptiva (sección por ejemplo sin numeración partidas y sub encabezados de sección).

    y reconocer la estructura generada en la pantalla sin ver el código fuente. que no se mira, el editor de texto presenta una "versión fácil de usar "de él, que es WYSIWYG con respecto a los caracteres que se leerán en el dispositivo de salida, como). ocurren con frecuencia difiere de un documento a otro ). . - Para simplificar la generación de documentos HTML (X), se han ideado las siguientes opciones:
    • Editores HTML con autocompletado;
    • TeX4ht convierte la salida DVI de TeX en HTML o XML;
    • Sistemas de gestión de contenido para no programadores, ver sistema editorial , que es más general en el sentido de que también se apuntan formatos de destino distintos de (X) HTML, e incluye los editores WYSIWYG ya mencionados varias veces;
    • Lenguajes de marcado simplificados : se describen con más detalle a continuación. En las wikis , representan el "formato fuente original", a partir del cual se genera principalmente XHTML, desde el cual también se puede imprimir en buena calidad (PDF), por ejemplo, a través de XSL.
    • Ver también
      : código de programa

      Lenguajes de marcas simplificados

      caracteristicas

      Las publicaciones en wikis , blogs y foros de Internet se suelen realizar en ventanas de formularios web . Las opciones de diseño pueden ser muy limitadas, lo que puede beneficiar una apariencia ordenada de las páginas resultantes. Aunque el formato de destino (en el que se presentan los artículos a los lectores) es HTML o XHTML, el código de entrada HTML en el formulario solo se acepta de forma limitada (de lo contrario, se filtrará). El marcado ( aparte de las URL para hipervínculos ) a menudo solo usa ( combinaciones inusuales de) signos de puntuación o al menos caracteres que no son letras; o algunas etiquetas HTML se acortan y los elementos correspondientes no se cierran (similar a SGML ), por ejemplo

    HTML Látex
    <
    head
    >
    <
    title
    >
    Hallo Welt!
    </
    title
    >
    <
    style
    type
    =
    "text/css"
    >
    em
    {
    text-decoration
    :
    underline
    ;
    </
    style
    >
    </
    head
    >
    <
    body
    >
    <
    em
    >
    Hallo,
    </
    em
    >
    Welt!
    <
    em
    >
    Hörst
    </
    em
    >
    du?
    </
    body
    >
    \documentclass
    {
    article
    }
    \usepackage
    {
    ulem
    }
    \begin
    {
    document
    }
    \emph
    {
    Hallo,
    }
    Welt!
    \emph
    {
    H
    \"
    orst
    }
    du?
    \end
    {
    document
    }
    Textil Traducción en XHTML Representación de ejemplo
    h3. Unterabschnitt <h3>Unterabschnitt</h3> Subsección

    (similar a Haml ). Como resultado, el marcado interrumpe mínimamente el flujo de lectura al escribir el artículo en la ventana del formulario. Para la presentación de documentos de este marcado se encuentra en el lado del servidor en el requerido para este complejo lenguaje de marcado como HTML o XHTML convertido , por ejemplo por Pandoc o, como en el caso de Wikipedia, por el software MediaWiki .

    Ejemplo de representación
    Ejemplos de marcas con dos lenguajes de marcas simplificados
    MediaWiki- Wikitexto Markdown como este ... … más o menos: resultados en XHTML
    ==
    Abschnitt
    ==
    ##
    Abschnitt
    <
    h2
    >
    Abschnitt
    </
    h2
    >

    *
    Punkt 1
    *
    Punkt 2

    *
    Punkt 3

    -
    Punkt 1
    -
    Punkt 2

    -
    Punkt 3

    *
    Punkt 1
    *
    Punkt 2

    *
    Punkt 3

    <
    ul
    >

    <
    li
    >
    Punkt 1
    </
    li
    >

    <
    li
    >
    Punkt 2
    </
    li
    >

    <
    li
    >
    Punkt 3
    </
    li
    >

    </
    ul
    >

    • Punto 1
    • Punto 2
    • punto 3
    [
    https://www.w3.org/ W3C
    ]
    [
    W3C
    ](
    https://www.w3.org/
    )
    <
    a
    href
    =
    "https://www.w3.org/"
    >
    W3C
    </
    a
    >
    W3C
    '''
    fett
    '''
    **
    fett
    **
    __
    fett
    __
    <
    b
    >
    fett
    </
    b
    >
    grasa
    ''
    kursiv
    ''
    *
    kursiv
    *
    _
    kursiv
    _
    <
    i
    >
    kursiv
    </
    i
    >
    itálico

    Además, los lenguajes de marcado simplificados normalmente prescinden del uso de saltos de línea de código simples y la sangría del código únicamente para estructurarlo (en el sentido de legibilidad y comprensibilidad); más bien, en el caso de MediaWiki, por ejemplo, un salto de línea finaliza un párrafo sangrado ( "sangría francesa" ) en una lista o una cita en bloque . Un asterisco ( *) inmediatamente después inicia un elemento de lista (nuevo) y se muestra como una viñeta tipográfica . Las desventajas de este método son posibles colisiones con otra función de los caracteres correspondientes, lo que puede provocar errores. En Markdown, p. Ej. B. El texto en cursiva comienza con un asterisco ( ich rufe *laut* um Hilfe), que al principio de la línea ( *laut* rufe ich um Hilfe) puede entrar en conflicto con el uso de una entrada de lista. El código sangrado (es decir, el salto de línea del código va seguido de al menos un espacio ) se representa en Wikitext "literalmente" como "código" (sin resaltar la sintaxis). Los artículos Wikitext y Markdown , así como los demás artículos de la categoría: Lenguaje de marcado simplificado, ofrecen ejemplos más precisos .

    , se pueden cumplir otras funciones:
    • Etiquetas para etiquetado adicional de una base de datos con información adicional y para categorización;
    • Transclusiones para incluir partes de otros documentos por referencia.
    • ) se pueden convertir.

      Desarrollo historico

      - se basa estrechamente en esta práctica histórica.

      La mayoría de los lenguajes de marcado se han desarrollado mediante el uso de software diferente; apenas existen soluciones estandarizadas o uniformes, aunque las funciones suelen ser similares.

    • El BBCode se ha establecido en foros .
    • Para incrustar documentación estructurada en programas de computadora ( Plain Old Documentation (POD) para Perl o Javadoc para Java).
    • Markdown , Textile , AsciiDoc y reStructuredText se enfocan en diferentes enfoques.

    Probablemente el primer lenguaje de marcado simplificado con conversión fue desarrollado por Ward Cunninghams en 1994 y publicado en 1995 como WikiWikiWeb junto con Portland Pattern Repository , ver también Chronology of Hypertext Technologies .

    datos

    YAML y su subconjunto JavaScript Object Notation (JSON) son lenguajes de marcado simplificados para la serialización de datos .

    Véase también
    : Categoría: Lenguaje de marcado simplificado

    Sistemática externa: Clasificación como lenguaje de programación o formato de datos

    lenguajes de marcado.

    De los paradigmas de procedimiento lenguajes de marcado - PostScript , TeX y el descendiente goteo de la primitiva ESCORRENTIA (el pozo de Goldfarb GML SAT) se sabe que es Turing completo son. En este sentido, pueden representar algoritmos de cualquier complejidad y así cumplir una característica esencial y generalmente reconocida de los lenguajes de programación. XSLT es otro lenguaje de programación completo de Turing, cuyos "comandos", sin embargo, al igual que los "lenguajes" mencionados anteriormente, están diseñados para la representación de documentos etiquetados "descriptivamente" con XML y que, curiosamente, se anota en un "XML formato de datos". El lenguaje XQuery para bases de datos XML , que se indica en XML, también es Turing completo.

    Consulte también
    : "Otros significados" en el artículo sobre el código fuente.

    literatura

    Extensiones de nombre de archivo y tipos MIME de
    lenguajes de marcado seleccionados
    Lenguaje de marcado extensión de archivo Tipo de Mimica
    HTML .htm, .html text/html
    Posdata .ps application/postscript
    Formato de texto enriquecido .rtf text/rtf
    TeX / LaTeX .tex text/x-tex
    XML .xml text/xml