SGML significa Standard Generalized Markup Language ou, em português, Linguagem Padrão de Marcações Genéricas.
A tecnologia SGML é consideravelmente recente, embora o uso de "marcações" no texto não sejam. Façamos pois um levantamento dos esquemas de marcação que deram origem ao SGML.
Uma marcação em um documento é tudo aquilo que não lhe acrescenta conteúdo. As marcações referiam-se, originalmente, às anotações feitas a mão pelos autores e desenhistas e que seriam adicionadas ao texto escrito. Essas anotações eram instruções ao digitador de como o texto deveria ser diagramado e que tipo de letra ele deveria usar. Esse tipo de marcação é conhecido como marcação de procedimentos.
Hoje, a maioria dos sistemas de publicação eletrônica utilizam-se de marcação de procedimentos. São exemplos desses sistemas programas de edição de texto e de editoração eletrônica. Um sistema que utiliza marcações de procedimentos geralmente usa formatos proprietários de arquivos de dados, como os arquivos .doc do Microsoft Word ou as planilhas .xls do Excel. Cada um desses programas possui um conjunto de instruções específicas que diz ao programa como deve ser organizado o texto e como o mesmo deve ser formatado. Uma marcação por procedimentos define como o documento se parecerá numa mídia específica, como uma apresentação do Power Point ou um relatório impresso do Word e, dificilmente, ficam bons numa mídia diferente da que o autor originalmente pensou em usar: um documento do Word, por exemplo, é horrível para ser usado na Internet.
O sistema de marcações oposto ao de procedimentos é o de marcações descritivas. Num sistema de marcação descritiva o autor não se preocupa com a aparência do texto mas sim com as entidades que eles representam. Enquanto num sistema de procedimentos definiríamos o tamanho da letra, o tipo de fonte etc., num sistema descritivo dizemos que aquela porção do texto representa o título do documento, outra porção de texto representa o nome de um capítulo e assim por diante.
Num sistema descritivo, a mídia onde o texto será divulgado não afeta o resultado final, já que não há uma preocupação com constantes e sim com o conteúdo.
Um sistema de marcações por procedimentos tem também a desvantagem de tornar a documentação obsoleta muito rapidamente, pois é isto o que acontece com as máquinas e programas nos quais os documentos são gerados.
O SGML é um padrão internacional (ISO 8879) publicado em 1986 e descreve um padrão para o uso de marcações descritivas mescladas ao documento. O SGML também fornece um método padrão para nomear as estruturas de um texto, definindo modelos hierárquicos para cada tipo de documento produzido. A linguagem SGML força que cada um dos elementos descritos, como "capítulo", "título" e "parágrafo", a se ajustarem na estrutura lógica e previsível de seu documento.
Há diferentes estruturas de documentos para cada diferente tipo de informação criada: boletins informativos, manuais técnicos, catálogos, especificações de projeto, relatórios, cartas e memorandos.
O SGML permite a criação de documentos independentes do tipo de máquina e dos programas usados já que, como o SGML é um padrão internacional, ele é portável. Pode-se trocar informações entre usuários em diferentes sistemas e plataformas sem nenhuma alteração necessária.
Um exemplo da importância dessa independência é a fotografia: pode-se comprar um filme ISO 100, por exemplo, sem se preocupar com o fabricante, ajustar-se a velocidade da máquina para 100 (automático em muitas máquinas) e sair tirando fotos. O SGML representará para a indústria da documentação o que os padrões ISO e ASA representam para a indústria fotográfica: uma universalização dos formatos, tornando-os 100% compatíveis e acessíveis a partir de qualquer plataforma ou sistema usado.