A importância dos metadados

Os metadados são a fonte “dos/sobre” os dados em si mesmo. É aquilo que normalmente os utilizadores da informação não “vêm” mas que de uma forma, mais ou menos imperceptível, estão associados aos dados que eles utilizam. Enquanto a grande maioria dos utilizadores não vê, nem tem interesse em ver, há casos em que querem ver mas não os deixam.

Em Setembro de 2013 o supremo tribunal do estado do Arizona (EUA) decretou que os metadados (electrónicos) são do domínio público ao contrário do que uma entidade patronal pretendia. Enquanto numa imagem os metadados podem ser, ou servir, como meros marcos espaciais ou temporais, já no caso de registos pessoais eles podem ser fundamentais na vida de uma pessoa: quem escreveu as anotações sobre o desempenho profissional, em que data essas notas foram adicionadas, em que sistema informático, entre muitas outras hipóteses. A base para essa decisão do tribunal é a de que os metadados são parte integrante dos dados e que não têm existência ou significado quando tomados de uma forma isolada. Por exemplo, ter conhecimento de que o metadado “velocidade do obturador” numa fotografia é de 1/100s só faz sentido quando associado ao objecto.

James Comey confirmado pelo Senado dos EUA para comandar o FBI em Julho de 2013, durante uma audição na Comissão de Justiça do Senado, no dia 9 desse mês, disse que de um modo geral a análise de metadados é uma forma muito importante de ajuda ao combate contra-terrorista.
O jornal “Le Monde”, de 4 de Julho de 2013, noticiou que o estado Francês dispõe de um programa de escutas, semelhante ao norte-americano “Prism”, que de uma forma sistemática recolhe sinais digitais transmitidos entre computadores e telefones, i.e., mensagens de email, de SMS, Facebbok ou Twitter, que são armazenados numa gigantesca base de dados. Mas, as autoridades não se interessam pelos conteúdos das mensagens, mas antes pelo seu contexto. Ou seja, é mais interessante saber quem são o emissor e o receptor do que ter conhecimento da mensagem em si mesma. O que está a ser “escutado” são os metadados.

Este conhecimento, que em inglês se costuma designar como “signals intelligence”, com origem eletromagnética, como por exemplo, os nomes de quem liga e de quem atende, o local, a data, a duração, o tamanho da mensagem, o assunto, tudo isto distribuído por todas as formas de comunicação (email, SMS, FAX, Google, facebook, Yahoo, Twitter, etc. é uma quantidade astronómica de metadados que pode ser utilizada com múltiplos propósitos.

O termo metadado é claramente ambíguo. Pode ser utilizado com objetivos e funções muito diversas. Tem igualmente diversas classificações e conceitos. Um deles subdivide-os em metadados estruturais e descritivos; o primeiro está associado ao desenho e especificações das estruturas de informação, enquanto, por outro lado, os metadados descritivos tem a ver com o próprio conteúdo dos dados. Um bom exemplo deste último caso são os catálogos (em papel ou digital) das bibliotecas. Imagine-se a dificuldade, ou mesmo a impossibilidade, em encontrar um livro numa biblioteca sem o respectivo sistema de catalogação. Quem seria capaz de encontrar um determinado exemplar num universo de 50000 volumes sem qualquer tipo de auxílio?

A adição de metadados beneficia bastante a qualidades dos dados. Outro exemplo: uma página web pode incluir metadados especificando a linguagem em que está escrita, que ferramentas foram utilizadas na sua construção ou palavras-chaves que ajudam os motores de busca a localizá-la.

Os metadados são constituídos por um conjunto de descritores organizados numa estrutura e, que informaticamente podem ser trabalhados de diversas maneiras, e que se destinam a descrever qualquer forma de “dado”. Os metadados estão “espalhados” por todos os sectores de actividade.

Pode-se afirmar que no campo da análise de informação os metadados são mais importantes que o próprio conteúdo da informação. São como que um “anzol” que “pesca” os dados mais pertinentes numa determinada situação. Tendo os metadados uma estrutura então podem ser utilizados como matéria-prima em diversos tipos de operações, i.e., uma estrutura de suporte que, por exemplo, descreve, localiza no tempo e no espaço simplifica muito a pesquisa, gestão e utilização das próprias peças de informação.