Banco de Dados Temporal

Introdução

Atualmente com a crescente difusão do uso de computadores nos mais diversos segmentos da sociedade ouve-se cada vez mais o termo banco de dados. Banco de dados caracteriza-se por um conjunto de dados armazenados sendo que cada um deles possuem um significado explícito.

Um banco de dados pode ser classificado sobre várias características e/ou conceitos. Este visa apresentar os conceitos de um banco de dados temporal. Um banco de dados é dito temporal, em um sentido mais amplo, quando possui na organização de suas informações algum aspecto de tempo(ELMASRI, NAVATHE, 2005).

Representação de Dimensões Temporais

Em banco de dados temporais o tempo é considerado uma sucessão ordenada de pontos(chronon), com alguma granularidade, métrica, definida pela aplicação. Granularidade é a menor unidade que pode ser representada por uma unidade em uma aplicação temporal, i.e., é a representação do chronon. Ao definir-se a granularidade de uma aplicação implica que todos os eventos que ocorrem dentro de uma mesma granularidade serão considerados eventos simultâneos, sendo que, pode acontecer dos mesmos não serem(ELMASRI, NAVATHE, 2005). Está definição deve ser tomada com plena consciência das características da aplicação.


Para representação de dados temporais utiliza-se os seguintes tipos de dados: DATE, TIME, DATETIME, TIMESTAMP, INTERVAL e PERIOD.


Informação de evento contra informação de duração(ou estado)


Um banco de dados temporal armazena as informações sempre que ocorre um dado evento ou quando um evento é considerado verdadeiro. Um evento pontual, ou fato pontual, normalmente são associados aos bancos de dados por um único ponto de tempo representado por alguma granularidade. Esta informação é frequentemente representado por uma série de dados temporal. Série de dados temporal envolvem valores que são registrados de acordo com uma sucessão específica e predefinida de tempo(ELMASRI, NAVATHE, 2005).

Os eventos de duração, por um outro lado, podem ser referenciados por um período de tempo específico em um banco de dados(ELMASRI, NAVATHE, 2005), e.g., um funcionário ocupou a diretoria de uma empresa entre o período de 20 de março de 2008 à 31 de outubro de 2008.

Um período de tempo é representado por um ponto inicial e um ponto final[START-TIME, END-TIME](ELMASRI, NAVATHE, 2005). Essa representação, assim como nos conjuntos matemáticos, podem ser representados por intervalos abertos ou fechados.

Tempo válido e dimensões de tempo de transação

Dado um evento associado a um ponto ou a um período de tempo específico, pode-se apresentar significados diferentes. Devido a este fato é preciso interpretar os significados destas associações, a forma mais natural, é que o tempo associado é aquele em que o evento aconteceu ou o período em que o evento foi considerado verdadeiro(ELMASRI, NAVATHE, 2005). Caso se empregue este tipo de interpretação diz-se que o tempo associado é um tempo válido. Bancos de dados temporais que utilizam-se dessa interpretação são denominados banco de dados de tempo válido.

Uma outra interpretação utilizada é aquela onde o evento associado refere-se ao tempo de fato em que a informação foi armazenada no banco de dados. Tal interpretação de evento associado é denominada tempo de transação, e os banco de dados temporais que trabalham sobre esse paradigma são conhecidos como banco de dados de tempo de transação.

Outras dimensões

Existem outros tipos de interpretação porém as acima citadas são as mais comumente encontradas, e são chamadas de dimensões de tempo. Uma dada aplicação pode necessitar de apenas uma dimensão, já em outra, faz-se necessário a presença de ambas dimensões, neste caso o banco de dados é dito banco de dados bitemporal.

Pode-se ainda haver a necessidade de outras interpretações do tempo, e estas interpretações serão definidas especificamente para a aplicação, tais bancos serão chamados de banco de dados de tempo definido pelo usuário.

Exemplo

Será levado em conta como exemplo para fixação do conteúdo um banco de dados de tempo válido. O mesmo seguirá o seguinte modelo:

Figura 1. Modelo referente as tabelas do banco exemplificado

A tabela Empregado conta com dois campos: PK_IDEMP e NOME, e receberá o nome dos funcionários de uma empresa fictícia. A tabela Funcao, assim como a tabela Empregado, possue dois campos: PK_IDFUNCAO e DESCRICAO, e armazenará a descrição da função exercida por um dado empregado. A relação existente entre as duas gera uma terceira tabela denominada Emp_Funcao, que armazenará todas as funções que um empregado exercer na empresa.

Note que existem dois campos na tabela Emp_Funcao que são tipos que representam datas em banco de dados. Os campos são INICIO e FIM, e receberão o START TIME e o END-TIME, respectivamente. Para este exemplo será levado em conta a granularidade de dia.

Considere que cada tupla referente a relação Empregado-Funcao representa uma versão válida de um evento ocorrido, em um período[INICIO, FIM]. Geralmente, a versão atual de uma dada tupla, neste caso o campo FIM, possue um valor especial que neste exemplo chamar-se-á de ATUAL. Este valor especial, é uma variável temporal que implicitamente representada o tempo corrente a medida que ele acontece(ELMASRI, NAVATHE, 2005). Note que, em uma relação não-temporal só serão armazenadas somente as relações correntes.

Observe os registros inseridos na figura 2.
Figura 2. Registros de Empregados e Funções

A figura 3 mostra algumas versões de tuplas de tempo válido: duas versões para JOÃO, três para MARIA, uma para JOSÉ e uma para JOANA. Sempre que haver alguma alteração de um funcionário, e.g., promoção, demissão, etc., o seu campo FIM é mudado para o valor do término e, dependendo da situação, uma nova tupla é inserida com as novas informações.

As tuplas 1 e 2 da figura 3 tem-se a movimentação das funções para o empregado JOÃO, a segunda tupla da relação indica que foi realizada uma promoção e à medida que a mesma se concretizou(1º de Julho de 2008) a primeira tupla teve seu encerramento um dia antes(30 de Junho de 2008 – GRANULARIDADE DE DIA). A segunda tupla passou a ser a corrente e a anterior passou a ser uma versão fechada ou histórica.

O registros 3, 4 e 5 comporta-se da mesma forma que as tuplas 1 e 2. O registro 6 informa a saída de um funcionário da empresa o seu valor de saída é atualizado e não é inserido um novo registro na relação. O contrário ocorre na sétima e última tupla onde é a admissão de um empregado e seu tempo final está definido com o valor especial ATUAL.
Figura 3. Relação de Empregados por Função.

Detalhes


Note que em um relação temporal o tempo de início, juntamente com um outro atributo trabalha como chave primária de uma relação, não repetindo em momento algum. Isto ocorre porque em ponto do tempo deveria haver no máximo uma versão de tempo válido.

As atualizações podem assumir três tipos: proativa, retroativa e simultânea. As atualizações proativas ocorrem no banco antes que o evento ocorra no mundo real, ao contrário das atualizações retroativas que são persistidas em banco depois da ocorrência do evento. As atualizações simultâneas são as acontecem sobre um mesmo instante de tempo.

José Mauro da Silva Sandy

Referências
  • ELMASRI, Ramez; NAVATHE, Shamkant B. Sistema de Banco de Dados. Revisor técnico Luíz Ricardo de Figueiredo. São Paulo: Pearson Addison Wesley, 2005. cap. 24, p. 552-561.

Leia Também

2 comentários:

  Diego de Souza Freias

8 de março de 2010 às 17:44

Boa tarde amigo, gostaria de sugestões para monografia em banco de dados temporal, vc teria alguma?
Abraços.

  José Mauro

8 de março de 2010 às 23:17

Oi Diego, tudo bem?

A inserção da métrica temporal em uma instância de banco de dados é um tema bastante interessante para uma monografia, desde já desejo boa sorte, porque também estou na mesma situação, e sei como é complicado.

Ao meu ver um tema interassante que você poderia abordar utilizando bancos temporais seria algo voltado para utilidade, e neste caso pública.

Atualmente, estamos passando por uma série de situações ambientais decorrentes da urbanização, poluição.... e por ai vai(não vou entrar em assuntos políticos).

O que sugiro é uma mescla de banco de dados temporais e um pouco de redes sensores para previsão de expectativas de um fenomemos ambientais.

Uma situação poderia ser o acompanhamento da cheia de um rio e mapeamento de todo o seu histórico. Com sensores seria possível capturar o nível em uma determinado fatia de tempo.

E sobre essa massa de informações você verificaria qual a sua melhor métrica.

O que eu tenho em mente é algo nesse sentido.

Abraço.