Backup do Repósitório do PDI (kettle)

Vou detalhar abaixo o projeto de backup que criei no Pentaho Data Integration (PDI) para fazer backup do seu próprio repositório de projetos.

Tenho um repositório de projetos hospedado em um banco de dados MSSQL 2000. Este tem seu backup realizado regularmente, mas resolvi criar uma rotina independente, pois não sou eu quem administra este backup hoje, além disso, achei muito prático utilizarmos os próprios recursos do PDI para fazer um auto-backup.

Em resumo o que o projeto vai fazer é bem simples:
  • Exporta o repositório para um arquivo XML;
  • Compacta o arquivo XML;
  • Faz um Ping no Servidor FTP para ver se está respondendo;
  • Faz upload deste arquivo compactado neste servidor de FTP;
  • Caso haja algum erro num destes processos envia um e-mail para minha caixa detalhando a falha.

Abaixo segue uma imagem do Projeto:
Ficou bastante simples de configurar e muito prático. Criei um agendamento para executar toda noite, salvando o arquivo com sufixo de Ano + Mês (AAAAMM), com isso vou ter backups de muito tempo, visto que o repositório não está grande e compactado nem chega ainda a 100Kb. Deve demorar até atingir 1Mb.

Obs.: Um cuidado essencial na criação do Projeto de backup é que não pude deixá-lo no repositório de Projetos. Ao invés disso criei um Job em arquivo pois houveram alguns erros ao tentar exportar o próprio projeto em uso para XML.


O PDI (antigo Kettle, que foi incorporado ao projeto de BI Pentaho) é uma solução OpenSource de Integração de Dados e Sistemas, conhecida conceitualmente como EAI (Enterprise Aplication Integration) . É uma ferramenta muito versátil e poderosa.
Postar um comentário

Postagens mais visitadas deste blog

[eXo] - Remover janela de solicitação de Registro

[Kettle] - Ajuste de problema com horário de verão

Pegando informações de Sessão no Oracle e equivalente no MSSQL