Backup do Repósitório do PDI (kettle)

Vou detalhar abaixo o projeto de backup que criei no Pentaho Data Integration (PDI) para fazer backup do seu próprio repositório de projetos.

Tenho um repositório de projetos hospedado em um banco de dados MSSQL 2000. Este tem seu backup realizado regularmente, mas resolvi criar uma rotina independente, pois não sou eu quem administra este backup hoje, além disso, achei muito prático utilizarmos os próprios recursos do PDI para fazer um auto-backup.

Em resumo o que o projeto vai fazer é bem simples:
  • Exporta o repositório para um arquivo XML;
  • Compacta o arquivo XML;
  • Faz um Ping no Servidor FTP para ver se está respondendo;
  • Faz upload deste arquivo compactado neste servidor de FTP;
  • Caso haja algum erro num destes processos envia um e-mail para minha caixa detalhando a falha.

Abaixo segue uma imagem do Projeto:
Ficou bastante simples de configurar e muito prático. Criei um agendamento para executar toda noite, salvando o arquivo com sufixo de Ano + Mês (AAAAMM), com isso vou ter backups de muito tempo, visto que o repositório não está grande e compactado nem chega ainda a 100Kb. Deve demorar até atingir 1Mb.

Obs.: Um cuidado essencial na criação do Projeto de backup é que não pude deixá-lo no repositório de Projetos. Ao invés disso criei um Job em arquivo pois houveram alguns erros ao tentar exportar o próprio projeto em uso para XML.


O PDI (antigo Kettle, que foi incorporado ao projeto de BI Pentaho) é uma solução OpenSource de Integração de Dados e Sistemas, conhecida conceitualmente como EAI (Enterprise Aplication Integration) . É uma ferramenta muito versátil e poderosa.

Comentários

Postagens mais visitadas deste blog

[Openfire] - Ajuste de horário no cliente Spark

Verificar uso de disco em partição ASM do Oracle 11g no Linux

[Pentaho] - Criando uma Simples transformação para apagar tabelas de um esquema no Oracle