Pentaho Business Analytics Server 8.0 CE - Configuração Em Modo De Produção (pt_BR)

Document created by Andre Sammarco on Mar 13, 2018
Version 1Show Document
  • View in full screen mode

1. Introdução

Existe uma certa dificuldade, para aqueles que estão iniciando nesse mundo, em entender para que serve cada ferramenta. Não se assuste com a quantidade de nomes que vão surgindo. “No final das contas”, a idéia é sempre a mesma: existem as fontes, das quais os dados são extraídos, a forma de cálculo ou transformação, a tecnologia de armazenamento, de visualização, etc. Cada ferramenta, e consequentemente, cada nome, denomina uma dessas funções.

O pentaho Business Analytics Server é o teatro onde a orquestra toca. Para aproveitar todo o potencial do conjunto da obra, ou conectar todas as peças da suíte, é necessário ter uma instância do BA - Server instalada e configurada. Neste artigo, será feita a configuração em modo de produção, utilizando o PostgreSQL como servidor de dados. Os passos são análogos para outros tipos de SGBD, como o MySQL, MSSQL, Oracle, etc. Para mais informações a respeito das configurações feitas, consulte a referência (1).

 

 

 

2. Ambiente

  • Sistema Operacional: CentOS 6.9 (Instalação Mínima)
  • Java JDK: Versão 8
  • PostgreSQL: Versão 10

 

 

 

3. Pré Instalação

Antes de começar, iremos desabilitar o SELinux:

Img.1 - Editar o arquivo do SELinux

 

Na linha assinalada, trocar o valor da variável por disabled.

Img.2 - Trocando o valor da variável por disabled.

 

Após, basta reiniciar o sistema.

Ao iniciar novamente, deve-se liberar a porta 8080 no firewall:

Img.3 - Desabilitando o firewall para gravar as novas regras

 

E a seguir,

Img.4 - Inserindo as novas regras

 

Salve as configurações criadas:

Img.5 - Salvando as configurações no firewall

 

E para terminar, habilite novamente o firewall:

Img.6-Habilitando o firewall

 

Caso não tenha instalado e configurado o java, veja (2) nas referências ao final do artigo. Por fim, deve ser criado um usuário pentaho, ao qual designaremos a autoridade sobre o BA - Server.

Img.7 - Adicionando o usuário pentaho

 

No diretório home/pentaho, crie uma pasta v8, para a versão do BA - Server que será configurada:

Img.8 - Adicionando uma subpasta “v8” ao diretório /home/pentaho.

 

A preparação do ambiente termina aqui. Agora, prosseguimos com o download.

 

 

 

4. Download

Para fazer download da última versão do BA - Server Community Edition, navegue até o projeto pentaho no site sourceforge:

Img.9 - Download do BA Server CE no Source Forge

 

Assim, que o download iniciar, pause o processo, e no navegador web, vá até a seção downloads, como mostra a imagem abaixo:

Img. 10 - Seção downloads do Google Chrome

 

Com o botão direito, em cima do download pausado, selecione a opção “Copiar endereço do link”. Assim, você copiará a URL para fazer o download direto no servidor pelo comando wget. Na pasta v8, criada anteriormente fazemos:

Img.11 - Fazendo o download pelo comando wget

 

Ao finalizar, devemos ter baixado o seguinte arquivo em formato zip:

Img.12 - Download finalizado

 

E por fim, basta descompactá-lo com o comando unzip:

Img.13 - Descompactando a pasta de instalação

 

Ao terminar, os arquivos descompactados estão na pasta pentaho-server,

Img.14 - Pasta descompactada do BA Server

 

Antes de executar o BA - Server, serão feitas algumas configurações iniciais.

 

 

 

5. Configuração em modo de Desenvolvimento

Para iniciar a configuração, conforme podemos ver na imagem 14 acima, devemos alterar as permissões da pasta pentaho-server, e também de suas subpastas, para o usuário pentaho:

Img.15 - Configurando o usuário pentaho como dono da pasta

 

E ainda,

Img.16 - Configuração de grupo da pasta.

 

E assim, as alterações resultam em:

Img.17 - Alteração das permissões da pasta e subpastas de pentaho-server

 

Dentro do diretório pentaho-server, devem ser encontrados os arquivos start-pentaho.sh e stop-pentaho.sh. O nome já diz o que fazem. No entanto, criaremos um arquivo que os utilizará para que o server seja iniciado e parado. Isso é necessário para não iniciarmos o serviço com um usuário indesejado o que causaria erros(root, por exemplo), e também, se quisermos adicionar configurações de forma mais flexível, sem ter que editar o arquivo original de inicialização. Sendo assim, para iniciar o server será criado o arquivo ”start.sh”:

Img.18 - Criando o arquivo de inicialização.

 

Insira a seguinte linha neste arquivo:

Img.19 - Arquivo start.sh configurado.

 

Salve as configurações, e feche o arquivo. Da mesma forma, com o vi, será criado o stop.sh:

Img.20 - Criação do arquivo stop.sh

 

Após, salve para sair do script. Para finalizar, será dada permissão de execução para os scripts que serão utilizados para iniciar e parar o BA - Server:

Img.21 - Permissão de execução para os scripts

 

Após, deve-se conferir quanta memória há disponível para execução do serviço:

Img.22 - Memória disponível para uso

 

Assim, deve-se alterar o script “start-pentaho.sh” para adequar a memória de execução ao ambiente:

Img.23 - Alteração do script de start-pentaho.sh

 

A primeira variável “ -Djava.awt.headless=true” refere-se ao ambiente de execução em linha de comando. As outras duas, -Xms e -Xmx referem-se a memória mínima e máxima de execução. Para o sistema atual, essa configuração basta. Sendo assim, podemos executar o script “start.sh”.

Img.24 - Inicialização do BA -Server.

 

É possível visualizar o log do BA -Server, conforme abaixo:

Img.25 - Logs do BA - Server

 

Já é possível fazer login com o usuário padrão (admin) senha (password). Basta acessar através do browser, a url do BA - Server. Vejamos:

Img.26 - Login Pentaho Business Analytics Server.

 

Após fazer login, você terá acesso à seguinte interface web:

Img.27 - Tela inicial

 

Deixe a curiosidade te guiar por todo lugar, não se intimide, divirta-se para descobrir o que há depois de cada click. A próxima etapa será iniciar a configuração em modo de produção, de uma instância do BA - Server. Serão utilizados todos os passos realizados até aqui. Iremos configurar alguns arquivos que se referem principalmente aos repositórios de dados que o sistema utiliza. Neste caso, será utilizado o Postgresql como servidor de dados. No entanto, os passos são bem parecidos para outros SGBD’s como, MySQL, MSSQL, Oracle, etc. Consulte (1) nas referências abaixo.

 

 

 

6. Configuração Em Modo De Produção

Vários arquivos de configuração serão editados, para que o BA - Server utilize os repositórios em um servidor de dados. No caso, foi selecionado o PostgreSQL. Para organizar nosso raciocínio, segue abaixo, uma breve listagem dos passos a serem seguidos e o que será feito:

  1. Criação dos repositórios através dos scripts (utilize o pgAdmin se quiser), na seguinte ordem:

    1. create_repository_postgresql.sql: Script que cria a base de dados hibernate. Esta é utilizada no BA - Server para armazenar os logs de acesso aos dados.
    2. create_quartz_postgresql.sql: Script que cria a base de dados do Quartz, utilizado como agendador de tarefas pelo BA - Server.
    3. create_jcr_postgresql.sql: Script que cria a base do jackrabbit, repositório que armazena as soluções, exemplos, dados de segurança, dados de conteúdo dos relatórios criados, etc.
  2. Configuração Do Hibernate

    1. Edição dos arquivos referentes ao Hibernate para se conectar ao PostgreSQL
  3. Configurar o Quartz

    1. Edição dos arquivos de configuração referentes ao Quartz, para se conectar ao PostgreSQL
  4. Configurar Jackrabbit

    1. Edição dos arquivos de configuração referentes ao Jackrabbit, para se conectar ao PostgreSQL
  5. Alterar configurações do Driver JDBC no context.xml

    1. Edição do arquivo context.xml
  6. Inicialização e configurações adicionais

    1. Edição do arquivo web.xml
    2. Edição do arquivo config.properties
    3. Edição do arquivo index.jsp
    4. Edição do arquivo PUCLogin.jsp
  7. Apagar conteúdo dos diretórios temporários do tomcat

    1. Apagar conteúdo do diretório temp
    2. Apagar conteúdo do diretório work
    3. Apagar conteúdo do diretório logs

 

6.1 - Criação Dos Repositórios

Inicialmente, devem ser criados os repositórios de dados no PostgreSQL. Todos os scripts para a criação estão na pasta descompactada do servidor:

Img.28 - Arquivos para criação das bases no PostgreSQL

 

E dessa forma, podemos começar:

Img.29 - Criação do repositório no postgres

 

Repita a operação para os outros dois arquivos. Quando solicitada, a senha padrão para o usuário “pentaho_user” é “password”.

 

6.2 - Configuração Do Hibernate

A maior parte dos arquivos de configuração, por padrão,está configurada para o PostgreSQL. No entanto, repassamos as configurações,caso queiramos alterar a porta padrão de comunicação,usuário, password, entre outras configurações. Segue abaixo, o caminho para a configuração do hibernate:

Img.30 - Pasta para configuração do Hibernate

 

Nessa pasta, podem ser encontrados os seguintes arquivos:

Img.31 - Arquivos na pasta hibernate

 

O arquivo (1) deve estar configurado conforme a imagem abaixo. Procure a linha que aponta para o arquivo (2). Esta linha se refere ao arquivo das configurações do servidor de dados escolhido:

Img.32 - Configuração do arquivo hibernate

 

Por fim, o arquivo (2), postgresql.hibernate.cfg.xml,deve ser editado conforme asconfigurações doservidor (endereço: localhost,porta: 5432, usuario: hibuser,password: password).

Img.33 - Edição do arquivo do hibernate conforme as configurações do PostgreSQL

 

A configuração do hibernate está concluída. Agora, devemos configurar o Quartz.

 

6.3 - Configuração Do Quartz

O Quartz pode ser configurado através do arquivo a seguir:

Img.34 - Configuração Quartz

 

Com seu editor de arquivo preferido (pode ser o vi), faça as seguintes alterações no arquivo selecionado:

Img.35 - Primeira alteração no arquivo de configuração do Quartz.

 

E após,

Img.36 - Segunda alteração.

 

6.4 - Configuração Do Jackrabbit

A configuração é feita através do arquivo no caminho abaixo,

Img.37 - Edição do arquivo repository.xml

 

Neste arquivo, devemos alterar as linhas conforme as configurações da base de dados utilizada (Postgresql).

1. Repositório: Descomente o seguinte trecho de código:

Img.38 - Configurando o jackrabbit: Repositório

 

Após comente o seguinte trecho:

Img.39 - Configurando o jackrabbit: Repositório

 

2. Data Store: Descomente o seguinte trecho de código:

Img.40 - Configurando o jackrabbit: Data Store

 

E após, comente o seguinte trecho de código:

Img.41 - Configurando o jackrabbit: Data Store

 

3. Workspace: Descomente o seguinte trecho de código:

Img.42 - Configurando o jackrabbit: Workspace

 

E após, comente a seguinte parte:

Img.43 - Configurando o jackrabbit: Workspace

 

4. Persistence Manager: Após descomente o seguinte trecho de código:

Img.44 - Configurando o jackrabbit: Persistence Manager

 

E após, comente o seguinte trecho:

Img.45 - Configurando o jackrabbit: Persistence Manager

 

5. Versionamento: Descomente o seguinte trecho de código:

Img.46 - Configurando o jackrabbit: Versionamento

 

E após, comente o seguinte trecho de código:

Img.47 - Configurando o jackrabbit: Versionamento

 

6. Persistence Manager 2: Descomente o seguinte trecho de código:

Img.48 - Configuração do jackrabbit: Persistence Manager 2

 

E após, comente o seguinte trecho:

Img.49 - Confiiguração do jackrabbit: Persistence Manager 2

 

Essa configuração é mais trabalhosa. Além de selecionar a parte de código relativa ao sistema de banco de dados escolhido, as configurações de endereço, porta, usuário, etc, também devem ser editadas, caso tenham sido alteradas anteriormente.

Encerrada essa etapa relativa às configurações do BA - Server, será feita a configuração do arquivo context.xml do Tomcat.

 

6.5 - Alterar configurações do Driver JDBC no context.xml

O arquivo context.xml está no seguinte diretório:

Img.50 - Diretório que contém o arquivo context.xml

 

Nesse diretório, edite o arquivo context.xml, da seguinte forma:

Img.51 - Editando o arquivo context.xml

 

Faça uma cópia de segurança do arquivo existente. Após, edite-o com as configurações acima.

Feito isso, devemos desabilitar a inicialização das bases de exemplo, e ainda, alterar algumas configurações para melhorar a configuração em modo de produção do servidor.

 

6.6 - Inicialização E Configurações Adicionais

A inicialização das bases de exemplo se encontra no arquivo abaixo:

Img.52 - Pasta para edição do arquivo web.xml

 

Com o editor de sua preferência, edite o arquivo web.xml, comentando os seguintes trechos de código:

Img.53 - Comentando inicialização das bases de exemplo

 

E ainda,

Img.54 - Comentando listener das bases de exemplo

 

Agora, comentamos a exibição de erros, utilizada em modo de desenvolvimento e testes:

Img.55 - Comentando exibição de erros utilizada em modo de desenvolvimento

 

Após, removemos o filter mapping referente ao SystemStatusFilter

Img.56 - Removendo filter mapping de SystemStatusFilter

 

No arquivo “config.properties” iremos desabilitar mensagens de inicialização, visualização de favoritos e arquivos recentes.

Img.57 - Diretório do arquivo config.properties

 

Nesse diretório, edite o arquivo config.properties, conforme abaixo:

Img.58 - Removendo algumas seções da página de inicialização

 

Agora, no diretório abaixo, iremos editar o arquivo “index.jsp”

Img.59 - Diretório que contém o arquivo index.jsp

 

Edite o arquivo, conforme abaixo:

Img.60 - Editando o arquivo index.jsp

 

Após, desabilitamos a opção de acesso em modo de avaliação, na página de login. No diretório abaixo, editamos o arquivo “PUCLogin.jsp”

Img.61 - Edição do arquivo PUCLogin.jsp

 

Edite o arquivo conforme abaixo

Img.62 - Comentando o trecho de código para desabilitar login em modo de avaliação

 

Você pode fazer configurações bem mais personalizadas, tanto em relação ao design de cada página, quanto em relação ao desempenho do servidor.

Em (3) nas referências ao fim do artigo, você poderá descobrir como fazer essas alterações, e muito mais. Diria que é uma leitura obrigatória para quem quer administrar seu BA Server.

A seguir, faremos a remoção dos arquivos temporários do tomcat.

 

6.7 - Apagar conteúdo dos diretórios temporários do tomcat

O primeiro diretório a ter seu conteúdo excluído é o temp:

Img.63 - Removendo conteúdo do diretório temp

 

Utilize o comando “rm” para deletar o conteúdo dessa pasta.

O segundo diretório a ter seu conteúdo excluído é o work:

Img.64 - Removendo conteúdo do diretório work

 

Assim, como anteriormente, utilize “rm” para deletar seu conteúdo.

Por fim, iremos remover o conteúdo do diretório logs:

Img.65 - Removendo conteúdo do diretório logs.

 

E novamente, utilize “rm” para deletar seu conteúdo.

Ao concluir os passos acima, execute o script start.sh para inicializar sua instância novinha do Pentaho BA Server CE.

 

 

 

7. Considerações Finais

Verifique as configurações de desempenho que podem ser adotadas em seu BA Server. Leia (4) nas referências abaixo.

De forma muito prática, todas essas configurações podem ser consultadas no site da ferramenta https://help.pentaho.com/Documentation/8.0

Para o conteúdo visto nesse artigo, navegue até a seção abaixo:

Img.66 - Instalação e configuração do BA - Server

 

Encerro esse artigo com um discurso bem conhecido em nosso mundo:

 

Mantenha-se faminto por coisas novas, mantenha-se certo de sua ignorância. Continue ávido por aprender, continue ingênuo e humilde para procurar. Tenha fome de vida, sede de descobrir. Stay hungry, Stay fooolish.(Steve Jobs)

 

 

 

 

Referências

  1. https://help.pentaho.com/Documentation/8.0/Setup/Installation/Manual

 

  1. https://tecadmin.net/install-java-8-on-centos-rhel-and-fedora/

 

  1. https://help.pentaho.com/Documentation/8.0/Setup/Administration/Server/Maintain_the_Pentaho_Server_Manually

 

  1. https://help.pentaho.com/Documentation/8.0/Setup/Administration/Performance_Tuning

Attachments

    Outcomes