Data Warehousing

Data Warehousing (depósito de dados no Brasil) é um sistema de computação utilizado para armazenar informações relativas às atividades de uma organização em bancos de dados. O desenho da base de dados favorece os relatórios, a análise de dados e a obtenção de informações estratégicas que podem facilitar a tomada de decisão.

Data Warehousing

Data Warehouse ou Data Warehousing, o que é ?

Data Warehouse

O Data Warehouse possibilita a análise de grandes volumes de dados, coletados dos sistemas transacionais (OLTP). São as chamadas séries históricas que possibilitam uma melhor análise de eventos passados, oferecendo suporte às tomadas de decisões presentes e a previsão de eventos futuros. Por definição, os dados em um DW não são voláteis, ou seja, eles não mudam, salvo quando é necessário fazer correções de dados previamente carregados. Os dados estão disponíveis somente para leitura e não podem ser alterados.

A ferramenta mais popular para exploração dos dados é a Online Analytical Processing OLAP ou Processo Analítico em Tempo Real, mas muitas outras podem ser usadas.

Os primeiros DWs surgiram como conceito acadêmico na década de 80. Com o amadurecimento dos sistemas de informação empresariais, as necessidades de análise dos dados cresceram paralelamente. Os sistemas OLTP não conseguiam cumprir a tarefa de análise com a simples geração de relatórios. Nesse contexto, a sua implementação passou a se tornar realidade nas grandes corporações. O mercado de ferramentas, que faz parte do mercado de Business Intelligence, cresceu então, e ferramentas melhores e mais sofisticadas foram desenvolvidas para apoiar a estrutura e sua utilização. Atualmente, por sua capacidade de sumarizar e analisar grandes volumes de dadod, ele é o núcleo dos sistemas de informações gerenciais e apoio à decisão das principais soluções de business intelligence do mercado.

Basicamente o projeto de Inteligência é formato por 3 partes principais :

  • Armazenamento de Dados, que pode ser um banco de dados como Oracle, SqlServer, MySql entre outros, também existem bancos de dados específicos como Teradata, Netezza, Greenplum. Atualmente para armazenar dados podemos usar tecnologias como Hadoop ou bancos NoSql como Cassandra, HBase, entre outros.
  • Integração de Dados ou ETL ( Extract, Tranform and Load ), a integração é necessária para receber ou buscar dados de outros sistemas de origem como ERPs, CRMs, sistemas proprietários e aplicações que servem de fontes para o sistema de inteligência. as ferramentas de ETL tem capacidade de acessar dados em diversas tecnologias e fazer o processo de transformação e padronização dos dados. Essas ferramentas também podem incorporar funções de qualidade de dados, para melhorar os conteúdos e gerar bases de dados mais consistentes. Nessa categoria estão ferramentas como Informatica PowerCenter, IBM DataStage, Oracle DI (ODI), Microsoft Integration Services, Talend ETL, Pentaho DI (PDI), entre outras.
  • Camada de Acesso, nessa categoria estão as aplicações responsáveis pela interação entre os usuários finais e os dados que estão sendo disponibilizados para análise. Existem diversas ferramentas para essa categoria, responsáveis por montar relatórios, gráficos e análises, além das funções de impressão, salvamento ou exportação dos dados. Softwares como Tableau, Qlik, Oracle BIEE ou DV, IBM Cognos, Tibco SpotFire, entre outros.

Você pode saber mais, participando do Curso Analista de Data Warehousing (Academia de Business Intelligence).

Visite também nossa página de Materiais : Materiais Gratuitos para Download