5 motivos para usar Hadoop

Recebi uma tarefa de um amigo, que me perguntou: “Se tiver que explicar porquê usar Hadoop para um executivo, o que falaria?”. O ecosistema Hadoop, sempre veja como um conjunto de ferramentas e não somente 1 meio de armazenamento, revolucionou a maneira em que grandes volumes de dados sejam armazenados.

Listo abaixo 5 motivos para usar Hadoop:

1- Flexível

Nenhum outro meio de armazenamento e/ou processamento de dados tem a capacidade de armazenar desde conteúdos estruturados como tabelas e arquivos texto, até vídeos, fotos, etc. Com sua estrutura baseada em file system, seu armazenamento tem as características do sistema operacional Linux e comandos POSIX.

2 – Rápido

A capacidade de processamento em paralelo do Hadoop torna suas cargas de dados extremamente rápidas.
Um fator de baixa performance era o Map-Reduce, que se mostrava ineficiente para alguns tipos de tarefas, mas aceleradores como Impala e Tez, ou mesmo processadores em Memória como Spark ou Flink.

3 – Escalável

Montamos um cluster com 6 servidores, está no limite de processamento e armazenamento, o que fazemos ? colocamos mais 3 ou 6 servidores, assim por diante. Comparado com Appliances ou Outros Sistemas, onde muitas vezes a escalabilidade é somente possível com a troca do sistema inteiro. No Hadoop, podemos adicionar nós ( servidores ) ao cluster.

4 – Projeto de Software “Vivo”

O Ecosistema Hadoop é mantido pela apache foundation, seus usuários ou desenvolvedores estão em todo o mundo usando, testando, sugerindo e melhorando a versão a todo momento. Seria como ter equipes de desenvolvimento 24×7, antecipando problemas e correções, antes mesmo de nós chegarmos a eles. Por ser Open Source, qualquer um pode identificar e sugerir mudanças, diferente dos sistemas de dono único, onde somente ele conhece o código e suas peculiaridades.

5 – Barato

Qual o custo do Hadoop ? Pode ser Zero, somente acessar a página da apache foundation, baixar, instalar e começar a usar. Mas claro que poucos colocariam um sistema em produção sem nenhum tipo de suporte, aí podemos pensar em escolher uma distribuição como:

 

Ou algum sistema de Big Data baseado em Hadoop, como:

Por fim, escolher um parceiro para treinar sua equipe, implantar o ambiente e desenvolver o projeto se necessário.

Claro que aí, indico a Cetax: www.cetax.com.br

Abraço
Marco Garcia.

Sobre o autor

por: cetax

Posts recentes

Comentários

Arquivos

Categorias

Meta