CategoriasTutorial

Tutorial Pyspark e MLlib

T

Tutorial de PySpark e MLlib Nesse tutorial de Spark vamos utilizar PySpark e MLLib para uma atividade simples de processamento de Machine Learning. Uma breve introdução Com o advento do Big Data, faz-se necessário inserir novas técnicas de processamento de dados. Estas técnicas incluem tanto armazenamento, quando velocidade de processamento e operações matemáticas. Neste cenário, 2 ferramentas se...

Como criar seu primeiro DataFlow com Apache NiFi

C

Tutorial usando Apache Nifi Nesse artigo vamos mostrar de uma maneira simples como criar um data flow para fazer integração de dados. O Apache Nifi é um projeto Open Source de integração de dados, que integra diversas origens com diversos tipos de destinos, usando bancos de dados, Hadoop (HDFS), Kafka, Spark, entre outros. Preparando Ambiente do Apache Nifi Antes de começar a trababalhar com a...

HBase – Criando e persistindo valores via Phoenix

H

O que é o Apache Phoenix e para que serve? O Apache Phoenix é desenvolvido em java para rodar uma camada SQL para ser interpretada em banco de dados NoSQL. Ele permite que os usuários criem, excluam, alterem tabelas, visualizações, índices, sequências, Insira e exclua as linhas individualmente e em massa e dados de consulta através de uma camada SQL sobre o HBase. Apache Phoenix É performático? O...

Posts recentes

Comentários

Arquivos

Categorias

Meta