CategoriasHadoop

Tutorial Pyspark e MLlib

T

Tutorial de PySpark e MLlib Nesse tutorial de Spark vamos utilizar PySpark e MLLib para uma atividade simples de processamento de Machine Learning. Uma breve introdução ao Hadoop e Spark Com o advento do Big Data, faz-se necessário inserir novas técnicas de processamento de dados. Estas técnicas incluem tanto armazenamento, quando velocidade de processamento e operações matemáticas. Neste...

Como criar seu primeiro DataFlow com Apache NiFi

C

Tutorial usando Apache Nifi Nesse artigo vamos mostrar de uma maneira simples como criar um data flow para fazer integração de dados. O Apache Nifi é um projeto Open Source de integração de dados, que integra diversas origens com diversos tipos de destinos, usando bancos de dados, Hadoop (HDFS), Kafka, Spark, entre outros. Conheça mais sobre o Apache Nifi na página do Projeto :  Preparando...

Posts recentes

Comentários

Arquivos

Categorias

Meta