TagHadoop

Tutorial Pyspark e MLlib

T

Tutorial de PySpark e MLlib Nesse tutorial de Spark vamos utilizar PySpark e MLLib para uma atividade simples de processamento de Machine Learning. Uma breve introdução Com o advento do Big Data, faz-se necessário inserir novas técnicas de processamento de dados. Estas técnicas incluem tanto armazenamento, quando velocidade de processamento e operações matemáticas. Neste cenário, 2 ferramentas se...

Apache HBase: O que é, Conceitos e Definições

A

VISÃO GERAL DO APACHE HBASE    Um banco de dados não-relacional (NoSQL) que é executado em cima do HDFS O Apache HBase é um banco de dados de código aberto NoSQL que fornece acesso de leitura/gravação em tempo real a esses grandes conjuntos de dados. HBase escala linearmente para lidar com grandes conjuntos de dados com bilhões de linhas e milhões de colunas e combina facilmente fontes de dados...

Livro Big Data para Leigos | Blog Cetax Treinamentos BI

L

Livro Big Data para Leigos Sempre nos perguntam sobre livros do assunto big data ou analytics, existem diversos materiais bons na internet, poucos ainda em português, mas vemos muitos livros de autores estrangeiros sendo traduzidos. Apesar de parecer for Dumbs demais, os livros da série “Para Leigos” são excelente introdutórios, como esse abaixo: Gosto também dos livros da Packt...

Interview Questions for Big Data and Hadoop

I

Interview Questions for Big Data and Hadoop What is Big Data? Big Data is nothing but an assortment of such a huge and complex data that it becomes very tedious to capture, store, process, retrieve and analyze it with the help of on-hand database management tools or traditional data processing techniques. Know more about Big Data Can you give some examples of Big Data? There are many real life...

5 motivos para usar Hadoop

5

Recebi uma tarefa de um amigo, que me perguntou: “Se tiver que explicar porquê usar Hadoop para um executivo, o que falaria?”. O ecosistema Hadoop, sempre veja como um conjunto de ferramentas e não somente 1 meio de armazenamento, revolucionou a maneira em que grandes volumes de dados sejam armazenados. Outra pergunta é onde usar Hadoop ? Vou falar isso futuramente em outro post, mas...

Plataforma de dados Hortonworks no Amazon Web Services

P

Big Data está mudando a maneira como as empresas interagem e consumir dados. Plataformas de dados modernos, como Hortonworks Data Platform (HDP) e de fluxo de dados Hortonworks (HDF) , está dirigindo uma revolução dados ligando novas cargas de trabalho e aplicações analíticas. Esta semana, há milhares de participantes em San Jose em Hadoop Summit 2016 aprendizagem sobre as tecnologias e drivers...

Guia de Comandos Hadoop HDFS

G

O que é HDFS ? O Hadoop Distributed File System (HDFS) é o sistema de arquivos do Hadoop, nele os dados são divididos em blocos e os blocos replicados nas máquinas que compõe o Cluster Hadoop, a ideia é utilizar hardwares commodity ( padronizados ) sem necessitar de hardware muito potente para montar um sistema de dados Comandos HDFS No HDFS seus comandos seguem o POSIX, comandos como cd, ls...

Apache Hadoop: O que é, conceito e definição

A

O Apache Hadoop é uma plataforma de software de código aberto para o armazenamento e processamento distribuído de grandes conjuntos de dados, utilizando clusters de computadores com hardware commodity. Os serviços do Hadoop fornecem armazenamento , processamento, acesso, governança, segurança e operações de Dados. HISTÓRIA – APACHE HADOOP A gênese do Hadoop veio do papel Google File System...

Apache hadoop, o que é?

A

Hadoop, o que é ? Hadoop é um framework que permite o processamento distribuído de grandes conjuntos de dados em clusters de computadores usando modelos de programação simples. Ele é projetado para ampliar a partir de um único servidor para milhares de máquinas, cada um oferecendo computação e de armazenamento local. Ao invés de confiar em hardware para proporcionar alta disponibilidade, a...

Posts recentes

Comentários

Arquivos

Categorias

Meta