O que é HDFS ?

O Hadoop Distributed File System (HDFS) é o sistema de arquivos do Hadoop, nele os dados são divididos em blocos e os blocos replicados nas máquinas que compõe o Cluster Hadoop, a ideia é utilizar hardwares commodity ( padronizados ) sem necessitar de hardware muito potente para montar um sistema de dados

Comandos HDFS

No HDFS seus comandos seguem o POSIX, comandos como cd, ls, mkdir, rm, rmdir e etc.

Para quem está acostumado a usar Linux, terá mais facilidade em operar o terminal para manipular o sistema de arquivo, existem 2 apresentações comuns para fazer um list ( ls ) :

hadoop fs -ls ou hdfs dfs -ls

A primeira ( hadoop fs ) é a mais antiga e está sendo substituida pela 2 ( hdfs dfs ) que se tornou padrão.

Pessoal para quem está iniciando os estudos em Hadoop, segue uma lista oficial dos comando usados para manipular o HDFS.

http://hadoop.apache.org/docs/stable/hadoop-project-dist/hadoop-common/CommandsManual.html

Abraço

Marco Garcia.