Est-ce que Hadoop prend soin de la taille HD de nœud différente seule?

J'ai un seul noeud (configuration pseudo-dissortingbuée) et je considère append un 2ème noeud esclave. Est-ce important que l'esclave ait less de capacité HD? Le rééquilibrage prend-il cela pour lui-même. Je ne suis pas un expert HADOOP de loin.

Non, cela n'a pas d'importance, mais HDFS ne redissortingbue pas les blocs au nouveau nœud automatiquement, donc vous devrez le faire de votre côté. Le moyen le plus simple est d'exécuter bin/start-balancer.sh . De plus, avant de procéder à un rééquilibrage, assurez-vous de modifier vos files Conf afin de pouvoir passer d'une configuration pseudo-dissortingbuée à un cluster.

Consultez cette question sur les FAQ de Hadoop pour plus de façons de rééquilibrer.

Hadoop équilibrera la charge. En outre, vous pouvez définir la propriété "dfs.replication" pour définir le nombre de réplications que vous souhaitez.