Création d'un cluster de serveurs domestiques pour l'analyse des données
J'ai vu quelques questions ici qui sont similaires à ce que je pense, mais pas tout à fait. Alors, je me suis dit que je demanderais et que je verrais ce qui tomberait.
En gros, j'ai 2 ou 3 vieux ordinateurs portables plus lents qui traînent. Ce que je voudrais faire, c'est regrouper ces ordinateurs afin d'effectuer des procédures d'analyse de données "embarrassantes en parallèle" sur eux (par exemple, entraîner un algorithme d'apprentissage automatique sur de nombreux cœurs différents). Pour être plus précis, je veux courir Code Python (scikit-learn, qui a la capacité de s'exécuter sur de nombreux cœurs différents) sur ce cluster.
Idéalement, ce que je voudrais faire, c'est avoir un cluster avec les 3 ordinateurs portables liés ensemble et un périphérique de stockage (1-2 To) lié au réseau. Je voudrais ensuite écrire les scripts pour faire mon analyse de données sur mon ordinateur portable actuel, accéder au cluster d'une manière ou d'une autre (ssh?), et exécuter les scripts sur les données stockées sur l'appareil connecté tout en répartissant l'analyse entre les différents ordinateurs portables. Pensées?
J'en ai lu sur les clusters Beowulf, le clustering avec Ubuntu et d'autres choses. J'ai cependant 0 expérience de la mise en réseau, du clustering, des commandes Unix, etc., et je n'en comprends pas vraiment. Je suis prêt à apprendre mais je n'ai vraiment aucune idée par où commencer, alors des conseils, des ressources, des suggestions seraient grandement appréciés.