devise de stockage archivistique: rapide, consultable, api, fiable

J'ai de grandes quantités de données structurées provenant du réseau à partir de sources disparates, et ces données sont archivées dans le système de files, analysées et analysées, et font éventuellement une input dans une database (mysql) par quelques applications. Les données ne sont pas adaptées à la relation et doivent être massivement massées.

J'aimerais replace l'étape 'archive to filesystem' par un autre système, qui a une fiabilité équivalente (lire: perte de données nulle), mais possède des fonctionnalités d'une database comprenant des interfaces de requête et d'api. Il me semble que l'un des produits NoSQL serait parfait pour cela, car ils remplissent les conditions de la requête + api et ne me forcent pas à enfoncer datatables dans un format structuré. J'aime vraiment le mongodb, mais AFAGTM it (entre autres produits nosql) sacrifie la fiabilité et l'intégrité des données pour la performance. J'étais sur le sharepoint mettre en place une instance de mongodb avec la journalisation activée, mais je voulais être extra-spécial-super sûr avant de l'avoir fait.

Je ne cherche pas un DMS ou un système apparenté, car datatables ressemblent plus à log-ish que file-ish. Et évidemment, j'ai des sauvegardes, etc.

TL; DR Je search un produit NoSQL qui peut fonctionner comme une «archive» car il ne mangera jamais mes données.

Je vous remercie. Désolé pour le roman.

  • 50 000 files dans un directory, quelle est ma meilleure option?
  • Suggestions pour les systèmes de database spatiales
  • Est-ce que cela est normal ou doit être bogue dans le mongodb?
  • Impossible de se connecter au cassandra lors de l'utilisation de AllowAllAuthenticator
  • Qu'est-ce que cela signifie quand Twitter dit que leur base de données entière est en RAM?
  • Les astuces du serveur de linux et windows, tels que ubuntu, centos, apache, nginx, debian et des sujets de rĂ©seau.