in Alles komt goed

Opgeruimd staat netjes

Als je niet goed oplet heeft een website de neiging data te verzamelen alsof het een lieve lust is. Zeker als het ook nog eens van alles verschillende versies maakt op verschillende groottes. Gigabytes aan overtollige data verzamelen op een hosting omgeving is zonde van de ruimte. Dus toen ik er achter kwam eens een goede digitale lenteschoonmaak gehouden. Voor deze website hield dat in dat hij van bijna 10GB terug kon naar 1,5GB. Wow. En dan ben ik nog niet eens in elke hoekje gedoken.

Ik vraag me af hoeveel procent van de totale data die er digitaal staat op al die verschillende servers niet een vorm van een kopie is al dan niet (goed) bedoeld. Mijn onderbuik denkt meer dan 70%.

Kon het toch niet laten om die onderbuik te checken. In een bericht uit 2013 schatte Google dat het 25-30% is. Zal nu toch zeker meer zijn nu sociale media echt los is. En almachtig Google kijkt alleen maar naar datgene wat indexeerbaar is. Nog zoveel walled gardens en folders waar we het niet van weten.

En dan al die backups nog bij hosting bedrijven. Klein rekensommetje: Elke host maakt gemiddeld voor elke site 3 backups. Dan zou dat al 75% van alle data op servers slechts een kopie zijn, en dan staat er nog wel een server redundant te zijn voor het geval dat die ene de geest geeft (wat met regelmaat gebeurd). Dan zitten we al op 80%. Van die 20% is dus op zijn minst 30% al een kopie. Plus al dat slechte data management van mensen. En tel daar dan nog eens ons mail gedrag bij op. Hoeveel mailtjes hebben wel niet hele string aan vorige mailtjes eronder gekopieerd? Misschien is die 70% nog wel optimistisch en moet ik het bijstellen naar 90% ;)

1

Wat vind jij?

Reactie