Werken met veel data; grote bestanden in Excel

22 maart 2023

Lekker even data in Excel inkloppen. Wie houdt er niet van? We durven wel te stellen dat iedereen die weleens een computer heeft aangezet, ook weleens een ‘Excelletje’ heeft gemaakt. Of het nou gaat om de kosten van de boodschappen thuis of een volledige dataset die al het betalingsverkeer van een energieleverancier laat zien. Behoor je tot de eerste categorie? Stick with Excel. Doet wat het moet doen.  

Desirée Weijs

Zijn de bestanden complexer en verwerk je meer dan één huishouden? Dan kan het lonen om andere keuzes te maken. Komen we zo op terug. Goed zoals we al zeiden; Excel behoort tegenwoordig tot de basisvaardigheden voor iedereen die op kantoor werkt. Je kunt snel lijsten met data maken, bekijken en bewerken. Ook formules tover je zo op je scherm en Excel doet de rest. Maar zoals Cruyff zei: elk nadeel heb z’n voordeel. Of was het nou andersom?  

Hoe dan ook heeft Excel ook zo zijn beperkingen. Zeker wanneer je met grote bakken data aan de slag gaat. En laat dat nu juist een trend zijn die we veel terugzien bij onze klanten. Steeds meer meten en dus ook steeds meer data verwerken én analyseren. Wij verwachten dat die data-honger alleen maar blijft toenemen, want we kunnen ontzettend veel interessante inzichten uit data halen. Die bestanden worden dus steeds groter en groter. Daarom is het heel belangrijk om een toekomstbestendige manier te vinden om met deze grote hoeveelheid data om te gaan. Excel is dan uiteindelijk niet de oplossing. Dus wat doe je dan als je bestand te groot is waardoor Excel steeds vastloopt?  

Hier een paar gratis hints 😃 

  • Verklein je Excelbestand met allerlei trucs. Of vergroot juist je computerkracht. Op die manier kan Excel alsnog met deze zwaargewichten van bestanden omgaan. Leuk voor even, maar voor de lange termijn ga je toch weer hoofdpijn krijgen van de traagheid.  
  • Schakel over naar PowerBI. Zoals de naam al verklapt: power! Je kunt Exceldata inlezen en het werkt net zo intuïtief als Excel. Het is geschikt om je data weer te geven, maar minder voor de invoer ervan.  
  • En misschien wel de meest duurzame (maar daarmee ook duurdere) oplossing. Want je kunt ook Excelbestanden bewerken met Python of SQL. Yes, nu gaan we even lekker met technische termen strooien. Oh nee wacht. Valt wel mee. Je gebruikt je Excelbestand als input om transformaties uit te voeren die je schrijft in Python of SQL. Het leuke daaraan? Veel sneller resultaat. Je krijgt als output weer gewoon een Excelbestand terug. Deel die met (niet-technische) collega’s en iedereen is blij. Nadeel is wel dat je Python of SQL moet leren (of deze kennis in huis moet halen).  

Opslaan van data 

Excel op zichzelf is geen veilige manier om je data op te slaan. Daarvoor ben je beter uit met een gespecialiseerd IT systeem met een goede database erachter. Maar ook bij deze systemen krijg je alsnog te maken met csv of Excel bestanden als je bijvoorbeeld een export maakt. Ook dan is het dus handig als je met deze grote bestanden om kan gaan. 

Wat de beste optie is? Dat hangt af van hoe je processen zijn ingericht, wat je doel is en hoeveel technische kennis je in huis hebt. Onze data analisten denken graag met je mee om de beste optie te kiezen voor jouw situatie en om je te helpen met de implementatie ervan.  

Het laatste nieuws