Elke grote gegevenstabel met veel getallen is moeilijk te lezen. Als mens zou je elk getal moeten verwerken en vervolgens vergelijken met alle andere getallen om erachter te komen welke hoger zijn dan welke andere. Een veel eenvoudigere manier om snel te zien welke cellen in een tabel opvallen, is door er een heatmap van te maken.
Wat is een heatmap?
Een heatmap is een visualisatiemethode waarbij elke cel in een tabel op een kleurenschaal met gradaties wordt ingekleurd. Aan beide uiteinden van de kleurenschaal heb je twee verschillende kleuren. Voor elke tussenliggende waarde op de schaal heb je een gradiënt van de ene eindpunt-kleur naar de andere. Vaak gaan deze kleuren van rood naar groen via geel, wat doet denken aan de kleuren die meteorologen gebruiken bij de presentatie van het weer – rood is heet/hoger, dus “warmte” kaart.
Een aantal gegevens in een tabel…
Om een heatmap te maken heb je een tabel met gegevens nodig om mee te werken. In dit geval heb ik de klimaatgegevens van de Wereldbank voor Zweden tussen 1901 en 2015 verzameld. Dat geeft me een zeer grote tabel met meer dan 100 rijen en 12 kolommen, met cellen die de gemiddelde temperatuur voor elke maand bevatten. Voor ons Amerikaanse publiek zijn deze temperaturen in Celsius (Anders Celsius was per slot van rekening een Zweed!). Een deel van mijn tabel ziet er als volgt uit:
Dat is helemaal niet gemakkelijk te lezen! Hoewel ik gemakkelijk kan zien dat de temperaturen aan het eind van het jaar lager zijn dan de temperaturen in het midden van het jaar, krijg ik geen goed beeld van de veranderingen in de loop van het jaar. Ik kan niet goed zien hoe de temperaturen eruit zien.
Enter: Voorwaardelijke opmaak
Excel kan elke cel in mijn tabel automatisch kleuren op basis van de hoogste en laagste waarde in mijn gegevens. Om dit te doen, selecteer alle cellen in de tabel, ga dan naar Home > Voorwaardelijke opmaak > Kleurschalen > Rood – Geel – Groen. Hierdoor krijgen alle cellen in de tabel onmiddellijk een kleur en ziet het resultaat er als volgt uit:
Ik krijg een gemakkelijk overzicht van welke maanden heter waren dan andere maanden – dat zijn de maanden in het rood. Het zal geen verbazing wekken dat het de zomermaanden zijn die warmer zijn, en de wintermaanden die koeler zijn. Juli 1901 en 1914 springen eruit als bijzonder warm. December 1915 was niet een maand waar ik graag in de buurt had willen zijn… Brrr!
Zo ver zo goed, maar dit laat me slechts een deel van het plaatje zien. Ik wil de hele periode tussen 1901 en 2015 zien. Om dat te doen, verander ik de kolom- en rijgroottes, zodat ik meer op mijn scherm kan krijgen. Laten we eerst een aantal van die decimalen wegwerken: ze voegen niets toe aan mijn verhaal. Selecteer alle cellen in de tabel en klik dan een paar keer op de knop Decimaal getal > Decimaal verlagen, totdat alleen nog hele getallen overblijven.
Naar aanleiding hiervan selecteer je alle kolommen tezamen en dubbelklik je op een van de lijntjes tussen twee kolommen. Dit zal de kolommen automatisch verkleinen tot de breedste breedte die nodig is om de inhoud op één rij te tonen. Ik ben echter een beetje kieskeurig, dus ik wil dat ze allemaal precies even breed zijn. Selecteer alle kolommen opnieuw, klik met de rechtermuisknop, en selecteer Kolombreedte. Ik stel mijn kolommen in op 2,5 eenheden breed, en vervang de maandlabels door een maandlabel met één letter. Dit is waar ik nu ben:
Mijn tabel is echter een beetje te groot om op één scherm te passen.Er is maar één oplossing – ik moet mijn tabel opnieuw structureren zodat ik alle perioden naast elkaar kan zien. Dit is snel gedaan door een beetje kopiëren en plakken (selecteer de cellen, en gebruik ctrl+c op je toetsenbord op een PC om te kopiëren, en ctrl+v om te plakken). Voor de goede orde wil ik ook zien of de gemiddelde temperatuur in de loop van de tijd is veranderd, dus heb ik hiervoor een extra kolom toegevoegd, met behulp van de =AVERAGE() functie in Excel. Tenslotte heb ik de rasterlijnen verwijderd om een duidelijk beeld te krijgen van mijn gegevens (op het tabblad Beeld in het lint, het selectievakje Rasterlijnen in de sectie Weergeven uitschakelen.
Hier is mijn uiteindelijke warmtekaart:
Er is eigenlijk maar één patroon dat er in dit voorbeeld uitspringt – de stijging van de gemiddelde temperatuur in de afgelopen decennia. De frequentie van meer roodachtig is hoger in de gemiddelde kolom naarmate we dichter bij vandaag komen.
Addendum: Laat me gewoon de kleuren zien!
Het is mogelijk om al die getallen te verbergen als u liever een schone warmtekaart hebt. Selecteer daartoe alle cellen met getallen, klik met de rechtermuisknop en selecteer Cellen opmaken. Op het tabblad Getal selecteert u Aangepast en typt u ;;; (drie puntkomma’s) in het vak Type. Klik op OK. De getallen zijn weg, maar de opmaak blijft. Ziet u wel!
Klaar om verder te gaan dan Excel? Er zijn andere manieren om visualisaties te maken die meer geavanceerde opties en flexibiliteit bieden. Bekijk hoe u een heatmap maakt in Displayr!