KB logo

KUB Datalab: Rensning

KUB Datalab

Værktøjer

Hos KUB Datalab bruger og understøtter vi et stort udvalg af software.

Vi har forsøgt at organisere vores hovedværktøjer i kategorier nedenfor. Husk, at mange typer software kan bruges til flere formål. Vi har forsøgt at kategorisere efter hovedformål.

Værktøjer til rensning af data

OpenRefine logo

OpenRefine

OpenRefine er et gratis software, som kan hjælpe dig med at rense rodet data. En typisk arbejdsgang er at importere en datafil, arbejde med de mange datarensningsindstillinger i OpenRefine og eksportere filen efter rensningen. OpenRefine har en række import- og eksportmuligheder. Brugere kan bruge OpenRefines grafiske brugergrænseflade og kodning (GREL og Regular Expressions). OpenRefine hjælper ikke brugere med at indsamle data, analysere eller visualisere data.

RegEx logo

RegExp

Regulære udtryk er en struktureret måde at beskrive mønstre i tekst. Et solidt kendskab til regulære udtryk gør eksempelvis muligt at finde alle ord i en tekst, der begynder med "th" efterfulgt af 3 eller 4 tegn, og slutter på enten "e" eller "r". Regulære udtryk er en nyttig teknik i mange situationer og er tilgængelig i adskillige af de software pakker KUB Datalab understøtter. Vores mål er at tilbyde kurser i regulære udtryk og at anvende metoden i andre relevante sammenhænge.