View Source

Fildownloads er en ny funktionalitet, som bliver idriftsat på Datafordeleren i juni 2024 og skal ikke misforstås som værende det samme som de abonnementsbaserede filudtræk, der hidtil har været på Datafordeleren. Fildownloads tilbydes som prædefinerede entitetsbaserede fildownloads og baserer sig på de datamodeller som registrene har på Datafordeleren.

En entitet svarer til en tabel i Grunddatamodellen som er defineret i registrenes datamodel: https://grunddatamodel.datafordeler.dk/. En entitet kan eksempelvis være en ”Adresse” fra DAR, en ”Bygning” fra BBR eller et ”Jordstykke” fra MAT osv. Det at fildownloads er entitetsbaserede betyder, at et fildownload indeholder data for en enkelt type af entitet. Der leveres entitetsbaserede fildownloads på tabulære data og ikke for rasterdata (billeddata). Tabulære data forstås som strukturerede data der kan opbevares i tabeller som f.eks. adresser men ikke billedtyper som skærmkort.

Fildownloads genereres løbende i bestemte intervaller for en række registre, hvorefter filerne kan hentes gennem et REST-API, der udstiller de genererede fildownloads. Det eneste krav til at hente fildownloads er, at man har en tjenestebruger med brugernavn og adgangskode. Det er ikke nødvendigt at oprette et abonnement på fildownloads, da de allerede ligger klar til at blive hentet. REST-API’et beskrives nærmere i afsnit mens skema for generering samt frekvenser for generering beskrives nærmere i afsnit 2.5.

Datafordeleren udstiller flere typer af entitetsbaserede fildownloads. Der findes følgende typer af fildownloads:

Totaludtræk: Et totaludtræk er et fuldt udtræk af al data der eksisterer for en given entitet. Datafordeleren opbevarer ét totaludtræk pr. type pr. entitet.
Deltaudtræk: Et deltaudtræk indeholder alle ændringer for en given entitet siden sidste gang der blev lavet et deltaudtræk. Datafordeleren opbevarer deltaudtræk i 14 dage fra de er blevet genereret.

Hvis der genereres fildownloads for en entitet, bliver der altid genereret både totaludtræk og deltaudtræk. Udover at der findes flere typer af fildownloads, findes der også flere typer af filtreringer på den data som udtrækkene indeholder. Dette skyldes at delmængder af data på Datafordeleren er bitemporal og at der dermed kan være flere forekomster af det samme objekt over tid i to tidsdimensioner.

Fuldt bitemporale udtræk: Et fuldt bitemporalt udtræk inkluderer alt, hvad angår både registreringstid og virkningstid.
Temporalt udtræk: Et temporalt udtræk filtrerer registreringsdimensionen fra, men beholder virkningsdimensionen.
Udtræk med aktuelle data: Både registreringstiden og virkningstiden er sat til at være på det pågældende tidspunkt udtrækket blev lavet.

Det er muligt at kombinere en type fildownload med en type af bitemporal filtrering. En opsummering af, hvilke fildownloads der eksisterer – og med hvilke bitemporale filtreringer findes i nedenstående tabel over understøttede typer af fildownloads på Datafordeleren.

Type af fildownload	Type af bitemporal filtrering
Totaludtræk	Bitemporal
Totaludtræk	Temporal
Totaludtræk	Aktuel
Deltaudtræk	Bitemporal

Fildownload-typer bliver kombineret med bitemporale filtreringer og filformater.

Nedenstående tabel viser, hvilke registre der har fildownloads på deres entiteter, samt hvilke filformater der er tilgængelige for registrenes entiteter. Et kryds i en række i tabellen indikerer at filformatet generelt er understøttet for det givne registers entiteter.

Register	JSON	GPKG	GML
BBR	X
DAR	X
EBR	X
MAT2	X	X	X
DAGI	X	X	X
DHM Oprindelse	X	X	X
DHM Højdekurver	X	X	X
Danske Stednavne	X	X	X
GeoDanmark Vektor	X	X	X
FIKSPUNKT	X	X	X

Det skal bemærkes at det ikke er alle entiteter for et register der har fildownloads i GPKG og GML-format. Der skal gøre sig følgende gældende for at en entitet understøttes i GPKG eller GML-format:

GPKG-formatet understøttes på en entitet hvis entiteten indeholder 0 eller 1 geometrier.
GML-formatet understøttes på en entitet hvis entiteten indeholder minimum 1 geometri.

Udtræksnumre er en fortløbende talrække der beskriver tidsmæssig sammenhæng mellem data i et register. Hver gang der genereres fildownloads for et register, påsættes alle fildownloads ved samme generering det samme udtræksnummer. Dette bevirker at fildownloads med det samme udtræksnummer indeholder konsistente data indenfor registerets egen data. Denne egenskab er særlig relevant hvis man som anvender er interesseret i at sammensætte data fra flere entiteter i et register.

Det er her vigtigt at understrege, at udtræksnumrene kun er fortløbende per register, og at hvert register derfor har sin egen fortløbende talrække, der er uafhængig af andre registre. Udtræksnumre kan derfor ikke garantere referentiel integritet på tværs af registrenes data, da dette afhænger af registrenes indlæsningstidspunkter, samt indlæsningsfrekvens.

Om fildownloads

Typer af fildownloads

Filformater

Udtræksnumre

Sammenhæng mellem total- og deltaudtræk