Denne side beskriver hvordan du som anvender kan etablere et kopiregister lokalt ved at hente totaldownload og herefter vedligeholde det ved at hente deltadownload.

Der tages i dette eksempel udgangspunkt i at oprette et kopiregister bestående af én entitet fra ét register. I dette eksempel vil det være registret BBR med sin entitet Etage af typen bitemporal.

Bemærk at processen beskrevet i eksemplet kan gentages, hvis der ønskes flere entiteter for samme eller andre registre.


Sideinformation




Forudsætninger og afgrænsninger


Følgende forudsætninger og afgrænsninger gælder for at kunne følge guiden:

  • Guiden antager anvenderen har opsat en database på forhånd. I eksemplet bruges en Postgres database.
  • Guiden beskriver ikke hvordan man opsætter et batchjob som eksempelvis Windows Task Scheduler. Det antages at anvenderen selv vælger måden at gøre dette på.
  • Guiden behandler ikke opdatering af flere entiteter på én gang. Dette kan dog gøres ved at gentage processen beskrevet i guiden.
  • CVR tillader ikke man kan hente deltadownload.
  • For at få adgang til data, skal man først have oprettet en bruger i Datafordeler Administrationen med tilhørende OAuth Shared Secret. Der henvises til følgende guide: Brugeroprettelse Datafordeler Administration.






Projektsetup


I dette guideeksempel bliver der brugt et C# projekt. Til dette er der blevet opsat et regulært C# Console App Project.




NuGet pakker


Følgende NuGet pakker som ikke medfølger automatisk ved opsætning af nyt projekt skal i dette guideeksempel tilføjes vha. NuGet Package Manager Console:

  • Install-Package Microsoft.Extensions.Configuration.Json
  • Install-Package Npgsql




Appsettings


Opret en appsettings.json fil som indeholder Client ID og Client Secret som blev oprettet og gemt under Forudsætninger og afgrænsninger.

Et eksempel kan være dette:


Sørg for appsettings-filen er med i build ved at tilføje følgende til .csproj:


Filen er i dette guideeksempel placeret følgende sted:






Hentning af access token til at tilgå API


For at kunne tilgå Datafordelerens API, skal der hentes en access token, som har en kortvarig holdbarhed.

Først oprettes der en metode til at hente access token ud fra Client ID og Client Secret. Denne kontakter https://auth.datafordeler.dk/realms/distribution/protocol/openid-connect/token som er endpointet der bruges til at hente access token.




Bemærk at følgende blot er et eksempel på hvordan det kan implementeres.



For at kalde denne metode med brug af sine værdier fra appsettings.json, kan man eksempelvis gøre følgende:




Her er der sat op således at der bruges en ConfigurationBuilder til at hente fra appsettings.json, hvorefter ens access token gemmes i den lokale variabel accessToken.






Etablering af kopiregister


Efter at have hentet en access token, kan man nu bruge denne til at hente seneste totaldownload for en entitet fra et givent register for at etablere et kopiregister. I det følgende eksempel vil vi hente totaldownload for BBR's entitet Etage.




Hentning af totaldownload


For at hente totaldownload er der i dette eksempel lavet en metode som gør følgende:


  1. Kald Datafordelerens GetFile endpoint
    1. Brug følgende parametre
      1. Register: BBR
      2. LatestTotalForEntity: Etage
      3. Type: Bitemporal
      4. Format: JSON
    2. Angiv din access token fra Hentning af access token til at tilgå API som Bearer token i headeren
  2. Gem indholdet lokalt og opbevar filstien i en variabel / konfigurationsnøgle.
  3. Træk indholdet fra zip-filen ud




Her fremgår et eksempel på en implementering med ovenstående logik:




Identificering af udtræksnummer


Da der kan findes opdateringer til totaldownload'et gennem efterfølgende deltadownload, skal udtræksnummeret fra totaldownload'et identificeres. Da filnavnet fra deltadownload'et slutter med et udtræksnummer kan det nemt trækkes ud vha. regular expressions.




Følgende eksempel trækker versionsnummeret ud fra filstien der blev gemt i forrige trin.




Gem udtræksnummeret i databasen


For at gemme det senest hentede udtræksnummer mellem kørsler, vil der i dette eksempel blive oprettet en tabel i databasen til at indeholde et udtræksnummer for entiteter i et register.

Implementeringen følger denne rækkefølge:

  1. Opret forbindelse til databasen
  2. Opret tabel i databasen (hvis den ikke eksisterer) med følgende kolonner
    1. Register
    2. Entity (Entitet)
    3. Latest_generation_number (Seneste udtræksnummer)
    4. Primary key: (register, entity)
  3. Indsæt udtræksnummeret hentet i Identificering af udtræksnummer for primærnøglen.







Konvertering af hentet totaldownload til Data Transfer Object (DTO)


Indlæsning i databasen af den hentede entitets totaldownload, bruger følgende fremgangsmåde:

  1. Udled entitetens variabler og tilhørende typer samt opret DTO
  2. Læs filen gemt fra Hentning af totaldownload og konverter JSON-objekterne til DTO'erne.




Udledning af entitetens variable og tilhørende typer samt DTO-oprettelse


Først oprettes en DTO til BBR's entitet Etage kaldt "BBREtageDTO.cs". For at udlede variablerne samt typerne som fremgår i en entitet, kan man gøre følgende for BBR Etage eksemplet:

  1. Tilgå https://datafordeler.dk/dataoversigt/
  2. Vælg "Tjeneste: GraphQL Schema".
  3. Vælg "Bygnings- og Boligregistret (BBR)".
  4. Tryk herefter "Hent GraphQL Skema".
  5. Heri kan typer udledes.




Et eksempel på den udledte BBR Etage DTO fremgår i følgende:




Hjælpemetode: ReadLatestTotalOfEntityJsonFile


Følgende kodeeksempel læser filen gemt fra Hentning af totaldownload og konverterer JSON-objekterne fra filen til DTO'en oprettet i Udledning af entitetens variable og tilhørende typer samt DTO-oprettelse




Indlæsning af DTO'er i databasen


For at indlæse DTO'erne i databasen er følgende fremgangsmåde implementeret:

  1. Opret en hjælpemetode som opretter tabellen for bbr_etage med de udledte variabler og typer fra Udledning af entitetens variable og tilhørende typer samt DTO-oprettelse.
  2. Indsæt DTO'erne i databasen




Hjælpemetode: EnsureTableExists


Hjælpemetoden opretter tabellen for bbr_etage med de udledte variabler og typer fra Udledning af entitetens variable og tilhørende typer samt DTO-oprettelse. Her skal det også vides hvad primærnøglen er. Dette kan findes i registrets tilhørende DLS.

BBR bruger eksempelvis følgende fil, som findes i DLS’en: BBR_v2.4.1_2018.05.07_Bilag 26 - Primær nøgler.xlsx




For BBR’s Etage-entitet gælder følgende composite-key: (id_lokalId, registreringFra, virkningFra).




Hjælpemetode: UploadDtosToDatabase


For at indsætte DTO'erne i databasen, kan man med fordel bruge COPY-metoden. Heri gennemløbes DTO'erne fra Hjælpemetode: ReadLatestTotalOfEntityJsonFile og indlæses én efter én i databasen på effektiv vis.




Overordnet rækkefølge


Hele afsnittet Etablering af kopiregister overordnede rækkefølge af kaldt funktionalitet kan ses i følgende overblik:






Vedligeholdelse af kopiregister gennem deltadownload for entitet


Efter at have hentet totaldownload'et for en entitet, holdes denne entitet opdateret vha. deltadownload. Deltadownload kommer én gang i døgnet og man kan derfor med fordel opsætte en scheduled task, som henter deltadownload dagligt og opdaterer databasens rækker for en given entitet.

Det skal her bemærkes, at da totaldownload dannes én gang om ugen, kan der allerede været kommet adskillige deltadownload siden den nyeste total man har hentet. Det anbefales derfor, at man sætter hentningen af deltadownload op med det samme.




Denne del beskriver eksempler på hvordan man kan opsætte hentning af deltadownload samt opdaterer databasen med dens værdier for BBR's entitet Etage.

Det overordnede flow fremgår således:

  1. Navnene hentes på alle deltafiler som har et udtræksnummer højere end det sidst hentede totaldownload/deltadownload.
  2. Deltafilerne hentes ud fra navnene.
  3. Deltafilerne castes til DTO'er og tilføjes til databasen.
  4. Det sidste hentede generationsnummer opbevaret i databasen opdateres med generationsnummeret fra den nyeste af de deltadownloads som blev tilføjet.




Hentning af navne på nyeste deltafiler


Der oprettes en hjælpemetode som henter de nyeste fildownload for BBR’s entitet Etage vha. GetAvailableFileDownloads, for derefter at filtrere filer fra, så de tilbageværende opfylder følgende kriterier:

  1. Har et generationNumber højere end det senest hentede generationsnummer
  2. typeOfDownload typen er ”DeltaDownload”
  3. typeOfData har bitemporaliteten ”Bitemporal”
  4. containedFileFormat er af typen ”json”
  5. Seneste version Dvs. at hvis der f.eks. findes både ” BBR_V1_Etage_DeltaDownload_json_Bitemporal_295.zip” og ” BBR_V2_Etage_DeltaDownload_json_Bitemporal_295.zip” vil V1 sorteres fra. Ønsker man at udstille både version 1 og version 2 osv., skal man undlade at filtrere fra her samt udvide DTO’en i Udledning af entitetens variable og tilhørende typer samt DTO-oprettelse til at have version med sig. Guiden her tager kun udgangspunkt i den seneste version, som i dette eksempel er V2.







Hentning af nyeste deltafiler samt indlæsning i databasen


Efter at navnene på de nye deltafiler nu er fundet og gemt i den lokale variabel newDeltas, skal filerne nu hentes, castes til DTO'er, så de herefter kan bruges til at opdatere databasen.




Gennemløb af nyeste deltadownload


Første trin gennemløber de hentede deltafiler og kalder hjælpemetoden DownloadAndProcessDeltaFiles som henter filerne, caster dem til DTO'er samt ligger den i databasen. Denne metode uddybes i næste sektion.




Hælpemetode: DownloadAndProcessDeltaFiles


DownloadAndProcessDeltaFiles henter deltafiler vha. GetFile endpointet. Dette kodeeksempels funktionalitet foregår på følgende måde:

  1. Navnene på deltafilerne sorteres efter generationNumber, så entiteterne i databasen opdateres i korrekt rækkefølge. Dvs. at deltafiler der slutter på xxx_395.zip eksempelvis indsættes i databasen før xxx_396.zip.
  2. De sorterede deltafiler gennemløbes én efter én, hvor følgende sker:
    1. Deltafilen download vha. hjælpemetoden GetFile.
    2. Deltafilens JSON-objekter deserialiseres til en liste af BBREtageDTO (se Udledning af entitetens variable og tilhørende typer samt DTO-oprettelse) vha.
    3. DTO’erne tilføjes til databasen vha. hjælpemetoden UpdateDatabaseWithDelta.
    4. GenerationNumber fra filens navn udledes vha. Regex. Hvis generationsnummeret er højere end latest_version fra databasen, opdateres databasen med det nye generationsnummer. Dette bruges til at holde styr på det senest hentede generationsnummer, så man ikke overskriver med ældre versioner / unødigt henter allerede-indlæste filer.





Hjælpemetode: GetFile


Denne hjælpemetode bruges til at simplificere hentning af deltafiler vha. GetFile endpointet.

Først kaldes GetFile endpointet med den access token som blev hentet i Hentning af access token til at tilgå API. Herefter læses indholdet ved hjælp af streaming.


Kodeeksempel på hjælpermetode til hentning af filer vha. GetFile endpointet




Hjælpemetode: DeserializeDeltaFile


Denne hjælpemetode bruges til at deserialisere deltafilens JSON-objekter til en liste af BBREtageDTO'er.

Hjælpemetoden udpakker zip-filen for derefter at gennemløbe JSON-filerne og caste dem til DTO'er.




Hjælpemetode: UpdateDatabaseWithDelta


Denne hjælpemetode bruges til at opdatere databasen med de nye delta DTO'er. Den gør følgende:

  1. Opretter forbindelse til databasen
  2. Tjekker at bbr_etage tabellen findes. Hvis ikke, oprettes denne.
  3. Gennemløber alle DTO'erne en ad gang, hvor der for hver enkelte oprettes en query til databasen som køres mod databasen.









Afrunding


Efter at have fulgt trinene op til denne sektion, er der nu følgende funktionalitet tilgængelig i rækkefølge:

  1. Visual Studio projekt i C# er opsat med relevante NuGet pakker samt appsettings.
  2. Programmatisk hentning af access token til kald mod API'erne
  3. Det nyeste totaldownload er hentet for BBR's Etage entitet. Herunder er dens generationsnummer samt filens objekter lagt i deres respektive tabeller i databasen.
  4. Deltadownloads med nyere generationsnumre end seneste totaldownload hentes. De tilhørende objekter placeres i databasen samt det senest-hentede generationsnummer opdateres i databasen.