/ UiT Norges arktiske universitet
 

Utvekslingsformat for folketellingene 1865 til 1910

Fra: Heimen 2/ 1995
Av: Gunnar Thorvaldsen

De samme historiske data kan struktureres på forskjellig vis avhengig av hvilken programvare som anvendes. De ulike formatene skaper problemer når flere brukere vil utveksle data, eller når vi overfører våre data fra et dataprogram til et annet. Løsningen på disse problemene er å lage en felles standard for lagring og utveksling av kildene. En slik standard er utarbeidet for folketellingene. Den gir to fordeler. For det første kan all utveksling av folketellingsdata gå via standarden. Det betyr at vi ikke bør skrive programvare for omformatering mellom alle de ulike formater som er i bruk, vi kan nøye oss å lage programvare som konverterer mellom det enkelte formatet og standarden. For det andre vil alle de ulike folketellingene ligge på samme standardformat. Dermed vil for eksempel fornavnet ligge i felt nr 10 i personposten enten det kommer fra 1865- eller 1910- tellinga. Slik er det ikke i de registreringsformatene som er i bruk eller er foreslått brukt i framtida. Her varierer feltstrukturen fra telling til telling, og det er relativt arbeidskrevende å flytte data inn i de formatene ulike edb- verktøy krever. For at utviklingsformatet skal fungere, må det utvikles programvare som omdanner eller konverterer data fram og tilbake mellom dette formatet og de ulike registreringsformatene. Utvekslingsformatet er presentert i detalj i publikasjonen Histform, som er tilgjengelig fra Registreringssentral for historiske data.

Utvekslingsformatet inneholder åtte posttyper eller ulike enheter. Rekkefølgen til posttypene gjenspeiler hierarkiet blant de ulike skjemaene som fins i kildene: Kretser (type '1') omfatter flere bosteder, bosteder (type '2') omfatter flere leiligheter (type '3'), leiligheter omfatter flere personer (type '5'). Etter disse følger eventuelle hjemvendte norsk-amerikanere (type '6'), jordbruksposter (type '7') og informasjonspostene (type '9') i den rekkefølge de hører hjemme innenfor det enkelte bosted eller leilighet. Skipspostene (type '4') samles til sist i datafila, sammen med sine tilhørende personposter.

Noen felt omdannes ved overføring mellom registrerings- og utveklingsformat. Det gjelder spesielt datoer, som overføres fra formen dd.mm.åååå til åååå.mm.dd. Årets settes altså først for å gjøre sorteringer kronologiske.

Først i hver post kommer alltid følgende seks felt, som nullutfylles fra venstre:
1 Folketellingsår; 2 Kommunenummer; 3 Kretsnummer;
4 Bostedsnummer; 5 Leilighetsnummer; 6 Posttype

Eksempel på 1875-telling for Tromsø:
1875<1902<003<0042<01<5<..

Deretter følger de feltene hvis innhold varierer avhengig av hvilken posttype vi tar for oss. Det vil også variere i hvilken grad den informasjon som trengs til feltene, er tilgjengelig i den enkelte folketellinga. Men feltenes rekkefølge og antall er altså den samme for alle tellingene innenfor hver posttype. Feltene er adskilt med haketegn '<', som altså er standard skilletegn mellom feltene. Tallet foran feltnavnet angir feltets faste nummer i rekkefølgen.