/ UiT Norges arktiske universitet
 

Databaser via Internett og standarder

Fra: Heimen 2/1998
Av: Gunnar Thorvaldsen

Antallet institusjoner og enkeltpersoner som skriver av og behandler historiske persondata, vokser stadig. I RHD's oversikt Historiske persondata i Norge er det pr i dag ført opp 85 adressater som besitter slike data og som i de fleste fall vil sende deg utskrift eller diskett på forespørsel. RHD legger nå denne lista over kilder og adresser som en søkbar database på Internett slik at det blir lettere å finne fram og holde oversikt over hva som er registrert.

For en rekke formål vil brukerne utvilsomt fortsatt ønske tilgang til kildene via papir eller diskett. Men især i slektsgransking er det imidlertid mer lettvint å søke fram personer via nettet. Både Digitalarkivet og Registreringssentralen har slike tilbud, og disse vil bli utvidet i nær framtid. Dette gjelder store kildeserier som folketellingene, som er dataført for hele eller mye av landet. Men hva med alle de mindre bitene, som befinner seg i PC'ene til slektsgranskere, historielag og andre? Det ideelle ville selvsagt være om også dette ble gjort søkbart via nettet. Her har sentrale medlemmer i foreningen DIS Databehandling i slektsforskning forespurt om ikke også dette bør legges inn søkbart på et sentralt sted. Dette er et godt spørsmål, som vi kan omformulere til "Hvem har den nødvendige maskinvare, programvare og arbeidskraft?".

Maskinvare er ikke lenger noe problem av betydning slik prisene raser nedover i dette markedet. Det betyr indirekte at også programvarespørsmålet løses. Det er ikke lenger nødvendig å lage skreddersydd programvare for hurtig søking i historiske persondata når maskinene er så kraftige at standard hyllevare fungerer fint. (Kommersielle program inneholder også færre feil enn de hjemmesnekrede.) Problemet er nok heller arbeidskraft. Å ta imot datasettene er kanskje ikke noen uoverkommelig oppgave i seg selv. Riktignok har MacIntosh en annen representasjon av æ,ø,å enn de IBM-kompatible PC'ene, men slikt er forholdsvis enkelt å løse. Verre er alle de ulike formater data blir registrert i. For det ene er en hel rekke ulike programsystem i bruk, både spesiallagede norske og importerte, kommersielle program. De tekniske dataformatene er ikke alltid like enkle å konvertere til samme standard. Enda verre er det imidlertid at feltrekkefølgen er ulik fra registrator til registrator og selvsagt fra kilde til kilde. Datoer kan skrives på et utall ulike vis; jeg så nylig et eksempel med over 11 000 ulike former for angivelse av alder eller fødselsdato i en serie begravelseslister! Å få alt dette inn i samme malen er en svær oppgave - den fører min tanke hen på salig Sysifos.

Løsningen på problemet er STANDARDER. Registreringssentralen kan gjerne ta imot materiale fra andre og legge det ut på nettet. Men en forutsetning er at datafilene kommer hit i avtalt stand. For folketellingene er et detaljert format for utveksling av filer spesifisert i boka Histform, som også er tilgjengelig via våre hjemmesider på Internett. En tilsvarende Histform-standard for kirkeboksdata er under utarbeidelse. I mellomtida anbefales bruk av "Standard 4G" for registrering av kirkebøker, eller formatene for disse og andre kilder spesifisert i undertegnedes bok "Håndbok i registrering og bruk av historiske persondata" (1996).