Lolland Falsters Stifs Adressecontoirs Efterretninger

Link til fritekstsøgning: https://hislabaau.shinyapps.io/Maribo/

Udgivelsessted: Maribo (1809-1835); Nykøbing (1835-)

Periode dækket: 1809-1843

Navne: Lollands Falsters Stifts Kongelig priviligerede Adresse-Contoirs Efterretninger, som forsendes med Ride-Posten (1809-1824); Lollands og Falsters Stifts Kgl. alene priv. Adresse-Contoirs Efterretninger (1824-1835); Lolland-Falsters Stifts-Tidende (1835-)

Digitaliseret: December 2024 - Juli 2025

Digitaliseret af: Johan Heinsen

Billedproveniens: LOAR

Version: 1.0

Præcision af tekstgenkendelse

Beregnet præcision af tekstgenkendelsen (ordniveau) pr. tekst måned for måned. Linjerne angiver median samt øvre og nedre kvartil.

Kendte udfordringer, der forårsager ujævn præcision:

  • Årgangen 1815 mangler. Det skyldes, at denne ikke har været del af det gamle Statsbiblioteks avissamling og derfor ikke findes i den mikrofilmede samling.

  • I årgangene 1820-21 er teksten delvist udvisket.

  • I årganene 1836-38 bløder blæk fra bagsiden ofte igennem og skaber falske positiver for linjegenkendelsen. Dette kommer til udtryk ved linjer, der ikke findes i selve avisen, og hvor modellen indsætter skud på ikke-eksisterende tekst.

Forklaring af datasættets kolonner

  • text: Indeholder den identificerede tekst. Teksten er segmenteret. Algoritmen er designet til at transkribere bogstavret og tekstsøgninger skal indrettes derefter. Det er denne variabel, der søges i via søgeknappen. Søgefeltet godtager regex.

  • id: Dette er et unikt id for den givne tekst. Vær opmærksom på, at disse id’er opdateres for hver udgave af datasættet.

  • dato: Datoen for udgivelsen i formatet år-måned-dag. Du kan klikke på datoen og læse hele udgaven for den givne dato.

  • pwa (= predicted word accuracy): Denne kolonne indeholder en beregnet score for præcisionen på tekstgenkendelsen. Værdierne rangerer mellem 0 og 1.

  • vis lignende tekster: Her har du mulighed for en alternativ filtrering, der viser en given teksts 25 nærmeste slægtninge i avisen. Slægtskabet er udregnet på baggrund af teksternes placering i et semantisk rum skabt via en encoder-model (https://huggingface.co/JohanHeinsen/Old_News_Segmentation_SBERT_V0.1) og Facebook Artificial Intelligence Similarity Search (https://faiss.ai/index.html).

  • link: her kan du gå til den oprindelige affotografering, der er tilgængelig i Mediestream.