Kiøbenhavns Kongelig allene priviligerede Adresse-Contoirs Efterretninger
Link til fritekstsøgning: https://hislabaau.shinyapps.io/Adresseavisen/
Udgivelsessted: København
Periode dækket: 1759-1804, 1807, 1817, 1822, 1827, 1832, 1837
Da kvaliteten af affotograferingen falder dramatisk omkring 1805, stoppede vi den kontinuerlige digitalisering og fokuserede på enkelte nedslag senere i serien, hvor kvaliteten igen finder et meningsfuldt leje.
Digitaliseret: Januar 2023 - Juni 2025
Digitaliseret af: Camilla Bøgeskov og Johan Heinsen
Billedproveniens: LOAR
Version: 1.0
Præcision af tekstgenkendelse
Kendte udfordringer, der forårsager ujævn præcision:
Tidlige årgange gør flittigt brug af initialer, der driller layoutsegmenteringen.
Årgangene fra 1795 og frem er grimt affotograferet. Præcisionen på tekstgenkendelsen er derfor mangelfuld.
Forklaring af datasættets kolonner
text: Indeholder den identificerede tekst. Teksten er segmenteret. Algoritmen er designet til at transkribere bogstavret og tekstsøgninger skal indrettes derefter. Det er denne variabel, der søges i via søgeknappen. Søgefeltet godtager regex.
id: Dette er et unikt id for den givne tekst. Vær opmærksom på, at disse id’er opdateres for hver udgave af datasættet.
dato: Datoen for udgivelsen i formatet år-måned-dag.
pwa (= predicted word accuracy): Denne kolonne indeholder en beregnet score for præcisionen på tekstgenkendelsen. Værdierne rangerer mellem 0 og 1.
vis lignende tekster: Her har du mulighed for en alternativ filtrering, der viser en given teksts 25 nærmeste slægtninge i avisen. Slægtskabet er udregnet på baggrund af teksternes placering i et semantisk rum skabt via en encoder-model (https://huggingface.co/JohanHeinsen/Old_News_Segmentation_SBERT_V0.1) og Facebook Artificial Intelligence Similarity Search (https://faiss.ai/index.html).
link: her kan du gå til den oprindelige affotografering, der er tilgængelig i Mediestream.