Berlingske Tidende
Link til fritekstsøgning: https://hislabaau.shinyapps.io/Berlingske/
Udgivelsessted: København
Navne: Kiøbenhavnske Danske Post-Tidender (1749-1762); De til Forsendelse med Posten allene priviligerede Kiøbenhavnske Tidender (1762-1808); Den til Fors. med de Kongelige Rideposter priv. Danske Statstidende (1808-1832); Den til Fors. med de Kgl. Brevposter priv. Berlingske Politiske og Avertissementstidende (1833-).
Periode dækket: 1749-1835
Digitaliseret: Juli 2024 - Maj 2025
Digitaliseret af: Johan Heinsen og Camilla Bøgeskov
Billedproveniens: LOAR
Version: 1.0
Præcision af tekstgenkendelse
Kendte udfordringer, der forårsager ujævn præcision:
Avisens affotografering er i svingende kvalitet, hvilket i nogle tilfælde påvirker kvaliteten af tekstgenkendelsen. Nogle år er særligt udfordrede: 1767, 1792-1800, 1807-12.
Tidlige årgange indeholder en del tyske artikler, hvor tekstgenkendelsesmodellen klarer sig dårligere end normalt.
Forklaring af datasættets kolonner
text: Indeholder den identificerede tekst. Teksten er segmenteret. Algoritmen er designet til at transkribere bogstavret og tekstsøgninger skal indrettes derefter. Det er denne variabel, der søges i via søgeknappen. Søgefeltet godtager regex.
id: Dette er et unikt id for den givne tekst. Vær opmærksom på, at disse id’er opdateres for hver udgave af datasættet.
dato: Datoen for udgivelsen i formatet år-måned-dag. Du kan klikke på datoen og læse hele udgaven for den givne dato.
pwa (= predicted word accuracy): Denne kolonne indeholder en beregnet score for præcisionen på tekstgenkendelsen. Værdierne rangerer mellem 0 og 1.
vis lignende tekster: Her har du mulighed for en alternativ filtrering, der viser en given teksts 25 nærmeste slægtninge i avisen. Slægtskabet er udregnet på baggrund af teksternes placering i et semantisk rum skabt via en encoder-model (https://huggingface.co/JohanHeinsen/Old_News_Segmentation_SBERT_V0.1) og Facebook Artificial Intelligence Similarity Search (https://faiss.ai/index.html).
link: her kan du gå til den oprindelige affotografering, der er tilgængelig i Mediestream.