DH-lab er Nasjonalbibliotekets digital humaniora-lab og utvikler digitale verktøy og metoder for utforskning og analyse av Nasjonalbibliotekets samling. I dette temamøtet får du en introduksjon til verktøyene som DH-lab har utviklet for at du kan gjøre digitale tekstanalyser, med fokus på hvordan du selv kan ta de i bruk i egen forskning. Med bruk av verktøyene trenger du nemlig ikke kunne programmere.
Presentasjonen vil gå gjennom hvordan man bygger et korpus av tekster basert på nøkkelord og metadata, for så å bruke korpuset til å gjøre analyser. Dette er for eksempel analyser av ordforekomst over tid, ord i kontekst, samforekomster av ord, assosierte ord og frekvenser av ord. For frekvenser av ord kan man få output i form av dokument-term-matriser som kan brukes videre i statistisk analyse. Samforekomster av ord kan brukes til å lage galakser, en form for ordsky, som viser ord i relasjon til andre ord og gir grunnlag for nettverksanalyser.
To viktige verktøy som er utviklet i app-form av DH-lab er:
1) Tema-analyse (topic modelling) på utvalgte korpus, hvor man får generert bolker av ord som ofte opptrer sammen.
2) Navnegjenkjenning (NER) og ordklasse-tagging (POS). Det vil si at man kan bruke spesialutviklede språkmodeller til å identifisere navn, steder, organisasjoner eller trekke ut verb, adjektiv, substantiv, osv. Med slike verktøy kan man enkelt få oversikt over hvem som snakkes om i offentlig dokumentasjon og hvordan de snakkes om, over tid. Dette gir grunnlag for mange interessante analyser av det offentlige og offentligheten i Norge.
Om møtet
Temamøtet er hovedsakelig rettet mot forskere og ansatte innen forskningsstøtte og forskningsadministrasjon ved OsloMet. Men vi ønsker også andre utenfor.
Selve presentasjonen er fra kl. 11.00 til 12.00, mens tiden 12.00 til 12.30 vil bli viet diskusjon og refleksjon rundt hva som er presentert med mer lavterskel samtale.
Arrangør: Symploké – nettverk for forskningsdatahåndtering (ansatt.oslomet.no). Bak initiativet står universitetsbibliotekar, Marianne Wehus, som forvalter forskningsdataarkivene Surveybanken og DataverseNO på OsloMet, og forsker Camilla Holm Soelseth (AFI/SVA), som har en doktorgrad i bibliotek- og informasjonsvitenskap fra OsloMet og som for tiden også er overingeniør ved IT-støtte for forskning.
Spørsmål? Kontakt nettverket på e-post.
Arrangementet holdes på norsk og er også åpent for eksterne. Ta med deg matpakka for faglig og matnyttig påfyll!