Statistikk med Stata – Forkurs til Statistiske Metoder

Videreutdanning - Enkeltemne ph.d.

Kunnskap om statistiske metoder er en forutsetning for å kunne besvare mange viktige forskningsspørsmål. Forkurs til Statistiske Metoder tar sikte på å gi kursdeltakerne de nødvendige basisferdighetene som kreves for å tilrettelegge og analysere et tallmateriale.

  • Om emnet

    *noen små justeringer kan forekomme

    Innledning

    Kunnskap om statistiske metoder er en forutsetning for å kunne besvare mange viktige forskningsspørsmål. For å oppnå metodekunnskapene som kreves, er det nødvendig å tilegne seg de tekniske ferdighetene. Kjennskap til, og ferdigheter innen, et eller flere statistikkprogrammer er helt essensielt for å kunne analysere et kvantitativt datamateriale. Emnet «Statistikk med Stata – Forkurs til Statistiske metoder og analysedesign» tar sikte på å gi kursdeltakerne de nødvendige basisferdighetene som kreves for å tilrettelegge og analysere et tallmateriale.

    Kurset går over to dager og er tilpasset ph.d.-stipendiater som skal delta på «Statistiske metoder og analysedesign» og som har lite eller ingen erfaring med statistikkprogrammet Stata fra før.

    Målgruppe

    Emnet er primært for ph.d.-stipendiater som skal delta på «Statistiske metoder og analysedesign» og som har lite eller ingen erfaring med statistikkprogrammet Stata fra før. Ved ledige plasser er emnet åpent for andre interesserte. OsloMet-studenter og -ansatte prioriteres ved opptak.

     Forkunnskapskrav

    Emnet er særlig velegnet for personer som har erfaring med statistikk, men som ikke har benyttet statistikkprogrammet Stata før. Personer uten noe særlig forkunnskaper innen statistiske analyser kan også få utbytte av dette forkurset, men det vil normalt kreve en hel del ekstrainnsats.

    Bestått mastergrad (120 studiepoeng) eller tilsvarende utdanning er i utgangspunktet et krav. Interesserte mastergradsstudenter kan søke om plass og få opptak på dette emnet dersom det er ledige plasser.

    Opptakskrav

    Dette emnet er primært lagt til rette for ph.d.-stipendiater som skal delta på «PHDPR9800 – Statistiske metoder og analysedesign». Dersom det er ledige plasser, vil det åpnes for at (i) PHDPR9800-kursdeltakere som ikke er ph.d.-stipendiater, (ii) interesserte masterstudenter ved OsloMet, og (iii) interesserte OsloMet-ansatte kan delta, i prioritert rekkefølge.

    Læringsutbytte

    Etter fullført emne har kandidaten følgende læringsutbytte, definert som kunnskap, ferdigheter og generell kompetanse:

    Kandidaten

    Kunnskap

    • Har god kjennskap til ulike kommandoer (f.eks. tab, sum, if, recode, gen, cor, reg) i statistikkprogrammet Stata.
    • Har inngående kunnskaper om hvordan man løser forskjellige tekniske og praktiske utfordringer i bearbeiding og tilrettelegging av data for analyser.
    • Har oversikt over hvilke muligheter og begrensninger som finnes for ulike typer variabler (kontinuerlig, kategorisk og dikotom).

    Ferdigheter

    • Kan tilrettelegge data for analyser i Stata.
    • Kan kode om og lage nye variabler.
    • Kan få ut deskriptiv statistikk (for ulike underutvalg).
    • Kan kjøre en enkel lineær regresjonsanalyse (OLS), og vite hva de ulike tallene (koeffisient, standardfeil, signifikansnivå, og konfidensintervall) svarer til.

    Generell kompetanse

    • Vet at de valgene man tar i omkoding og operasjonalisering av variabler kan ha stor innvirkning på resultatene fra analysen.
    • Har et bevisst forhold til hva man kan, og hva man ikke kan gjøre, med variabler der det f.eks. er mye missing eller der fordelingen av verdier er veldig skjev.
    • Er godt kjent med hvilke grafiske fremstillinger (f.eks. histogram, scatterplot) som egner seg for ulike typer variabler, evt. sammenheng mellom variabler.

     

    Innhold

    Kurset starter med en generell introduksjon til statistikkprogrammet Stata, inkludert hvordan man åpner og laster inn data. Deretter går vi gjennom syntaks, noen viktige kommandoer, samt hvordan Stata kan gi hjelp i form av forklaringer og tips/triks. Forskjellen mellom numeriske (tall) og alfanumeriske (tekst) variabler blir presentert, og vi viser hvordan variabler kan gis navn og merkelapp slik at de blir enklere å bruke.

    Etter hvert skal vi gjøre oss bedre kjent med datamaterialet, og bl.a. undersøke hvor mye missing (manglende informasjon) det er for utvalgte variabler. Fordeler og mulige fallgruver knyttet til omkoding av variabler blir dekket inngående. Både enkel og noe mer avansert presentasjon av deskriptiv statistikk (f.eks. gjennomsnittsverdi) dekkes også grundig i kurset, og vi skal bl.a. vise ulike måter å presentere tallmaterialet grafisk på.

    Mot slutten av kurset skal vi se på sammenhengen mellom to eller flere variabler ved hjelp av korrelasjonsmatriser og lineære regresjonsanalyser. For regresjonsanalysene er vi spesielt opptatt av at kursdeltakerne skal bli trygge på å kunne lese og forstå hva de ulike tallene i output-filen svarer til.

    Arbeids- og undervisningsformer

    Emnet gjennomføres primært som arbeid med ulike øvelser i laben. Det vil også være innslag av undervisning/ forelesning, samt diskusjoner og gruppearbeid.

    Det er statistikkprogrammet Stata som benyttes.

    Vi kommer til å benytte oss av et datasett (tverrsnitt) som vi låner fra NSD, og deltakerne trenger derfor ikke tilgang til sitt eget datamateriale. Det kan imidlertid være en fordel å ha data fra sitt eget ph.d.-prosjekt tilgjengelig for hjemmeøvelsene, slik at oppgavene blir enda mer relevante for det kursdeltakerne jobber med til daglig.

    Det legges opp til hjemmeøvelser på fridagen (tirsdagen) som blir gjennomgått i plenum på oppstarten av kursdag 2. Det er ikke et obligatorisk krav å løse disse oppgavene, men kursdeltakerne vil få større utbytte av emnet ved å jobbe med hjemmeøvelsene.

     

    Arbeidskrav og obligatoriske aktiviteter

    Aktiv deltakelse i laben/ undervisning er en forutsetning for å få fullt utbytte av kurset. Etter første kursdag, oppfordres deltakerne til å jobbe med hjemmeøvelser på fridagen. Hjemmeøvelsene er ikke veldig tidskrevende, men 2-3 timer sammenhengende arbeid må sannsynligvis medregnes. Andre kursdag starter med å gå gjennom hjemmeøvelsene.

    Det er ingen arbeidskrav som må leveres for å få godkjent deltakelse på kurset.

    Vurderings-/eksamensform og sensorordning. Vurderingsuttrykk

    Det er ingen eksamen eller annen vurdering av kandidatene på dette forkurset.

    Hjelpemidler til vurdering/eksamen Alle

    Klageadgang

    Bestemmelser om eksamen og fusk i forskrift om studier og eksamen ved OsloMet gjelder for arbeider som inngår i ph.d.-programmets opplæringsdel.

  • Pensum

    Pensum

    Totalt antall sider: 533

    Bøker:

    • Ringdal, K. & Wiborg, Ø. (2017) Lær deg Stata - innføring i statistisk dataanalyse. [295 sider]
    • Tjønndal, A. (2018) Statistisk analyse i Stata. [188 sider]

    Recommended book for course attendants not fluent in Norwegian or other Scandinavian language:  Mehmetoglu, M. & Jakobsen, T. G. (2016). Applied Statistics using Stata: A Guide for the Social Sciences. Thousand Oaks, CA: Sage. Chapters: 2, 3 & 4.

    Artikler:

    • Elstad, J. I. & Heggebø, K. (2019) Et voksende prekariat? Langvarige tilknytninger til arbeidslivet blant kjernegruppene i arbeidsmarkedet, Søkelys på arbeidslivet 36(3):139-157. [19 sider]
    • Huijts, T. et al. (2017) Prevalence of physical and mental non-communicable diseases in Europe: findings from the European Social Survey (2014) special module on the social determinants of health, European Journal of Public Health, 27, Issue suppl_1: 8–13. [6 sider]
    • Schwabish, J. A. (2014) An economist's guide to visualizing data. Journal of Economic Perspectives, 28(1), 209-234. [25 sider]
  • Søknad og opptak

    Dette emnet er primært lagt til rette for ph.d.-stipendiater som skal delta på «PHDPR9800 – Statistiske metoder og analysedesign». Dersom det er ledige plasser, vil det åpnes for at

    (i) PHDPR9800-kursdeltakere som ikke er ph.d.-stipendiater,

    (ii) interesserte masterstudenter ved OsloMet, og

    (iii) interesserte OsloMet-ansatte kan delta, i prioritert rekkefølge.

    Søknadsfrist: 29.08.2021

  • Høsten 2021

    Dag 1: Mandag, 04.10.2021 kl 09.15 - 16.00. Sted -  PP35 U1045

    Dag 2: Onsdag,  06.10.2021 kl. 09.15-16.00. Sted - PP33 5-040

     

    Dag 1

    09:15    Introduksjon, informasjon + bli kjent runde

    10:15    Stata – introduksjon og oversikt

    11:15    Hvordan man laster inn data, lagrer og koder om variabler?

    13:15-16:00 Deskriptiv statistikk (gjennomsnitt, median, standardavvik,  prosentuering mm.).Håndtering av missing verdier. Gruppeøvelse 1

     

    Dag 2

    09:15    Oppsummering deskriptiv statistikk + gjennomgang av Gruppeøvelse 1.

    10:15     Hypotesetesting

    11:15    T-test, chi2, korrelasjoner og bivariate regresjonsanalyser

    13:15—16:00 Lineær regresjonsanalyse (Ordinary Least Squares, OLS)

  • Kursbevis

    Etter fullført kurs vil deltakerne få utlevert kursbevis.

  • Faglig og administrativt ansvarlig

     

      Laster inn ...

       

        Laster inn ...

         

        Ved administrative spørsmål, kontakt kurs-sps@oslomet.no