Statistiske metoder og analysedesign (PHDPR9800)

Enkeltemne ph.d.

Som forskere er vi ofte ute etter å finne systematikk i store mengder data, og vi vil aller helst være sikker på at denne systematikken ikke kun er et resultat av tilfeldigheter og annen ‘støy’. Det finnes mange ulike typer statistiske metoder som kan benyttes for å prøve teorier og teste hypoteser. Alle disse statistiske teknikkene har styrker og svakheter som det er viktig å kjenne til. Det er også avgjørende å vite hvilke statistiske analyseteknikker som egner seg til hvilken type datamaterialer. ‘Statistiske metoder og analysedesign’ tar sikte på å gi kursdeltakerne en bred oversikt over statistiske metoder, samt muligheten til å gå i dybden på en eller flere av disse.

  • Om emnet

    *noen små justeringer kan forekomme

    Innledning

    Som forskere er vi ofte ute etter å finne systematikk i store mengder data, og vi vil aller helst være sikker på at denne systematikken ikke kun er et resultat av tilfeldigheter og annen ‘støy’. Det finnes mange ulike typer statistiske metoder som kan benyttes for å prøve teorier og teste hypoteser. Alle disse statistiske teknikkene har styrker og svakheter som det er viktig å kjenne til. Det er også avgjørende å vite hvilke statistiske analyseteknikker som egner seg til hvilken type datamaterialer. ‘Statistiske metoder og analysedesign’ tar sikte på å gi kursdeltakerne en bred oversikt over statistiske metoder, samt muligheten til å gå i dybden på en eller flere av disse.

    Forkunnskapskrav

    Bestått mastergrad (120 studiepoeng) eller tilsvarende utdanning. Interesserte mastergradsstudenter kan søke om plass og få opptak på dette emnet dersom det er ledige plasser.

    Det er en forutsetning med forkunnskaper innen statistiske metoder, f.eks. å ha gjennomført mastergradskurs i statistikk, evt. jobberfaring der statistiske analyser var en del av stillingen.

    Se mer under "Søknad og Opptak"

    Læringsutbytte

    Etter fullført emne har kandidaten følgende læringsutbytte, definert som kunnskap, ferdigheter og generell kompetanse:

    Kunnskap:

    • Har god kjennskap til ulike typer kvantitative datamaterialer (panel, tverrsnitt, tidsserier, etc.), og styrker og svakheter ved disse.
    • Har inngående kunnskap over hvilke statistiske analyseteknikker som egner seg til hvilken type datamaterialer.
    • Vet forskjellen mellom statistiske sammenhenger og kausalforhold, samt kjenner til ‘omitted variable bias’.

    Ferdigheter:

    • Kan analysere kvantitative datasett vha. OLS/lineær sannsynlighetsmodell.
    • Kan tolke resultatene fra en OLS analyse på en overbevisende måte.
    • Kjenner til en eller flere kausale analyseteknikker (f.eks. individnivå fast effekt).
    • Har et kritisk blikk på kausalanalyser og kan påpeke mulige svakheter ved designet.

    Generell kompetanse:

    • Forstår viktigheten av å spille med åpne kort gjennom hele forskningsprosessen ved hjelp av deskriptiv statistikk, alternative modellspesifikasjoner, og/eller bruk av andre statistiske metoder.
    • Kan si noe om hvordan, og på hvilken måte, de foreslåtte/planlagte/gjennomførte statistiske analysene bidrar med noe nytt til forskningslitteraturen (evt. forklare hvorfor replikasjon er nødvendig).
    • Forstår at ‘beskrivende’ analyseteknikker (f.eks. OLS analyse) kan være like – eller mer – nyttig kunnskapsmessig, sammenlignet med mer ‘forklarende’ analyseteknikker slik som diff-in-diff eller SEM.

    Innhold

    ‘Statistiske metoder og analysedesign’ starter med generell informasjon og en kort repetisjon av nøkkelbegreper innen anvendt statistikk (f.eks. gjennomsnitt, median, standardavvik, signifikanstesting, etc.). Forskjellene mellom statistiske sammenhenger og kausalforhold diskuteres, etterfulgt av en relativt dyptpløyende gjennomgang av OLS analyse siden denne teknikken er en helt sentral byggekloss for flere av de mer ‘avanserte’ statistiske metodene. Ulike typer kausalanalyser blir også dekket i nokså bredt omfang, og det legges særlig opp til en grundig gjennomgang av individnivå fast effekt, diff-in-diff, propensity score matching, og structural equation modeling (SEM). I tillegg skal vi innom instrumentvariabel-metode (IV), regression discontinuity, og flernivåanalyse, men ikke i like stor utstrekning (dette vil muligens endres dersom kursdeltakerne ønsker mer fokus på disse eller andre analyseteknikker). Det veksles mellom klasseromsundervisning (inkl. diskusjon og gruppearbeid) og arbeid i laben.

    Arbeids- og undervisningsformer

    Emnet gjennomføres som en kombinasjon av (i) forelesninger m/ diskusjon og gruppearbeid, og (ii) arbeid i laben.

    Forelesningene vil både dekke generelle temaer innen anvendt statistikk, samt gå mer i dybden på enkelte statistiske metoder. Det er bakt inn en del fleksibilitet i undervisningsplanen, slik at vi har mulighet til å dekke andre potensielle statistiske metoder etter ønske fra kursdeltakerne. Fokuset er gjennomgående på styrker og svakheter ved de ulike analyseteknikkene.

    Undervisningen i lab foregår i statistikkprogrammet Stata. Deltakerne kan benytte seg av andre programmer (f.eks. R, SAS eller SPSS), men undervisningen vil ikke bli tilrettelagt for noe annet program enn Stata. Det anbefales derfor å gjøre seg kjent med Stata i forkant av kurset. Søkere som har lite eller ingen erfaring med Stata, bør ta forkurset «Statistikk med Stata – forkurs til PHDPR9800». For mer informasjon se https://www.oslomet.no/studier/sps/statistikk-med-stata

    Vi kommer til å benytte oss av to datasett (ett tverrsnitt, ett panel) som vi låner fra NSD, og deltakerne trenger ikke tilgang til sitt eget datamateriale. Men det vil selvsagt være en fordel å kunne teste ut noen av analyseteknikkene på sitt eget datamateriale, og da særlig mot slutten av kurset når deltakerne skal starte med oppgaven/ paperskissen.

    Kurset går over 6 dager fordelt på to uker, med undervisning/lab ca. kl. 10—16.

    Vurdering og eksamen

    Godkjent deltakelse på emnet, bestått lab-besvarelse og bestått oppgave gir 10 studiepoeng. Deltakerne skal skrive og levere inn en oppgave/ paperskisse på ca. 15 sider, med skriftstørrelse 12 og dobbel linjeavstand. Temaet er valgfritt, men bør aller helst være nært forbundet med ph.d.- (eller mastergrads-) prosjektet som deltakeren er i gang med. Oppgaven/ paperskissen leveres senest to måneder etter siste kursdag. Oppgaven vurderes til bestått/ikke bestått. En presis problemstilling, overbevisende bruk av pensumlitteratur, samt metodisk kompetanse vektlegges i vurderingen. Innleverte oppgaver som vurderes til ‘ikke bestått’ kan leveres inn på nytt i en revidert form/versjon, én gang innen en nærmere angitt frist.

    Bestått oppgave er en forutsetning for å oppnå 10 studiepoeng.

    Vurderingen av innlevert oppgave gjøres på grunnlag av læringsutbyttebeskrivelser for emnet. Kursdeltakerne får skriftlige kommentarer og tilbakemeldinger på oppgaven/ paperskissen, i en stil som minner om fagfellevurdering.

    Det gis ikke anledning til forlengelse av innleveringsfristen. Unntak er sykdom som dokumenteres med sykemelding. Etter søknad kan det gis utsettelse tilsvarende den dokumenterte sykdomsperioden.

    Hjelpemidler til vurdering/eksamen Alle

    Klageadgang:  Bestemmelser om eksamen og fusk i forskrift om studier og eksamen ved OsloMet gjelder for arbeider som inngår i ph.d.-programmets opplæringsdel.

    Opptakskrav

    Emnet er primært for stipendiater som er tatt opp i et ph.d.-program. Ved ledige plasser er emnet åpent for andre interesserte med mastergrad eller tilsvarende utdanning. OsloMet-ansatte og -studenter prioriteres ved opptak.

    Dette emnet er primært lagt til rette for stipendiater som er tatt opp på et ph.d.-program ved OsloMet – storbyuniversitetet. Dersom det er ledige plasser, vil det åpnes for at (i) stipendiater ved andre ph.d.-programmer, (ii) mastergradsstudenter ved OsloMet, (iii) ansatte ved OsloMet, og (iv) mastergradsstudenter ved andre læresteder kan delta, i prioritert rekkefølge.

  • Pensum

    Totalt antall sider: 807

    Bøker:

    • Angrist, J. D., & Pischke, J.-S. (2009). Mostly Harmless Econometrics: An Empiricist’s Companion. Princeton/ Oxford: Princeton University Press. Kapittel 3, 5, 6 og 8. [85 + 28 + 18 + 33 sider]
    • Morgan, S. L., & Winship, C. (2007). Counterfactuals and Causal Inference. Methods and Principles for Social Research. New York: Cambridge University Press. Kapittel 2, 4, 5 og 9. [27 + 35 + 44 + 32 sider]
    • Acock, A. C. (2015). Discovering Structural Equation Modeling Using Stata. College Station: Stata Press. Kapittel 2 og 3 [55 + 37 sider]

    Artikler:

    • Allison, P. D. (1994). Using panel data to estimate the effects of events. Sociological Methods & Research, 23(2), 174-199. [26 sider]
    • Austin, P. C. (2011a). An introduction to propensity score methods for reducing the effects of confounding in observational studies. Multivariate Behavioral Research, 46(3), 399-424. [26 sider]
    • Austin, P. C. (2011b). A tutorial and case study in propensity score analysis: an application to estimating the effect of in-hospital smoking cessation counseling on mortality. Multivariate Behavioral Research, 46(1), 119-151. [33 sider]
    • Borgen, N. T. (2013). Instrumentvariabler - en introduksjon for samfunnsforskere. Sosiologi i dag, 43(3), 39-64. [26 sider]
    • Bowers, J., & Drake, K. W. (2005). EDA for HLM: Visualization when probabilistic inference fails. Political Analysis, 13(4), 301-326. [26 sider]
    • Bryan, M. L., & Jenkins, S. P. (2016). Multilevel modelling of country effects: A cautionary tale. European Sociological Review, 32(1), 3-22. [20 sider]
    • Elstad, J., & Pedersen, A. (2012). The impact of relative poverty on Norwegian adolescents’ subjective health: A causal analysis with propensity score matching. International Journal of Environmental Research and Public Health, 9(12), 4715-4731. [17 sider]
    • Finseraas, H., & Kotsadam, A. (2013). Hvordan identifisere årsakssammenhenger i ikke-eksperimentelle data? En ikke-teknisk introduksjon. Tidsskrift for samfunnsforskning, 54(3): 371-387. [17 sider]
    • Fletcher, J. M. (2012). Peer influences on adolescent alcohol consumption: evidence using an instrumental variables/fixed effect approach. Journal of Population Economics, 25(4), 1265-1286. [22 sider]
    • Gangl, M. (2010). Causal inference in sociological research. Annual Review of Sociology, 36, 21-47. [27 sider]
    • Halaby, C. N. (2004). Panel models in sociological research: Theory into practice. Annual Review of Sociology, 30, 507-544. [38 sider]
    • Halleröd, B., & Gustafsson, J. E. (2011). A longitudinal analysis of the relationship between changes in socio-economic status and changes in health. Social Science & Medicine, 72(1), 116-123. [8 sider]
    • Heggebø, K. (2015). Unemployment in Scandinavia during an economic crisis: Cross-national differences in health selection. Social Science & Medicine, 130, 115-124. [10 sider]
    • Heggebø, K., & Elstad, J. I. (2018). Is it easier to be unemployed when the experience is more widely shared? Effects of unemployment on self-rated health in 25 European countries with diverging macroeconomic conditions. European Sociological Review, 34(1), 22-39. [18 sider]
    • Hellevik, O. (2009). Linear versus logistic regression when the dependent variable is a dichotomy. Quality & Quantity, 43(1), 59-74. [16 sider]
    • Miguel, E., Satyanath, S., & Sergenti, E. (2004). Economic shocks and civil conflict: An instrumental variables approach. Journal of Political Economy, 112(4), 725-753. [29 sider]
    • Mood, C. (2010). Logistic regression: Why we cannot do what we think we can do, and what we can do about it. European Sociological Review, 26(1), 67-82. [16 sider]
    • Tufte, P. A. (2013). Forståelser av kausalbegrepet i samfunnsvitenskapene. Tidsskrift for samfunnsforskning, 54(3), 341-354. [14 sider]
    • Ugreninov, E. & Birkelund, G. E. (2013). Naturlige eksperiment. Sosiologi i dag, 43, 65-89. [25 sider]
    • Waldfogel, J. (1997). The effect of children on women's wages. American Sociological Review, 209-217. [9 sider]
    • Wessel, T. & Turner, L. M. (2020)"The migration pathway to economic mobility: Does gender matter? Population, Space and Place, 27(4), e2419. [16 sider]
  • Søknad og opptak

    Søkere må laste opp et sammendrag på om lag én A4-side med informasjon om eget ph.d.-prosjekt. Dvs. maks. 1-2 A4-sider med utfyllende informasjon om sin bakgrunn og sitt prosjekt. Oppgi navn, stilling, tilhørighet/arbeidssted i vedlagte filen. Beskriv kort hva du kan fra før, og hva du er mest interessert i å lære mer om innen statistiske metoder og fortell hvor mye erfaring du har med statistiske metoder fra før.

    Prosjektsammendraget lastes opp under "Mine dokumenter" i Søknadsweb (fsweb.no).

    NB! Vi behandler ikke søknader uten vedlagt prosjektsammendrag.

    Søknadsfrist: 29.08.2021

    For søkere som har lite erfaring med statistiske metoder, anbefales forkurset «Statistikk med Stata – forkurs til PHDPR9800». Forkurset går over to dager, og gir en nyttig innføring i anvendt statistikk.

  • Høsten 2021

    Kurset går over 6 dager fordelt på to uker, med undervisning/lab ca. kl. 10—16.

    • 11.10.2021: Forelesning i P46, PA311, Lab i P52, F323
    • 12.10.2021: Forelesning i P46, PA311, Lab i P52, F323
    • 13.10.2021: Forelesning i P46, PA311, Lab i P52, F323
    • 25.10.2021: Forelesning i P46, PA311, Lab i P48, R502
    • 26.10.2021: Forelesning i P46, PA311, Lab i PP33, 5-040
    • 27.10.2021: Lab i P52, F323, Forelesning i P46, PA311

    Kursdag 1: Introduksjon og deskriptive analyser

    09:15    Introduksjon, informasjon + bli kjent runde. Forskningsspørsmål og analysedesign

    10:30    Deskriptiv statistikk (gjennomsnitt, median, standardavvik, T-test, etc.)

    11:30    Lineær regresjonsanalyse (Ordinary Least Squares, OLS)

    13:15—16:00 Øvelser i lab: deskriptiv statistikk + OLS

    Kursdag 2: Regresjon, matching og multi-level

    09:15    Lineær regresjonsanalyse (Ordinary Least Squares, OLS) [del 2] m/ gruppeoppgave

    10:30    Propensity score matching (PSM)

    11:45    Clustered data og flernivåanalyse (multi-level)

    13:15—16:00 Øvelser i lab: propensity score matching + flernivåanalyse   

    Kursdag 3: Paneldataanalyse: individ-nivå fast effekt og diff-in-diff  

    09:15    Paneldataanalyse: individnivå fasteffekt

    11:30    Elisabeth Ugreninov: difference-in-difference

    13:15—16:00 Øvelser i lab: individ-nivå fast effekt

    Kursdag 4: Kausal modellering

    09:15    Korrelasjon og kausalitet. Instrumentvariabel metode (IV) og regression discontinuity (RD)

    10:30    Terje Wessel: Structural equation modeling (SEM)

    11:30    Terje Wessel: Structural equation modeling (SEM) [del 2]

    13:15—16:00 Øvelser i lab: SEM

    Kursdag 5: Forskningsspørsmål og analysedesign

    09:30    Gjennomgang av empiriske case og problemstillinger

    10:00    Gruppeoppgaver: diskusjon av mulige analysedesign

    11:00    Gruppepresentasjon: forslag til analysedesign

    13:15—16:00 Arbeid i lab: emneoppgaven (utkast/skisse)

    Kursdag 6: Paperpresentasjon og oppsummering

    09:15—12:30 Arbeid i lab: emneoppgaven (utkast/skisse)

    13:15—15:00   Individuelle presentasjoner av påbegynt/planlagt studie

    15:00—16:00   Oppsummering/avslutning + informasjon om innlevering

    Vi tar forbehold om endringer i kursopplegget og eventuelle kanselleringer. SPS kan dessverre ikke dekke eventuelle omkostninger for den enkelte dersom en slik situasjon skulle oppstå.

  • Attest for fullført emne

    Deltakere som har gjennomført og bestått emnet kan selv hente ut dokumentasjon på dette. Karakterutskrift kan bestilles på Studentweb (fsweb.no) eller hentes på Vitnemålsportalen (vitnemålsportalen.no). Du finner mer informasjon om karakterutskrift og vitnemål (student.oslomet.no) på studentsidene.

  • Faglig og administrativt ansvarlig

    Ved administrative spørsmål, kontakt kurs-sps@oslomet.no