Anvendt Statistikk (MET 2010)

Høsten 2022

NTNU Handelshøyskolen

Johannes Mauritzen

Kontakt

Beste måten å ta kontakt med meg er via mail:

johannes.mauritzen@ntnu.no

Jeg prøver å svare på mail innen en arbeidsdag (24 timer)

For teknisk eller faglig hjelp, så er det best å komme til klassetimene (se under.)

Om kurset

Dette kurset handler om hvordan å gjennomføre en fullstendig data-analyse med moderne verktøy og metoder. Statistiske modeller, metoder og tester er viktige komponenter i dette kurset, men kurset gir også en innføring i data-håndtering, visualisering og deskriptiv-analyse.

Dette er et gjøre-kurs . Filosofien er at den beste måten å lære data-analyse på er å egentlig gjøre data-analyse. Fra første uke kommer du til å jobbe med data og data-håndtering. Vurderingen i dette kurset er også basert på innlevering av en prosjektoppgave.

Python og co.

I dette kurset bruker vi Python sammen med pakker for dataanalyse. Det er flere grunner for dette:

Kurset er vanskelig og verdiful

Kurset er vanskelig og du kommer til å oppleve frustrasjon og forvirring. Det er vanlig.

Men hvis du gjør en innsats, kommer du til å få mye ut av dette kurset. Du kommer ikke til å lære alt om statistikk og data-analyse i dette kurset. Men du kommer til å få verktøyene du trenger til å lære selv nesten hvilken som helst metode eller teknikk.

Opplegget

Labber

Kurset er bygget opp rundt 14 "labber". Du burde jobbe gjennom labbene - det vil si prøve å replikkere arbeidet i labbene -- i grupper. Det er øvelser i slutten av hver labb og du burde prøve å gjøre alle øvelsene. Labbene er skrevet på engelsk. Jeg jobber gjennom semesteret med å ferdiggjøre labbene, men du kan gå ut i fra at labbene er ferdig til den uken som er indikert i kursplanen (under).

Hjelpesesjoner

Det vil ikke være tradisjonelle forelesninger i dette kurset. Det meste av informasjonen du trenger er i labbene og pensum.

Vi bruker heller klassetiden som hjelpesesjoner. Her skal jeg være tilgjengelig for å svare på spørsmål og hjelpe med utfordringer. Det kan være lurt å lese pensum og begynne å jobbe gjennom labbene hjemme, mens man bruker klassetiden til å jobbe med øvelser.

Innleveringer

Det er fire obligatoriske innleveringer som du må bestå for å kunne levere inn prosjektoppgaven. Du kan jobbe i grupper med opptil 3. Disse består av oppgaver fra labbene (se under for detaljer).

Vurdering

Vurdering i kurset er basert på en individuell prosjektoppgave. Se detaljer under.

Feedback

How-to notes

Her er noen kortere notebooks som går gjennom noen vanlige oppgaver.

  • Reshaping data
  • Using ready-made data sets from Statistics Norway (SSB)
  • Fake data simulation.
  • Working with dates in Pandas
  • Creating a map using geopandas
  • Obligatoriske innleveringer

    1. Første innlevering
      • Frist: Mandag 19. September
      • Oppgaver ("Assignments") 2 og 3 fra lab 1
      • Oppgaver 2 og 3 fra lab 2
      • Oppgave 3 fra lab 3
      • Oppgave 3 fra lab 4
    2. Andre innlevering
      • Frist: Mandag 17. Oktober
      • Oppgave 4 fra lab 5
      • Oppgave 4 fra lab 6
      • Oppgave 5 fra lab 7
      • Oppgave 2 fra lab 8
    3. Tredje innlevering
      • Frist: Mandag 14. November
      • Oppgave 4 fra lab 9
      • Oppgave 2 fra lab 10
      • Oppgave 3 fra lab 11
      • Oppgave 3 fra lab 12
    4. Fjerde innlevering
      • Frist: Mandag 28. November
      • Oppgave 2 fra lab 14

    Jeg vil først og fremst se at man har gjort en reell innsats på innleveringene. Hvis man har gjort det, så er det lite sannsynlig at man ikke får det godkjent. Men hvis man ikke skulle få det godkjent, så vil det også være mulig å levere inn igjen.

    Prosjektoppgave

    Frist: 22. desember, 1200

    Leveres som PDF av en Jupyter Notebook i inspira

    (I Jupyter Notebook kan du velge *Download As* og deretter velge *PDF via Latex*. Hvis det ikke fungerer prøv heller å laste ned som *HTML*,åpne med en nettleser, og deretter print til PDF.)

    Kurset avsluttes med en prosjektoppgave.

    Om vurderingen

    Det er mye mer læring i å gjøre en prosjektoppgave sammenlignet med å sitte for eksamen. Det er derfor vi har prosjektoppgave i dette kurset. Vurderingen blir derimot noe diffus. I dette kurset bruker jeg en velkvalifisert ekstern-sensur som vil vurdere oppgavene på en rimelig og fornuftig måte. Men det er vanskelig å si noe om akkurat hvor karaktergrensene ligger i forkant. Mitt beste råd: Skriv en oppgave som du selv synes er interessante og som du er stolt av. Dette vil vanligvis føre til en grei karakter.

    Jeg kan generelt sett ikke si noe i forkant om hva man må gjøre for å oppnå en viss karakter. Men for å sette riktige forventninger, i følge NTNUs retningslinjer er en A-karakter reservert for eksepsjonelle oppgaver. Du kan ha en veldig bra oppgave uten at noe nødvendigvis er feil og fortsatt ikke få en A.

    Datakilder

    Kilder for å lære mer Python og R

    Kilder til å lære mer statistikk og sanynslighetsteori