Dataanalyse og bruk av makroøkonomisk og finansiell data er en viktig del av makroøkonomi faget. Ved BI Trondheim, skal vi lære å bruke analyseverktøyet og programmeringspråket, R.
Du har antakelig brukt andre statistikk-verktøy i tidligere kurs, som SAS, STATA, eller Excel. Hvorfor burde man bruke tid på å lære nok et verktøy?
Fordi R er mer enn bare et statistikk-verktøy. Det er et programmeringspråk og standard. Det brukes av nesten samtlige statistikkere, de fleste empiriske forskere, og i økende grad forskere innenfor økonomi.
Enda viktigere, brukes det av:
Amazon
New York Times
Norges Bank
Statoil
Og mange flere.
R har blitt hovedverktøyet til en hel profesjon - det som kalles Data Analyst eller Data Scientist. I arbeidsmarkedet er det økende behov for ansatte som har grunnleggende kunnskaper i både økonomi og data-håndtering og analyse. Å ha både en solid økonomiutdannelse og grunnleggende kunnskaper i bruk av R vil gi en reel fordel i dagens konkurranse-preget arbeidsmarked.
Det finnes mange kilder for å lære mer R og få hjelp på nettet. Man kan begynne med An Introduction to R.
Online boken R for Data Science av Hadley Wickham.
UCLA har også en nyttig webside om R og data analyse.
Kanskje den mest vanlig måten å få hjelp er å bruke google. Det holder vanligvis å skrive noe som: “How to load in data R” i søkemotoren til å finne fram til riktig svar.
R er en kraftig og anvendbar verktøy. Den er også gratis og kan lastes ned uten restriksjoner fra webben. Du kan også laste ned et tilleggsprogram som gjør R lettere å bruke som heter R-Studio.
Instruksene finner du under:
Etter man har åpnet RStudio, burde man se 4 forskjellige vinduer på skjermen.
På bunnen på venstre siden er det et vindu som heter “console”
prøv å skriv in følgende etter “>” symbolet:
print("Hello World!")
## [1] "Hello World!"
Hva har skjedd? Console er der vi kommunsirer med R. Vi forteller R til å printe “Hello World”, og da gjør det det.
Nå prøv å skrive
#This is a comment
Hvis du har gjort det riktig, så burde ingenting skje. Å bruke “#” forran noe betyr at man ikke vil ha noe respons
For det meste, skal vi ikke skrive direkte inn i console. Isteden skal vi samle våre kode i en “script”-fil. Dette er det man ser i vinduet på toppen til venstre. Filene slutter med “.r”, men filene er egentlig bare vanlige tekst-filer, men å kalle det for .r forteller datamaskinen at det innholder kode for R.
Skriv in følgende linjer i din “.r” fil:
print("hello")
print("R is fun")
print("holy cow")
Hvis du markerer en av linjene og da trykker på knappen der det står Run blir den linjen sendt til konsolen. Hvis du markerer alle linjene, så blir alle linjene sendt til konsolen. På mac, kan du også trykke på
Det som gjør R så viktig, kraftig og anvendbar er at hvis man får en ide for noe som r burde kunne gjøre, så kan man skrive en app og gjøre det tilgjengelig for alle andre r-brukere. Sånne “apps” heter “packages” i r, og vi skal bruke flere nyttige packages
En package som vi skal bruke mye av i framtiden heter ggplot2, som lar oss plotte data på en særlig fleksibel og lettvint måte. For å laste ned og installere pakken skriver vi i konsolen:
install.packages("ggplot2")
For å bruke ggplot2 må vi først laste den in til R ved å skrive
library(ggplot2)
I vår første lab, lab 1, skal vi se hvordan r fungerer og lære hvordan å utføre noen enkle beregninger i r.