Ylioppilasdatan louhimista Pivot-taulukoilla

[edit. 25.5. Korjasin pari kirjoitus vihrettä ja muutin yo-tiedoston otsikkorivi-kohdan luettavammaksi.]

Tein tämän alunperin Excelillä, niinpä päätin tuottaa saman Google Sheetsin Pivot toiminnolla, jotta oppisin uutta. Tulevassa tarinassa teen saman Excelillä.

Mielestäni kaikkien matikan opettajien tulisi osata käyttää Pivot-toimintoa taulukkolaskennossa ja opettaa se oppilailleen. Näin monen taulukkoja käyttävien henkilöiden työ muuttuisi helpommaksi ja maamme kansantalous kasvaisi :o)

Ylioppilaslautakunnan sivulla Oppilaitoskohtaisia tunnuslukuja https://www.ylioppilastutkinto.fi/tietopalvelut/tilastot/koulukohtaisia-tunnuslukuja on ohjeet miten ladata kevään 19 ylioppilaskirjoitusten tulokset csv-tiedostona. Myös aiempien tutkintokertojen tiedostot ovat ladattavissa. Tiedostoja on kahta eri tyyppiä riippuen niiden päivitettävyydestä. D3000-sarjan tiedostot eivät päivity. D4000-sarjan tiedostot päivittyvät kun ylioppilastutkinnon tiedot täsmentyvät esimerkiksi tarkistusarvostelun takia.

Kevään 19 pakollisten aineiden (ei päivittyvät) tulokset löytyvät tiedostosta https://www.ylioppilastutkinto.fi/ext/data/FT2019KD3002.csv

Kun klikkaat tuohon osoitteeseen, niin selaimesi lataa tiedoston lataukset-kansioosi. Käytän tätä tiedostoa mallina siitä, miten tietoa voi käsitellä Google Sheetsin ja Excelin Pivot-taulukkotoiminnolla (myöhemmin).

Tavoitteena on tuottaa samankaltainen lista koulujen menestymisessä pakollisissa aineissa kuin lehdet ovat tuottaneet. Samoilla menetelmillä voi helposti laittaa kouluja järjestykseen vaikkapa eri oppiaineiden tulosten perusteella tai vertailla tyttöjen ja poikien (vaikka sukupuolella ei ole väliä) menestymistä eri aineissa.

Google Sheets

Koska Google on luonut Google Sheetsin, käytän Googlen Chrome selainta. Mene omaan Driveesi ja luo tyhjä Google Sheets-taulukko. Valise Tiedosto-valikosta Tuo ja Tuo tiedosto-ikkunassa Lähetä. Klikkaa Valitse tiedosto ja hae ladattu Ytl:n tiedosto Lataukset-kansiosta. Laita Erotintyypiksi puolipiste ”;”.

Jos kaikki meni oikein meillä on 29574 riviä dataa eli 29573 oppilaan pakollisten aineiden tulokset. Tässä vaiheessa tiedostolle on syytä antaa nimi vaikka 19Kpakolliset.

Otsikkorivinä näyttää olevan seuraavanlaista:

tutkintokerta koulun_nro koulun_nimi opetuskieli tyyppi sukup yht A O Z I W Q A5 O5 M N BI FF FY HI PS UE UO ET GE KE TE YH BA BB CA CB EA FA SA PA VA EC FC SC PC VC DC IC QC GC TC L1 L7 opintotausta

Ytl:n sivulla on ohje muuttujanimistä:

  • [koekoodi] – Arvosanapisteet; I=0, A=2, B=3, C=4, M=5, E=6, L=7
  • yht – Tutkinnon arvosanapisteet yhteensä
  • sukup – Sukupuoli 1=mies, 2=nainen
  • ka_pak – Pakollisten aineiden keskiarvo
  • ka – Oppilaitoksen keskiarvo kokelaiden kaikken kokeiden keskiarvosta
  • n – Vastaavasti kokeiden lukumäärä (oppilatoksen keskiarvo)
  • ka_pkr – Oppilaitoksen keskiarvo kokelaiden ”pitkien aineiden” keskiarvosta; mukana pitkä matematiikka, pitkät kielet, pitkä toinen kotimainen, äidinkieli ja kaikki reaalikokeet
  • n_pkr – Vastaavasti kokeiden lukumäärä (oppilaitoksen keskiarvo)
  • ylioppilas – niiden kokelaiden lukumäärä, jotka ovat kyseisellä tutkintokerralla saaneet hyväksytyn tutkintokokonaisuuden ja joilla lisäksi on julkaisuajankohtana lukion päättötodistus.
  • opintotausta:
    • 1 – Lukion opiskelija
    • 2 – Ammatillisten opintojen pohjalta tutkintoa suorittava kokelas
    • 3 – Lukion oppimäärää ja ammatillista tutkintoa suorittava kokelas
    • 4 – Muu opiskelija/tuntematon

Ytl:n sivulta löytyy linkki sivulle https://www.ylioppilastutkinto.fi/ext/data/FT2016KD0010.csv, sieltä löytyvät yo-kokeiden koodit.

koe                nimi              namn

A                   Äidinkieli, suomi                Modersmålet, finska

A5                 Suomi toisena kielenä        Finska som andraspråk

BA                Ruotsi, pitkä oppimäärä     Svenska, lång lärokurs

BB                Ruotsi, keskipitkä oppimäärä                  Svenska, medellång lärokurs

BI                  Biologia        Biologi

CA                Suomi, pitkä oppimäärä     Finska, lång lärokurs

CB                Suomi, keskipitkä oppimäärä                  Finska, medellång lärokurs

DC                Pohjoissaame, lyhyt oppimäärä               Nordsamiska, kort lärokurs

EA                Englanti, pitkä oppimäärä  Engelska, lång lärokurs

EC                 Englanti, lyhyt oppimäärä  Engelska, kort lärokurs

ET                 Elämänkatsomustieto         Livsåskådningskunskap

FA                 Ranska, pitkä oppimäärä    Franska, lång lärokurs

FC                 Ranska, lyhyt oppimäärä    Franska, kort lärokurs

FF                 Filosofia       Filosofi

FY                 Fysiikka        Fysik

GC                Portugali, lyhyt oppimäärä Portugisiska, kort lärokurs

GE                Maantiede     Geografi

HI                 Historia         Historia

I                    Äidinkieli, inarinsaame      Modersmålet, enaresamiska

IC                  Inarinsaame, lyhyt oppimäärä                  Enaresamiska, kort lärokurs

KE                Kemia           Kemi

L1                 Latina, lyhyt oppimäärä     Latin, kort lärokurs

L7                 Latina, pidempi oppimäärä Latin, längre lärokurs

M                  Matematiikka, pitkä oppimäärä               Matematik, lång lärokurs

N                   Matematiikka, lyhyt oppimäärä               Matematik, kort lärokurs

O                   Äidinkieli, ruotsi                Modersmålet, svenska

O5                 Ruotsi toisena kielenä        Svenska som andraspråk

PA                 Espanja, pitkä oppimäärä   Spanska, lång lärokurs

PC                 Espanja, lyhyt oppimäärä   Spanska, kort lärokurs

PS                 Psykologia    Psykologi

Q                   – ei käytössä –                     – ej i bruk –

QC                Koltansaame, lyhyt oppimäärä                Skoltsamiska, kort lärokurs

SA                 Saksa, pitkä oppimäärä      Tyska, lång lärokurs

SC                 Saksa, lyhyt oppimäärä      Tyska, kort lärokurs

TC                 Italia, lyhyt oppimäärä       Italienska, kort lärokurs

TE                 Terveystieto  Hälsokunskap

UE                Evankelis-luterilainen uskonto                Evangelisk-luthersk religion

UO                Ortodoksi uskonto              Ortodox religion

VA                Venäjä, pitkä oppimäärä    Ryska, lång lärokurs

VC                Venäjä, lyhyt oppimäärä    Ryska, kort lärokurs

W                  Äidinkieli, koltansaame     Modersmålet, skoltsamiska

YH                Yhteiskuntaoppi                 Samhällslära

Z                   Äidinkieli, pohjoissaame    Modersmålet, nordsamiska

Minä itse koen vastenmielisenä laittaa kouluja johonkin ”paremmuusjärjestykseen” mutta pitkin hampain esitän tässä, miten se tehdään.

Google Sheets-taulukossa valitse kaikki rivit klikkaamalla vasemmalla riviin 1 ja sitten Vaihto pohjassa riviin 25974. Tämä on kohta hankala muistaa, jos on tottunut käyttämään Exceliä. Valitaan Tiedot-valikosta Pivot-taulukko.

(Google Sheets-taulukossa valitse ensin koko taulukko klikkaamalla taulukon rivien ja sarakkeiden nurkkaan tai ctrl -A (Macissa cmd-A). Ei toimi sillä se tuottaa tyhjän rivin alkuun joka haittaa suuruusjärjestystä myöhemmin.)

Sheets luo uuden lomakkeen nimeltä Pivot-taulukko.

Valitse Pivot-taulukon editorissa Rivit -> Lisää -> Lajitteluperuste -> Koulun nimi ja Arvot ->Lisää -> yht sekä Yhteenvedon peruste -> Average. Jätä myös Kokonaismäärä pois.

Näin saatiin koulukohtaiset keskiarvot laskettua pakollisista kirjoitetuista aineista.

Jostain kumman syystä en saanut suuruusjärjestystä toimimaan Pivot-taulukossa. Niinpä valitsin koko taulukon ctrl-A:lla (cmd-A Macissä) loin uuden lomakkeen ja Muokkaa valikosta Liitä määräten ->Liitä vain Arvoja.

Valitaan koko taulukko ja Tiedot-valikosta Lajitteluväli.

Näin saatiin koulut järjestykseen.

Kuvittelin, että tämä olisi ollut helpompaa. Se muuten on Excelillä. Niinpä seuraavassa tarinassa tehdään sama Execlissä ja siirretään dataa GeoGebraan.

Lisätään loppuun bonuksena Google Sheetsin lähes ilmaiseksi tuottama histogrammi.

Mainokset

16.11.16 Webinaari Abittikokeesta

Syyskuussa Ylioppilastutkintolautakunta pyysi minua ja Lauri Hellsteniä tuottamaan kaksi lukiomatematiikan ensimmäisen kurssin (MAY1) koetta tutkintolautakunnan Abitti-järjestelmään. Tuotimme kokeet siten, että ehdin testata toisen kokeista omilla oppilaillani ensimmäisen jakson koeviikolla. Lautakunta julkaisi kokeet marraskuussa Digabi-blogissa ja julkaisuun liittyen pidettiin webinaari. YTL:n tiloissa webinaarin tuottajana/toimittajana toimi Matti Lattu ja Lauri ja minä olimme paikalla esittelemässä kokeita.

Webinaari toteutettiin Adoben Connect Pro järjestelmällä, kuulijoina oli reilut 10 opettajaa ympäri Suomea. Webinaarin tallenne on nähtävissä Digabi-blogissa (tosin tätä kirjoitettaessa tallennetta ei näy).