Ekonometriset mallit, asiantuntijaennusteet ja ennuste-epävarmuus

Makrotaloudellisten muuttujien, kuten bruttokansantuotteen, vuosikasvun ennustaminen prosenttiyksikön kymmenyksien tarkkuudelta voi tuntua järjettömältä, jos ennustetta ei tulkita oikein. Tällainen niin kutsuttu piste-ennuste tarkoittaa yksinkertaisesti sitä, että raportoitu arvo on (ennusteen laatijan arvion mukaan) todennäköisempi, kuin mikään muu arvo. Bruttokansantuotteen vuosikasvuvauhdin ennusteen ollessa esimerkiksi 1,4 prosenttia ovat arvot kuten 1,2 prosenttia tai 1,6 prosenttia tyypillisesti lähes yhtä todennäköisiä. Mutta kuinka todennäköistä on, että kasvuvauhti jäisi vaikkapa alle 0,5 prosentin? Tämän kaltaiset kysymykset ovat usein mielenkiintoisempia (ja tärkeämpiä) kuin piste-ennusteen tarkka arvo.

Vastataksemme tällaisiin kysymyksiin on tehtävä jonkinlainen arvio ennusteen todennäköisyysjakaumasta, mikä on usein hyvin paljon helpommin sanottu kuin tehty. Ennusteen todennäköisyysjakauman ominaisuuksiin viitatessamme puhumme usein ennuste-epävarmuudesta.

Jos ennuste laaditaan käyttäen vain ekonometrisia malleja (tässä tekstissä emme tee eroa tilastollisten mallien ja ekonometristen mallien välille, kuten joskus on tapana), on ennustejakauman muodostaminen kohtuullisen suoraviivaista. Näin laadittu arvio ennuste-epävarmuudesta voi kuitenkin olla harhaanjohtava, jos malli perustuu epäuskottaviin jakaumaoletuksiin, kuten valitettavan usein on tapana. Tyypillisesti julkaistut ennusteet, kuten Etlan suhdanne-ennuste, perustuvat kuitenkin ekonometristen mallien lisäksi asiantuntija-arvioihin, sillä asiantuntijalla on aina käytössään enemmän informaatiota kuin yksikään malli pystyy käsittelemään. Tällaista informaatiota voi olla esimerkiksi Suomen toimialarakenteen yksityiskohtainen tuntemus, näkemys suhdannevaihteluiden ja kansainvälisen politiikan suhteesta tai uutiset koko maailmaa koettelevan pandemian kehityksestä.

On totta, että ekonometrinen malli voidaan suunnitella niin, että se voi käyttää edes jossain määrin hyväkseen mitä tahansa informaatiota, mutta yksikään malli ei voi käsitellä kaikkea informaatiota, joka asiantuntijalla on käytössään. On kuitenkin asiantuntijasta kiinni, miten hyvin tätä informaatiota pystytään hyödyntämään.

Niin ekonometrisiin malleihin kuin asiantuntija-arvioihinkin perustuvilla ennusteilla on siis puolensa, jolloin käyttääksemme saatavilla olevaa informaatiota mahdollisimman tehokkaasti, on ihanteellista pohjata ennusteet niin malleihin kuin asiantuntija-arvioihin. Käytännössä tämä tapahtuu usein niin, että asiantuntijat käyttävät malleja ennusteiden apuna, mutteivat pohjaa ennusteitaan yksistään näihin. Tällaisten ennusteiden, kuten kaikkien asiantuntija-arvioihin perustuvien ennusteiden, suuri heikkous on kuitenkin luotettavan ennustejakauman muodostamisen vaikeus. Piste-ennuste on vain ennustejakauman huippu ja kertoo valtavan paljon vähemmän kuin koko ennustejakauma.

Ratkaistaksemme ongelman ja muodostaaksemme uskottavan ennustejakauman myös asiantuntija-arvioihin perustuville ennusteille tarvitsemme tarpeeksi joustavan mallin ja kourallisen uskottavia oletuksia. Tähän tarkoitukseen olemme käyttäneet eräänlaista versiota taloustieteessä nykyään etenkin ennustetarkoituksiin laajalti käytetystä BVAR-mallista (eng. Bayesian vector autoregressive model). Poiketen tyypillisestä BVAR-mallista, teemme kuitenkin vain hyvin heikkoja oletuksia koskien mallin virhetermien ja näin ollen myös itse ennusteen jakaumaa. Teknisesti ottaen sallimme virhetermien olevan hyvinkin vinoja ja paksuhäntäisiä. Tyypillinen BVAR-malli olettaa virhetermien seuraavan normaalijakaumaa, mikä ei mahdollista makrotaloudellisten muuttujien tapauksessa uskottavaa ennustejakaumaa.

Muodostaaksemme ennustejakauman asiantuntija-arvioilla rikastetulle ennusteelle, eli lopulliselle ennusteelle, oletamme edellä mainitun mallin virhetermin koostuvan kahden termin summasta, joista toisen tulevat arvot ovat asiantuntijan tiedossa ennusteen laatimishetkellä. Tästä toisesta termistä muodostuu BVAR-mallin ennusteen ja lopullisen ennusteen ero. Näin muodostetun ennustejakauman huippu kuvaa piste-ennustetta, ja jos asiantuntija-arviot tekevät ennusteesta tarkempia (kuten toivoa sopii), on ennustejakauman hajonta (siis ennuste-epävarmuus) myös pienempää kuin puhtaasti BVAR-mallin tuottaman ennustejakauman tapauksessa.

Ennuste-epävarmuus, eli ennustejakauman hajonta, ei ole kuitenkaan yhtä suurta jokaisella ajanhetkellä. Tyypillisesti suurten yllätysten jälkeen epävarmuus myös tulevasta on suurempaa. Mallissamme suurten ennustevirheiden jälkeen myös tulevat ennustevirheet ovat todennäköisemmin tavallista suurempia. Tässä on hyvä huomata, että termin ennustevirhe käyttö voi johtaa helposti väärinkäsitykseen, sillä sana virhe ei tässä viittaa minkään sortin epäonnistumiseen vaan piste-ennusteen ja toteutuneen arvon erotukseen, jonka jakaumaa ennustejakauma edustaa. Kuvio 1 esittää mallimme arvion Suomen bruttokansantuotteen ennustevirheen volatiliteetille, jonka voi tulkita yhdenlaisena mittana ennusteen epävarmuudelle. Kuten arvata saattaa, on ennuste-epävarmuus kuvan viimeisillä neljänneksillä koronakriisin takia huomattavasti tavallista suurempaa.

Kuvio 2 esittää Suomen bruttokansantuotteen kehityksen neljännesvuositasolla vuodesta 2005 vuoden 2020 viimeiseen neljännekseen sekä Etlan suhdanne-ennusteen ennustejakauman vuoden 2022 loppuun. Kuvassa vaaleimman punainen alue kattaa 90 prosenttia ennustejakaumasta, toiseksi vaalein 80 prosenttia, kolmanneksi vaalein 70 prosenttia ja niin edelleen.

Ensi näkemällä ennustejakauma voi näyttää hyvin laajalta ja epävarmuus toivottoman suurelta, mistä syystä ennustejakauman oikea tulkinta on äärimmäisen tärkeää. Ensinnäkin on ymmärrettävä, että kuvan esittämässä 90 prosentissa ei ole mitään erityistä. Nostamalla tuon luvun lähes sataan prosenttiin, voisi väritetty alue ulottua nollasta lähes äärettömiin. Tällainen kuva ei kuitenkaan olisi millään tapaa informatiivinen, eivätkä todennäköisyysarviot paljon 90 prosenttia kauempana piste-ennusteesta ole välttämättä muutenkaan merkityksellisiä, sillä ennustejakauman muodon (tai tiheyden) tarkka arviointi ennustejakauman hännissä ei ole mahdollista olemassa olevaan hyvin rajalliseen datamäärään pohjaten.

Karkeasti ottaen, ennustejakauman ulottuessa kahden vuoden päähän ja väritetyn alueen kattaessa 90 prosenttia ennustejakaumasta voisi väritetyn alueen reunat tulkita niin, että toteutunut bruttokansantuote on tätä kauempana piste-ennusteesta noin kerran kymmenestä kerrasta tai vaihtoehtoisesti kerran kahdessakymmenessä vuodessa. Jälkimmäisen tulkinnan kanssa on kuitenkin oltava tarkkana, sillä kuten mainittua, vallitseva ennuste-epävarmuus on juuri nyt paljon tyypillistä suurempaa. Huomaa myös, että mitkä tahansa arvot väritetyn alueen ulkopuolella ovat mahdollisia niiden kokonaistodennäköisyyden ollessa arviomme mukaan 10 prosenttia, mutta siitä kuinka todennäköisiä tai epätodennäköisiä erilaiset skenaariot tuolla alueella suhteessa toisiinsa ovat, emme voi sanoa juuri mitään.

Vaihtoehtoisesti olisimme totta kai voineet esittää kuvassa esimerkiksi vain 50 prosenttia (tai bayesiläisessä kirjallisuudessa usein käytetyn 68 prosenttia) ennustejakauman massasta, jolloin ensivaikutelma ennusteen epävarmuudesta olisi ollut aivan toinen. Valitsemamme 90 prosenttia johtaa kuitenkin informatiivisempaan kuvaan. Joka tapauksessa, kuvion 2 kaltaisen kuvan tulkinta vaatii tarkkaavaisuutta, sillä kyseisen prosenttiluvun avulla voidaan luoda hyvin erilaisia ensivaikutelmia.

Kuvio 2 esittää ennusteen bruttokansantuotteen tasolle neljännesvuositasolla, mutta suhdanne-ennusteiden yhteydessä puhutaan usein makrotaloudellisten muuttujien vuosikasvuvauhdista. Kuvio 3 esittääkin ennustejakauman bruttokansantuotteen vuosikasvuvauhdille vuonna 2021. Sama ennuste voidaan siis esittää monella tapaa, ja useampi esitystapa sisältää mahdollisesti enemmän informaatiota ja luo paremman kokonaiskuvan ennusteesta. Esimerkiksi kuvio 3 ei ole johdettavissa kuvion 2 sisältämästä informaatiosta, eikä toisinpäin.

Kuvioon 3 on piste-ennusteen lisäksi merkitty ennustejakauman kertymäfunktion arvoja. Esimerkiksi todennäköisyys sille, että bkt:n vuosikasvuvauhti jää alle -2,5 prosentin on noin 5 prosenttia. Toisaalta vuosikasvuvauhti on jakauman mukaan positiivinen 85 prosentin todennäköisyydellä (100 %–15 %).

Kuvaajan pylväät kattavat kukin yhden prosenttiyksikön mittaisen alueen, ja pystyakselin arvot on ilmoitettu niin sanottuina todennäköisyystiheyksinä. Siispä esimerkiksi todennäköisyys sille, että vuosikasvuvauhdin toteutunut arvo osuu korkeudeltaan 0,15 yksikköä korkean pylvään sisään, on 15 prosenttia. Konkreettisempana esimerkkinä voimme sanoa, että todennäköisyys alle prosenttiyksikön ennustevirheelle on tällä hetkellä vain noin 30 prosenttia (15 %+15 %). Kuten tästäkin luvusta ilmenee, vallitseva ennuste-epävarmuus on juuri nyt poikkeuksellisen suurta.

Ennustejakauman muodostaminen on usein hyvin haastavaa, mistä syystä ennusteiden yhteydessä puhutaan tyypillisesti vain piste-ennusteista, jotka yleensä edustavat ennusteen laatijan käsitystä (mahdollisesti muuten tuntemattoman) ennustejakauman huipusta. Tästä huolimatta jokainen ennuste on todennäköisyysarvio, ja todennäköisyydet ovat aina riippuvaisia käytetyistä menetelmistä ja saatavilla olevasta informaatiosta. Tässä artikkelissa esitetyt todennäköisyysarviot on muodostettu kaiken kirjoitushetkellä saatavilla olevan informaation perusteella käyttäen kirjoitushetkellä parhaiksi nähtyjä saatavilla olevia menetelmiä. Siispä ne edustavat vain yhtä näkemystä parhaasta mahdollisesta todennäköisyysarviosta.

Jetro Anttonen

Jetro Anttonen

Tutkija, VTK
Alue: makrotaloudellinen ennustaminen