Rahvaloenduse andmete tõlgendamisest

Rahvaloenduse andmete tõlgendamisest
13 minutit

sirp2_loendus

Ääremaade tühjenemine

Kui valglinnastumine on elanike jaoks põhiliselt positiivne protsess, mis küll tekitab teatavaid taristuga seotud probleeme kohalikele omavalitsustele, siis teise probleemi – ääremaade tühjenemise suhtes on ilmselt arvamused vastakad. Tähelepanuväärne on see, et väga jämedates joontes võib öelda, et inimesed liiguvad üldiselt tõmbekeskuste poole – peale Tallinna, mis on kõige jõulisem keskus, toimib Lõuna-Eestis tõmbekeskusena Tartu. Piirkonnad, mis on tõmbekeskustest kaugemal, tühjenevad (see seletab nähtavasti mingil määral ka Kesk-Eesti, sh Järvamaa tühjenemist), kuid kõigis maakondades tühjenevad üldiselt kõige enam maakonna äärealad, kusjuures sama suundumus ilmneb ka paljudes valdades – elanikke kaotavad kõige enam valdade äärealade külad. On avaldatud arvamust, et tegemist on protsessiga, mis parandab inimeste elukvaliteeti, kuid mille mõju riigile tervikuna on negatiivne. Karta on, et kõigil juhtudel pole maalt lahkumine ka inimeste jaoks üheselt positiivne, sest väga paljud hindavad kõrgelt võimalust elada maal looduselähedases keskkonnas ning keskustesse või isegi välismaale kolimine on pigem sundkäik, mida ajendab töökohtade puudus, aga ka teeninduse kokkukuivamine ja mitterahuldavad transpordivõimalused.

Pruudi- ja peiuprobleem

Linna ja maa elanikkonna erineva struktuuriga on seotud ka nn pruudi- või peigmeheprobleemid, kusjuures needki pole tekkinud viimastel aastatel, küll aga on viimasel ajal märgatavalt süvenenud. Linnades on noori naisi olnud meestest rohkem juba pikkade aastakümnete vältel, maal on aga noorema ja keskealise elanikkonna hulgas ülekaal olnud meeste poolel. Seda on tinginud töökohtade paiknemine ja aastakümnete jooksul süvendanud Eesti naiste meestest märksa kõrgem haritus. Olgu märgitud, et see pole siiski Eesti eripära, samasugune on meeste ja naiste hariduse vahekord ka meie lähinaabrite, lätlaste ja soomlaste juures. Haritumad inimesed on aga liikuvamad ja nii lahkuvadki noored naised mitte üksnes kodukülast, vaid ka kodulinnast ja kodumaaltki. Siit tuleneb valitsejatele ja otsustajatele mõtlemise ülesanne: mis võiks olla rakendatav meede noorte naiste koju kutsumiseks? Kindlasti on üks selliseid teid tõhusalt toimiv perepoliitika. Praegugi näitavad andmed, et teatav hulk väikelastega naisi (peresid) tuleb Eestisse, kus nad saavad vanemahüvitist.

Tühjad külad

Võrdlemisi suurt elevust on ühiskonnas tekitanud see tõsiasi, et Eestis on üle saja elaniketa küla. See pole siiski uus nähtus – elaniketa külasid on Eestis olnud kõigi rahvaloenduste ajal. Eelmise rahvaloenduse ajal oli niisuguseid külasid 80. Külade seas, kus ei ole alalisi elanikke, on väikesaarte külad (nt Koipsi, Rammu, Rohusi, Hobulaiu jne), kaitseväe polügooni läheduses paiknevad külad (Koitjärve ja Kolgu) ning mõned muudki külad, kus elatakse peamiselt suveperioodil. See, et Eestis on väikese elanike arvuga külasid, pole uus nähtus – väikekülasid on, eriti Lõuna-Eesti kuplite vahel olnud alati. Suurim külade tühjenemise ja kadumise aeg oli 50–60 aastat tagasi. Tänapäeva probleem on aga see, kuidas säilitada elu hõreasustusega piirkondades nende inimeste jaoks, kes seal elada soovivad.

Mõningatest kahtlustustest

Veel ühest küsimusest, mis statistikutele muret valmistab. Kuigi enamik loendusandmete põhjal ilmunud artikleid on asjalikud ja suhtuvad statistikasse positiivselt, on niihästi trüki- kui ka sotsiaalmeedias ilmunud mõningaid kahtlustavaid artikleid – kas avaldatud andmed on ikka õiged? Võib-olla on statistikud teinud vigu või muutnud andmeid poliitikutele meelepärasemaks?

Demokraatlikus ühiskonnas on igal inimesel õigus oma arvamust avaldada, kusjuures mõnikord võib arvamus tugineda ka arusaamatusele. Igal juhul on statistikute ülesanne esitatud küsimustele põhjalikult ja üldarusaadavalt vastata. Eriti oluline on see sel korral, kui jutt käib niivõrd olulisest asjast nagu rahvaloenduse andmete õigsus ja usaldusväärsus. Käsitleme alljärgnevalt kolme viimasel ajal tõstatatud teemat, mis on tekitanud mõningaid küsimusi. Need on:
 miks on rahvaloenduse andmetel Eestis nii vähe ettevõtjaid?
 kas mõned rahvaloendusel avaldatud andmed on moonutatud, ja kui, siis mis­pärast?
 miks on mõnes linnas/vallas loenduse andmetel inimesi vähem, kui seda võib lugeda nt Vikipeediast?

Enamasti tulenevad rahvaloenduse andmete tõlgendamisega seotud probleemid loendusandmete kogumise või ka esitamise nõuete teatavast eripärast. Päris kindlasti ei ole statistikud andmeid muutnud kellegi poliitilise soovi kohaselt.

Kuhu on kadunud ettevõtjad?

Üks tõstatatud probleeme on seotud ettevõtjate, sh eriti palgatöötajatega ettevõtjate arvu vähesusega. Mõneski vallas võib selguda, et tegutsevaid ettevõtteid on rohkem kui rahvaloenduse andmed ettevõtjate arvu näitavad. Ja see ongi põhjustanud küsimuse: kuhu on ettevõtjad rahvaloenduse andmestikust kadunud? Kas on tegemist loendusveaga või varjatakse ettevõtjate arvu sihipäraselt?

Siiski pole kumbki oletus õige. Loendustulemused näitavad täpselt seda, kui paljud inimesed ise end ettevõtjana loendasid. Vastuolu põhjuseks ongi see, et osa ettevõtjaid ei märkinud loendusel ennast ettevõtjaks. Ja seda tehes ei rikkunud nad ühtegi seadust. Põhjuseks on siin asjaolu, et rahvaloendusel ei saa ükski inimene end märkida ühekorraga kahel toolil istuvaks.

Elus tuleb paljudel meist olla ühekorraga mitmes rollis – pensionärid võivad samaaegselt olla FIEd või töötada, tudengid õppimise kõrval teha tööd, palgatöölised olla samaaegselt ettevõtjad jne. Rahvaloendusel aga peab inimene enese jaoks valima ühe, tema hinnangul kõige tähtsama „tooli”, s.t sotsiaal-majandusliku seisundi. Kui ta on samaaegselt palgatööline ja õppur, märgib ta enese ootuspäraselt töötajaks. Samuti on valikuvõimalus töötaval pensionäril, palgatöötajal-ettevõtjal jne. Teist (või ka kolmandat-neljandat) sotsiaal-majanduslikku seisundit rahvaloendusel ei registreerita. Nii on rahvusvaheliselt kokku lepitud, sest vastasel korral läheks võimalike seisundikombinatsioonide loetelu ülemäära pikaks ja keerukaks.

Kuidas märgib oma seisundi vallavanem, kes juhib ka väikefirmat? Sotsioloogilised uuringud näitavad, et valikuvõimaluse korral valitakse pigem see seisund, mis vastajale tundub prestiižikamana. See tähendab enamikul juhtudest palgatöötaja seisundi valimist. Oletatavasti hindab suurem osa Eesti vallavanematest oma ametiposti nii väärikaks, et märgib loenduselehele oma ametiks vallavanema ja seega on ta palgatööline, mitte ettevõtja. Samuti võib oletada, et kooliõpetaja või mõni muu riigiametis olev palgaline märgib enese staatuseks palgatööline ja jätab märkimata tegevuse oma erafirmas. Kuigi palgatööjõu pidamise halvustamine, ja veelgi enam, selle eest karistamine on Eestis kauge minevik, võib arvata, et ka tänapäeval ei tõtta kõik inimesed teatama seda, et nad oma kaaskodanikele tööd ja leiba võimaldavad. Siit järeldubki, et ettevõtjaid võib mõnes omavalitsuses olla tegelikult rohkem, kui seda näitab rahvaloendus. Rahvaloendus näitab ainult nende ettevõtjate arvu, kes ise peavad ettevõtlust oma tähtsaimaks tegevuseks, mitte kõrvaltegevuseks palgatöö kõrval.

Samal põhjusel võib kohalik omavalitsus leida, et loendusel leitud pensionäride arv on väiksem, kui oodatud. Põhjuseks on siin see, et töötavad pensionärid on ennast töötajana loendanud. Samuti võib oodatust väiksem olla loendatud õppurite arv, sest osa neist töötab ja selletõttu on nende sotsiaal-majanduslik seisund „palgatöötaja”.

Kas statistikaamet muudab andmeid sihipäraselt?

Enne sellele küsimusele vastamist tuleb selgitada mõningaid tänapäeva andmekaitse seisukohti. Andmeturbe küsimustele pööratakse väga suurt tähelepanu. Kogu loenduse ja andmetöötluse protsessi vältel jälgiti, et ükski kõrvaline isik, ka mitte statistikaameti töötaja, ei saaks ühegi loendatud isiku kohta teada teda identifitseerivaid tunnuseid ja ankeediandmeid. Sama printsiipi tuleb järgida ka andmete avaldamisel, kusjuures lisaks otsesele identifitseerimisele inimese nime ja tema isikukoodi kaudu peab olema välistatud ka tema kaudne identifitseerimine. See tähendab, et ka avaldatavatest tabelitest ei tohi olla võimalik välja lugeda mõne isiku ankeediandmeid.

Kuna tabelites esitatakse andmed summeeritud kujul, pole enamasti võimalik neist üksikinimeste kohta midagi välja lugeda. Eriolukord tekib aga siis, kui tegemist on tunnustega, mille puhul tabeli lahtritesse võib sattuda väga vähe objekte, nii et objektide arv (sagedus) on 1 või 2. Sagedused 1 ja 2 on lubatud vaid tabelites, mis sisaldavad ainult sugu, vanust ja elukohta, kuid mitte teisi inimest iseloomustavaid tunnuseid (ankeedivastuseid). Ülejäänud juhtudel tuleb, vastavalt rahvusvahelistele reeglitele, tabelid moodustada nii, et neis arve 1 ja 2 ei sisalduks.

See on statistikute jaoks väga tõsine nõue. Eestis on aga hulk külasid, kus loendusmomendil elas alaliselt vaid üks-kaks inimest. Kui avaldada asulate kaupa inimeste rahvus, religioon, tervislik seisund ja muud andmed, siis on kõigil inimestel, kes teavad, et Kapa-Kohilas elab tädi Maali üksinda, selged ka tema loendusel märgitud isikuandmed. Niisugust asja ei tohi aga juhtuda, seda keelavad rahvusvahelised reeglid ja ka statistikute kutse-eetika. Siin on kohane meenutada turvareegleid lennuki pardale astumisel – halbade kavatsustega inimesi on reisijate hulgas tühine protsent, kuid vältimaks nende poolt põhjustatavat ohtu (mis võib olla katastroofiliselt suur) rakendatakse turvakontrolli kõigile reisijatele.

Mida siis teha tabelitega, kus esineb väikesi, kuid nullist erinevaid sagedusi? Kõige lihtsam lahendus oleks jätta tabel avaldamata. Vaevalt et selline lahendus vallajuhte ja ametnikke rahuldaks.

Teine võimalus oleks asendada numbrid 1 ja 2 tabelites mingi sümboliga. Ka see viis on suhteliselt sageli rakendatav, kuid sellelgi on oma puudused – tabelist ei saa kõrvaldada ainult ühte arvu, sest seda on võimalik tabeli ülejäänud arvude järgi välja rehkendada. Näiteks kui vallas elab kuus tatarlast, viis meest ja üks naine, siis ainult tatari naiste kohta käiva lahtri asendamine punktidega oleks mõttetu. Selleks et tundlik info (vallas elab üks tatarlanna) oleks varjatud, tuleks punktidega asendada rohkem lahtreid ja mõningate keerukamate tabelite puhul läheks kaotsi ülemäära palju teavet.

Eesti Statistikaametis valiti andmete konfidentsiaalsuse tagamiseks nn juhitud ümardamise meetod, mida kasutatakse ka mitmes teises Euroopa riigis. Selle meetodi sisuks on, et tabelites olevad arvud (sagedused) ümardatakse kolmega jaguvaks. See tähendab, et lahtrisse, kus originaalselt on arv 2, kirjutatakse 3 ja lahtrisse, kus on 1, kirjutatakse 0. Asendatakse ka suuremad arvud, näiteks 47 ja 49 asemele kirjutatakse 48 jne.

See tähendab tegelike sageduste teatavat moonutamist, kuid selle meetodi eeliseks on, et algtabelis muudetakse arve võimalikult vähe – vaid ühe ühiku võrra üles- või allapoole. Siinjuures on need muudatused omavahel tasakaalus, nii et keskmiselt on kõik tabelites esitatud summad õiged. Tõsi, on võimalik, et erinevates sama valla kohta käivates tabelites on mõni sama sisuga summa erinev. Kuid sisuliste järelduste tegemist see asjaolu siiski ei häiri – niisugused ümardamisvead on keskmiselt palju väiksemad kui kõikvõimalikud juhuslikud vead, mille põhjuseks on mõne vastaja koostööst keeldumine või loendaja eksitus.

Andmete ümardamist konfidentsiaalsuse tagamise eesmärgil ei kasutata kõikides tabelites, vaid ainult nendes tabelites, kus
 elukoht on märgitud kohaliku omavalitsuse täpsusega ja omavalitsuse elanike arv on väiksem kui 2000 inimest;
 isikud on jaotatud viieaastastesse vanuserühmadesse.

Ümardamisele kuuluvad tabelisse lisatavad täiendavate näitajate (sotsiaal-majanduslik seisund, haridus, rahvus jne) sagedused. Alati, kui tabelitele on ümardamist rakendatud, märgitakse seda ka tabeli juures.

Miks on loenduse andmetel meie linnas/vallas nii vähe inimesi?

Rahvaarvu kohta annavad eri allikad erinevaid andmeid. Selles mõttes pole Eesti olukord erandlik – riigid, kus on arenenud statistikasüsteem ja mitu registrit, on see peaaegu paratamatu, sest andmebaasides on tegemist eri andmeallikate, definitsioonide ja eesmärkidega.

Näitena vaatame kolme juhuslikult valitud valla – need on Lääne-Virumaa Kadrina, Laekvere ja Rakke vald – rahvaarvu kolme kõige tuntuma allika järgi. Need on Vikipeedia, statistikaameti veebilehel (www.stat.ee) olev „Piirkondlik portree Eestist” ja 2011. aasta rahvaloenduse andmed. Kõik andmed vastavad peaaegu samale ajahetkele – kas 31.12.2011 või 1.01.2012.

sirp2_loendusvallad

Vikipeedia andmed pärinevad ilmselt rahvastikuregistrist ja näitavad kõige suuremat rahvaarvu. See ongi ootuspärane, sest rahvastikuregistri andmetel elaski 1.01.2012 Eestis u 47 000 inimest rohkem, kui seda näitas statistikaameti rännet arvestav statistika, mis on aluseks piirkondliku portree andmetele. Selle põhjuseks on tõsiasi, et rahvastikuregistri andmed on dokumendipõhised ja selletõttu ei ole sellest registrist kustutatud isikuid, kes on Eestist registreerimata lahkunud. Neid on aga RR paarikümne tegevusaasta jooksul kogunenud üsna palju. Piirkondliku portree puhul on tegemist jooksva statistikaga, mis tugineb eelmisele rahvaloendusele (2000. aastal) ja mida on registreeritud rände arvel parandatud. See arv on täpsem kui rahvastikuregistri arv, sest selles arvus ei sisaldu inimesed, kes lahkusid Eestist enne eelmist loendust. Samuti ei kajasta see arv (nagu ka rahvastikuregistri arv) viimastel aastatel toimunud registreerimata rännet, sh siserännet. Rahvaloenduse (REL2011) puhul loendati inimesi nende alalistes elukohtades, arvestamata seda, kuhu nad sel hetkel olid registreeritud. Selletõttu on need andmed põhimõtteliselt kõige täpsemad, kuid kahjuks jäi u 2% inimestest mitmesugustel põhjustel, peamiselt inimeste endi vähese aktiivsuse tõttu, loendamata. Selletõttu on Eesti tegelik rahvaarv loendustulemusest ligemale 2% võrra suurem ja edaspidi võetakse seda ilmselt arvesse ka rahvastikustatistikas.

Üldiselt on loendustulemused võrdlemisi hästi kooskõlas statistikaameti rännet arvestava rahvaarvuga. Kui võrrelda lisatud tabelis kaht viimast veergu, selgub, et Kadrina vallas loendati inimesi rohkem, kui seda näitas jooksev statistika – ilmselt on põhjuseks sellesse valda elama asunud endised Rakvere elanikud (kes ei ole ametlikult end selle valla elanikuks registreerinud), sest suund asuda elama linna lähedale maale ei iseloomusta üksnes suuri linnu, vaid ka Rakvere-sarnaseid väiksemaid (Eesti mõistes keskmise suurusega) linnu. Laekvere vallas näitab loendus seevastu väiksemat elanike arvu, kui näitas jooksev statistika. Selle põhjuseks on nähtavasti elanike lahkumine, kusjuures loendusest me vahetult ei näe, kuhu need inimesed on läinud. Rakke vallas on aga kaks viimast arvu üsna lähedased, mis ongi pigem tüüpiline.

Seega, kui mingis linnas või vallas elas loenduseandmetel vähem inimesi, kui oodatud või loodetud, siis võib sellel olla kaks põhjust. Üks võimalus: inimesed on sealt lahkunud, kuid pole oma lahkumist ametlikult registreerinud. Niisuguseid inimesi võib tihti leida selle linna või valla lähiümbrusest, kuid nad võivad ol
la lahkunud ka kaugemale, sh välismaale. Teine võimalus on, et mingi osa selle linna või valla elanikest jäi loendamata. Niisuguseid inimesi võib olla elanike arvust keskmiselt 2%. Kindlasti on üks loendamata jäämise põhjusi nende inimeste vähene koostöövalmidus, mis on aga pigem erandlik, sest üldiselt iseloomustas 2011. aasta loendust inimeste väga positiivne suhtumine loendusse ja aktiivne osalus.

Mõne omavalitsuse soovitus – registreerige end siia elama! – on teretulnud üksnes sel juhul, kui see on adresseeritud inimestele, kes selles omavalitsuses tegelikult elavad. Kui aga hüvede pakkumise toel soovitatakse inimesi registreerida end elukohta, kus nad püsivalt ei ela, süvendab see vaid segadust rahvastiku paiknemise statistikas.

Asjakohane on siin märkida, et rahvaloenduse andmetest on seni publitseeritud vaid väike osa ja järk-järgult ilmuvad statistika andmebaasi uued tabelid, mida ka pressiteadetes kommenteeritakse ning mille kohta loodetavasti ajakirjanduses ilmub täiendavaid analüüse.

Jaga

Samal teemal

Jaga
Sirp