Am publicat aici un set de date care mie imi pare a fi foarte interesant si totodata o premiera. Este primul dataset provenit dintr-o baza de date ce contine date personale asupra carora am aplicat o tehnica de anonimizare.
Am plecat de la aplicatia de crotaliere a ANSVSA, acele numere care se infig in urechile animalelor si care asigura trasabilitatea si subventionarea acestora. Vorbim de vaci, oi, capre si porci, pentru toate acestea si pentru fiecare localitate din Romania avem numarul total de capete precum si distributia in localitate. Mai exact sunt numarate gospodariile care contin un anumit interval de numar de animale. Spre exemplu numar gospodarii cu 1-2 porci, numar gospodarii cu 3-5 porci, etc. Folosirea intervalelor este necesara atat pentru considerente practice, daca am avea cate o colana pentru un singur numar de capete pe gospodarie am avea foarte multe coloane cu multe valori de zero, cat si pentru anonimizarea datelor.
Vom avea avea in curand un set de date GIS care vor defini pe harta limitele administrative ale localitatilor. Astfel vom putea asocia marimii localitatii si naturii reliefului acesteia natura activitatilor zootehnice private din aceasta. Ar putea iesi niste idei interesante .... daca nu sunt cumva prea increzator in gradul de interes si profesionalism in activitatile de data journalism sau studii de marketing.
Niciun comentariu:
Trimiteți un comentariu