Koje su vrste validacije? Šta je to? Odgovore na ova i druga pitanja naći ćete u članku. Valjanost je inherentno jedinstvena karakteristika koja uključuje, s jedne strane, podatke o tome da li je tehnologija pogodna za mjerenje onoga za šta je razvijena, as druge strane, kolika je njena efektivnost, praktična korisnost, efikasnost. Provjera valjanosti tehnologije naziva se validacija. U nastavku ćemo to detaljnije razmotriti.
Pregledi
Mnogi ljudi pitaju: "Šta je validacija?" Kaže se da rafinirani um nema granica. Čini se da se metodolozi takmiče jedni s drugima u tome ko će otkriti ili izmisliti više vrsta i tipova valjanosti. Koja se samo imena ne pojavljuju u posljednje vrijeme! Ispostavilo se da postoji:
- vanjska i interna valjanost;
- konvergentno;
- diskriminantno;
- očito;
- faktorski;
- prediktivno;
- konstruktivno;
- criterial;
- značajno i tako dalje.
Ne postoji način da se razume, a još više da se razumno razlikuje jedna varijacija od druge. Zbrka u definicijama i klasifikacijama dovodi do toga da različiti autori istom obliku valjanosti pripisuju potpuno različite načine poboljšanja.
Spoljni kriterijumi
Za pragmatičnu validaciju metodologije, odnosno za procjenu njenog praktičnog značaja, efektivnosti, efikasnosti, obično se koristi eksterni nezavisan kriterij - pokazatelj pokazivanja kvaliteta koji se proučava u svakodnevnom životu. Takav kriterijum može biti i proizvodna postignuća (za tehnologije profesionalne orijentacije), i akademski učinak (za testove inteligencije, postignuća ili sposobnosti učenja), i efektivnost stvarnih aktivnosti - modeliranje, crtanje i tako dalje (za testove posebne vještine), lične procjene (za provjeru identiteta).
Vrste kriterijuma eksterne validacije su sledeće:
- mjere učinka (ovo mogu uključivati kao što je količina obavljenog posla, vrijeme provedeno na obuci, akademski učinak, stopa rasta kvalifikacija i slično);
- fiziološki znakovi (koriste se prilikom proučavanja uticaja okoline i drugih situacionih varijabli na ljudsku psihu i tijelo);
- mjere se krvni pritisak, puls, simptomi umora, električni otpor kože i tako daljesljedeći;
- subjektivne mjere (uključuju različite vrste odgovora koji odražavaju nečiji stav prema nekome ili nečemu, njegove stavove, mišljenja, preferencije; po pravilu se takve mjere dobijaju upitnicima, upitnicima, intervjuima);
- znakovi nesreća (koristi se kada se svrha studije tiče, na primjer, problema odabira za posao ljudi koji su manje skloni nezgodama).
Empirijska validnost. O čemu se radi?
Malo ljudi zna šta je empirijska validacija. U slučaju valjanosti sadržaja, test ocjenjuju stručnjaci (utvrđivanje usklađenosti testnih zadataka sa sadržajem objekta mjerenja). A empirijski se uvijek mjeri pomoću statističke korelacije: izračunava se korelacija dvije vrste vrijednosti - rezultati testa i indeksi za eksterni parametar odabran kao kriterij pouzdanosti.
Konstruktivno
Ne znaju svi vrste metoda validacije. Šta je konstruktivna valjanost? Ima veze sa samom teoretskom konstrukcijom i sastoji se od traženja faktora koji objašnjavaju ponašanje performansi testa.
Kao specifičan tip, konstruktivna valjanost je legitimirana u članku Mil i Cronbach (1955). Koristeći ovaj oblik validnosti, autori su evaluirali sva test istraživanja koja nisu bila direktno usmjerena na predviđanje nekih značajnih kriterija. Istraživanje je sadržavalo informacije o psihološkim konstrukcijama.
Valjanje sadržaja
Još uvijekpitate: "Validacija - šta je to." Razmotrite valjanost sadržaja. Zahteva da svaki problem, pitanje ili zadatak koji pripada datoj oblasti ima identične šanse da postane test stavka.
Valjadnost sadržaja procjenjuje prikladnost testnog entiteta za mjereno područje ponašanja. Provjere koje su kreirale dvije grupe programera provode se na uzorku onih koji se provjeravaju. Pouzdanost testova se izračunava podjelom pitanja u dvije zone, što rezultira indeksom valjanosti sadržaja.
Predictive
Nastavljamo razmatrati metode validacije. Prediktivna valjanost se takođe utvrđuje eksternim, prilično pouzdanim kriterijumom. Ali informacije o njemu se prikupljaju neko vrijeme nakon verifikacije.
Spoljno merilo je obično zanimanje pojedinca, prikazano u bilo kojoj proceni, za vrstu zanimanja za koje je izabran na osnovu rezultata dijagnostičkih testova.
Iako je ova metoda najpogodnija za zadatak dijagnostičkih alata - predviđanje budućeg uspjeha, vrlo ju je teško primijeniti. Preciznost prognoze je obrnuto ovisna o vremenu koje je određeno za takvo predviđanje. Što više vremena prođe nakon mjerenja, više faktora treba uzeti u obzir prilikom procjene prediktivne vrijednosti tehnologije. Međutim, gotovo je nemoguće uzeti u obzir sve faktore koji utiču na predviđanje.
Retrospektiva
Slažem se, validacija je vrlo zamršen proces. Poznato je da se retrospektivna valjanost otkriva na osnovu kriterijuma,odražava stanje nekog kvaliteta ili događaja u prošlosti. Može se koristiti za trenutno dobijanje prediktivnih izvora tehnologije. Dakle, da bi se revidirao stepen u kojem dobri rezultati testa vještina odgovaraju brzom učenju, može se uporediti prethodna mišljenja stručnjaka, procjene učinka i tako dalje kod pojedinaca sa niskim i visokim dijagnostičkim indeksima u ovom trenutku.
Diskriminantno i konvergentno
Vrste validacije su od interesa za mnoge. Hajde da saznamo šta su diskriminantna i konvergentna validnost. Strategija uvođenja utvrđenih zadataka u test zavisi od toga kako psiholog otkriva dijagnostički konstrukt. Ako Eysenck kvalitet "neuroticizma" definira kao nezavisan od introverzije-ekstroverzije, onda to znači da njegov upitnik treba podjednako predstavljati pozicije koje će odobriti neurotični ekstroverti i introverti..
Ako se u praksi pokaže da će u zadatku prevladati stavke iz kvadranta "introverzija-neuroticizam", onda sa pozicije Eysenckove teorije to znači da je indikator "neuroticizam" opterećen nebitnim indikatorom - "introverzija". Identičan efekat se javlja kada postoji pristranost u uzorku - ako u njemu ima više neurotičnih introverta nego istih ekstraverta.
Da bi izbjegli takve složenosti, psiholozi su spremni da se bave empirijskim stavkama koje informišu samo o jednom faktoru. Ali u stvarnosti ovaj zahtjev nikada nije ispunjen: ispada da svaki empirijski indeks nije određensamo faktorom koji nam je potreban, ali i drugim - nebitnim za problem mjerenja.
Dakle, za faktore koji su konceptualno definisani kao ortogonalni u odnosu na izmjereni (koji se javljaju kod njega u svim kombinacijama), kreator testa je u obavezi da pri odabiru stavki koristi strategiju neautentičnog balansiranja.
Korespondencija bodova sa izmjerenim indikatorom garantuje konvergentnu validnost testa. Konzistentnost stavki u odnosu na irelevantne izvore daje diskriminatornu valjanost. Empirijski se manifestuje u odsustvu značajne korelacije sa testom, koji meri konceptualno jedinstvenu kvalitetu.
Ket alata
U općem skupu metoda validacije, autori obično uključuju:
- neformalizirano (od jednostavnih trikova za pažljivo pregledavanje liste alternativa u upitniku do sofisticiranijih procedura za teorijsku analizu korak po korak);
- formalizirani, koji uključuju procedure i tehnologije matematičke statistike: testiranje statističkih hipoteza, izračunavanje procjena, korelacijske analize, konstrukcija intervala povjerenja, procjena odnosa između varijabli, disperzija, faktorijalna, regresijska i strukturna analiza, itd. on.
Kreiranje alata
A ipak, šta je validacija? Sofisticirane alate za validaciju prvi su kreirali psiholozi. Davne 1959. godine D. Fiske i D. Campbell (SAD) razvili su posebnu tehniku. Dobila je potpuno prirodan za engleski, ali neprevodiv nanaš jezik, naziv: multi-method-multi-prokleta matrica (MTMM). Ova matrica je bila tabela korelacija. Sastojao se od dva vrlo atraktivna izuma, od kojih je jedan bio namijenjen otkrivanju konvergentne istine, a drugi diskriminatornoj istini.
Njegovi autori su tvrdili da svako može dokazati internu prihvatljivost ako:
- vrijednosti između kojih se pretpostavlja visok nivo teorijske veze naći će identičan nivo u empirijskom (konvergencija);
- vrijednosti koje su teoretski nepovezane će se pokazati kao nepovezane empirijski nakon izvršenja testa (diskriminacija).
Ugrubo govoreći, konvergentna valjanost treba da kaže da postoji mnogo više sličnosti između dva tima zaposlenih, na primer, građevinskih radnika i radnika na montažnoj traci, u smislu šansi na tržištu rada nego između vlasnika i zaposlenih. Ako se teoretski predviđeni odnos pronađe empirijski, vaš uzorak je validan.
Diskriminantna valjanost pokazuje stepen identifikacije različitih pojava. Da uzmemo isti primjer tržišta rada, očekivalo bi se da dobro formirana teorija svojim sredstvima može razlikovati mogućnosti vlasnika i zaposlenih na tržištu rada. Ne možete ih zbuniti, a vaša teorija ih može razlikovati.
Ako ste kreirali skalu koja mjeri matematičke sposobnosti, onda bi u slučaju valjanosti konvergentnih indeksa matematičkih talenata trebalo dobro korelirati s općim vještinama osobe, ako je na teoretskom nivou takav odnosima, i to loše - sa estetskim sposobnostima koje od osobe zahtijevaju potpuno drugačije talente od vještina brojanja, ako, naravno, vaša teorija proklamuje nisku korelaciju.
Vrste
Validacija je proces podešavanja, poboljšanja kreiranih psihodijagnostičkih metoda. Njegov osnovni zadatak je osigurati da tehnologija dijagnosticira upravo ono što je programeru potrebno. Pravi se razlika između teorijske i pragmatične validacije.
Za prvi tip, kardinalni problem je odnos između mentalnih pojava i njihovih indeksa, uz pomoć kojih se te pojave pokušavaju spoznati. To pokazuje da su rezultati metodologije i apstraktna namjera autora isti.
Da bi se ustanovila apstraktna valjanost, veoma je teško pronaći bilo koji nezavisni kriterijum koji je izvan metodologije. U istoriji psihodijagnostike u ranim fazama, dakle, oslanjanje je bilo na instinktivni koncept koji test meri:
- Metoda se smatrala valjanom ako je jednostavno "očigledna".
- Dokaz valjanosti bio je zasnovan na vjerovanju kopača da njegova tehnologija može "razumjeti ispitanika".
- Šema se smatrala validnom samo zato što je teorija iza tehnologije bila "prilično dobra".
Dalje je počela potraga za dokazima opravdanim naukom. Ovdje treba napomenuti da je neprimjetno nagomilavanje arsenala tehnologija sa već potkrijepljenim i poznatimvaljanost. Ako psihodijagnostičar kreira šemu za procjenu kvaliteta i zna se da su druge, važeće tehnologije usmjerene na istu procjenu, onda možete proučavati korelaciju, upoređivati rezultate prema tuđoj i vlastitoj metodi.
Ako je koeficijent korelacije previsok, onda generisana šema ima impresivnu apstraktnu validnost. Ako ste u nedoumici šta tačno tehnologija vrednuje, uporedite rezultate za nju sa rezultatima za nečije važeće šeme koje prepoznaju susedna (sumnjiva) svojstva. Ako se korelacijske vrijednosti pokažu neočekivano velike, može se zaključiti da metoda ne procjenjuje ono što se očekivalo.
Dakle, ako već postoje druge šeme koje imaju za cilj mjerenje potpuno istih normi ili srodnih, možemo odrediti diskriminantnu i konvergentnu valjanost.
Njanse
Dakle, šta je validacija? Jednostavnim riječima, ovo je revizija proizvoda kako bi se vidjelo koliko odgovara deklariranim karakteristikama. Odnosno, nijedna validacija pametnog telefona neće proći do tada. Sve dok se kupci ne uvjere da ima kameru i skladište za koje su spremni platiti.
Kriterij validacije je mjera mentalnog kvaliteta koja je nezavisna i direktna od testa koji se validira, a na koji je usmjerena psihodijagnostička shema.
Trenutna valjanost - karakteristika testa, koja odražava njegovu sposobnost da razlikuje subjekte na osnovu dijagnostičke karakteristike koja je predmet proučavanja u ovommetod.
Konkurentska valjanost se procjenjuje korelacijom kreiranog testa sa drugim, čija se valjanost u odnosu na mjereni parametar utvrđuje. Diferencijalna valjanost se može objasniti na primjeru testova interesa.