Wiarygodność i spójność w psychometrii

Kiedy nazywamy kogoś lub coś wiarygodnego, mamy na myśli, że są konsekwentni i niezawodni. Wiarygodność jest również ważnym elementem dobrego testu psychologicznego. W końcu test nie byłby zbyt cenny, gdyby był niespójny i za każdym razem dawał inne wyniki. W jaki sposób psychologowie definiują niezawodność? Jaki ma wpływ na testy psychologiczne?

Niezawodność odnosi się do spójności środka. Test jest uważany za wiarygodny, jeśli wielokrotnie otrzymujemy ten sam wynik. Na przykład, jeśli test jest przeznaczony do mierzenia cechy (takiej jak introwersja ), to za każdym razem, gdy test jest podawany osobnikowi, wyniki powinny być w przybliżeniu takie same. Niestety nie da się dokładnie obliczyć wiarygodności, ale można ją oszacować na wiele różnych sposobów.

Test-Retest Niezawodność

Rzetelność testu-retestu jest miarą spójności testu lub oceny psychologicznej. Ten rodzaj niezawodności służy do określania spójności testu w czasie. Rzetelność testu i retestu najlepiej sprawdza się w przypadku rzeczy stabilnych w czasie, takich jak inteligencja .

Rzetelność testu-retestu mierzona jest przez dwukrotne podanie testu w dwóch różnych punktach czasowych. Ten typ niezawodności zakłada, że ​​nie będzie żadnych zmian w jakości lub konstrukcie, które będą mierzone.

W większości przypadków niezawodność będzie większa, gdy minie trochę czasu między testami.

Metoda test-powtórz to tylko jeden ze sposobów, które można wykorzystać do określenia wiarygodności pomiaru. Inne techniki, które można zastosować, obejmują niezawodność między-rater, wewnętrzną spójność i niezawodność form równoległych.

Ważne jest, aby pamiętać, że wiarygodność test-retest odnosi się tylko do spójności testu, niekoniecznie do trafności wyników.

Niezawodność między raterami

Ten rodzaj wiarygodności ocenia się, oceniając dwóch lub więcej niezależnych sędziów. Wyniki są następnie porównywane w celu określenia spójności ocen oceniających.

Jednym ze sposobów sprawdzenia niezawodności między raterami jest, aby każdy rater przydzielił każdemu testowanemu punktowi ocenę. Na przykład każdy z graczy może zdobyć punkty w skali od 1 do 10. Następnie obliczysz korelację między dwiema ocenami, aby określić poziom wiarygodności między raterami.

Innym sposobem sprawdzenia wiarygodności między raterami jest, aby oceniający określili, do której kategorii należy każda obserwacja, a następnie obliczają procent porozumienia między osobami oceniającymi. Tak więc, jeśli oceniający zgadzają się z 8 na 10 razy, test ma współczynnik niezawodności równy 80%.

Równoległa niezawodność form

Równoległość form jest porównywana przez porównanie dwóch różnych testów, które zostały utworzone przy użyciu tej samej treści. Osiąga się to poprzez utworzenie dużej puli elementów testowych, które mierzą tę samą jakość, a następnie losowo dzielą elementy na dwa osobne testy. Te dwa testy powinny być następnie podawane tym samym osobom w tym samym czasie.

Niezawodność wewnętrzna spójności

Ta forma wiarygodności służy do oceny spójności wyników w odniesieniu do pozycji w tym samym teście. Zasadniczo porównujesz elementy testowe, które mierzą ten sam konstrukt, aby określić wewnętrzną spójność testów. Gdy zobaczysz pytanie, które wydaje się bardzo podobne do innego pytania testowego, może to oznaczać, że te dwa pytania są używane do oceny wiarygodności. Ponieważ oba pytania są podobne i mają na celu pomiar tej samej rzeczy, osoba testująca powinna odpowiadać na oba pytania tak samo, co wskazywałoby, że test ma wewnętrzną spójność.

Czynniki, które mogą wpływać na niezawodność

Istnieje wiele różnych czynników, które mogą mieć wpływ na wiarygodność danego środka.

Po pierwsze i być może najbardziej oczywiste, ważne jest, aby mierzone rzeczy były dość stabilne i spójne. Jeśli mierzona zmienna jest czymś, co zmienia się regularnie, wyniki testu nie będą spójne.

Aspekty sytuacji testowej również mogą mieć wpływ na niezawodność. Na przykład, jeśli test jest przeprowadzany w pomieszczeniu, które jest bardzo gorące, respondenci mogą być rozproszeni i nie mogą ukończyć testu najlepiej jak potrafią. Może to mieć wpływ na wiarygodność środka. Inne rzeczy, takie jak zmęczenie, stres, choroba, motywacja, kiepskie instrukcje i zakłócenia środowiska mogą również zaszkodzić niezawodności.

Niezawodność a ważność

Ważne jest, aby pamiętać, że tylko dlatego, że test jest wiarygodny, nie oznacza to, że jest on ważny. Ważność odnosi się do tego, czy test rzeczywiście mierzy to, co twierdzi, że mierzy. Pomyśl o wiarygodności jako miary dokładności i trafności jako miary dokładności. W niektórych przypadkach test może być wiarygodny, ale niepoprawny. Na przykład wyobraź sobie, że kandydaci do pracy biorą udział w teście, aby ustalić, czy posiadają określoną cechę osobowości . Chociaż test może dawać spójne wyniki, może nie mierzyć cechy, którą chce mierzyć.