Mayntz R., Holm K., Hűbner P., Wprowadzenie do metod socjologii empirycznej (1)
March 4, 2017 | Author: kadanors | Category: N/A
Short Description
Download Mayntz R., Holm K., Hűbner P., Wprowadzenie do metod socjologii empirycznej (1)...
Description
Mayntz R., Holm K., Hűbner P., Wprowadzenie do metod socjologii empirycznej, Warszawa 1985
Operctcjonalizacja pojęć .............................................................................11 4. Problem trafności i rzetelności ................................................................17 5. Formułowanie pytań socjologicznych.....................................................19 1. Formalne własności danych ....................................................................30 2. Zasady dokonywania pomiaru ................................................................36 3. Różne poziomy pomiaru .........................................................................38 Wskaźnik ....................................................................................................40 5. Indeksy ....................................................................................................45 1. Skala jako narzędzie pomiaru .................................................................50 1. Co to jest próba i do czego służy ............................................................77 2. Próba losowa ...........................................................................................79 Metody obserwacji ....................................................................................101 Wywiad socjologiczny ..............................................................................121 3. Budowa kwestionariusza ......................................................................133 Socjometria ...............................................................................................146 Analiza treści ............................................................................................154 Eksperyment .............................................................................................176 Opracowanie i analiza danych ..................................................................203
Niektóre metodologiczne założenia empirycznych badań społecznych 1. Pojęcia iv badaniach społecznych Pojęcie a przedmiot. Naukowiec ma do czynienia nie z „rzeczywistością samą w sobie", lecz z pewnym zbiorem doświadczeń mniej lub bardziej celowo organizowanych przez pojęcia. Jego kontakt z przedmiotem nie ma charakteru bezpośredniego i bezrefleksyjnego; nazywając go i tym samym porządkując pojęciowo — uczony postrzega przedmiot myślowo i z dystansu. Uwalnia go to równocześnie od przymusu bezpośredniego spontanicznego reagowania na bodźce otoczenia i daje swobodę myślenia. Posługiwanie się językiem,-a tym samym pojęciami, ma znaczenie, rzecz jasna, nie tylko dla naukowca, jednak dla procesu poznania naukowego to pojęciowe pośrednictwo między podmiotem a przedmiotem doświadczenia jest conditio sine cjua non. Pojęcie jest to opisana za pomocą określonego słowa (lub zestawu słów) treść wyobrażenia. Pojęcie więc nigdy — co może brzmieć jak tautologia — nie jest tożsame ze zjawiskami, których dotyczy wyobrażenie. Dlatego też samo pojęcie nie może być podstawą do orzekania, co jest rzeczywistością. Przyjęcie pojęcia „grupa" czy „zbiorowość" za podstawę konstatacji, czym grupa jest, oznaczałoby milczące utożsamienie pojęcia z rzeczywistością realną. Analiza pojęcia może co najwyżej pomóc uściślić, jakie zjawiska czy fakty mamy na myśli używając odnośnego słowa. Pojęcia nie stanowią także czegoś w rodzaju fotograficznej odbitki zjawisk rzeczywistości. Porządkujemy nasze doświadczenia za pomocą pojęć, ale porządek ten nie odzwierciedla wprost struktury rzeczywistości obiektywnej. Różnice między tym, co „organiczne", i tym, co „nieorganiczne", czy między „ciałem" a „duszą" są to przykłady schematów pojęcio-
Metodologiczne założenia empirycznych badań^Colecznych
12
wych, z których niedoskonałości współczesny uczony zdaje sobie sprawę. Zasada prostej relacji między pojęciem a przedmiotem jest nie do przyjęcia choc;ażby dlatego, że nasze postrzeganie przedmiotów czy faktów jest z konieczności niepełne. Przyczyną są nic tylko granice, w jakich poruszać się może ludzkie doświadczenie, lecz także selektywność uwagi kierująca naszym postrzeganiem w obrębie tego, co jest temu postrzeganiu dostępne. Co więcej, selektywność postrzegania rzeczywistości i postępująca za tym selektywność pojęć nie ma charakteru przypadkowego, lecz — najogólniej rzecz biorąc —■ uwarunkowana jest przez zainteresowanie czy interes. Postrzegamy przede wszystkim to, co wydaje się nam z jakichś względów ważne lub znaczące, i to następnie, jako istotna składowa treści wyobrażenia, staje się elementem pojęcia. Ponieważ wszelki sąd o względnej doniosłości różnych aspektów doświadczalnie poznawanego świata można uznać za sąd wartościujący, więc pojęcia, z racji swej wybiórczości, nacechowane są wartościujące Owego immanentnego związku z wartościami nie należy mylić z elementami specyiieznie wartościującymi, zawartymi w wiciu pojęciach obok elementów opisowych. Dotyczy to zwłaszcza pojęć, które odnoszą się do zjawisk społecznych. Wyrazistymi przykładami mogą tu być pojęcia takie, jak „morderstwo" czy „bohater", ale także „oświata", „wspólnota". (W odróżnieniu od nich — wyrażenia „grzech", „zły", „szpetny" itp. nie oceniają zjawisk, lecz symbolizują jedynie miary wartości służące do ich oceny). Istnieją, oczywiście, także pojęcia nacechowane wartościująco w stopniu nieznacznym lub zgoła nierozpoznawalnym (np. „wiek szkolny"). Ocena zawarta w pojęciu jest przy tym uwarunkowana kulturowe i ulega historycznym zmianom tak pod względem kierunku, jak siły; może być ona również różna w różnych grupach tego samego społeczeństwa, czego przykładem jest chociażby pojęcie „rewolucja" 1. Wartościujące elementy wielu pojęć dotyczących, zjawisk społecznych przy braku odpowiedniej ostrożności mogą stać się czynnikiem zakłócającym badanie. Nie chcemy przez to powiedzieć, że należy posługiwać się pojęciami 1
Opisany w rozdziale drugim dylercncjal semantyczny jest metoda pozwalającą ni. in. ujawniać wartościowanie zawarte implicite w pojęciu.
Pojęcia. Funkcje pojęć
13
neutralnymi ze względu na wartości. Neutralne ze względu na wartości pojęcia nie są warunkiem uzyskania wartościowych wyników badań, przeciwnie — pozytywna łub negatywna ocena zjawisk społecznych może być ważna dla formułowania społecznie istotnych pytań badawczych. Funkcje pojęć. Chcąc dokładniej określić rolę i znaczenie pojęć w badaniu zaczniemy od wyróżnienia ich czterech podstawowych funkcji. Pojęcia mogą porządkować postrzeganie (funkcja poznawcza lub porządkująca), oceniać spostrzeżenia (funkcja oceniająca), kierować działaniem jednostek (funkcja pragmatyczna lub praktyczna) oraz umożliwiać porozumiewanie się (funkcja komunikacyjna). Funkcji pragmatycznej pojęć nie będziemy tu rozważać. Oceniająca funkcja pojęć, jak już powiedzieliśmy, odgrywa rolę przy określaniu celów poznania naukowego, formułowaniu pytań badawczych i wyciąganiu wniosków z uzyskanych wyników. Zajmijmy się teraz dwiema pozostałymi funkcjami. W społecznych badaniach empirycznych pojęcia służą do ustalenia, co należy badać (funkcja porządkująca): „atmosferę w zakładzie pracy", „autorytarny styl kierowania", „ruchliwość społeczną" itd. W następnej kolejności umożliwiają one powiadomienie o wynikach badań (funkcja komunikacyjna), ewentualnie także ich sprawdzenie w powtórnych badaniach. Aby spełniać te funkcje, pojęcia muszą odpowiadać trzem warunkom. Pierwszym jest trwała zgoda co do treści wyobrażeń, które wiąże się z określonymi słowami, inaczej mówiąc — nie może zdarzyć się, że ktoś przez „grupy" rozumie tylko chwilowe zgromadzenie kilkunastu osób w parku czy na ulicy, ktoś inny zaś tylko wielkie, zorganizowane struktury w rodzaju urzędu czy zakładu pracy. Wiąże się z tym ściśle drugi warunek: pojęcia muszą być precyzyjnie zdefiniowane, tzn. dokładnie należy ustalić ich zawartość znaczeniową. Jest to tym trudniejsze, im bardziej abstrakcyjne jest pojęcie lub im mniej wiąże się z zewnętrznym wyglądem przedmiotu. Istnieją np. różnice zdań co do tego, czy poczucie „my" albo przejawy współpracy wchodzą w zakres wyobrażenia „grupa". Wreszcie pojęcia użyte w badaniach empirycznych muszą mieć jakiś ekwiwalent empiryczny, tzn. muszą oznaczać coś, co dostępne jest doświadczeniu, obserwacji — przynajmniej za pośrednictwem wskaźników. Te trzy warunki można ująć
mmsm
14
Mstodoiogiczae założenia empirycznych badań społecznych
w jednym zdaniu: aby pojęcia użyte w badaniu empirycznym mogły spełnić funkcję porządkującą, muszą mieć uzgodnione i precyzyjnie zdefiniowane ekwiwalenty empiryczne. Treści pojęć: społeczne jednostki i cechy. Sformułowana wyżej zasada dotyczy pojęć nie formalno logicznych, lecz substancjalnych pojęć socjologicznych, tzn. pojęć, których używamy do oznaczenia obserwowałnych danych wchodzących w zakres przedmiotowy tej nauki. (Pojęcia logiczne, jak koniunkcja, alternatywa, negacja itp., nie należą do specyficznie przedmiotowych, toteż nie będziemy się tu nimi zajmować). Pojęcia substancjalne odnoszą się zarówno do jednostek społecznych, jak do ich cech. Jednostki społeczne, które mogą stać się przedmiotem badania (jednostkami badawczymi), to: 1) jednostki ludzkie traktowane jako istoty społeczne; 2) określone produkty działań ludzkich — materialne i niematerialne (np. idee, wartości, normy); 3) zbiorowości lub grupy społeczne — poczynając od małych i chwilowych ugrupowań, a kończąc na dużych i zorganizowanych zbiorowościach, ze społeczeństwami włącznie. Badane jednostki społeczne z reguły interesują badacza nie w całej ich złożoności, lecz z punktu widzenia określonej własności czy cechy. Człowieka jako produkt socjalizacji nikt nie bada „w całości", bada się np. jego stosunek do religii, jego przynależność klasową czy efekty pracy zawodowej. Również grupy społeczne bada się nie jako całości, lecz np. w aspekcie struktury komunikacyjnej, systemu wartości czy stopnia zhierarchizowania. Druga zasadnicza kategoria pojęć dotyczy więc właściwości lub cech (określenia te są zamienne). Oba rodzaje pojęć są ze sobą ściśle powiązane. Pojęcia określające cechy mają sens tylko o tyle, o ile odnoszą się do jednostek badawczych: badamy nie cechę „konformizm" czy „zintegrowanie", lecz konformistyczne zachowania osób (cechę jednostek ludzkich) lub stopień integracji społeczeństw (cechę grup). Kiedy indziej, posługując się szczegółowym opisem określonych cech, wyodrębniamy jednostki badawcze z ogółu możliwych przedmiotów obserwacji i tworzymy w ten sposób zbiory obiektów (kobiety, szpitale, społeczeństwa przemysłowe itd.). Pojęcia określające cechy można podzielić na kilka podkategorii.
^^ Pojęcia. Wymiar i konkretne wartości cechy
15
Nie siląc się na przedstawienie klasyfikacji wyczerpującej i w pełni rozłącznej możemy wymienić kilka kryteiiów podziału. Zacznijmy od cech jednostek ludzkich. Po pierwsze, jedne z nich określają, jaki człowiek jest (wiek, płeć, inteligencja, zadowolenie z czegoś) lub co czyni (emigruje, pracuje, wyjeżdża)2. Po drugie, istnieją cechy tak zwane zrelatywizowcuw, które charakteryzują jednostkę z uwagi na jej stosunek do innych jednostek: być przełożonym, przyjacielem, małżonkiem; bardziej procesualnie rzecz ujmując — należą do nich także określenia pewnych czynności: być komuś posłusznym, zawierać z kimś związek małżeński. I wreszcie, charakteryzując jednostkę z. uwagi na jej przynależność do określonej grupy (nie do abstrakcyjnej kategorii cech!) posługujemy się cechami kontekstowymi; przykładem jest określenie człowieka jako Francuza, hamburczyka, członka związku zawodowego czy studenta Wolnego Uniwersytetu w Berlinie. Analogicznie wyróżnić można także cechy grup, między nimi jednak występuje jeszcze inna ważna różnica. Istnieją mianowicie takie cechy grup, które są prostą wypadkową cech ich poszczególnych członków, oraz takie, które taką prostą wypadkową nic są. W pierwszym przypadku mówi się o cechach agregatywnych (lub analitycznych), należy do nich np. średni wiek uczniów danej klasy czy udział robotników wśród ogółu zatrudnionych w danym zakładzie pracy. Struktura władzy w społeczeństwie, stopień zbiurokratyzowania instytucji czy cel, ku któremu zmierza stowarzyszenie, nic dadzą się natomiast wyprowadzić bezpośrednio z cech poszczególnych członków społeczeństwa, instytucji, stowarzyszenia; w takim przypadku mówi się o cechach globalnych (lub integralnych). Wymiar cechy i konkretne wartości cechy. Użyte tu wyrażenie „wymiar cechy" wskazuje, że pojęcia określające własności charakteryzują nie konkretne zjawiska, lecz wymiary zjawisk. Ze względu na dany wymiar pojedynczy obiekt badawczy reprezentuje zatem s
Należą do nich także tzw. cechy dyspozycyjne, czyli skłonności, aby w określonych warunkach zachowywać się. zmieniać się czy, ogólnie mówiąc, reagować w określony sposób. Nie jest jednak pewne, czy jest to rzeczywiście szczególny rodzaj cech i czy nie chodzi tu po prostu o takie właściwości, których nie możemy bezpośrednio obserwować, ale o których istnieniu możemy wnioskować na podstawie określonych obserwowalnych przejawów.
a»
34
Metodologiczne założenia empirycznych badań społecznych
3) realizacja bada''1: zbieranie materiału; 4) opracowanie materiału: przygotowanie i analiza danych, próba odpowiedzi na pytania badawcze; 5) wnioski teoretyczne: ustalenie zakresu ważności twierdzeń wynikających z badan, ewentualnie ich generalizacja oraz konfrontacja z istniejącą teorią. Zdarza się, oczywiście, że na którymś z późniejszych etapów trzeba powrócić raz jeszcze do jakiegoś etapu wcześniejszego, żeby coś uzupełnić lub zmodyfikować, ale tym nic będziemy się tu zajmować. To, co wymaga w tym momencie podkreślenia, to zasada, iż każde badanie musi poprzedzać pojęciowa struktura! izacja przedmiotu i sformułowanie pytań badawczych, choć nic ulega również wątpliwości, że dobre przygotowanie teoretyczne nie wystarcza do osiągnięcia liczących się wyników. Potencjał poznawczy istotnych pytań badawczych może zostać roztrwoniony na którymś z następnych etapów procesu badawczego. Wszelako przygotowanie teoretyczne jest tu conditio sine qua non: wyznacza ono pułap możliwych do osiągnięcia efektów poznawczych. Nie można przy tym wykluczać nagłego olśnienia, niespodziewanego odkrycia czegoś, czego w ogóle się nie szukało. Dobry badacz zawsze jest na to przygotowany, ale też nie oczekuje, że najcenniejszy owoc jego pracy wpadnie mu sam do ręki jako nieprzewidziany „produkt uboczny". Geneza pytań badawczych. Zwrotu „pytania badawcze" nie należy rozumieć zbyt dosłownie, chodzi bowiem nie tylko o pojedyncze pytania czy hipotezy, ale także o weryfikację złożonych modeli wzajemnych zależności. Czy istnieją jakieś reguły decydujące o tym, że postawione pytanie będzie pytaniem istotnym? Odpowiedź zależy od wyjściowego nastawienia metodologicznego. W myśl założeń teorii analitycznej •— badacz nie jest niczym skrępowany w stawianiu pytań, tzn. nie przedmiot jest tym, co niejako narzuca pytania badaczowi, lecz badacz, swobodnie je wybierając, „narzuca" pytania przedmiotowi swych badaii. Przy założeniu zasadniczej dowolności stawiania pytań decyduje o nich praktycznie zainteresowanie badacza lub jego zleceniodawcy. Zainteresowanie to mogą budzić luki jakiejś funkcjonującej już teorii bądź tezy, które wydają się w niej wątpliwe, albo dostrze-
Formułowanie pytań w socjologii. Geneza pytań
35
ganc problemy społeczne. W pierwszym przypadku badacz może chcieć np. zweryfikować moc obowiązującą twierdzeń Georga Simmla 0 związkach trzyosobowych lub zbadać warunki, w jakich „prawomocność" władzy, w znaczeniu teorii Maxa Webera, jest rzeczywiście akceptowana przez rządzonych i leży u podstaw ich uległości. Przykłady zagadnień badawczych, jakie podsuwają dostrzegane problemy społeczne, można mnożyć w nieskończoność: nierówność szans oświatowych, dyskryminacja rasowa, konflikt ról w sferze opieki społecznej, oligarchiczne tendencje w łonie wolnych zrzeszeń, zla atmosfera w zakładach pracy, radykalne ruchy prawicowe, ograniczona efektywność biurokratycznych form zarządzania, przestępczość młodzieży. We wszystkich tych przypadkach „problem" występuje w wąskim znaczeniu: oznacza jakiś stan niepożądany. W każdym z nich można też rozpoznać nastawienie wartościujące, decydujące o tym, że określone zjawisko społeczne uznane zostaje za „problem''. Praktyczne implikacje takich badań są mniej lub bardziej wyraźne, zależnie od tego, czy badacz koncentruje się raczej na objawach i ich przyczynach czy na możliwościach rozwiązania problemu, którego istnienie stwierdza. Badane zjawisko społeczne nie zawsze jednak musi być postrzegane jako „problem". Istnienie cech osobowości specyficznych dla warstw społecznych, przemiany elit, spontaniczne różnicowanie się ról w małych grupach rozwiązujących zadania, powstawanie norm grupowych czy zmiana funkcji rodziny, wszystko to są zagadnienia interesujące badaczy ze względów poznawczych nie związanych bezpośrednio z praktyką. W każdym razie nie są to „problemy społeczne" w sensie'takiego stanu rzeczy, który z punktu widzenia systemu wartości większych lub mniejszych grup społecznych oceniany jest jako zły. Należy tu zwrócić uwagę na trzy sprawy. Po pierwsze, przy tego rodzaju zagadnieniach badawczych odwołanie się do istniejąc3'ch teorii odgrywa zazwyczaj większą rolę niż przy takich zagadnieniach, które nasuwają się pod wpływem bezpośrednio postrzeganych problemów społecznych w wąskim znaczeniu. Po drugie, trudno zanegować istnienie pewnej quasi-abstrak-cyjnej ciekawości, chęci „poznania tajników tego, co sprawia, że świat jest taki, jaki jest", czyli, w naszym przypadku, istoty i charak3-
36
Metodologiczne założenia empirycznych badań społecznych
tern procesów społecznych, bytu i rozwoju społecznego. Po trzecie, są to jednak także w pewnym sensie „problemy społeczne", wynikające z chęci zapanowania nad rzeczywistością społeczną, którą najpierw trzeba poznać, aby uzyskać dane pozwalające działać w sposób celowy. Więź z praktyką może mieć charakter pośredni, kolejne zaś etapy rozumowania teoretycznego mogą spełniać rolę ogniw w jej nawiązywaniu. Jeżeli zabieg ten się nie uda, może to znaczyć, że pytanie ogólne było pytaniem trywialnym, że problem abstrakcyjny był problemem pozornym; przy tego rodzaju zagadnieniach badawczych niebezpieczeństwo takie rzeczywiście istnieje. Analogicznie do więzi z praktyką ma się rzecz z nastawieniem wartościującym: w przypadku charakteryzowanych tu zagadnień badawczych nastawienie to może uzewnętrzniać się mniej wyraźnie niż przy określaniu problemów społecznych w wąskim znaczeniu i dlatego łatwiej może umykać krytycznej ocenie, mimo to jednak — nawet wbrew woli i chęci — nastawienie takie istnieje, ponieważ bez odwołania się do wartości nic sposób postawić żadnych pytań. Sprawą zasadniczą w tym, co zostało wyżej powiedziane, jest to, że od badacza (lub jego zleceniodawcy) zależy, czy pytania badawcze będą ważne, znaczące. Dlatego też łatwo się co do ich ważności pomylić, zwłaszcza wówczas, gdy odrzuca się zasadę, że miara tej ważności zawarta jest w samym przedmiocie. Zasadę tę głosi dialektycznokrytyczna koncepcja nauki, zgodnie z którą o istotności stawianych pytań stanowi sam przedmiot, a zatem nie jest wszystko jedno, czego one będą dotyczyć. Wynika to z jednej strony z faktu, że za cel poznania naukowego przyjmuje się krytykę społeczeństwa, z drugiej zaś z założenia, że kryteria tej krytyki — wyobrażenie o tym, co powinno być — zawarte są obiektywnie w rzeczywistości społecznej. Bez względu na to, jaką formę treściową zechce się nadać tym kryteriom, czy będzie to cel, ku któremu zmierza prawidłowo rozwijający się proces historyczny, czy urzeczywistnienie prawdziwej natury człowieka, czy aspiracje jakiejś instytucji społecznej (np. partii demokratycznej), nigdy nie zależą one od subiektywnych decyzji badacza. Przy poszukiwaniu ważnych pytań badawczych kieruje się on niezmiennym, choć trzeba przyznać — często trudnym do skonkretyzowania założeniem, a zarazem ogólną zasadą metodo-
I^Bmutowanie pytań w socjologii. Opis i wyjaśnianie
37
logiczną: czy biorąc pod uwagę różnicę między tym, co społecznie istnieje, a tym, co istnieć powinno, historyczne przyczyny tych rozbieżności oraz realne szanse, można to, co jest, zmienić w pożądanym kierunku. Co prawda trzeba przyznać, że powyższa zasada często prowadzi w efekcie do takich samych pytań szczegółowych, jakie mogliby sformułować zwolennicy analitycznej teorii naukowej; różnica polega wówczas głównie na argumentach uzasadniających ważność pytania, jego bazie teoretycznej i roli, jaką mu się powierza w całościowo rozumianym procesie poznania naukowego. Badania opisowe i wyjaśniające. Dotychczas zastanawialiśmy się nad genezą i ważnością pytań badawczych. Zajmiemy się teraz ich formą. Zaczniemy od prostego rozróżnienia: jedne pytania badawcze dotyczą właściwości zjawisk społecznych, inne zależności między zjawiskami społecznymi. Badanie oparte na pytaniach pierwszego rodzaju nazywa się badaniem opisowym, oparte zaś na pytaniach drugiego rodzaju — badaniem wyjaśniającym. Zresztą bezpośredni wynik badań nie musi być celem ostatecznym. Wiadomo chociażby, że krytyczne konstatacje socjologii dialektyczno-krytycznej nie poddają się prostym podziałom na opisowe i wyjaśniające, często natomiast można je zakwalifikować jako konieczny etap przygotowawczy właściwych badań. Wynikiem badań opisowych jest opis i klasyfikacja zjawisk społecznych (wraz z ustaleniem częstości ich występowania). Przykładem pytań stawianych w tych badaniach mogą być następujące pytania: Jakie formy rodziny spotyka się dziś w Republice Federalnej i jak licznie każda z tych form jest reprezentowana? Jaki jest poziom zadowolenia z pracy robotników pracujących przy taśmie? Jakie wartości i normy charakterystyczne są dla subkultury zakładów karnych? Pytania stawiane w badaniach wyjaśniających dotyczą relacji, a więc np.: Jak wysokość płacy roboczej wpływa na zadowolenie z pracy? Czy decentralizacja uprawnień decyzyjnych zmniejsza czy zwiększa produktywność przedsiębiorstw ? Czy ustrój demokratyczny jest bardziej stabilny w społeczeństwach posiadających liczną klasę średnią? Oczywiście, relacje mogą obejmować kilka elementów: np. ostatnie z pytań może uwzględniać również wpływ rosnącego
38
Metodologiczne założenia empirycznych badań społecznych
średniego poziomu wykształcenia oraz poziomu życia na stabilność systemu demokracji. Możemy ponadto badać względną ważność tych różnych czynników. Te i tym podobne pytania można formułować także inaczej — nie jako pytania, lecz jako twierdzenia na temat możliwej lub oczekiwanej natury związku. Pytania zmieniają się wówczas w hipotezy. Twierdzenie: „Im wyższa płaca, tym większe zadowolenie z pracy" byłoby np. hipotezą dotyczącą relacji, do której odnosiło się pytanie pierwsze. W wyniku badania hipoteza zostaje albo potwierdzona (zweryfikowana) 5, albo odrzucona (sfal-syfikowana); niekiedy może zostać także zmodyfikowana, np. wówczas gdy spodziewana relacja wprawdzie występuje, ale tylko w pewnych określonych warunkach. Stwierdzone relacje pozwalają wyjaśniać lub przewidywać zjawiska w rodzaju względnego zadowolenia z pracy określonych grup pracowników lub chwiejności ustroju demokratycznego w określonym społeczeństwie — przynajmniej w tej mierze, w jakiej zależy to od czynników wyrażonych w hipotezie. Badaniom wyjaśniającym przyznaje się zazwyczaj wyższą rangę niż badaniom opisowym. W istocie czysty opis nie wystarcza ani nauce wyjaśniającej, ani teorii krytycznej. Jednakże opis jest często, jeśli nie zawsze, niezbędnym elementem procesów badawczych, których celem jest wyjaśnienie, a w miarę możliwości —■ także krytyczna ocena. Ponadto przeciwstawianie badań opisowych badaniom wyjaśniającym jest zdecydowanym upraszczaniem sprawy. Po pierwsze, nie są to badania wykluczające się na zasadzie albo — albo. Rzadko zdarza się, aby zamysł badawczy sprowadzał się wyłącznie do pytań jednego lub drugiego rodzaju. Po drugie, poza tymi dwoma modelami skrajnymi istnieją pośrednie lub uzupełniające typy badań, takie jak sondaże, służące budowaniu hipotez, studia diagnostyczne, mające na celu wyjaśnienie określonych zjawisk na gruncie hipotez już zweryfikowanych, czy wreszcie badania projektujące, służące konstruowaniu i doskonaleniu narzędzi badawczych. Szeroko zakrojone 5 Według współczesnej t eori i analitycznej, nie można mówić o jednoznacznej weryfikacji hipotezy, lecz jedynie o względnym jej potwierdzeniu; używamy tu słowa „weryfikacja" pamiętając o tym zastrzeżeniu. Patrz K. R. Popper: Logika odkrycia naukowego, tłum. z ang. U. Niklas, Warszawa 1977.
Formułowanie pytań w socjologii. Hipotezy badawcze
39
przedsięwzięcia badawcze mogą uwzględniać wszystkie wymienione typy badali równocześnie lub w pewnej kolejności. Różnice między badaniami opisowymi i wyjaśniającymi, związane ze sposobem stawiania pytań i rodzajem wyników, które chce się uzyskać, rzutują na tryb postępowania badawczego. Wszystkie metody eksperymentalne i quasi-eksperymentalne służą badaniom wyjaśniającym. To samo dotyczy opracowywania danych: w badaniu wyjaśniającym sporządza się zawsze tabele z wieloma zmiennymi (jeśli opracowanie wymaga sporządzenia tabel). Techniki zbierania danych są natomiast w obu przypadkach takie same, a narzędzia bez względu na typ badań muszą spełniać warunki trafności i rzetelności. Hipotezy bachrwcze. Określenia „hipoteza" używamy tu w wąskim' znaczeniu. W poprzednim ustępie zostało już powiedziane, że hipotezą jest zdanie stwierdzające spodziewaną relację między jakimiś zjawiskami. Jak z tego wynika, twierdzenie, że 48% robotników w Republice Federalnej jest niezbyt zadowolonych z pracy, nie jest hipotezą, ponieważ informuje ono po prostu, że określona klasa przedmiotów (robotnicy w Republice Federalnej) przejawia określoną cechę. Natomiast zdanie: zadowolenie z pracy robotników w Republice Federalnej rośnie wraz ze wzrostem płacy roboczej, stwierdza relację między dwiema zmiennymi, a zatem jest hipotezą. Hipoteza może, oczywiście, dotyczyć zależności między większą liczbą zmiennych, np. między płacą roboczą, czasem pracy i zadowoleniem z pracy. fPrzy czym jedną ze zmiennych, tę mianowicie, która w danym związku występuje jako domniemany czynnik warunkujący czy sprawczy, określa się jako zmienna^ niezależna^, zmienną zaś, która zmienia się pod jej wpływem —■ jako zmienną zależną\ Hipotezy formułowane specjalnie dla" celów badawczych muszą spełniać ponadto jeszcze inne warunki. Przecie wszystkim muszą być sprawdzalne empirycznie, tzn. wymienione w nich zmienne muszą być empirycznie uchwytne i mierzalne — przy zastosowaniu właściwych operacji. Co więcej, głoszona zależność nie może być związkiem niepowtarzalnym i przypadkowym, lecz musi mieć charakter prawidłowości, choć niekoniecznie bezwarunkowej. Zależność ta może występować tylko w ściśle określonych okolicznościach, ale w tych
40
Metodologiczne założenia empirycznych badań społecznych
okolicznościach musi stanowić regule. Hipoteza może wymieniać owe okoliczności, warunki konieczne, ustalenie zaś ich wpływu na wystąpienie zależności, o której mowa, może być jednym z celów badania. Jeżeli przypuszczamy, że dana relacja występuje tylko w określonych warunkach, ale nie potrafimy ich sprecyzować, wówczas hipoteza obarczona jest — wyrażonym lub nic wyrażonym — zastrzeżeniem ceteris pdribus: relacja obowiązuje „przy innych warunkach stałych". Uwarunkowania relacji oraz klasy przedmiotów, których ona dotyczy, stanowią łącznie zakres ważności hipotezy. Hipoteza musi być nie tylko sprawdzalna i nie tylko musi mówić o takich relacjach między zjawiskami, które mają charakter prawidłowości, musi mieć ona także moc wyjaśniającą, tzn. winna być pomocna przy wyjaśnianiu obserwowalnych zjawisk. Na przykład hipoteza mówiąca, że zadowolenie z pracy jest tym większe, im wyższa jest płaca i im krótszy jest czas pracy, pozwala wyjaśnić, dlaczego jakaś grupa robotników, których obowiązuje długi czas pracy i którzy otrzymują niską płacę, jest niezadowolona z pracy. Bez hipotezy wskazującej trwałą czy ogólną zależność między tymi trzema zmiennymi (nawet jeśli występuje ona tylko w pewnych okolicznościach, np. przy braku bezrobocia) można by wymienioną sytuację uznać za zbieg okoliczności, przypadkowe współwystąpienie braku zadowolenia z pracy, wydłużonego czasu pracy i niskiej płacy. Hipoteza ma moc wyjaśniającą zwłaszcza wówczas, gdy związek, o którym mówi, jest związkiem o charakterze przyczynowym. Moc wyjaśniająca hipotezy wzrasta, jeżeli postulowana w niej zależność da się ponadto uzasadnić teoretycznie jako konieczna. Pozostając przy naszym przykładzie, należałoby dysponować empirycznie zweryfikowaną teorią, która pozwoliłaby wyjaśnić, dlaczego mianowicie malejący czas pracy i rosnąca płaca zwiększają zadowolenie z pracy (w danych warunkach). Jeżeli wiele hipotez uznajemy za prawdopodobne także bez takiego uzasadnienia teoretycznego, to zazwyczaj dlatego, że w istocie wstępnie założyliśmy istnienie pewnej teorii wyjaśniającej dane zależności. Przy próbie teoretycznego uzasadnienia jakiejś hipotezy trzeba uważać, żeby jej przesłanek teoretycznych nie mylić z charakterystyką warunków koniecznych danej relacji. Pozostając w dalszym ciągu
Formułowanie pytań w socjologii. Hipotezy badawcze
41
przy naszym przykładzie: hipoteza sformułowana początkowo bez jakichkolwiek ograniczeń będzie bardziej prawdopodobna, jeżeli dodamy, że zależność, o której mowa, występuje wówczas, gdy brakuje osobistego zainteresowania pracą samą w sobie. Nie jest to jednak wyjaśnienie, lecz warunek ograniczający zakres ważności hipotezy. Chcąc ją natomiast wyjaśnić, należałoby powołać się, dajmy na to, na założenie teoretyczne, zgodnie z którym ludzie starają się osiągnąć pewien korzystny bilans osobistych kosztów i zysków, a następnie na założenie, że w sferze działalności zawodowej wykładnikiem tego bilansu jest zadowolenie z pracy: im korzystniejszy bilans, tym większe zadowolenie z pracy. Przy braku osobistego zainteresowania pracą wysiłek w nią włożony liczy się w owym bilansie osobistym po stronie kosztów, płaca natomiast po stronie zysków. Założenia te łącznie mogą wyjaśnić zależność sformułowaną w hipotezie: rosnące zadowolenie z pracy jest wyrazem osobistego bilansu, który przy braku zainteresowania samą pracą jest tym korzystniejszy, im wyższy jest zarobek, a mniejszy konieczny nakład czasu pracy. Związek, którego nie można udowodnić empirycznie (np. eksperymentalnie) jako zależności przyczynowej ani uzasadnić innymi empirycznie zweryfikowanymi twierdzeniami, pozostaje jedynie pewną korelacją empiryczną, współwystępowaniem cech w danym czasie i danym miejscu. Zawsze chętnie przytacza się tu przykład „korelacji" między liczbą urodzeń a liczbą bocianów żyjących w danej okolicy, dwiema cechami, między którymi można co najwyżej domniemywać istnienia jakiegoś nie wyjaśnionego związku przyczynowego. Należy zwrócić uwagę, że hipoteza nie musi dotyczyć relacji o charakterze przyczynowym, ale dla wyjaśnienia, które jest celem poznania, właśnie hipotezy przyczynowe mają największe znaczenie.
•
Rozdział drugi
Pomiar
Podstawy pomiaru 1. Formalne własności danych Jak każda nauka, tak i socjologia musi gromadzić poddającą się systematycznej kontroli wiedzę o tym, co stanowi przedmiot jej dociekań. Fundament, na którym opiera się wiedza socjologiczna, stanowią dane o cechach rzeczywistości społecznej, uzyskane i analizowane za pomocą określonych metod. Dane te są wynikiem uporządkowanych pojęciowo i ukierunkowanych przez założenia teoretyczne, systematycznych i kontrolowanych obserwacji zachowań lub własności.„zjawisk społecznych. Jednak ani same obserwacje, ani zaobserwowane własności nie stanowią jeszcze danych. Odpowiedzi respondenta na pytanie: „Czy interesuje się pan polityką?", podobnie jak faktu, że odpowiedź tę usłyszała osoba prowadząca wywiad, nie można uznać za dane. Dane to krzyżyki, którymi ankieter opatruje określone odpowiedzi w kwestionariuszu ankiety, krzyżyki sygnalizujące treści ujawnione w toku postępowania badawczego. Dane to nie jest kara cielesna, którą matka wymierza dziecku, ponieważ było nieposłuszne, ani fakt, że obserwator zachowanie to widział i odpowiednio zaklasyfikował. Również w tym przypadku z danymi mamy do czynienia dopiero wtedy, gdy zachowanie to zostanie odpowiednio zaznaczone w określonej rubryce na specjalnym arkuszu obserwacji zachowań rodzicielskich. Obserwowane właściwości zjawisk społecznych lub sposoby zachowań stają się więc danymi wówczas, gdy odpowiednio uporządkowane pojęciowo mogą być zarejestrowane, umożliwiając identyfikację i klasyfikację badanych obiektów według cech istotnych dla uzyskania odpowiedzi na pytania badawcze.
PółKiwy pomiaru. Formalne własności danych
43
Rys. 1 ukazuje miejsce danych w procesie badawczym. Z ogółu dostępnych obserwacji cech badanych obiektów wybiera się i porządkuje pojęciowo tylko te, które są istotne dla uzyskania odpowiedzi na postawione pytania (etap 1). Jeżeli np. w badaniu zachowań rodzicielskich chodzi jedynie o ustalenie częstotliwości stosowania kar, O nie ma potrzeby zajmować się rodzajem tych kar. etap 1 ogól dostępnych obserwacji cech obiektu badanego
etap 2 pojęciowo uporządkowane obserwacje cech zewnętrznych
etap 3 obserwacje zarejestrowane — dane
wniosek co do przynależności badanego obiektu do zbioru o określonych cechach
Rysunek 1. Miejsce danych w procesie badawczym
Oczywiste jest, że już na pierwszym etapie zarysowanego tu procesu uzyskiwania danych konieczne jest przyjęcie pewnych założeń teoretycznych, wstępnych w stosunku do danego postępowania badawczego. Zanim jakieś zachowanie rodziców będzie można zakwalifikować jako wymierzanie kary, trzeba mieć jasność, jakimi bezpośrednio obserwowalnymi (zewnętrznymi) cechami różni się zachowanie, które należy określić jako „karę", od innych zachowań rodziców względem dzieci. Obserwacje cech zewnętrznych, przeprowadzone stosownie do przyjętych kategorii pojęciowych, zarejestrowane w ściśle określonej, standaryzowanej formie, dostarczają danych o przedmiocie badania (etap 2). Podobnie jak na pierwszym etapie, tak i tym razem trzeba dokonać teoretycznie uzasadnionego wyboru owych form (narzędzi badawczych). Na podstawie uzyskanych w ten sposób danych można wnioskować o określonych wcześniej pojęciowo (ukrytych) własnościach przedmiotu badań (etap 3). Również realizacja tego etapu wymaga odwołania się do teorii, która umożliwi dokonanie analizy. Dopiero teraz można także badać związki zachodzące między danymi. Momentem zasadniczym jest tu fakt, że na każdym z etapów uzyskiwanie i analiza danych uzależnione są od teoretycznej koncepcji przedmiotu badań, a zarazem od teoretycznego podejścia do
44
Pomiar
rzeczywistości społecznej, a przede wszystkim, że same dane uzasadnione są tylko na gruncie określonego wnioskowania teoretycznego 1. Aczkolwiek różnym cechom socjologicznym odpowiadają różne rodzaje danych — wszystkie one mają identyczną strukturę formalną, która musi być brana pod uwagę przy gromadzeniu danych, a zwłaszcza przy ich analizie: 1. Dane empiryczne dotyczą jednostek badawczych (patrz s. 14). 2. Dane odnoszą się z reguły nie do jednostek badawczych ujmowanych całościowo, lecz tylko do niektórych spośród wiciu wymiarów, w jakich jednostki te dają się charakteryzować (patrz s. 15). Wymiary te występują w postaci zmiennych. Zmienne są po prostu symbolicznym odpowiednikiem cech mierzonych. 3. W toku postępowania badawczego ustala się wartość określonych cech jednostek badawczych. Każda zmienna może zatem przyjmować różne wartości. Terminem „zmienna" należałoby wobec tego posługiwać się tylko w odniesieniu do tych cech, które mogą przyjmować przynajmniej dwie wartości. Liczba możliwych wartości zmiennej zależy zarówno od metody gromadzenia danych, jak od złożoności kategorii pojęciowych. Wobec powyższego możemy powiedzieć, że dane są to ustalone w wyniku postępowania badawczego wartości cech jednostek badawczych, mówiąc po prostu — każdorazowo .określone wartości pewnej zmiennej. W ten sposób jednostki badawcze można opisywać bądź charakteryzować za pomocą poszczególnych wartości badanych zmiennych. Badając np. liczbę n osób należących do określonej grupy społecznej i biorąc pod uwagę ich przynależność społeczną, wiek, płeć, zainteresowania polityką i orientację polityczną uzyskane dane można przedstawić w postaci macierzy (tab. ł). V/C„2 oznacza wartość, jaką zmienna druga przyjmuje u //-tej osoby badanej, czyli konkretny wiek tej osoby. Z macierzy danych, ukazującej także wzajemne usytuowania jej elementów składowych — jednostki badanej, cechy i jej wartości — wynikają zarazem trzy 1
Por. N. R. Hanson: Patterns of Discovery, Cambridge, Mass. 1958, rozdz. 1.
45
Podstawy pomiaru. Formalne własności danych Tabela 1
Macierz danych Cecha
Jednostka przynależność społeczna
wiek
pleć zainteresowania polityką
JBX JB.
WCn
wcv
WCn W Ca,
JBj
wclx
wą« wcJ%
JB„
WC,n
wcai
badana
wc,x
we,.
wcM
orientacja polityczna
wcu wcu
wc» WC
wc}i
wcJt
wcM
a
wcm
JB = jednostka badana WC = wartość cechy
ważne zasady sposobu gromadzenia danych: (1) zasada porównywalności, (2) zasada klasyfrkowalności i (3) zasada kompletności. 1. Zasada porównywalności głosi, że (a) cechy umieszczone w macierzy danych muszą być rzeczywiście cechami jednostek badanych, w przeciwnym bowiem razie zdania sformułowane na podstawie danych z macierzy pozbawione będą sensu, tzn. empirycznie rzecz biorąc nie będą ani prawdziwe, ani fałszywe. Jeżeli jednostkami badawczymi są n.p. grupy społeczne, to cechą tych jednostek nie może być pleć; zdanie „grupa jest pici męskiej" nie jest ani prawdziwe, ani fałszywe — jest pozbawione sensu; (b) jednostki badawcze mogą być sensownie porównywane tylko pod względem jednej i tej samej cechy. Zdanie ,JBt jest płci męskiej, natomiast JB2 bardzo interesuje się polityką" nic zawiera żadnego wymiernego sensu. 2. Zasada klasyfikowalności wymaga, aby możliwe wartości każdej z cech stanowiły zbiory wyczerpujące, tak iżby każdej jednostce badawczej przypadało w każdym zbiorze tylko jedno określone miejsce.
44
Pomiar
rzeczywistości społecznej, a przede wszystkim, że same dane uzasadnione są tylko na gruncie określonego wnioskowania teoretycznego 1. Aczkolwiek różnym cechom socjologicznym odpowiadają różne rodzaje danych — wszystkie one mają identyczną strukturę formalną, która musi być brana pod uwagę przy gromadzeniu danych, a zwłaszcza przy ich analizie: 1. Dane empiryczne dotyczą jednostek badawczych (patrz s. 14). 2. Dane odnoszą się z reguły nie do jednostek badawczych ujmowanych całościowo, lecz tylko do niektórych spośród wielu wymiarów, w jakich jednostki te dają się charakteryzować (patrz s. 15). Wymiary te występują w postaci zmiennych. Zmienne są po prostu symbolicznym odpowiednikiem cech mierzonych. 3. W toku postępowania badawczego ustala się wartość określonych cech jednostek badawczych. Każda zmienna może zatem przyjmować różne wartości. Terminem „zmienna" należałoby wobec tego posługiwać się tylko w odniesieniu do tych cech, które mogą przyjmować przynajmniej dwie wartości. Liczba możliwych wartości zmiennej zależy zarówno od metody gromadzenia danych, jak od złożoności kategorii pojęciowych. Wobec powyższego możemy powiedzieć, że dane są to ustalone w wyniku postępowania badawczego wartości cech jednostek badawczych, mówiąc po prostu — każdorazowo .określone wartości pewnej zmiennej. W ten sposób jednostki badawcze można opisywać bądź charakteryzować za pomocą poszczególnych wartości badanych zmiennych. Badając np. liczbę n osób należących do określonej grupy społecznej i biorąc pod uwagę ich przynależność społeczną, wiek, płeć, zainteresowania polityką i orientację polityczną uzyskane dane można przedstawić w postaci macierzy (tab. 1). WC„2 oznacza wartość, jaką zmienna druga przyjmuje u H-tej osoby badanej, czyli konkretny wiek tej osoby. Z macierzy danych, ukazującej także wzajemne usytuowania jej elementów składowych — jednostki badanej, cechy i jej wartości — wynikają zarazem trzy 1
Por. N. R. Hanson: Patterns of Discovcry, Cambridge, Mass. 1958, rozdz. 1.
Podstawy pomiaru. Formalne własności danych
45 Tabela 1 Macierz danych
Jednostka badana
Cecha przynależność społeczna
JBy JB-,
wca
wiek
pleć
zainteresowania polityką
v \VC,„
wc
wc WC*n
WC, li'C,
orientacja polityczna WC,
wca
JBj
wcn
WCjt
wc1%
wcM
WCj,
JBn
wcm
v/c,a
wcn%
wcm
WCm
JB = jednostka badana WC = wartość cechy
ważne zasady sposobu gromadzenia danych.: (1) zasada porównywalności, (2) zasada klasyfikowalności i (3) zasada kompletności. 1. Zasada porównywalności głosi, że (a) cechy umieszczone w macierzy danych muszą być rzeczywiście cechami jednostek badanych, w przeciwnym bowiem razie zdania sformułowane na podstawie danych z macierzy pozbawione będą sensu, tzn. empirycznie rzecz biorąc nie będą ani prawdziwe, ani fałszywe. Jeżeli jednostkami badawczymi są n.p. grupy społeczne, to cechą tych jednostek nie może być pleć; zdanie „grupa jest pici męskiej" nie jest ani prawdziwe, ani fałszywe — jest pozbawione sensu; (b) jednostki badawcze mogą być sensownie porównywane tylko pod względem jednej i tej samej cechy. Zdanie „JBv jest pici męskiej, natomiast J B«, bardzo interesuje się polityką" nie zawiera żadnego wymiernego sensu. 2. Zasada klasyfikowalności wymaga, aby możliwe wartości każdej z cech stanowiły zbiory wyczerpujące, tak iżby każdej jednostce badawczej przypadało w każdym zbiorze tylko jedno określone miejsce.
46
Pomiar
3. Zasada kompletności nakłada obowiązek empirycznego ustalenia wartości wszystkich istotnych z punktu widzenia pytań badawczych cech wszystkich jednostek.
2. Zasady dokonywania pomiaru Jeżeli dane o jakimś zjawisku społecznym stanowią wynik pojęciowo ustrukturowanych, systematycznych i kontrolowanych obserwacji cech jednostek badawczych, to ów proces obserwacji jest równoznaczny z najogólniej pojętym dokonywaniem pomiarów, czyli uzyskiwaniem danych. Dane o obiektach badanych, uzyskane w wyniku pomiaru, mogą dostarczać informacji o tym: (1) jaka jest wartość jakiejś cechy jakiegoś obiektu badanego w danym momencie; (2) jakiej zmianie uległa wartość danej cechy w nie zmienionych warunkach; (3) jakiej zmianie uległa wartość danej cechy w warunkach, które zmieniły się w sposób znany. Każda z tych możliwości wymaga spełnienia następujących warunków wstępnych, bez których pomiar nie odpowiadałby koniecznym wymogom strukturalizacji pojęciowej i kontrolowalności. 1. Zbiór obiektów badawczych musi być określony tak jednoznacznie, aby w każdym przypadku można było rozstrzygnąć, czy określony obiekt należy do niego czy nie. Jeżeli przedmiotem badania mają być np. demokratyczne versus autorytarne postawy nauczycieli szkół powszechnych pochodzących z warstw średnich, to muszą być dokładnie podane kryteria wyróżniające nauczycieli szkół powszechnych wywodzących się z warstw średnich spośród reszty nauczycieli szkół powszechnych łub — szerzej biorąc — spośród ogółu nauczycieli. Warunek ten wydaje się oczywisty, można jtdnak wyobrazić sobie przypadki, w których zaliczenie obiektów do kategorii jednostek badawczych nic jest takie proste. Jeżeli np. badanie ma dotyczyć zachowań młodych konsumentów we współczesnym społeczeństwie przemysłowym, to nie tak łatwo jest rozstrzygnąć, jaki krąg osób należy do tej kategorii. 2. Warunki sytuacyjne towarzyszące pomiarom, jeśli badacz nie może nimi odpowiednio manipulować, muszą być znane na tyle,
Podstawy pomiaru. Zasady dokonywania pomiaru
47
aby można było kontrolować ich ewentualny wpływ na przebieg pomiarów. Sytuacja, w której przebiega badanie—jak to później omówimy bardziej szczegółowo (patrz przede wszystkim s. 147 i nast. oraz s. 125 i nast.) — oddziałuje na uzewnętrznianie się obserwowanych cech, np. na odpowiedzi respondentów czy sposób zachowania się osób obserwowanych. Niekontrolowana zmiana warunków, w których dokonywany jest pomiar, stawia pod znakiem zapytania porównywalność i rzetelność danych. Jeżeli warunków tych nie można ujednolicić, tak jak to się dzieje w przypadku eksperymentów, trzeba je wyraźnie uwzględnić w badaniu. 3. Należy dokładnie ustalić metody pomiaru i zbierania danych. Wówczas gdy chodzi o uzyskanie takich danych, które pozwolą wnioskować o własnościach niedostępnych bezpośredniej obserwacji, prawie zawsze istnieje możliwość posłużenia się kilkoma różnymi metodami pomiaru. Następnie — trzeba wyraźnie sprecyzować for malne zasady posługiwania się narzędziami, za pomocą których do konywany ma być pomiar, oraz ich standardy metryczne. Standardy te zależą od tego, z jaką dokładnością ustalane mają być wartości cech obiektów badanych. W przypadku jednych badań może całkowicie wystarczać informacja, że dochód jest wysoki lub niski, w innych natomiast trzeba wiedzieć dokładnie, że waha się on w granicach 300-350 lub 1000--1100 DM. 4. Cechę, której dotyczyć mają dane, należy zdefiniować, tak aby można było dokładnie podać, jakiego rodzaju obserwacje mają. być przeprowadzone za pomocą danego narzędzia. Wówczas, gdy dane mają informować o wartościach tej samej cechy w różnych momentach (jak to jest np. w badaniach panelowych), warunkiem dodatkowym jest ustalenie, jaki odstęp czasu winien dzielić jeden pomiar od drugiego. Wówczas gdy dane mają informować, czy i jak zmieniła się wartość cechy przy kontrolowanej zmianie warunków (jak to ma miejsce w eksperymentach), konieczne jest dokonanie pomiaru lub skontrolowanie także tych warunków. Efektem pomiaru, dokonanego za pomocą narzędzi nie spełniających wymienionych wymagań, są dane, których obiektywność jest w najwyższym stopniu wątpliwa. Tylko wówczas bowiem, gdy
48
Pomiar
znane są wszystkie warunki, w jakich dokonywany jest pomiar, można sprawdzić rzetelność i intersubiektywność danych, t:n. ich naukową obiektywność.
3. Różne poziomy pomiaru Zawartość informacyjna danych zależy m. in. od tego, na jakim poziomie dokonywany jest pomiar wartości cech obiektów badawczych. Poziomy te charakteryzują się szeregiem własności określających zarazem metody stosowane przy analizie danych. Pomiar w węższym znaczeniu oznacza podlegający określonym regułom proces przyporządkowywania symboli zaobserwowanym wartościom badanych cech. Stosownie do owych reguł można wyróżnić cztery poziomy pomiaru i odpowiadające im cztery skale: (1) skalę nominalną, (2) skalę porządkową, (3) skalę interwałową, (4) skalę iłorazową. Skala nominalna. Pomiar na poziomic nominalnym jest najprostszą formą pomiaru. Opiera się on na regułach dwuwartościowej logiki predykatów i polega na klasyfikowaniu obiektów ze względu na posiadanie lub brak określonej cechy (jakościowej). Zgodnie z tym, ludzi można dzielić na mężczyzn i kobiety, na osoby wyznania protestanckiego, katolickiego i mojżeszowego; społeczeństwa można dzielić na takie, które mają ustrój autorytarny i demokratyczny itd. Przy pomiarze nominalnym muszą być spełnione następujące warunki : 1. W odniesieniu do dwóch obiektów badanych musi być rozstrzygalne, czy ze względu na badaną cechę są one takie same czy nie. Możliwa jest tylko jedna z dwu sytuacji: A = B lub A ^ B. 2. Identyczność dwu obiektów badanych musi być relacją symetryczną; jeżeli obiekt A ma tę samą cechę badaną co obiekt B, to obiekt B ma te samą cechę badaną co obiekt A: jeżeli A = B, to B = A. 3. Jeżeli obiekt badany A ma tę samą wartość cechy co obiekt badany B, obiekt zaś B tę samą wartość cechy co obiekt C, to obiekt
Podstawy pomiaru. Poziomy pomiaru
49
A ma tę samą wartość cechy co obiekt C: jeżeli A = B i B = C, to /l - C. Cechy mierzone za pomocą skali nominalnej charakteryzują się tym, że ogól możliwych wartości tych cech stanowi zbiór nieuporządkowany. Między poszczególnymi kategoriami tych wartości nie da się żalem ustalić żadnych stosunków metrycznych. Dlatego przy analizie danych nominalnych możliwe są jedynie następujące operacje matematyczne: (1) obliczenie bezwzględnej i względnej częstotliwości występowania poszczególnych kategorii cech; (2) określenie relacji między dwiema cechami przy użyciu współczynnika zależności. Skala porządkowa. Reprezentuje ona wyższy od nominalnej poziom pomiaru. Pozwala na porządkowanie obiektów badanych odpowiednio do wartości danej cechy, ponieważ cecha ta ma charakter ilościowy. Ten poziom pomiaru uwzględnia natężenie, siłę i wielkość określonej cechy u poszczególnych obiektów badanych. Na przykład ludzi można porównywać pod względem siły lub słabości zainteresowali politycznych, tzn. można ich szeregować według rang. Porządkowanie obiektów badanych według rang wówczas, gdy szereg rangowy tworzą nie obiekty same w sobie, lecz wcześniej zdefiniowane pod-kategorie zmiennej, można uznać także za klasyfikację opartą na ilościowych miernikach badanej cechy. Aby jakąś cechę można było uznać za mierzalną na poziomie porządkowym, dane muszą spełniać następujące warunki: (1) Jeżeli obiekt A. pod względem danej cechy jest większy od obiektu B, to obiekt B pod względem tej samej cechy nie jest większy od obiektu A: jeżeli A>B, to B>A. (2) Jeżeli obiekt A jest większy od obiektu B, a obiekt B jest większy od obiektu C, to obiekt A jest większy od obiektu C: A>B i B>C, to także A>C. Liczby określające rangę są wartościami rangowymi lub liczbami porządkowymi. Określają one każdorazowo jedynie miejsce, jakie w danej hierarchii zajmuje badany obiekt, a nie absolutny wymiar ilościowy cechy, ze względu na którą obiekt ten nas interesuje. Pozwalają zatem stwierdzić tylko tyle, że obiekt A jest większy niż obiekt B, nie informują natomiast, o ile jest większy. Nie dają również podstaw do wypowiadania się o wielkości odstępów dzielących poszczególne miejsca w hierarchii. Ponieważ zaś odstępy te nie są znane, więc 4 — Wprowadzenie...
ar
liczb porządkowych me można także dodawać, odejmować, mnożyć ani dzielić. Skala interwciłowa i skala ilorazową. Różnica między skalą intcrwałową i skalą ilorazową polega na tym, że skala interwałowa informuje, jak wielkie są odstępy między poszczególnymi punktami. Warunkiem podstawowym jest tu istnienie powtarzalnej jednostki miary, którą można uznać za standard. Tak np. długość mierzy się w centymetrach i metrach, czas w minutach i godzinach. Trzeba przyznać, że opracowanie takiej jednostki miary w naukach społecznych jest bardzo trudne. Istnieją jednostki do mierzenia dochodu, czasu trwania lub częstotliwości pewnych zachowań, gorzej przedstawia się sprawa z mierzeniem siły postawy autorytarnej lub inteligencji grupy. Wówczas jednak, gdy jesteśmy w posiadaniu jednostki miary, możemy dokładnie określić odległość między dwoma punktami na skali. Oznacza to także, że na poziomie interwałowym możemy przeprowadzać operacje dodawania i odejmowania. Gdy skala ma ponadto naturalny punkt zerowy, mamy do czynienia ze skalą ilorazową. Wobec wartości skali ilorazowej uprawnione jest stosowanie wszystkich operacji matematycznych, a więc także mnożenia i dzielenia. Dla ustalenia relacji między dwiema cechami mierzonymi za pomocą skali interwałowej lub ilorazowej stosuje się korelację według momentu iloczynowego.
Wskaźnik Czy dane uzyskane przy użyciu określonych narzędzi rzeczywiście informują o cechach będących przedmiotem badania, trudno orzec na podstawie samych danych. Dotykamy tu zagadnienia trafności, które pojawia się zawsze, ilekroć dane dotyczące obserwowałnych właściwości lub sposobów zachowań mają stanowić podstawę wnioskowania o cechach niedostępnych bezpośredniej obserwacji bądź dostępnych tylko częściowo. Ogólnie rzecz biorąc, jest to ta sama kwestia stosunku cech zdefiniowanych teoretycznie do ich ekwiwalentów empirycznych bądź wskaźników, o której była mowa już wyżej (s. 25 i nast.). Wiąże się z tym doniosły problem badań em-
Podstawy pomiaru. Wskaźniki
51
pirycznych, polegający na tym, że dla wymiarów zdefiniowanych wyłącznie teoretycznie trzeba znaleźć takie wskaźniki czy ekwiwalenty empiryczne, dzięki którym wnioskowanie to będzie nie tylko możliwe, ale także trafne. Wskaźnikiem pozytywnych bądź negatywnych postaw robotników wobec zakładu pracy mogą być np. ich reakcje werbalne na odpowiednie pytania zadane w toku wywiadu. Wskaźnikami wiedzy historycznej uczniów mogą być poprawne bądź błędne odpowiedzi na szereg pytań w rodzaju: „Kiedy skonstruowano pierwszą maszynę parową?", „Kto był pierwszym prezydentem Republiki Weimarskiej?". Wskaźnikiem przynależności społecznej badanych rodzin może być standard wyposażenia ich mieszkań. Wskaźnikiem dostępu do sprawowania władzy w jakimś społeczeństwie może być reprezentatywny udział przedstawicieli poszczególnych warstw społecznych we władzach. Płynność składu jakiejś grupy społecznej może być wskaźnikiem jej słabego zintegrowania. Wskaźniki różnią się między sobą stosunkiem do teoretycznie zdefiniowanej (tzn. jeszcze nie zoperacjonalizowanej) cechy, którą wskazują-. W związku z tym wyróżniamy: 1. Wskaźniki definicyjne, tzn. te, za pomocą których definiowana jest cecha mająca być przedmiotem badania. 2. Wskaźniki korelacyjne: a) wskaźniki korelacji wewnętrznej, stanowiące część deft-niens teoretycznie zdefiniowanej cechy, a zatem skorelowane z pozostałymi składowymi tej cechy; b) wskaźniki korelacji zewnętrznej, nie wchodzące w skład elefiniens teoretycznie zdefiniowanej cechy, mimo to empirycznie z nią skorelowane. 3. Wskaźniki inferencyjne, tzn. te, które pozwalają wnioskować o wartościach cech niedostępnych bezpośredniej obserwacji. Wskaźniki definicyjne mogą wskazywać pojęcia tylko względnie proste, empirycznie „łatwo dostępne". Znakomita większość pojęć socjometrycznych, takich jak „pozycja socjometryczna" czy „spójność grupy", definiowana jest za pomocą takich właśnie wskaźników. 3
Patrz S. Nowak: Correlational, Definitional, and hifcrential Indicators, „Polish Sociological Bullctin" 1963, nr 2 (8), s. 31 i nast. 4*
Pomiar
52
Na przykład „pozycja socjometryczna" definiowana jest jako liczba wyborów uzyskanych przez osobę w danej grupie. „Spójność"' jest definiowana m. in. jako udział wyborów wzajemnych w ogólnej liczbie wyborów dokonanych w danej grupie. Zjawiska, za pomocą których definiuje się takie pojęcia, jak „spójność" czy „pozycja" są zarazem ich wskaźnikami. Zakres znaczeniowy wskaźników pokrywa się z zakresem znaczeniowym definiowanych pojęć. W socjologii jednak spotyka się stosunkowo mało pojęć prostych, jednowymiarowych. Cechy określane przez większość pojęć składają się na ogół z wielu wymiarów cząstkowych i poszukiwana wartość cechy złożonej jest wypadkową owych wymiarów cząstkowych (tak jest np. w przypadku zadowolenia z pracy czy integracji grupy). Każdy z takich wymiarów cząstkowych ma własny wskaźnik. Jeśli któryś ze wskaźników wymiarów cząstkowych jest silnie skorelowany wewnętrznie ze wszystkimi pozostałymi wskaźnikami, to można przyjąć go za wskaźnik cechy złożonej. Skoro np. Stuart Chapin3 definiuje status społeczny jako pozycję przysługującą jednostce lub rodzinie ze względu na panujące normy grupowe, w końcu jednak za wskaźnik przyjmuje standard wyposażenia mieszkania, to musi on albo założyć, albo wykazać empirycznie, że wskaźnik ten jest silnie skorelowany ze wszystkimi pozostałymi elementami statusu społecznego. Stosunek wskaźnika skorelowanego wewnętrznie do zakresu znaczeniowego pojęcia przedstawia rys. 2. Pojęcie Wskcżnik WM= wyposażenie materialne WK = wyposażenie w przedmioty użytku kulturalnego D — dochody SM = standard wyposażenia mieszkania U = uczestnictwo w organizacjach
Rysunek 2. Zakres znaczeniowy pojęcia i wskaźniki statusu społecznego 3 S. Chapin: The Measurement of Social Status, Chicago 1951.
Podstawy pomiaru. Wskaźniki
53
Przy pełnej korelacji wszystkich wskaźników cząstkowych syndromu „status społeczny" każdy z nich może posłużyć do określenia statusu badanego obiektu. Jeśli jednak wybrany wskaźnik nie jest w pełni skorelowany z pozostałymi komponentami zakresu znaczeniowego pojęcia „status społeczny", to albo nie może być użyty w roli wskaźnika, albo wespół z innymi wskaźnikami musi wejść w skład indeksu. istnieje również możliwość zredukowania pojęcia do empirycznej zawartości jednego ze wskaźników. Wybór wskaźnika musi zależeć wówczas od przyjętej przez badacza teorii uwarstwienia społecznego oraz od tego, jakim konkretnie celom, ma służyć podjęte badanie. Przyjęcie wyposażenia mieszkania za wskaźnik statusu społecznego jest teoretycznie uprawnione, jeżeli sytuację materialną uznaje się za podstawowe kryterium podziału na warstwy, jeżeli różnice poziomu materialnego znajdują adekwatny wyraz w wyposażeniu mieszkania oraz jeżeli określony za jego pomocą status społeczny pozostaje w empirycznie stwierdzalnym związku z innymi ważnymi jego wyznacznikami — zachowaniami politycznymi, orientacją społeczną itp. Wskaźniki, które ex definitione stanowią komponenty cechy wielowymiarowej, różnią się od wskaźników, które takimi komponentami nie są (2b). Na przykład status społeczno-ekonomiczny może być użyty jako wskaźnik „orientacji politycznej", jeżeli obie te cechy są ze sobą silnie skorelowane, tzn. jeśli każdej wartości „statusu spo-łecznoekonomicznego" odpowiada określona, empirycznie potwierdzona wartość „orientacji politycznej". Stosunek między cechą wskaźnikową „status społeczno-ekonomiczny" a cechą wskazywaną „orientacja polityczna" można przedstawić graficznie (rys. 3).
o— o ctitus społeczno-ekonomiczny
orientacja polityczna
Rysunek 3
Wskaźniki korelacji zewnętrznej można podzielić na takie, które są:"(1) konsekwencją (skutkiem) cechy wskazywanej; (2) jej warun-
r
mtotomm&iimm
54
tijmm&^iiaffism
Pomiar
kiem (przyczyną); (3) pozostają z nią jedynie w statystycznym, teoretycznie nie wyjaśnionym związku. Jeżeli np. status spoleczno-ckonomiczny przyjmuje się za wskaźnik orientacji politycznej, to na podstawie ustaleń teoretycznych należy domniemywać, że jest to wskaźnik warunkujący. Z kolei urządzenie mieszkania jako wskaźnik wysokości dochodu jest raczej wskaźnikiem uwarunkowanym, t/.n. cecha wskaźnikowa jest empirycznie uwarunkowana przez cechę wskazywaną". Jeżeli korelacji między wskaźnikiem a cechą wskazywaną nie można uzasadnić teoretycznie, to trafność wskaźnika należy uznać za wątpliwą, nic wiadomo bowiem, czy empirycznie stwierdzona korelacja wystąpi również w warunkach zmienionych. Wskaźników korelacji zewnętrznej używa się wówczas, gdy cecha wskazywana jest wprawdzie empirycznie uchwytna, trudniej jednak niż wskaźnik, zwłaszcza zaś wówczas, gdy chodzi o cechy częściowo niedostępne bezpośredniej obserwacji. Należą do nich wszystkie cechy dyspozycyjne obiektów badanych, a więc postawy, określone cechy psychiczne czy skłonności, którymi, zgodnie z teorią, można tłumaczyć rodzaje zachowań przejawianych w konkretnych sytuacjach. Rozpoznanie takich dyspozycji, określonych jako „konstrukty pojęciowe", wymaga znalezienia wskaźników postrzegalnych zewnętrznie, na podstawie których można wnioskować o istnieniu tychże dyspozycji (wskaźniki inferencyjne). Tak właśnie dla rozpoznania postaw"stosuje się szereg odpowiednich pytań. Reakcje werbalne na te pytania uznaje się za wskaźniki określonej postawy, w której z kolei widzi się przyczynę określonych zachowań przejawianych w konkretnych sytuacjach (rys. 4). Owe konstrukty pojęciowe są uzasadnione teoretycznie tylko wtedy, jeżeli mogą służyć za podstawę klasyfikacji szeregu obserwowalnych cech i sposobów zachowań. Trafność wnioskowania o istnieniu określonej dyspozycji na podstawie cechy wskaźnikowej można weryfikować, niestety, tylko pośrednio, przez wskazanie kowariancji (współzmienności) wskaźnika i możliwie wielu innych cech obserwowalnych, które teoretycznie należy uznać za uwarunkowane przez daną dyspo4
W innej formie rozróżnienie to dotyczy także wskaźników korelacji wewnętrznej; chodzi wówczas o zależność między różnymi elementami cechy syndromatycznej.
tSSŚI4^8ył!ii^^
Podstawy pomiaru. Indeksy
55
P "postawa RW — reakcje werbalne Z — zachowanie
Rysunek 4
zycję. Jeżeli badanie dotyczy np. postaw robotników wobec bezpośrednich przełożonych, to wiarygodność reakcji werbalnych na zadawane im w tej materii pytania można weryfikować, obserwując, powiedzmy, jak często wchodzą oni w konflikt z tymi przełożonymi. Przy braku kowariancji między wskaźnikiem a poszczególnymi kategoriami zewnętrznie obserwowalnych cech lub sposobów zachowań, uznawanych za uwarunkowane przez te same cechy dyspozycyjne, których istnienia dowodzić ma ów wskaźnik, wnioskowanie na jego podstawie o występowaniu tych cech jest nieuprawnione. Napotykając w toku badań tego rodzaju sytuację mamy do wyboru dwie możliwości: (1) albo odrzucić wskaźnik i szukać innego, albo (2) przedefiniować zakres znaczeniowy danej dyspozycji tak, aby obscrwowalne cechy lub sposoby zachowań nie korelujące, wbrew oczekiwaniom, ze wskaźnikiem znalazły się poza tym zakresem. Decyzji, którą z tych możliwości wybrać, nie należy podejmować zbyt pochopnie, musi ją poprzedzić analiza teoretyczna. Jeżeli z pierwotnie przyjętej definicji dyspozycji można wydedukować wiele zależności już potwierdzonych empirycznie, to należy raczej zrezygnować ze wskaźnika.
5. Indeksy Wiele pojęć socjologicznych określa nie jedno-, lecz wielowymiarowe ukryte własności obiektów badanych. Anomia, izolacja społeczna, status społeczno-ekonomiczny, spójność grupy — wszystko
56
Pomiar
to są przykłady takich pojęć. Charakterystyka obiektu badanego ze względu na cechę wielowymiarową jest empirycznie wyczerpująca dopiero wtedy., gdy znane są wartości wszystkich jej wymiarów cząstkowych. Jeżeli na status społeczno-ekonomiczny składa się np. wykształcenie, zawód i dochód, które nie są ze sobą w pełni skorelowane, to status społeczno-ekonomiczny jakiegoś obiektu można określić dopiero wtedy, gdy zna się wartości wszystkich tych trzech wymiarów cząstkowych: obiekt badań A ma wykształcenie podstawowe, jest robotnikiem niewykwalifikowanym i zarabia 650 DM miesięcznie. Każdą cechę wielowymiarową można przedstawić graficznie jako wwymiarową przestrzeń. Pojęcie statusu społeczno-ekonomicznego byłoby zatem przestrzenią trójwymiarową (rys. 5). y
Rysunek 5
Status społeczno-ekonomiczny obiektów badanych zależy od ich usytuowania w tej przestrzeni własności: A (x;y; z). Ponieważ wartości poszczególnych wymiarów są do pewnego stopnia od siebie niezależne, możliwe więc są różne kombinacje tychże wartości, np. połączenie wykształcenia podstawowego z różnymi zawodami, określonego zawodu z różnymi poziomami dochodu itd. Jak rzecz się ma w konkretnym przypadku, wymaga oczywiście ustalenia empirycznego. W tej sytuacji pojedynczy wskaźnik nie lokuje badanych przedmiotów w przestrzeni własności ze względu na ich wielowymiarowe cechy na tyle dokładnie, by mogły one być przyporządkowane względnie homogenicznym kategoriom. Z reguły próbuje się wówczas znajdować przynajmniej jeden wskaźnik dla każdego wymiaru cząstkowego. Jeśli chce się np. poznać zadowolenie robotników określonego zakładu przemysłowego z miejsca pracy i zadowolenie to uznaje się
Podstawy pomiaru. Indeksy
57
za cechę dwuwymiarową, składającą się z „zadowolenia ze stanowiska pracy" i Z „zadowolenia z płacy", to dla każdego wymiaru cząstkowego trzeba znalc/.ć przynajmniej jeden wskaźnik. Zadowolenie z pracy w danym zakładzie każdej badanej osoby można przedstawić określając jej miejsce w dwuwymiarowej przestrzeni własności, ,w której każtly z dwóch, wymiarów cząstkowych mierzony byłby trzystopniową skalą porządkową (rys. 6). zadowolenie ze stanowiska pracy 2 wysokie 7 średnie O niskie
zadowolenie z piacy
t
■, i d b a O niskie
g e h c 1 średnie
i
f 2 wysokie
Rysunek 6. Dwuwymiarowa przestrzeń własności
W ten sposób powstaje dziewięć kategorii zadowolenia z pracy w danym zakładzie, które różnią się między sobą przynajmniej jednym wymiarem cząstkowym i których nie można uszeregować liniowo. Nie można bowiem powiedzieć, czy jednostki należące do kategorii b są bardziej zadowolone z pracy w danym zakładzie niż jednostki należące do kategorii c. Tylko dla każdego z wymiarów osobno można sporządzić szeregi rangowe, ale szeregi te uporządkują poszczególne kategorie w zupełnie odmiennej kolejności:
niskie średnie wysokie
zadowolenie ze stanowiska pracy acf beh dgi
zadowolenit z płacy a b cl ceg fhi
Aby dokonać analizy, należałoby więc oderwać się od wymiarów cząstkowych i potraktować cechę wielowymiarową jako jedną zmienną, której wartości mają przynajmniej charakter porządkowy. Spróbujmy zatem „zadowolenie z pracy w danym zakładzie" przedstawić jako zmienną ilościową, która pozwala wyróżnić osoby mało, średnio i bardzo zadowolone z pracy w danym zakładzie. W tym celu wielowymiarową przestrzeń własności trzeba zredukować do jednowymia-
58
Pomiar
rowej skali. Wymaga to takiego uszeregowania wymiarów cząstkowych, aby poszczególne kombinacje cech utworzyły szereg liniowy, a każdej kombinacji przyporządkowana została określona wartość zmiennej. Postępowanie to nazywa się budowaniem indeksu. Termin indeks oznacza więc zmienną jednowymiarową mogącą przybierać r wartości odpowiadających v klasom możliwych kombinacji atrybutów wielowymiarowej przestrzeni własności ■'. Praktycznie przebiega to tak, że wartościom wymiarów cząstkowych przyporządkowane zostają wartości liczbowe (por. układ dwuwymiarowy na s. 57), które następnie sumuje się dla różnych kombinacji cech. W naszym przykładzie — z dziewięciu różnych kategorii zadowolenia z pracy w danym zakładzie powstaje w ten sposób następujący szereg rangowy: rartość indeksu 4 3 21 0
kategoria „zadowoleń!a i S, h d, e, f b, c a
Przyporządkowanie wartości liczbowych ewentualnie ważenie poszczególnych wymiarów cząstkowych powinno być uzasadnione teoretycznie. Jeżeli cechy cząstkowe mierzone są na poziomie porządkowym, to odpowiadające im wartości liczbowe muszą być reprezentowane przez kolejne względem siebie liczby. Dopiero wówczas, gdy da się określić odstępy między poszczególnymi kategoriami cech, a więc przy skalach interwałowych, można odpowiednio do nich stopniować wartości liczbowe. Przy ważeniu wartości liczbowe cech Należy zwrócić uwagę, że funkcjonujące w naukach społecznych i użyte również tutaj pojęcie indeksu nie jest tożsame z identycznym określeniem pewnych złożonych wielkości stosowanym w statystyce. Niektóre z indeksów przedstawionych w dalszych rozdziałach, jak indeks zmiany / przy analizie panelowej, indeks zbieżności, a także pewne indeksy socjometryczne, odpowiadają raczej drugiemu znaczeniu tego pojęcia, kiedy to chodzi o względną częstość występowania określonych cech lub związków cech w różnych grupach. Na razie brak teorii obejmującej oba te rodzaje indeksów. 5
Podstawy pomiaru. Indeksy
59
cząstkowych mnoży się przez określoną wartość, aby uwypuklić tę cechę cząstkową, która w większym stopniu niż inne warunkuje cechę wielowymiarową. Jeżeli można np. uzasadnić, że zadowolenie z pracy w danym zakładzie bardziej zależy od zadowolenia z płacy niż od zadowolenia ze stanowiska pracy, to każdą z trzech wartości liczbowych zadowolenia z płacy można pomnożyć przez 2 i zamiast 0, 1 i 2 otrzymać 0, 2 i 4. Przy tworzeniu indeksu trzeba zatem rozwiązać dwa zadania. Po pierwsze, rozstrzygnąć, których cech cząstkowych dotyczące dane mają wejść w skład indeksu. Ważne jest przy tym uwzględnienie wszystkich komponentów badanej cechy wielowymiarowej, ale zarazem tylko tych komponentów. Po drugie, wskazać, jak dane te należy ze sobą powiązać (przyporządkowanie wartości liczbowych, ważenie, kombinacje). Problem zasadniczy, o którym trzeba pamiętać przy budowaniu indeksu, polega na tym, że często wartości liczbowe przypisane poszczególnym wymiarom cząstkowym, będące wyłącznie liczbami porządkowymi, dodaje się, jak gdyby były to liczby naturalne, w dodatku uzyskane w wyniku zastosowania tej samej skali pomiaru do wszystkich wymiarów cząstkowych. Zawsze, ilekroć oba te warunki nie są spełnione — a w socjologii spełnienie ich jest prawie niemożliwe — tworząc indeks porównuje się coś, co ściśle rzecz biorąc jest nieporównywalne, i stawia się znak równości między czymś, co jest różne. W efekcie nie można mieć pewności, czy rozmaite kombinacje cech występujące pod tą samą wartością indeksu są rzeczywiście ekwiwalentne. To zastrzeżenie pod adresem indeksu dotyka centralnego problemu pomiarów w badaniach społecznych, którym jest brak standaryzowanych, a równocześnie teoretycznie znaczących jednostek pomiaru. W tych okolicznościach indeks pozostaje dość wątpliwym narzędziem pomocniczym, choć mimo to często się przydaje. Pomaga bowiem porównywać nieporównywalne. Potraktowanie różnych kombinacji cech jako w pewnym sensie ekwiwalentnych da się poniekąd uzasadnić także empirycznie (i istotnie wymaga takiego uzasadnienia). W naszym przykładzie potwierdzeniem zasadności uznania kategorii b i c za reprezentujące ten sam poziom zadowolenia z pracy w danym zakładzie byłoby wykazanie, że w aspekcie innych
60
Pomiar
zmiennych, które można zdefiniować jako zależne od zadowolenia z pracy w danym zakładzie (np. częstość zmiany miejsca pracy [ub niestawianie się do.pracy bez usprawiedliwienia), jednostki należące do tych kategorii zachowują się tak samo lub podobnie. Jeśli to możliwe, należałoby trafność danego indeksu sprawdzać także empirycznie.
Metody skalowania
1. Skala jako narzędzie pomiaru Jak zostało już powiedziane wyżej, mierzenie polega na przyporządkowaniu jakiejś cesze danego obiektu (lub klasy obiektów) liczb według pewnych z góry określonych zasad. Skale są w tym sensie narzędziem pomiaru, a zasady skalowania —■ wskazówką, jak należy je konstruować. Wskazówka ta przyjmuje zazwyczaj postać wzoru matematyczno-statystycznego, pod który należy podstawić dane (np. wyniki odpowiedzi na pewną liczbę pytań). W tym celu trzeba najpierw ustalić, które z pytań dotyczą danej cech}', a następnie, posługując się określoną metodą (np. skalą Guttmana), jakie wartości przybiera ta cecha. Dysponując gotową skalą możemy określić usytuowanie badanego obiektu względem tejże cechy. Także indeks jest narzędziem pomiaru, tzn. wskazuje usytuowanie badanych obiektów ze względu na daną cechę. Różnica między indeksem a skalą nie polega, jak często się sądzi, na poziomie pomiaru. Większość skal, podobnie jak indeks, posługuje się porządkiem rangowym. Różnica polega na tym, że skala pozwala również stwierdzić, za pomocą, określonych obliczeń, czy wchodzące w jej skład elementy (items) rzeczywiście reprezentują ten sara wymiar. W przypadku indeksu brak wzoru, który umożliwiałby taki formalny sprawdzian. O jednowyrniarowości indeksu decydujemy arbitralnie łub intuicyjnie poprzez dobór odpowiednich pytań. Jednoznaczne kryterium klasyfikacji skał nie istnieje. Jedną istotną
Skalowanie. Rangowanie i porównywanie parami
61
różnicę wymieniają Coombs i Torgerson r'. Według nich, wyróżnić można skale, które mierzą cechy obiektów świata zewnętrznego. Z takimi skalami mamy do czynienia np. wtedy, gdy prosimy respondenta, aby uporządkował pewną liczbę przedmiotów według stopnia ich użyteczności lub pewną liczbę polityków według stopnia konserwatyzmu reprezentowanych przez nich postaw względnie ocenił udział treści racjonalistyczno-realistycznych w różnych systemach religijnych. Cecha będąca przedmiotem pomiaru charakteryzuje nie respondenta, lecz obiekty otaczającego go świata. Inne skale mierzą cechy samych obiektów badanych, np. patriarchalizm postaw ankietowanych mężczyzn, stopień udziału w życiu politycznym ankietowanych studentów, autorytaryzm ankietowanych nauczycieli itd. Skale pierwszego rodzaju prezentują kontinuum wartości liczbowych cech obiektów świata zewnętrznego, skale drugiego rodzaju — kontinuum waitości liczbowych cech badanych osób.
2. Rangowanie i porównywanie parami Skala porządkowa określa, jak była już mowa wyżej (s. 49), pozycję danego obiektu ze względu na określoną cechę przez porównanie jej z analogiczną pozycją innego obiektu. Porównanie, które przybiera postać szeregu rangowego, rzadko ma za podstawę kryterium obiektywne — standaryzowaną jednostkę pomiaru — zazwyczaj jest nią subiektywna ocena obiektu według kryterium dającego się wprawdzie zdefiniować teoretycznie, ale nie dającego się przekształcić w kryterium obiektywne. W najprostszym przypadku osoba (lub grupa osób) proszona jest o uporządkowanie pewnej liczby obiektów kolejno według stopnia posiadanej cechy, np. uporządkowanie zawodów według ich prestiżu społecznego. Ukryte kryteria porównywania utrudniają ten proces tym bardziej, im większa jest liczba obiektów porównywanych. Dlatego 0
Patrz W. S. Torgerson: Theory and Methodof'Scaling, New York 195S, rozdz. 3; C. H. Coombs: Theory and Methods of Social Measurement w: Research Mcthods in the Bchavioral Sciences, L. Fcstinger, D. Katz (red.), New York 1953, rozdz. 11; C. H. Coombs: A Theory of Data, New York 1964.
62
Pomiar
wybiera się często porównywanie parami, bardziej precyzyjne i łatwiejsze dla respondentów. Metodę tę wyjaśnimy na przykładzie. Zadaniem respondenta jest uporządkowanie czterech przedmiotów — A, B, C, D — ze względu na ich użyteczność. Są one „przedkładane" respondentowi parami (każdy przedmiot porównywany jest kolejno z wszystkimi pozostałymi). To „przedkładanie" dokonuje się z reguły w ten sposób, że zadajemy respondentowi pytanie, który z danych dwu artykułów chciałby mieć bardziej. Albo w ten sposób, że przedstawiamy mu listę, na której artykuły te ustawione są parami : A — B, A — C... itd. Respondent musi każdorazowo wskazać ten artykuł, który woli, czyli dokonać wyboru. Z reguły nie dopuszcza się odpowiedzi „nie mam zdania"7. Liczba możliwych par zależy od liczby przedłożonych do porównania obiektów. Przy czterech artykułach liczba możliwych par wynosi sześć. Mówiąc ogólnie: liczba możliwych par wynosi:
2 ' Przyjmijmy, że wyniki wyborów są następujące: A>B A>C A>D B>C B>D OD przy czym A >B oznacza, że respondent woli A niż B. Z danych tych wynika szereg rangowy A>B>C>D. Rangi poszczególnych artykułów wyrazić można za pomocą liczb porządkowych (tzn. wartości rang): A = 4, B — 3, C = 2, D = 7. Na tym kończy się proces pomiaru. Uzyskaliśmy „skalę użyteczności czterech artykułów według oceny respondenta /". W rzeczywistości jednak jest mało prawdopodobne, aby respondent udzielał tak spójnych odpowiedzi jak w powyższym przykładzie. Może się zdarzyć np., że przy ostatniej parze dokona wyboru „D>C". Niekonsekwencje będą tym bardziej prawdopodobne, im liczba obick7
Uwzględnienie odpowiedzi „nie mam zdania" komplikuje obliczenie, choć go nie uniemożliwia.
Skalowanie. Rangowanie i porównywanie parami
63
tów prezentowanych będzie większa, a rzeczywista (nie znana respondentowi) różnica wartości tych obiektów —• mniejsza. Także wówczas, gdy odpowiedzi respondenta są mniej spójne, istnieje metoda rangowego szeregowania obiektów. Przyjmijmy, że respondent dokonał porównania parami pięciu przedmiotów, jak następuje: B>A, B>C, B>E, A>C, A>D, OD, C>E, D>B, D>E, E>A. W tej sytuacji można policzyć, jak często każdy z artykułów został wybrany. I tak, artykuł B został wybrany trzy razy. Liczba „3" jest zatem liczbą porządkową stopnia użyteczności artykułu B. Tą metodą uzyskuje się w powyższym przykładzie następujący szereg rangowy: B — 3, A — 2, C — 2, D = 2, E ~ 1. Jak widać, większość artykułów uzyskała te same wartości rangowe. Inną, bardziej skomplikowaną metodą oceny, która przy większej liczbie porównywanych obiektów wymaga posłużenia się komputerem, możemy omówić tylko w paru słowach. Przyjmuje się hipotetycznie wiele różnych „prawdziwych" szeregów rangowych. Następnie oblicza się liczbę odchyleń uzyskanego materiału kolejno od wszystkich hipotetycznych szeregów rangowych. Ten szereg, który wykazuje najmniej odchyleń, przyjmuje się za prawidłowy. Im mniej spójne są wyniki porównania parami, tym bardziej należy wątpić, że porównanie dokonane zostało według jednego kryterium (czyli tej samej cechy porównywanych przedmiotów). Porównywanie parami przedstawione zostało dotychczas na przykładzie pojedynczego respondenta. W badaniach społecznych chodzi jednak na ogół o poznanie preferencji większych grup społecznych. Wyniki poszczególnych respondentów trzeba więc agregować. Można to robić dwojako: 1. Dla każdej jednostki sporządza się indywidualny szereg rangowy. Następnie grupuje się' osoby o tych samych preferencjach. Badana zbiorowość zostaje w ten sposób podzielona na różne grupy charakteryzujące się tym, że wchodzące w ich skład osoby reprezentują te same indywidualne szeregi rangowe. 2. Wówczas, gdy chodzi o ustalenie „średniego" porządku preferencji dla całej zbiorowości, oblicza się, ilu członków danej zbiorowości łącznie wybrało każdy z przedmiotów i odpowiednio nadaje się im wartości rangowe. Jeżeli indywidualne szeregi preferencyjne usta-
64
Pomiar
lane są nie przez porównanie parami, lecz w drodze zwykłego porządkowania, jak często bywa przy badaniu prestiżu różnych zawodów, to z indywidualnych wartości rangowych poszczególnych przedmiotów można obliczyć wartość średnią, która określa następnie ich rangę w ocenie całej badanej grupy. Metody tej — aczkolwiek stosuje sic ją często przy badaniu prestiżu zawodów — należy na dobrą sprawę unikać, traktuje ona bowiem liczby porządkowe tak, jak gdyby były liczbami naturalnymi. L. L. Thurstone opracował trzecią metodę budowania skali z danych uzyskanych przez porównywanie parami. Jego wzór operuje w istocie skalą interwałową. Thurstone nazwał swoją metodę „prawem szacunków porównawczych" (law of comparatire judgement). Zainteresowanych tą bardzo matematycznie skomplikowaną metodą można jedynie odesłać do literatury 8. Zadania 1. W okręgu wyborczym kandyduje czterech polityków: A, B, C i D. Pewien respondent dokonuje między nimi następujących (niespójnych) wyborów: 1. A > B; 2. D > A; 3. C> A; 4. C > D; 5. C> B; 6. D > B. Proszę ustalić rangi tych polityków. 2. Proszę sporządzić zestaw par dla potrzeb badania względnej ważności: płacy, pewności pracy, możliwości awansu, długości czasu pracy i stosunku do przełożonych w opinii robotników. Po sporządzeniu zestawu par proszę porównać swoje rozwiązanie z propozycją Miltona L. Bluma w Industrial Psychology and Its Social Foundations (New York 1949, s. 144 i nast.).
3. Dyferencjal semantyczny * Podobnie jak porównywanie parami, tak i dyferencjal semantyczny służy do mierzenia obiektów otaczającego świata. Dyferen8 Opis metody Thurstone'a patrz L. L. Thurstone: Measuremcnt of Yalties. Chicago 1963; W. S. Torgerson: Theory and MethoJ. rozdz. S i 9; J. P. Guilford: Psychometrtc Methods, New York 1954, s. 35-37 i roz .WWI vd — suma kwadratów odchyleń od średniej w grupach górnej i dolnej n liczba członków grup.
Następnie można obliczyć: W- C -*■ D (wybory mogą być także wzajemne); 5
Patrz M. L. Northway w: The Sociometry Reacler, J. L. Moreno (red.), s. 221 -228; G. Bastin: Die soziowelrisclicn Methoden, s. 55-62; K. M. Evans: Sociometry and Education, London 1962, s. 22-24.
PPf iSSr fHI Prezuntacja i opracowanie wyników
161
4) gwiazda: jedna z osób jest szczególnie często wybierana przez inne, które rzadko wybierają jedna drugą; 5) klika: określona liczba osób wybiera się wzajemnie bardzo często, rzadko natomiast wybiera innych członków grupy oraz równie rzadko jest przez nich wybierana; (powyższe konfiguracje można niekiedy uzupełniać wyborami oczekiwanymi oraz, zwłaszcza w przypadku kliki, odrzuceniami); 6) idol: osoba wybierana przez wielu; centralna postać gwiazdy. Zależnie od przyjętych zmiennych można mówić o idolu-ohiekcie uczuć (najbardziej lubiany), idolu-rzeczoznawcy (najlepiej znający zagadnienie), idolu-najlepiej-zorientowanym (najlepiej poinformowany) ; 7) szara eminencja: osoba izolowana, którą łączy odwzajemniany kontakt tylko z idolem; 8) samotnik: osoba nie wybierana przez nikogo i nikogo nie wybierająca; 9) zapoznany: osoba, która wprawdzie wybiera innych, ale przez nikogo nie jest wybierana; 10) odrzucony: osoba która uzyskała tylko wybory negatywne. Macierz socjometryczna to drugi z możliwych sposobów prezentacji wyników testu socjometrycznego. Jest on wprawdzie mniej poglądowy niż socjogram, ale znacznie ułatwia opracowanie wyników. Dla ilustracji przedstawiamy macierz socjometryczna relacji między pięcioma osobami (od A do E) (tab. 8). Macierz ta ukazuje, że A wybiera na swego partnera w grupie B. B jest wybrany przez A jako pierwszy oraz spodziewa się być wybranym przez A w pierwszej kolejności. A jako pierwszego (i jedynego) odrzuca C i spodziewa się również, że zostanie przez niego odrzucony... itd. Macierz ta ma dość skomplikowaną budowę, czego można uniknąć dzieląc ją na macierze cząstkowe, np. na macierz wyborów pozytywnych, wyborów negatywnych oraz wyborów oczekiwanych. Macierze cząstkowe można, rzecz jasna, ponownie łączyć. Opracowanie wyników macierzy socjometrycznej polega na obliczaniu różnych indeksów. Indeksy można dzielić na „wielkości podstawowe" (które bez dodatkowych obliczeń wynikają bezpośrednio z macierzy) i „złożone" (które uzyskuje się po pewnych przelicze11 — Wprowadzenie...
166
Socjomelria
miarów, które WCIKK!/;I w grę, tzn. trzeba posłużyć sic kilkoma testami. Joan II. Criswel; opracowała do tego celu in d e k s oparty na liczbie wyborów wzajemnych '". Za wybór wzajemny uznaje sic przy tym także np. laki przypadek: A wybiera I! w odpowiedzi na test sym-palii — antypatii. B nie odwzajemnia tego wyboru, ale wybiera A, gdy pytanie dotyczy sprawności działania, którego to wyboru nie odwzajemnia A. Ten rodzaj wyboru wzajemnego Criswell nazywa relacją krzyżową — cross-relationship. Wzór na obliczenie indeksu zwartości (Z) brzmi: • Up Ji = łączna liczba wszystkich wyborów wzajemnych jetlnoroilzajowych (w ramach tych samych zmiennych) plus wszystkie relacje krzyżowe. U = łączna liczba wszystkich wyborów nie odwzajemnionych.z uwzględnieniem relacji krzyżowych dopuszczalna liczba wyborów p = ----------------------------------- .-------liczba członków grupy —/ q = l — /j
Indeks Criswell można stosować tylko wówczas, gdy dla wszystkich respondentów i dla wszystkich zmiennych dozwolona jest ta sama liczba wyborów. 5. Bardziej uproszczony indeks integracji (/) można obliczyć według następującego wzoru: liczba osób, które nie uzyskały żadnego wyboru Pokazuje on, jak dalece równomiernie wybory rozkładają się na wszystkich członków grupy. Wada zarówno indeksu zwartości, jak indeksu integracji polega na tym, że nie uwzględniają one odrzuceń oraz wyborów i odrzuceń oczekiwanych trafnie i nietrafnie, aczkolwiek bez wątpienia są to istotne elementy integracji grupy.
Do ważnych zadań socjometrii należy ujawnianie podgrup ( k l i k ) W grupach. „Klik" nie da się bezpośrednio odr/ylae z macierzy SO-'" Putni Tin Soctontftry Rtailir, r l Morono (rad,), •.. ."■' i inni. < > t n / to/ i nut.
•
Socjometria a analiza relacji
167
cjometrycznej, Nic istnieje również żaden „indeks klik". Są jednak dwie dość skomplikowane metody pozwalające zidentyfikować kliki. Pierwszą opracowali E. Forsyth, i L. Katz13; polega ona na takim przckomponowaniu macierzy, aby wybory wzajemne zgrupowały się na przekątnej. Metoda druga, opracowana przez L. Festingerau, wykorzystuje rachunek macierzowy. Macierz socjometryczna podniesiona do trzeciej potęgi „ujawnia'1 kliki. Za pomocą tej metody można ujawniać także kliki „niedoskonale" (wewnątrz których liczba wyborów wzajemnych jest mniejsza od liczby wyborów możliwych).
4. Socjometria a analiza relacji Socjogram oraz macierz socjometryczna dostarczają informacji o charakterze głównie opisowym. Dane socjometryczne można jednak relatywizować, uzyskując dane dodatkowe, przede wszystkim dotyczące cech społecznych i osobowościowych ls. I tak można dociekać np. przyczyn pozycji socjometrycznej (jakie cechy budzą sympatię lub antypatię) lub jej następstw (np. w postaci dobrego samopoczucia, wydajności, konformizmu). Można pytać o warunki, w jakich np. kształtuje się grupa silnie bądź słabo zintegrowana, oraz o wpływ różnych struktur grupy na jej wydajność, stabilność, poczucie satysfakcji jej członków itp. W końcu można pytać także o ewentualną homogeniczność (podobieństwo cech) osób wzajemnie się wybierających lub członków kliki. Analiza socjometryczna okazuje się w tym przypadku rodzajem tzw. analizy relacji, mającej przeciwdziałać — podobnie jak omówiona w rozdziale dziesiątym analiza kontekstu-alna — „atomizującym" efektom zwykłego doboru prób. W przeciwieństwie do tego rodzaju metod gromadzenia danych, kiedy operuje się próbą, a zatem ma się do czynienia z jednostkami wyrwanymi z konkretnego układu stosunków w swoim otoczeniu 1: Piiir/. ibidem, s. 229-235. Patrz także K. M. Evans: Soclometry and Eclitcatlon, i, 24-27, IJ Patrz cytowany Th§ Soclometry Hiadtr pod rsdakcjłi J, L, Moronł( i, -Mi< 'ii " Putrj omówlsnlj nloktóryoh wyników w, J, NihnoviJii Soilomttrlt, wi Hond' buch dir tmpMsohtn Sottal/brscHung, R K0nli(rad ). I i. Itutt|trl i'">/, i 132 I Mil
'■:•
Roidilnł ósmy
Analiza treści
1. Założenia i ogólna problematyka analizy treści Język jest nie tylko istotnym warunkiem działania społecznego w tej mierze, w jakiej polega ono na komunikowaniu znaczeń, ale sama czynność posługiwania się językiem — mówienie i pisanie — należy do kategorii zachowań społecznych. W tym, co mówią i piszą, ludzie dają świadectwo swoim dążeniom, postawom, ocenom sytuacji, swojej wiedzy oraz milcząco przyjmowanym założeniom dotyczącym otaczającego świata. Owe dążenia, postawy itd. współokreśla system społeczno-kulturowy, w którym żyje mówiący i piszący, i dlatego odzwierciedlają one nie tylko cechy osobowe autorów, ale także cechy ich społeczności: zinstytucjonalizowane wartości, normy, społecznie zapośredniczonc definicje sytuacji itd. Analiza materiału językowego pozwala wiec na wyciąganie wniosków dotyczących indywidualnych oraz społecznych zjawisk niejęzykowych. Z tych ogólnych założeń wynikają zadania analizy treści. Analiza treści nawiązuje do przednaukowego i potocznego rozumienia języka, które poza znaczeniami komunikowanymi intencjonalnie pozwala z tego, co się mówi i pisze, wyciągać także wnioski wyżej wymienionego rodzaju. Jeżeli jednak owo intuicyjne rozumienie ma służyć celom analizy naukowej, musi zostać wyeksplikowane, usystematyzowane i zobiektywizowane. Analizę treści można więc określić jako technikę badawczą, która w sposób zobiektywizowany i systematyczny ustala i opisuje cechy językowe tekstów po to, aby na tej podstawie wnioskować o niejęzykowych własnościach ludzi i agregatów społecznych. „Tekst" może być mówiony (np. nagrany na taśmę) i pisany. Analizę treści w szerszym znaczeniu można sto-
i**? 155?
w5!7 ^8Sf SB?
WĘ
Założenia i ogólna problematyka analizy treści
^S£
^m
193
sować także do przekazów nie wyłącznie słownych, np. do filmów lub plakatów reklamowych 1. Systematyczność analizy jako jedno z kryteriów wymienionych w definicji wymaga uwzględnienia wszystkich istotnych dla odpowiedzi na pytanie badawcze aspektów analizowanego tekstu. Jest to konieczne do zapobieżenia groźbie rejestrowania tylko tych cech tekstu, które potwierdzają przyjętą hipotezę. Systematyczność jest więc warunkiem trafności wyników. Jedynie systematyczne, podporządkowane ustalonym regułom i standaryzowanym procedurom postępowanie może zapewnić obiektywność analizy, to znaczy inter-subiektywną ważność jej wyników. Subiektywne i impresyjne interpretacje tekstu są w sensie naukowym nierzetelne. Standaryzowana analiza treści nie musi być przy tym koniecznie analizą ilościową. Na etapie badań rozpoznawczych i opisowych bardzo przydatna jest jakościowa analiza treści. Tak samo jednak jak w przypadku innych technik badawczych, wyniki analizy ilościowej są nie tylko bardziej precyzyjne (i z reguły bardziej rzetelne), ale wręcz konieczne na etapie weryfikacji hipotez. Dwie wynikające z definicji analizy treści fazy postępowania badawczego — ustalanie cech językowych tekstu i na ich podstawie wnioskowanie o zjawiskach niejęzykowych — wiążą się z dwoma zasadniczymi problemami, od których rozwiązania zależy następnie trafność wyników. Omówimy je pokrótce. Jak wynika z samej nazwy, celem analizy treści (nie mylić z językoznawczą analizą tekstu) jest identyfikacja i odpowiednia klasyfikacja treści lub znaczeń określonych konfiguracji językowych — słów, zwrotów, zdań lub dłuższych wypowiedzi2. Narzuca się tu pytanie, jak można obiektywnie ustalić znaczenia konfiguracji słownych zawartych w tekście. Skąd, konkretnie mówiąc, osoba dokonująca analizy treści wie, co oznacza określony znak językowy w danym tekście, jaką treść nadają mu nadawca i odbiorca komuni1 Por. np. B. G. Bateson: An Analysis of tlie Nazi Film «.Ifil1erjttnge Que.w, w: The Study of Culture ał a Disłance, M. Mead, P. Mitraux (red.), Chicago 1953. 2 Nie wyklucza to, że analityka mogą interesować także określone cechy formalne tekstu, np. słownictwo, specyfika stylu, typowe konstrukcje zdaniowe iid.; z tego punktu widzenia określenie „analiza treści" trzeba uznać za zbyt wąskie.
13 — Wprowadzenie...
&*&('
194
Analiza treści
katu? Niestety, odpowiedzi na te pytania nie można uznać za zadowalającą, brzmi ona. bowiem: osoba dokonująca analizy treści opiera się z reguły na własnym intuicyjnym rozumieniu języka. W poszukiwaniu wyjścia z tej sytuacji początkowo ograniczano się do „jawnej treści" tekstu :!. Przez treść jawną rozumiano przy tym eksplicytne znaczenia jednostek językowych, czyli w efekcie to, co w określonym kręgu językowym „zazwyczaj" lub „tiadycyjnie" uznaje się za właściwe znaczenie danego słowa, wyrażenia itd. — niezależnie od intencji mówiącego lub piszącego. Owo znaczenie właściwe jest bezpośrednio dostępne osobie analizującej treść jako członkowi społeczeństwa posługującego się danym językiem. Z podejściem takim wiąże się mylne założenie, że analizujący rozumie znaczenie komunikatu tak, jak je pomyślał nadawca i jak je rozumie odbiorca '. Także i dziś większość technik analizy treści opiera się na mniej lub bardziej intuicyjnym rozumieniu języka. W tym stopniu, w jakim założona zgodność rozumienia tekstu przez nadawcę, odbiorcę i osobę analizującą jest iluzoryczna, trafność wyników musi być podana w wątpliwość. Dotyczy to w pierwszym rzędzie tych przypadków, gdy przedmiotem badania jest tekst sformułowany w języku obcym, ale także w języku subkultury własnego społeczeństwa, której osoba analizująca nie zna z autopsji. We wszystkich takich przypadkach powinno się dokonywać analizy empiryczno-semantycznej, tzn. najpierw zapoznać się ze znaczeniem poszczególnych jednostek językowych. W tym celu jednak trzeba wyjść poza czysto językowy kontekst tych znaczeń i zaznajomić się także z kontekstem sytuacyjnym, w jakim dany tekst powstał. Co więcej, ponieważ znaczenia form językowych denotują w ostatniej instancji obiekty doświadczenia społecznego, podczas dokonywania analizy empiryczno-semantycznej należy więc uwzględniać obiektywne własności oznaczanych obiektów (w przeciwnym razie trudno byłoby np. uchwycić pełne denotatywne znaczenie słowa „ordynariusz"). Przy tym wszystkim, mimo iż se3
B. Berelson: Content Analysis, w: Handbook of Social Psychology, G. Lindzey (red.), t. I. New York (1959) 1967, s. 488. 1 Berelson mówi w tym kontekście o common meeting ground — układzie odniesienia wspólnym dla nadawcy, odbiorcy i analizującego tekst; patrz B. Berelson: Content Analysis, s. 489.
• Założenia i ogólna problematyka analizy treści
195
miotyka, socjo- i psycholingwistyka mogą już dziś służyć wszechstronną pomocą przy tego rodzaju empiryczno-semantycznej analizie jednostek językowych, analiza treści w większości przypadków nadal obraca się w kręgu niekontrolowanego rozumienia intuicyjnego. Kolejny ważki problem analizy treści wyłania się wówczas, gdy charakterystyka treści, tzn. rodzaj i częstotliwość występowania elementów językowych o określonym znaczeniu, ma być podstawą do wnioskowania o zmiennych niejęzykowych. Wnioski tego rodzaju mogą dotyczyć: (a) nadawcy tekstu (np. jego intencji, uznawanego systemu wartości, określonych cech osobowościowych); (b) założonych przez nadawcę cech odbiorcy czy odbiorców (np. poziomu wiedzy, zainteresowań, uznawanych wartości), które bierze pod uwagę formułując komunikat; (c) przypuszczalnych reakcji odbiorcy na komunikat; (d) cech systemu społeczno-kulturowego, w którym tekst powstał lub do którego jest adresowany (np. celów odnośnej organizacji, interesów klasy społecznej, politycznej orientacji wydawnictwa, cnót i wartości akceptowanych w danym społeczeństwie). W określonych przypadkach zależności takie można badać łącząc analizę treści z innymi metodami badawczymi — obserwacją czy wywiadem socjologicznym. Analizę treści stosuje się jednak często właśnie wówczas, gdy zdobycie danych o zjawiskach niejęzykowych nie jest możliwe bezpośrednio lub gdy się sądzi, że ich kształt językowy jest wskaźnikiem bardziej jednoznacznym niż jakiekolwiek inne dostępne wskaźniki. Dla uniknięcia interpretacji spekulatywnych i wyłącznie impresyjnych, wnioski w takich przypadkach muszą znajdować oparcie w teorii, która mówi, w jakich okolicznościach określone postawy, intencje, wartości itd. przyjmują określone formy językowe. Takiej ogólnej teorii na dobrą sprawę ciągle brak5. Co najwyżej rozporządzamy szczegółowymi hipotezami, które pewnym konkretnym wnioskom mogą nadawać niejakie prawdopodobieństwo. Dlatego właśnie trafność wyników analizy treści w dziedzinie nauk społecznych budzi często wiele wątpliwości. 5 Teorię taką próbowali budować H. D. Lasswell, D. Lerner i I. de Sola Pool: The Comparativc Study of Symbols. An Introductiort, Stanford. Cal. 1952, s. 49. 13*
196
Analiza treści
2. Metody analizy treści Niżej omówimy kolejne etapy procedury zwanej analizą treści. Podbudowa teoretyczna. Ponieważ o wyborze techniki czy technik badawczych powinien decydować temat, najpierw należy więc postawić pytanie, czy dane zagadnienie rzeczywiście najlepiej jest badacza pomocą analizy treści. Atrakcyjność narzędzia stanowi jednak często tak silną pokusę, że pytanie to się pomija, a przynajmniej pomijało w początkowym okresie rozwoju analizy treści. Wczesne praso-znawstwo oraz badania nad propagandą w swoim początkowym okresie posługiwały się analizą treści bez żadnej prawie podbudowy teoretycznej. Sytuacja ta trwała do połowy lat pięćdziesiątych i krytyka Cartwrighta, który wielu wynikom analizy treści odmawia jakiejkolwiek wartości teoretycznej i praktycznej, w odniesieniu do tamtego okresu jest w pełni uzasadniona 6. Jedną z najwcześniejszych prac opartych na podbudowie teoretycznej jest studium Lassweila i Leitesa, którzy do analizy treści języka polityki posłużyli się teorią zachowań politycznych 7 . Z biegiem czasu analiza treści coraz bardziej rozbudowuje swoje zaplecze teoretyczne i doskonali metody. Jedno z drugim zresztą ściśle się wiąże. Jeżeli bowiem zagadnienie badawcze sprowadza się do pytania w rodzaju: jak często w artykułach wstępnych różnych gazet określone zwroty wartościujące występują w połączeniu z nazwiskiem danego polityka, to odpowiedzi na nie może udzielić każdy, kto umie po prostu liczyć s. Natomiast zweryfikowanie kompleksowej hipotezy badawczej obejmującej również zmienne nie-językowe wymaga już sięgnięcia po bardziej skomplikowane metody 9. Jedną z najważniejszych przesłanek sensownego posłużenia się analizą treści jest więc sformułowanie hipotez. Czego takie hipotezy mogą D. Cartwright: Anulysls of Qualitative Materiał, w: Research Metltods in lite Behmioral Sciences, L. Festinger, D. ICatz (red.), New York 1966, s. 447. 7 Language of Politics, H. D. Lasswell, N. Leites (red.), Cambridge, Mass. 1965. 3 Przykładem pracy naiwnej i teoretycznie, i metodologicznie jest R. Budda, R. Thorpa i L. Donohewa: Conlent Aiutlysis of Communications, New York 1967. " Możliwości nowoczesnej standaryzowanej analizy treści dowodzi książka Ph. J. Stone'a, D. C. Dunphy'ego i wspólaut.: The General Incjnirer, Cambridge, Mass. 1966. n
Metody. Dobór materiału
197
dotyczyć, zostało powiedziane wyżej. Precyzyjne sformułowanie hipotezy (hipotez) przewodniej jest warunkiem wstępnym podjęcia dalszych kroków. Dobór materiału tekstowego. O tym, jakie teksty stanowią zbiór generalny, z którego należy wybrać materiał do analizy, decydują pytania badawcze. Mogą to być np. „wszystkie wiadomości, artykuły i komentarze na temat radykalizacji norm prawnych w Republice Federalnej, opublikowane w 1968 i. na łamach gazet zachodnioniemieckich o nakładzie nie mniejszym niż 20 000 egzemplarzy" lub „wszystkie opowiadania ułożone przez młodzież w wieku 14-24 lata w odpowiedzi na Test Apercepcji Tematycznej". W pierwszym przykładzie chodzi o materiał tekstowy, który powstał niezależnie od aktualnych zainteresowań badacza i niezależnie od nich istnieje. Przykład ten sygnalizuje ważny walor analizy treści: można ją zastosować wobec materiału powstałego dowolnie dawno. Za pomocą analizy treści — inaczej niż za pomocą obserwacji, a w znacznym stopniu także wywiadu socjologicznego — można więc zbierać dane o przeszłości: o postawach, przekonaniach, systemach wartości itd. dawno minionych, niedostępnych żadnym innym metodom gromadzenia danych. Technika analizy treści pozwala również na podstawie posiadanego materiału tekstowego badać procesy zmian, które dokonywały się w przeszłości — także bardzo rozciągnięte w czasie. W drugim z podanych przykładów chodzi o materiał tekstowy powstały specjalnie do celów konkretnego badania metodą analizy treści. Ma on tę zaletę, że został tak przygotowany, aby mógł służyć do uzyskania odpowiedzi na wcześniej postawione pytanie badawcze. Trudność natomiast polega na tym, że badacz musi odpowiednio dobrać autorów tekstów, jeżeli uzyskane wyniki mają rnieć moc uogólniającą. Jeżeli w podanym przykładzie chodzić ma o wypowiedzi „całej młodzieży w wieku 14-24 lata", to badani testem TAT muszą stanowić reprezentatywną próbę tej zbiorowości. Posłużenie się próbą jest konieczne także w odniesieniu do nie zależnie istniejącego materiału tekstowego, jeżeli ogół tekstów, o które chodzi, jest objętościowo zbyt duży, aby mógł być analizowany w całości. Przy czym określenie owego „ogółu tekstów" i sporządzenie próby są to dwie odrębne czynności. W użytym wyżej przykładzie
198
Analiza treści
trzeba np. rozstrzygnąć, czy z punktu widzenia pytania badawczego wystarczy ograniczyć się do tekstów opublikowanych w roku 1968 (i do gazet O nakładzie przekraczającym 20 000). Jeśli zapadnie decyzja, że w badaniu należy uwzględnić okres czteroletni, to objętość próby można zredukować np. w ten sposób, że z każdego roku uwzględni się tylko te numery, które ukazały się w trzech wybranych miesiącach. Przy sporządzaniu próby można zastosować metody omówione w rozdziale trzecim. Charakter wybieranych jednostek, którymi są nie osoby, lecz np. poszczególne wiadomości, artykuły czy komentarze, nastręcza co prawda pewne szczególne problemy. Przede wszystkim zbiór, z którego ma być wybrana próba, często ze względu na swoją formę, uniemożliwia swobodne manipulowanie jednostkami zgodnie z zasadą doboru losowego. W naszym przykładzie należałoby najpierw zbiór skompletować, przeglądając wszystkie wydania gazet w nakładzie przekraczającym 20 000, które ukazały się w okresie objętym badaniem, wyciąć lub zrobić fotokopie wszystkich wiadomości na dany temat, sporządzić z nich kartotekę i następnie wylosować z niej próbę. Postępowanie takie praktycznie jest często zbyt kosztowne i zbyt czasochłonne. Dlatego wybiera się na ogól metodę doboru wielostopniowego (np.: (1) wybór właściwych gazet, (2) wybór z tych gazet numerów, które ukazały się pod odpowiednią datą, (3) wybór z tych numerów artykułów na dany temat). Wówczas gdy kryterium wyboru jest czas powstania tekstu, konieczna jest szczególna ostrożność dla uniknięcia zniekształceń systematycznych, bowiem charakter i częstotliwość ukazywania się interesujących badacza treści mogą być różne w różnych latach, porach roku, miesiącach i dniach tygodnia. Po ustaleniu w ten sposób materiału do analizy treści, następuje moment najważniejszy: operacjonalizacja zmiennych zawartych w hipotezach. Mogą być przy tym brane pod uwagę tylko takie zmienne, których wskaźniki można znaleźć w samym tekście. Operacjonalizacja składa się z dwu ściśle ze sobą powiązanych etapów: określenia jednostek tekstowych, które będą przedmiotem postępowania analitycznego, oraz opracowania kategorii analitycznych jako podstawy klasyfikacji treści.
Metody. Określanie jednostek i kategorii analizy
199
Określenie jednostek analizy. Analizowanymi jednostkami mogą być słowa, części zdań, całe zdania, całe akapity tekstu, ale także całe artykuły, książki czy audycje radiowe. Wybór jednostek zależy od tego, jakiego rodzaju treści badacz szuka. Jeżeli chodzi mu o tematy powieści, artykułów gazetowych czy audycji radiowych, to przyjmie je w całości za jednostki analizy. Jeżeli natomiast stara się poznać np. orientacje czy postawy wobec określonych obiektów, to powinien zdecydować się na jednostki mniejsze — słowa, części zdań, zdania lub akapity. Wybór jest jednak często trudny, zwłaszcza w przypadku analizy jakościowej, ponieważ szukana treść (np. postawa), zależnie od okoliczności, może wyrażać się w różny sposób. Negatywny sąd o politycznej postawie studentów może być wyrażony w dłuższym zdaniu, ale równie dobrze w jakimś pojedynczym epitecie. Liczenie pojedynczych słów określonej kategorii jest wprawdzie metodą najprostszą, ale dającą dość ograniczone wyniki. Niewiele socjologicznie ważnych treści można wyczytać wyłącznie z faktu występowania określonych słów. Na przykład wnioskowanie o postawie wobec jakiegoś obiektu na podstawie liczby pojedynczych pozytywnych i negatywnych określeń (rzeczowników i przymiotników) jest wręcz wątpliwe, bowiem znaczenie pojedynczych słów często staje się jasne dopiero w kontekście. To samo można powiedzieć o pojedynczych zdaniach. Wówczas gdy chodzi nie tylko o nastawienie do konkretnego obiektu, ale o całościowe sądy, zapatrywania, wyobrażenia itd., jednostkami analizy w żadnym razie nie mogą być pojedyncze słowa. Opracowanie kategorii analitycznych. Kategorie treściowe mające być podstawą klasyfikacji jednostek tekstowych są ogniwem, które zmienne zawarte w hipotezach'pozwala powiązać z konfiguracjami językowymi stanowiącymi wskaźniki tych zmiennych. Schemat kategorii analitycznych ma zawsze charakter wybiórczy, nie chodzi bowiem o całościowe uchwycenie materiału tekstowego, tzn. o charakterystykę wszystkich zawartych w nim treści, lecz o odpowiedź na określone joytania. Jeżeli przedmiotem zainteresowania jest jedynie pozytywna lub negatywna ocena określonego wydarzenia politycznego w artykułach wstępnych różnych dzienników, to nic ma potrzeby opracowywać kategorii dla klasyfikacji argumentów uży-
200
Analiza treści
tych na poparcie tej oceny (a cóż dopiero dla klasyfikacji wypowiedzi nie mających z tym wydarzeniem nic wspólnego). Natomiast w odniesieniu do badanych treści schemat kategorii musi być tak zróżnicowany, aby pozwalał mierzyć i porównywać różne jednostki nadanego materiału. Budowa schematu kategorii zaczyna się logicznie od ustalenia wymiarów treści, które nas będą interesować. Przy badaniu stosunku do określonego wydarzenia politycznego można wybrać np. następujące wymiary treści: normatywna ocena wydarzenia; praktyczno--polityczna ocena jego skutków; kryteria oceny; rady adresowane do instancji politycznych, jak powinny zareagować na to wydarzenie; emocjonalne komponenty wyrażanego stanowiska itd. Schemat kategorii musi spełniać nadto następujące wymogi formalne: 1. Podział na kategorie musi być dokonany według jednolitej zasady klasyfikacji, co znaczy, że każda z nich musi odnosić się tylko do jednego z wyróżnionych wymiarów treści. 2. Poszczególne kategorie muszą spełniać warunek rozłączności. Znaczy to, że każda jednostka tekstowa wyrażająca jeden z wyróżnionych wymiarów treści musi dać się przyporządkować jednej i tylko jednej kategorii. 3. Podział na kategorie musi być wyczerpujący. Znaczy to, że każda jednostka tekstowa wyrażająca jeden z wyróżnionych wymiarów treści (lecz nic każda jednostka językowa w tekście) musi dać się przyporządkować którejś z istniejących kategorii. Wymienione reguły odnoszą się nic tylko do analizy treści jako szczególnej techniki badawczej, w tym samym stopniu muszą być przestrzegane przy klasyfikacji wyników obserwacji i wywiadu socjologicznego oraz ogólnie przy opracowywaniu klucza kodowego dla danych. W gotowym schemacie kategorii każda kategoria sygnuje określoną klasę znaczeń związaną z określonym wymiarem treści. Jednostki językowe występujące w tekście przyporządkowane są do konkretnych kategorii według równoznaczności (czy ściślej, ich semantycznego podobieństwa). W ten sposób różnorodne artykulacje tych samych treści zostają zredukowane do klas podobieństwa semantycz-
flPHW«
vmm&
Metody. Opracowanie kategorii analitycznych
201
nego. Rzetelne przyporządkowanie jednostek tekstowych poszczególnym klasom wymaga ich operacyjnego zdefiniowania. Trzeba zatem każdorazowo dokładnie podać, choćby posługując się typowymi przykładami, jakie rodzaje słów i wyrażeń należy zaklasyfikować np. jako „pozytywną ocenę wydarzenia", „ekonomiczne uzasadnienie oceny" itd. Ponieważ jednak definicje operacyjne poszczególnych klas znaczeniowych nie mogą być wyczerpującym i szczegółowym wyliczeniem wszystkich wchodzących w ich zakres słów, części zdań, zdań itd. — co zresztą w przypadku treści złożonych i abstrakcyjnych byłoby w ogóle niemożliwe — więc w toku klasyfikacji ostatecznie decyduje intuicyjne rozumienie języka przez osobę dokonującą analizy. Rzeczywiste znaczenie przyjętych kategorii określa zatem w efekcie dopiero ogół przyporządkowanych im jednostek językowych. Im mniej dokładnie zoperacjonalizowana została kategoria, tym większa może okazać się niezgodność między jej znaczeniem zamierzonym i rzeczywistym. Niżej przedstawimy na przykładzie proces konstruowania dość złożonego schematu kategorii10. Historyjki opowiedziane przez osoby badane testem TAT mają być analizowane z punktu widzenia tego, czy wyrażają motywację osiągnięć. Na ich podstawie osoby badane będą klasyfikowane jako: (1) jednoznacznie zorientowane na osiągnięcia, (2) wątpliwie zorientowane na osiągnięcia, (3) jednoznacznie nie zorientowane na osiągnięcia. Przyjmuje się, że osoby zorientowane na osiągnięcia zareagują na ambiwalentny bodziec w postaci obrazka opowiadaniem mówiącym o różnych działaniach motywowanych osiągnięciami, zorientowanych na osiągnięcie celu..Założenie takie pozwala z treści opowiadań TA T wnioskować o strukturze motywacji i potrzeb ich autorów. Przystępując do ustalania kategorii analizy treści u, należy zacząć od wyodrębnienia charakterystycznych komponentów instrumentalnie zorientowanej na osiągnięcie celu sekwencji działań. .Komponenty te spełnią następnie rolę kategorii analitycznych. Mamy wówczas do Pełny raport z badania patrz ibidem, s. 191 i nasi. Podstawą kategoryzacji jest analiza pojęciowa. Por. D. McClelland i wspólaut.: The Acttievement Mo)ive, New York 1953, s. 111 i nast. 10 11
czynienia z takim rozumowaniem: Jednostka żywi potrzebę. Potrzeba ta rodzi wyobrażenie celu, którego osiągnięcie równałoby się jej zaspokojeniu. Za działanie motywowane osiągnięciami uznaje się takie działanie instrumentalne, którego cele definiowane są społecznie jako wartości i wymagają od jednostki, aby o ich zdobycie rywalizowała Z innymi. Wartości te to albo powszechnie cenione dobra, albo role społeczne cieszące się wysokim prestiżem w społeczeństwie. Jednostka obmyśla postępowanie, które powinno służyć osiągnięciu wyobrażonego cela. Równocześnie, przewiduje możliwy sukces albo niepowodzenie swego działania. W toku samego działania mogą pojawiać się przeszkody. Ostateczny sukces albo niepowodzenie wywołuje w niej emocje — pozytywne albo negatywne. W ten sposób zostało już określone dziesięć kategorii. Dla łatwiejszego stwierdzenia, że działanie zorientowane na osiągnięcie celu oceniane jest pozytywnie, wprowadza się jeszcze kategorię „przysłówki nacechowane pozytywnie" i podobnie —• dla łatwiejszego stwierdzenia pozytywnej oceny dóbr i ról społecznych — kategorię „przymiotniki nacechowane pozytywnie". Dla lepszego rozpoznania związków syntaktycznych wprowadza się kategorię „bycie, stawanie się". Ponieważ działanie motywowane osiągnięciami zmierza często do celów odległych — ostatecznie uwzględniona zostaje jeszcze kategoria „czas". Schemat kategorii wygląda więc następująco: kategorie
przykłady
potrzeba bycie, stawanie się rywalizacja aktywne czasowniki nacechowane pozytywnie przysłówki nacechowane pozytywnie cenione dobra
życzenia, nadzieje, potrzeby, żądania bycie, stawanie się, wyrastanie uzyskiwać, przezwyciężać, osiągać, brać czynić, robić, pracować, wymyślać
pozytywnie oceniane role społeczne przymiotniki nacechowane pozytywnie przeszkody sukces niepowodzenie
pi ln i e, starannie, gruntownie odkrycie, wynalazek, inteligencja, gactwo sędzia, profesor, lekarz, adwokat duży, potężny, obiecujący, sławny, bitny kryzys, strata, egzamin sława, poważanie, sukces błąd, pomyłka, niepowodzenie
bo-
wy-
Metody. Opracowanie kategorii analitycznych emocje pozytywne emocje negatywne czas
203
szczęśliwy, wesoły, zachwycony, uradowany smutny, przestraszony, zmieszany przez cale życie, przez wiele lat, przez wiele tygodni
Po opracowaniu tych czternastu kategorii trzeba dokonać następnego kroku. Ani rejestrowanie luźnych jednostek językowych należących do poszczególnych kategorii, ani obliczanie częstotliwości, z jaką występują one w opowiadaniu, nie prowadzą do wykrycia w tekście wątków motywowanych osiągnięciami. Znaczenie jednostek językowych można zrekonstruować dopiero wówczas, gdy odnoszą się przynajmniej do dwu różnych kategorii pozostających w związku syntaktycznym. Dopiero wtedy można orzec, czy poszukiwany temat występuje w tekście czy nie. Dlatego trzeba ustalić reguły określające takie syntaktyczne związki kategorii, które można zinterpretować jako wyrażające działania motywowane osiągnięciami. Skonstruujemy dziewięć takich reguł: (1) potrzeba + rywalizacja przykład: „Miał nadzieję zyskać szacunek"; (2) sukces + emocja pozytywna przykład: „Cieszył się z uzyskanego w końcu uznania"; (3) niepowodzenie + emocja negatywna przykład: „Nie przeforsowawszy swego wynalazku, pełen rozgoryczenia wycofał się"; (4) aktywny czasownik nacechowany pozytywnie -| przysłówek nacechowany pozytywnie (także określenie przysłówkowe) przykład: „Obsesyjnie pracował nad swoim dziełem"; (5) aktywny czasownik nacechowany pozytywnie + cenione dobro przykład: „Przez wiele lat pracował, by w końcu dorobić się majątku"; (6) przymiotnik nacechowany pozytywnie + cenione dobro przykład: „Dążył do zdobycia wielkich pieniędzy"; (7) potrzeba + bycie + pozytywnie oceniana rola społeczna przykład: „Chciał zostać sławnym lekarzem"; (8) potrzeba + bycie -f- przymiotnik nacechowany pozytywnie przykład: „Marzył, że stanie się sławny";
204
Analiza treści
(9) bycie -(- sukces (dotyczy tylko ostatniego zdania w tekście) przykład: „Jego dzieło stało,się wreszcie sławne". W przypadku reguł 2 i 3 kategorie „sukces" bądź „niepowodzenie" w połączeniu z emocją pozytywną lub negatywną mogą znajdować się wic w jednym, lecz w dwóch kolejnych zdaniach. Po ustaleniu tych reguł można przystępować do kodowania poszczególnych jednostek tekstu. Każde zdanie lub każda para zdań są kwalifikowane z tego punktu widzenia, czy podpadają pod którąś z reguł. Wszystkie przypadki odpowiadające którejś z reguł są rejestrowane z zaznaczeniem, której z nich dotyczą. Do grupy pierwszej (jednoznacznie motywowane osiągnięciami) zalicza się te teksty (opowiadania), w których występuje przynajmniej jedno zdanie lub para zdań odpowiadających jednej z dziewięciu wymienionych reguł. Do grupy drugiej — te teksty, które zawierają przynajmniej dwie jednostki językowe podpadające pod kategorię „aktywny czasownik nacechowany pozytywnie" lub jedną jednostkę z kategorii „przeszkody". Wszystkie pozostałe teksty zaklasyfikowane zostają jako jednoznacznie nie motywowane osiągnięciami. Oczywiście, można przyjąć także inne reguły klasyfikacji. OWiczajiie, budowa indeksu, weryfikacja hipotez. W przedstawionym wyżej przykładzie wykroczyliśmy już o krok poza etap konstruowania kategorii mówiąc o obliczaniu i ostatecznej klasyfikacji poszczególnych tekstów zgodnie z przyjętą typologią teoretyczną. Porównanie tekstów z punktu widzenia ich ogólnej charakterystyki wymaga często sporządzenia indeksu uwzględniającego zbiorczo te różne wymiary treści, które w schemacie analitycznym występują oddzielnie. Zależnie od stawianych pytań wyniki analizy treści można następnie korelować z danymi o samym tekście (takimi np., jak moment ukazania się artykułu w druku), o jego nadawcy, odbiorcach, okolicznościach powstania itd. W końcu — za pomocą metod statystycznych weryfikuje się istotność stwierdzonych różnic, co oznacza potwierdzenie bądź obalenie hipotez wyjściowych. Rzetelność i trafność. Analiza treści jest rzetelna wówczas, gdy ta sama osoba dwukrotnie kodując ten sam tekst względnie różne osoby kodujące go niezależnie od siebie uzyskują te same wyniki (częstotliwość występowania poszczególnych kategorii). Stopień zgod-
?»m..:,.; \-&m:-.:~!,«>%Sm __ .PRą, ^ IWB
Wm
Metody ilościowe
-Wm-':-- WĘ
WW
205
ności tych wyników można obliczyć. Nie ulega wątpliwości, że jednoznacznie i precyzyjnie zdefiniowane kategorie oraz wyraźne reguły zaliczania analizowanych jednostek do poszczególnych kategorii zwiększają rzetelność, ograniczają prawdopodobieństwo subiektywnego interpretowania treści przez osobę kodującą. Kolejnym warunkiem rzetelności wyników jest, jak zawsze przy gromadzeniu danych, sumienne przestrzeganie ustalonych reguł postępowania przez osoby kodujące. Trafność analizy treści jest trudna do sprawdzenia. Wymagałoby to udowodnienia, że osoba analizująca odczytywała znaczenie poszczególnych jednostek tekstowych zgodnie z tym, jak je pomyślał nadawca (i jak je pojmuje odbiorca) oraz — przy wnioskowaniu o zmiennych niejęzykowych — że założona zależność między występowaniem określonych znaków językowych w tekście a zamiarem, postawą, motywacją itd. rzeczywiście istnieje. Problemy te zostały już omówione na wstępie. W celu sprawdzenia trafności wyników analizy treści stosuje się zresztą metody omówione w rozdziale drugim (s. 85 i nast.), tzn. (1) sprawdzanie trafności z udziałem ekspertów {expcrt validity), (2) sprawdzanie trafności w grupach o znanych właściwościach (known groups validity), (3) trafność prognostyczna (predictive validity) i (4) trafność teoretyczna (construd ra/idily). 3. Niektóre metody ilościowej analizy treści Z ilościową analizą treści mamy do czynienia już wówczas, gdy określamy częstotliwość występowania pewnych treści w analizowanych tekstach. Co więcej, również same treści można traktować jako zmienne ilościowe (zamiast 'ograniczać się tylko do stwierdzania, że „występują" lub „nie występują"). Obie możliwości można też wykorzystać łącznie przyjmując częstość, z jaką określona treść występuje w tekście, za wskaźnik intensywności postawy. Istnieje szereg metod analizy treści pozwalających mierzyć ocenę (lub postawę względem) obiektów doświadczenia społecznego (grup, instytucji itd.), o których jest mowa w tekście. Już Lasswell próbował stosować ilościową charakterystykę obiektów występujących w te-
WW ■ '**** .
kścic '-. Tu jednak przedstawimy bardziej złożoną metodę Osgooda, zwaną analizą określeń wartościujących (cvaluative assertion analy,v/.v)ł;i.'
Analiza określeń wartościujących. Dokonanie analizy zakłada cztery warunki wstępne, i. Wyióżnienie wyrażeń określających obiekty postaw (OP) i syntaktycznie z nimi powiązanych określeń wartościujących te obiekty (GW). Obiektami postaw są np. „rodzina", „związek zawodowy", „demokracja", zaś określeniami wartościującymi odnoszące się do nich orzeczniki o charakterze wartościującym: „Xjest dobry", „ Y strajkuje", 2. Zidentyfikowanie konstrukcji różnych syntaktycznie jako równoznacznych. Zdanie: „Przyzwoici ludzie gardzą kupcem, który oszukuje" byłoby zatem semantycznie równoznaczne ze zdaniem: „Kupiec, który oszukuje, jest w pogardzie". 3. Oceny dokonane przez różne osoby kodujące muszą wykazywać wystarczający stopień zgodności. 4. Znaczenie wyrażeń wartościujących nie może pozostawiać wątpliwości. Jest tak niewątpliwie w przypadku wyrażeń w rodzaju „zbrodniczy", „mordować" itd. Często jednak ocena zawarta w słowie zależy od kontekstu. W zdaniu: „Dzielni robotnicy fabryki XY strajkują, domagając się należnych im świadczeń socjalnych", słowo „strajkować" można ocenić jako wyrażające treść pozytywną, natomiast w zdaniu: „Robotnicy fabryki XY, podburzeni przez funkcjonariuszy związkowych, strajkują, powodując tym straty w produkcji" jako wyrażające treść negatywną. Metoda analizy określeń wartościujących składa się z kilku etapów. 1. Najpierw wszystkie będące przedmiotem zainteresowania OP zastąpione zostają semantycznie neutralnymi symbolami (literami), aby wykluczyć wpływ postaw osoby kodującej na proces analizy. Często przy tym wynikają trudności z rozróżnieniem synonimów OP i wyrażeń oznaczających różne elementy OP, które muszą otrzymać własne symbole (czy np. „SPD", „kierownictwo SPD" i „wysocy funkcjonariusze SPD" są synonimami tego samego OPT) Aby wykluczyć identyfikację pośrednią, zneutralizowane muszą być również 12 I. L. Janis, R. Fadner: The Coefficicnt of Imbalance, w: Language oj Politics, H. D. Laswell, N. Leites (red.), s. 153 i nast. 1? - Cli. E. Osgooci: The Reprcsentational Model and Rclcvant Research Methods w: Trends in Content Analysis, I. de Sola Pool (red.), Urbana 1959, s. 41.
Metody ilościowe. Analiza określeń wartościujących
207
takie wyrażenia, które mogą zasugerować tożsamość OP, np. „amerykańscy" w zdaniu: „Miłujący wolność naród wietnamski (OP) dławią amerykańscy agresorzy". 2. Następnie wszystkie zdania zawierające neutralne symbole OP przekłada się według przyjętej formuły na zdania pioste, aby lepiej uwidocznić określenia (O W) charakteryzujące OP. Stosuje się dwie zasadnicze formy zdań prostych: (1) syntaktyczne powiązanie OP z OW czasownikowym lub przymiotnikowym (orzeczniki jednowy-razowe): ZFjcst pilny; XY zwyciężył; (2) syntaktyczne powiązanie OP z innym OP, implikującym ocenę wartościującą (orzeczniki dwu-wyrazowe): XY pokonał przestępcę. Rozczłonkowanie zdania złożonego: „Wprawdzie dzielni DX wspomagali DZ w jego walce ze skorumpowanym EF, ale nie dowierzali DZ bez zastrzeżeń" wygląda zatem mniej więcej tak:' 1. DX są dzielni. 2. DX wspomagają DZ. 3. DX nie dowierzają w pełni DZ. 4. EF jest skorumpowany. 5. DZ walczy z EF. Przekształcone zdania składają się gramatycznie z podmiotu, orzeczenia i dopełnienia. 3. Dla każdego OP, o którym badacz chce się dowiedzieć, jak jest oceniane, sporządza się osobną tabelę kodową i nanosi na nią wszystkie przekształcone zdania zawierające dotyczące go określenia. Następnie w każdym z tych zdań ocenę OP stanowiącego jego podmiot szacuje się ilościowo. W tym celu treść wartościującą orzeczeń i dopełnień kwalifikuje się jako pozytywną lub negatywną oraz określa jej intensywność posługując się oznaczeniami liczbowymi od +3 do —3. Orzeczenia kwalifikuje się zależnie od tego, czy w układzie syntaktycznym pełnią funkcję asocjatywną czy dysocjatywną. „DX wspomagają DZ" zawieia orzeczenia o asocjatywnej (jednoczącej) funkcji, otrzymuje więc znak plus (+), „DZ pokonał EF" zawiera orzeczenie o funkcji dysocjatywnej (dzielącej), zostaje więc oznakowane minusem (—). Nadawanie tym wartościom wag nie podlega regułom formalnym, decyzja należy do osoby kodującej.
Analiza treści
208
Tabela 17 przedstawia jeden z możliwych wycinków tabeli kodowej. Kierunek i intensywność wartościowania zawartego w każdym ze zdań wynika z wartości przypisanych orzeczeniu i dopełnieniu. Ustalenie średniej oceny określonego OP, wynikającej z całego tekstu, wymaga na zakończenie sporządzenia indeksu, którego wartość waha się między +3 i —3 ". Indeks ten pozwala porównywać różne teksty. Tabela 17 Tabela kodowa analizy wartościującej OP
Orzeczenie
Wartość
DF
doznał
+3
DF
jest
+3
DF
przyczynił sic
+2
DF
utraci!
—3
Dopełnienie
ciężkiej porażki wyborczej wewnętrznie załamany do nowej koniunktury gospodarczej wiarygodność
Liczba zdań: 4
Wartość
Ocena wynikowa
_2
—6
—3
—9
+2 +3
—9
0
+4 —20
Kontynuacją analizy określeń wartościujących jest analiza obrazu. Za pomocą tej samej techniki co przy analizie określeń wartościujących bada się tu dwa dalsze wymiary semantyczne (omówione już w związku z dyferencjałem semantycznym na s. 64 i nast.), a mianowicie wymiar „silą — słabość1' i wymiar „aktywność — pasywność". W ten sposób postawy względem określonych obiektów zostają schaS;j w użyciu dwie formy tego indeksu: ( I) sumę ocen wynikowych poszczególnych zdań dzieli się przez liczbę zdań i mnoży przez 1/3: w
1
3-|
IE(W0-Wcl)\
;v j
(2) waży się dodatkowo wszystkie wartości orzeczeń w ten sposób, że sumę ocen wynikowych (jzieli się przez sumę bezwzględnych wartości orzeczeń:
SOK)
Metody ilościowe. Analiza kontyngencji
209
rakteryzowane trójwymiarowo. Podstawowa różnica między techniką dyferencjału semantycznego a analizą obrazu polega na tym, że ta ostatnia, zamiast zlecać klasyfikację obiektów postaw według przyjętych wymiarów osobom badanym, posługuje się materiałem, który już powstał. Orzeczenia i dopełnienia zdań prostych kodowane są zatem trojako: pod względem kierunku (+, ■—) i intensywności zawartych w nich ocen, pod względem siły lub słabości przypisywanej OP oraz pod względem przypisywanej mu aktywności lub pasywności. Analiza kontyngencji. Analiza kontyngencji13 służy do określania szczególnej struktury asocjacji między różnymi pojęciami. Stosuje się ją przede wszystkim w odniesieniu do tekstów powstających spontanicznie, gdzie asocjacje nie są w sposób konieczny uwarunkowane względami argumentacji, tzn. nadawca nie stosuje ich z rozmysłem, np. w celu propagandowego oddziaływania na odbiorcę. Ponieważ częstotliwość skojarzeń określonych słów w tekście może być często rzeczą przypadku, należy wyłapać wyrażenia występujące w skojarzeniu z częstotliwością wykraczającą poza prawdopodobieństwo losowe. Analiza kontyngencji składa się z następujących etapów: 1. Najpierw w materiale tekstowym trzeba wyodrębnić jednostki. Jeżeli materiał ten nie dzieli się na jednostki tekstowe w sposób naturalny, jak w gazetach na artykuły, w powieściach na rozdziały itd., trzeba podzielić go na jednostki mniej lub bardziej sztuczne. 2. Stosownie do pytań badawczych ustala się kategorie analityczne. Badanie może dotyczyć np. powiązań między wyrażeniami „dobrobyt", „postęp", „ubezpieczenie społeczne", „związek zawodowy", „strajk", „kryzys", „społeczny brak pewności". Ich odpowiedniki semantyczne również byłyby zaliczane do tych samych kategorii. Im bardziej szczegółowo potraktowane są kategorie (w przypadku skrajnym mogą one obejmować tylko określone słowa), tym większy objętościowo musi być materiał, w przeciwnym bowiem razie kon-tyngencje będą nieistotne. 3. Sporządza się macierz danych, w której zaznacza się obecność lub nieobecność odnośnych wyrażeń w każdej jednostce tekstowej 16
Ch. E. Osgood: The Representational Model, s. 61 i nast.
14 — Wprowadzenie...
Analiza treści
210
Tabela IS
rednostki
Macierz danych do analiz kontyngencji y Kategorie analizy treści
i 9
3 '4 5
+ _
ABC
D
E...
N
—
+
+ .—
_ — —
+ — +
+ + +
+ — — + —
+ + + — —
+ + + +
— Częstotliwość względna:
70
20
30
+ 10
30
osobno (patrz tab. 18). Jeżeli jednostki tekstu są bardzo duże, to można poprzestać na stwierdzeniu, czy określone wyrażenie występuje w nich z częstotliwością ponadprzeciętną, co zaznacza się w macierzy jako „ + "'. 4. Oblicza się względną częstotliwość występowania każdej z kategorii analizy treści we wszystkich jednostkach tekstu iącznie. W tab. 18 względna częstotliwość A wynosi 70%, B — 20% itd. Stąd można obliczyć wartość oczekiwaną wystąpienia określonej kombinacji dwóch kategorii: PAB = PAxPn. Wartość oczekiwana równoczesnego wystąpienia A i B w tab. 18: PAn = 0,70x0,20 = 0,14. Wartości oczekiwane nanosi się następnie na tabelę kontyngencji (tab. 19) powyżej przekątnej. Rzeczywistą częstotliwość względną występowania dwóch kategorii łącznie, ustaloną na podstawie macierzy danych (tab. 18), nanosi się poniżej przekątnej. 5. Porównuje się częstotliwość względną każdej kombinacji dwóch kategorii z odpowiednią wartością oczekiwaną. Jeżeli częstotliwość względna kombinacji jest znacząco większa lub niniejsza niż wartość oczekiwana, fakt ten można przyjąć za wskaźnik ujawniającej się w tekście struktury asocjacji poznawczych. Jeżeli częstotliwości
. WSR ■
RwraF.
^W
Metody ilościowe. Analiza kontyngencji
211 Tabela 19
Tabela kontyngencji Kategorie
analizy treści
A
B
C
D
E...
N
A
—
0,14
0,21
0,21
0,07
0,21
B C D
0,21 0,31 0,06
—
0,06
0,12 0,04
0,06 0,09
0,12
0,02 0,03 0,03
0,06 0,09 0,09
__
—
0,10
N
0,20
0,07
E
0,12
0.18 0,42
0,31
0,12
0,03
0,15
względne różnią się od wartości oczekiwanych w stopniu nieistotnym, można to uznać za wskazówkę, że między zawartością semantyczną danych kategorii analitycznych nie występuje związek uwarunkowany strukturą asocjacji. Istotność różnicy między wartością oczekiwaną a częstotliwością względną można oszacować posługując się odchyleniem standardowym wartości oczekiwanej. Odchylenie to oblicza się według wzoru:
Pi\-P) W przykładzie
'
V
N dla wartości oczekiwanej
AC wynosi ono: /0,2T0J9 20
0,073
Wyznacza ono granice odchyleń losowych od wartości oczekiwanej. Jeżeli jest ona niniejsza niż rzeczywista częstotliwość względna, która dla kombinacji AC wynosi 0,31, to znaczy, że asocjacja tych kategorii nie jest rzeczą przypadku, lecz wynika ze struktury
poznawczej mówiącego lub piszącego. Ponieważ analiza kontyngencji nie uwzględnia syntaktycznych powiązań między jednostkami językowymi, więc jednoczesne wystę-
212
Analiza treści
powanic dwóch jednostek nie dostarcza żadnych informacji o rodzaju związków semantycznych między nimi. Jeżeli np. w jednej gazecie zdanie: „Wolność i komunizm wykluczają się nawzajem" występuje równic często jak w innej zdanie: „Komunizm jest warunkiem wolności", to wprawdzie zdania te semantycznie sobie przeczą, ale analiza kontyngencji wykaże dla obu gazet tę samą, nieprzypadkową zależność między „wolnością" a „komunizmem". Zadania 1. Jaki materia! tekstowy (teksty źródłowe, periodyki) należy poddać analizie, jeżeli chce się za pomocą analizy określeń wartościujących zweryfikować hipotezę, że w obliczu zagrażającego kryzysu postawa związków zawodowych i przedsiębiorców jest bardziej antagonistyczna niż w czasach pomyślnej koniunktury? 2. Proszę przygotować artykuł gazetowy na tematy aktualne do analizy określeń wartościujących, neutralizując wyrażenia określające obiekty poitaw i rozczlonkowujac zdania na zdania proste. Proszę sporządzić tabelę kodową dla głównego OP i przeprowadzić postępowanie wartościujące. 3. Proszę przeprowadzić analizę treści ogłoszeń matrymonialnych z uwzględnieniem wszystkich wymienionych w ustępie 2 niniejszego rozdziału etapów, ustalając z jaką częstotliwością poszukiwane są określone cechy potencjalnych współmałżonków — (a) mężczyzny i (b) kobiety — oraz jakie cechy poszukujących współmałżonków — (a) mężczyzny i (b) kobiety — wysuwane są na plan pierwszy jako rzekomo atrakcyjne.
Rozdział dziewiąty
Eksperyment
1. Eksperyment jako metoda analizy zależności przyczyno wy eh Eksperyment można uznać za najszlachetniejszą z metod badawczych, ponieważ pozwala dochodzić uwarunkowań przyczynowych. Nic podejmując dyskusji nad pojęciem przyczynowości, przyjmiemy za podstawę następującą definicję pragmatyczną: dwie lub więcej zmiennych łączy związek przyczynowy, jeżeli ich wzajemny stosunek ma charakter empirycznie nieodwracalny, niesymetryczny. X wywołuje Y (X -> Y), ale nie odwrotnie. X jest tu zmienną niezależną, Y zmienną zależną \ Przykładowo — rywalizacja (X) powstała między członkami grupy osłabia ich wzajemną życzliwość (Y). Ta życzliwość mogła już wprawdzie wcześniej — z innych przyczyn — być niewielka, ale fakt ten sam w sobie nie rodził rywalizacji. Warunkiem podjęcia eksperymentu jest zakończenie opisowej fazy badań bądź posiadanie skądinąd koniecznej wiedzy o sytuacji. Potrzebna jest znajomość zarówno jednostek badawczych, jak zmiennych, ale ponadto przynajmniej wstępne założenie co do zależności między nimi. Często stwierdzona jest już także empirycznie korelacja (prawidłowość empiryczna) i rzecz idzie o to, aby sprawdzić w diodze eksperymentu, czy związek ma charakter przyczynowy i jak on się konkretnie kształtuje. Eksperyment stanowi więc stosunkowo późną fazę procesu badawczego. Pragnąc ustalić związek pizyczynowy, badacz musi operować zmienną niezależną w określonej sytuacji i obserwować skutki tych 1 Na temat zasady przyczynowości patrz H. A. Simon: Modcls of'Mmi, New York 1957, s. JO i nast. oraz E. Nagel: Struktura nauki, tłum. J. Giedymin, B. Rassalsld, H. Eilstein, Warszawa 1970, s. 277 i nast.
214
Eksperyment
operacji. I1!) to jednak, aby mieć pewność, że zaobserwowany skutek rzeczywiście wywoła'a zmienna niezależna, musi równocześnie spra wować kontrole nad pozostałymi czynnikami oddziałującymi na daną sytuację. W badaniach, społecznych, te dwa istotne warunki ekspery mentu - ... kontrola czynników i swobodne operowanie zmienną nie zależną — często okazują się niemożliwe do spełnienia. Trudności te, ograniczające możliwość stosowania metod eksperymentalnych, przez długie lata były argumentem w ustach tych, którzy odmawiali przy znania naukom .społecznym statusu nauki ścisłej. Badania ąuasi-eksperymcntalne — kiedy badacz nie może bezpośrednio operować zmienną niezależną, a czynniki intciTcrujące w danej sytuacji kontro luje tylko symbolicznie — nie mogą zastępować prawdziwego ekspe rymentu, ponieważ pozwalają jedynie na snucie (mniej lub bardziej uprawnionych) przypuszczeń co do związków przyczynowych, nie pozwalają natomiast na ich faktyczne stwierdzenie. Dla wartości wyników nie ma za to decydującego znaczenia, czy eksperymentu do konuje się w laboratorium czy w warunkach naturalnych, jakkolwiek w tym drugim przypadku kryteria eksperymentu są zwykłe, ze wzglę dów praktycznych, trudniejsze do spełnienia. Eksperyment jest to podejście badawcze, a nie technika gromadzenia danych. Jego realizacja wymaga jednak użycia technik w rodzaju obserwacji czy wywiadu socjologicznego dla ustalenia, jakie zmiany dokonały się pod wpływem zastosowanego bodźca. W badaniach eksperymentalnych, podobnie jak nieeksperymentalnych, mogą być stosowane rozmaite techniki gromadzenia danych. 2. Schemat eksperymentu badawczego Podstawową kwestią w badaniach eksperymentalnych jest pytanie, jak można wykazać, że dana zmienna jest właśnie zmienną niezależną oiaz jak się powinna względem niej zachowywać przypuszczalna zmienna zależna, aby mogła być za taką uznana? Pierwszy odpowiedział na te pytania John Stuart Mili". 2 J. S. Mili: System logiki dedukcyjnej i indukcyjnej, tłum. C. Znamierowski, Warszawa .1962.
• Schemat. Milki kanony indukcji
215
Milla kanony indukcji. Przypuśćmy, że A, B, C, X i Y są zmiennymi „dwuwartościowymi", tzn. jako cechy albo występują, albo nie występują. Ich brak symbolizuje znak negacji „~"; np. ~X oznacza brak (niewystępowanie, nieobecność) X. Mili opracował dwie metody indukcji przez eliminację. 1. Kanon jedynej zgodności: X, A, B, C -> 7
(1)
X, ~ A, ~ B, ~ C -» Y
(2)
Jeżeli występują zmienne X, A, B i C, to występuje także Y, której przyczynę należy ustalić (zdanie 1). Która z czterech zmiennych jest właściwym czynnikiem sprawczym 7? Jeżeli występuje tylko X, nie występują natomiast A, B i C, to występuje /(zdanie 2). Z tych dwóch zdań wynika, że X jest przyczyną Y. 2. Kanon jedynej różnicy: X, A, B, C -» Y
~ X, A, B, C -* ~ Y
(1)
(2)
Jeżeli występują zmienne X, A, B i C, to występuje także Y (zdanie 1). Jeżeli nie występuje X, występują natomiast A, B i C, to nie występuje Y (zdanie 2). Wynika stąd, że przyczyną Y jest X. Kanony te można ze sobą połączyć. Otrzymamy wówczas następujący ciąg zdań: X, A, B, C -> Y
(1)
X, ~ A, ~ B, ~ C -* Y
(2)
~X, A, B, C -» ~y
(3)
Z tych trzech zdań wynika; że X — jak się przy takich okazjach mówi —jest konieczną i wystarczającą przyczyną Y, tzn. X musi wystąpić, aby wystąpiło Y oraz sam X może spowodować wystąpienie Y. Kanony Milla krytykuje się z różnych stron3. Wskażemy tu dwa najwćiżniejsze zarzuty. Po pierwsze, kanony Milla mają zastosowanie 3
Por. krótkie omówienie R. L. Ackolla: Sckntijic Method, New York 1962, s. 312 i nast.
216
Eksperyment
tylko przy zmitnnych dwuwartościowych (występuje lub nie występuje). Bardzo często jednak chodzi nie o to, czy cecha występuje c/y nic, lecz o to, juką przybiera, wie/kość. Co więcej, wiele istOiiiych zmiennych (np. płeć) występuje zawsze. Drugi zarzut stawiany kanonom Milla jest znacznie poważniejszy. Przewidywany czynnik sprawczy X uwikłany jest w określone „środowisko" (czynniki A, B i C). W drodze eliminacji metodą jedynej zgodności lub jedynej różnicy powinno się więc stwierdzić, która spośród zmiennych wchodzących w skład „środowiska" powoduje powstanie Y: Całego jednak środowiska A'nie można wyeliminować, liczba i rodzaj czynników, które się na nie składają i przypuszczalnie oddziałują na Y, nie jest bowiem znana. Być może więc Y determinuje nie znany czynnik D. W przypadku kanonu jedynej zgodności sytuacja mogłaby wyglądać następująco: X, A, B, C @-> Y X, ~ A , ~ B , ~ C @-+ Y
(!) (2)
Kółko, w którym znajduje się D, oznacza, że D jest nie znane. W przypadku kanonu jedynej różnicy mogłaby się zdarzyć rzecz następująca: X, A, B, C@-+ Y ~X, A, B, C (£/>)-> •- Y
(1) (2)
Nie można zatem wykluczyć — a nawet jest bardzo prawdopodobne — że właśnie D występuje lub nie występuje razem z X. Ten drugi zarzut spowodował, że w naukach społecznych, w których uwarunkowania mają najczęściej charakter wicloczynnikowy i w których stosunkowo mało wie się o przedmiocie badania, zrezygnowano raczej z kanonów Milla. Jedynie w naukach przyrodniczych, gdzie wielokrotne badania pozwalają dość dobrze poznać „środowisko" (domniemanego) czynnika sprawczego, uznaje się jeszcze kanony Milla. Toteż eksperymenty w dziedzinie fizyki prowadzi się z reguły zgodnie z tymi kanonami. Współczesny eksperyment stochastyczny. Eksperyment zgodny z kanonami Milla nazywa się często „eksperymentem deterministycznym". ponieważ opiera się na deterministycznym widzeniu świata. Pracom
Schemat. Eksperyment stochastyczny
217
statystycznym R. A. Fischera i w latach trzydziestych zawdzięczamy zasady nowoczesnego eksperymentu stochastycznego, nie obarczonego żadnym z dwu wyżej wymienionych mankamentów eksperymentu deterministycznego. Przedstawimy go niżej, przyjmując, że (domniemany) czynnik sprawczy X jest zmienną dwuwartościową (występuje, nie występuje), zaś zmienna zależna ma charakter ilościowy. Osobami badanymi będą studenci, a celem eksperymentu jest odpowiedź na pytanie, czy obejrzenie określonego filmu (X) ma wpływ na siłę uprzedzeń (Y). Przebieg eksperymentu można zapisać następująco : Gx:
X-+ Yx
Gr. ~Ar- 72 Gx i Go są to dwie grupy studentów wybrane ze zbiorowości generalnej studentów uniwersytetu przy użyciu metody, którą omówimy niżej. Wobec Gx zastosowano bodziec eksperymentalny X: grupie tej pokazano film pozytywnie przedstawiający rozwój państwa Izrael. Następnie za pomocą ilościowej skali intensywności uprzedzenia do Żydów zmierzono wartość uprzedzeń Yx. Grupie G2 nie pokazano żadnego filmu (~X), a jedynie zmierzono intensywność uprzedzeń, stwierdzając wartość Y2. Jeżeli Y1 istotnie różni się od Y2, to badacz ma piawo uznać tę różnicę za skutek bodźca X. Na tym bardzo prostym przykładzie można omówić zasady nowoczesnego eksperymentu. 1. Identyczność obu grup. Yx i Y2 mogą być zasadnie porównywane, jeżeli grupy Cj i G, są jednakowe, i topod względem wszystkich zmiennych, które opiecz X mogły mieć wpływ na intensywność uprzedzenia Y. Warunek ten nazywamy kontrolowaniem nie znanych czynników sprawczych. Są one kontrolowane, jeżeli wiadomo, że ich wpływ na Y jest w obu grupach taki sam. Jednakowość grup uzyskuje się zazwyczaj dwiema metodami: za pomocą doboru losowego lub doboru parami. a. Dobór losowy (ang. randomization). Obie grupy stanowią próby losowe tej samej zbiorowości generalnej (zbiorowość studentów uni1
JR.. A. Fischer: The Design oj' Expcrimen1s, London 1935.
Eksperyment
218
wersytetu). Zgodnie z matematyczno-statystyczną teoria prawdopodobieństwa, próBy te (w granicach błędu szacunkowego) są jednakowe pod względem wszystkich swoich cech (wartość średnia, rozkład częstości). W ten sposób nie znane czynniki sprawcze są kontrolowane. Przy Milłowskicj metodzie jedynej zgodności nie podejmuje się natomiast żadnych kroków zmierzających do tego, aby obie grupy oprócz X i kontrolowanych zmiennych A, B i C także pod względem innych, nie znanych, a wpływających na Y, zmiennych były porównywalne. Jeżeli uczestnicząca w eksperymencie zbiorowość jest zbyt mała, aby wyciągnąć z niej dwie próby, dzieli się ją na dwie grupy według zasady doboru parami. J tym razem, w myśl zasad teorii prawdopodobieństwa, można przyjąć, że cechy obu grup są jednakowe pod warunkiem, że grupy te nie są zbyt małe. b. Dobór parami (ang. mcttclung). Jeżeli eksperyment ma dotyczyć małej zbiorowości, jednakowość obu grup można uzyskiwać stosując metodę matcliing. Wówczas gdy przypuszcza się, że oprócz czynnika X intensywność uprzedzeń warunkują płeć i wiek studentów, można te cechy uwzględnić dzieląc badanych na podgrupy jak w tab. 20. Tabela 20 Podgrupy przy doborze parami Wiek
Pleć
Mężczyzn i Kobiety
poniżej 20 lat
i I
20—">5
lat
powyżej 25 lat
20
40
j
20
15
30
j
IS
Każdą z sześciu podgrup dzieli się następnie losowo na połowę. Jedna połowa to grupa G,, druga to grupa Go5. W ten sposób każda 1 Jeśli podgrupa składa sic z nieparzystej liczby osób, to jedna jej polowa będzie miała o jedną osobę więcej niż druga. Nad faktem tym można przejść do porządku dziennego, jeśli podgrupa jest wystarczająco duża, ale można także drogą losowania zredukować liczbę osób w podgrupie, tzn. usunąć jedną z nich, otrzymując w ten sposób liczbę parzystą.
Schemat. Eksperyment stochastyczny
219
osoba w jednej grupie ma „bliźniaka" (pod względem wybranych cech wspólwarunkujących) w drugiej grupie. Dlatego metodę tę nazywa się doborem parami. Podział losowy zapewnia to, że pod względem wszystkich innych nie znanych cech warunkujących połowy każdej podgrupy będą statystycznie rzecz biorąc jednakowe (pod warunkiem, że podgrupy nie są zbyt małe). W ten sam sposób można zrównoważyć kilka czynników. W przypadku jednak, gdy podgrupy są zbyt małe, ich podział losowy spowoduje fałszywą „jednakowość". Dobór [larami można stosować także wobec prób wyciągniętych z wielkich, zbiorowości. Niekiedy wymienia się jeszcze trzecią metodę uzyskiwania podobieństwa grup: wyrównywanie parametrów rozkładów istotnych zmiennych °. Osoby badane dzieli się z punktu widzenia domniemanych cech współwarunkujących na dwie grupy tak, aby każda reprezentowała tę samą wartość średnią i ewentualnie takie samo rozproszenie wokół średnich. Jeżeli przypuszcza się, dajmy na to, że czynnikiem współwafunkującym jest wiek, to w obu grupach powinna być ta sama średnia wieku i ewentualnie ten sam rozkład grup wiekowych 7. Jest to uproszczona forma doboru parami. W odróżnieniu od właściwej metody, matching — tym razem inne nie znane czynniki sprawcze pozostają poza kontrolą, ponieważ przydział do grup Gx i C2 nie przebiega losowo. 2. Bodziec eksperymentalny. W grupie G^ eksperymentator stosuje bodziec eksperymentalny (w naszym przykładzie jest nim film). Grupa G-, nie podlega żadnym manipulacjom. Gx jest grupą eksperymentalną, G2 — grupą kontrolną. Ważne jest, że badacz może sam operować bodźcem, decydując, czy zastosuje go w grupie Gx czy G«. Jest to warunek sine qua non rzeczywistego eksperymentu, tylko wówczas bowiem można mieć pewność, że zmiana Y (zmiennej zależnej) spowodowana została przez X (zastosowany bodziec). 3. Zmiany zmiennej zależnej. Po zastosowaniu bodźca eksperymentalnego mierzy się i porównuje wartość Y (w przykładzie: siłę 8
Patrz np. E. Grecnwood: Das Exper!ment in i!er Soziologte, w: Beobachtung mul Experimenl in der Sozialforschimg, R. Kónig (red.), Koln 1950. 7 Zastrzeżenia wobec tej metody patrz rozdział trzeci s. 92.
220
Eksperyment
uprzedzeń) w C7, i 6'2. Jeżeli wartości te różnią się między sobą, to powstaje jeszcze pytania, czy różnią się one istotnie. Przy eksperymencie stochastycznym jest bowiem możliwe, że różnica ta ma charakter przypadkowy, ponieważ Gt i G2 są do siebie podobne tylko jako próby, tzn. „jednakowe" tylko w określonych granicach błędu. Istotność różnicy wartości 7 sprawdza się za jsomocą testu. W użytym przykładzie stosuje się zazwyczaj test t, którego nie będziemy tu omawiać 8. Można także posłużyć się analizą wariancji; omówimy ją niżej. 4. Interpretacja, wyników. Jeżeli różnica między Ys a 7, jest „rzeczywista" na określonym poziomie istotności, np. z prawdopodobieństwem 95% (patrz s. 246), to dowodzi to istnienia związku przyczynowego. Można wówczas z 95% pewności powiedzieć, że w przypadku wszystkich osób należących do zbioru i (czyli zbiorowości, wobec której uprawnione jest to uogólnienie) zmienna X współokreśla zmienną 7 (lub: X jest przyczyną 7). W konkretnym przypadku precyzuje się w miarę możliwości, jak kształtuje się ta zależność: czy 7 pod wpływem X rośnie czy maleje, zmienia się proporcjonalnie czy wykładniczo itd. Jak dalece tego rodzaju stwierdzenia są możliwe, zależy od rodzaju zmiennych. Eksperyment może wykazać jedynie, że 7 zależne jest między innymi od X, na 7 bowiem mogą oddziaływać również inne czynniki. Na przykład siła przesądu w grupie kontrolnej może być skutkiem owych „innych czynników". Działają one także w grupie eksperymentalnej, nie można ich jednak wypreparować metodą upodobnienia grup G^ i G2. Chcąc poznać wszystkie przyczyny 7, trzeba by przeprowadzić wiele eksperymentów, w których każdorazowo inny domniemany czynnik sprawczy byłby bodźcem eksperymentalnym, pozostałe zaś czynniki, łącznie z tymi, których oddziaływanie ustalono w poprzednich eksperymentach, pozostawałyby pod kontrolą, tzn. były ujednolicone w grupach 6\ i G2. Pracochłonność takiego postępowania można ograniczyć stosując eksperymenty uwzględniające wiele czynników sprawczych równocześnie. Wyniki eksperymentu można uogólniać ceteris paribus, tzn. przy zachowaniu tych samych warunków. Warunki te obowiązują jednak " Test t opisany jest w podręcznikach statystyki. Patrz np. H. M. Blalock: Statystyka dla socjologów, tłum. M. Tabin, I. Topińska, K. Starzec, Warszawa 1975, s. 166-172.
Warianty eksperymentu. Wielowartościowe zmienne niezależne
221
z całą pewnością tylko w odniesieniu do tej zbiorowości, z której wyciągnięto porównywane grupy jako próby reprezentatywne (do osób zbioru i). W innych zbiorowościach warunki powodujące wystąpienie stwierdzonej zależności mogą się kształtować inaczej. W innej grupie społecznej jakaś cecha, która nie występuje u studentów, może spowodować np., że obejrzenie tego samego filmu wzmocni siłę uprzedzeń, podczas gdy u studentów ją osłabiło. Tylko wówczas, gdy znane są wszystkie warunki wyjściowe i sposób ich oddziaływania, można wyciągać wnioski ogólne bez względu na reprezentatywność grup badanych, jednak przy zależnościach społecznych sytuacja taka byłaby czymś wyjątkowym. 3. Warianty schematu eksperymentalnego Analizowany wyżej eksperyment charakteryzował się tym, że zastosowano w nim tylko jedną, i to dwuwartościowa (występuje, nie występuje) zmienną niezależną (czynnik warunkujący), zaś zmienna zależna mierzona była tylko jeden raz. Teraz omówimy krótko bardziej rozbudowane warianty badawcze. Eksperymenty z udziałem wielowartościowych zmiennych niezależnych. Przyjmijmy, że czynnikiem warunkującym pozostanie w dalszym ciągu obejrzenie filmu, tym razem jednak X jest zmienną porządkową trójwartościową: Xmalo to film zawierający mało pozytywnych informacji o mniejszości będącej przedmiotem uprzedzeń, Iiw,„,„ i Xduł0 to filmy zawierające średnio i dużo informacji pozytywnych o tej mniejszości (czynnikiem warunkującym może być także zmienna wielowartościowa nominalna — liczba osób w rodzinie — bądź ilorazowa nieciągła — wiek). Eksperyment wyglądałby zatem następująco: "i: Xma!o -* Yx G"-'-
^średnio ~* Y*
G-j- Xduio -* Y3
W eksperymencie tym nie ma grupy kontrolnej. Każda z trzech grup jest raz grupą eksperymentalną (dwie pozostałe są wówczas
222
Eksperyment
jej grupami kontrdlnymi), a raz kontrolną (dla którejś z dwu pozostałych, która tym razem jest .grupą eksperymentalną). Grupy te podobnie jak poprzednio — muszą być jednakowe. Za pomocą testu istotności trzeba sprawdzić, czy różnice między Yu Y2 i 7"., są „rzeczywiste". Eksperyment z dwiema lub więcej zmiennymi niezależnymi. Chcąc zbadać wpiyw większej liczby czynników na zmienną zależną nie przeprowadzając dla każdej z nich odrębnego eksperymentu, można je zastosować w jednym eksperymencie równocześnie. Ze względów praktycznych oraz rachunkowych nie powinno ich być więcej niż cztery. Posłużmy się przykładem z dwiema cechami warunkującymi. Pierwszą zmienną niezależną X będzie, jak wyżej, film: Xliwh, Xircdnjn, Xlluio. Drugą zmienną niezależną będzie „dyskusja o mniejszości" (której dotyczą uprzedzenia). Ten drugi czynnik oznaczymy symbolem W. Będzie on dwuwartościowy: W i ^~W („dyskusja" i „brak dyskusji"). Eksperyment ma zatem formę następującą: C,: Xumhn W~* Y1
G,_: Xmola, ~W-* Y,
G,: XMnlo, W^Y,
G4: XirtMo, ~W-+ Yt
Gy. Xlhlio, W-* Y,
Gt,: XHatBt ~W - Yn
Tym razem potrzeba więc sześciu jednakowych grup 9 (przygotowanych albo za pomocą doboru losowego, albo doboru parami), które poddane zostaną działaniu zmiennych niezależnych w sześciu możliwych kombinacjach. Eksperymenty z uwzględnieniem zm\cnnc\ czasu. Dotychczas mówiliśmy o eksperymentach, w których wymiar czasu grał rolę tylko o tyle, że najpierw stosowano bodziec, a następnie mierzono zmienną-zależną. Niżej przedstawimy eksperyment, w którym zmieniła za-
■' Stworzenie takich grup może w praktyce nastręczać znaczne trudności. Dla zredukowania czynności praklyczno-empirycznych można posłużyć się metodą „kwadratu łacińskiego". Metody tej nic będziemy tu opisywać. Jej opis patrz R. L. Ackofl": Scienlijic MethocI, s. 322 i nast. oraz W. G. Cochran, G. M. Cox: Experimental Design, New York 1957, rozdz. 4.
sHHas&aHŁ«-J!
Ei&S
■•____ - „>« -".Hi™
fcasass
Warianty eksperymentu. Zmienna czasu
Sas-Ł'.T
!■» »
223
leżna mierzona jest dwukrotnie (układ before-after). Dla uproszczenia użyjemy dwuwartościowej zmiennej niezależnej.
C-. C:
r. 1 ^
'+«
'+i
U
1
x
y,
~A"
y.
W momencie r0 mierzy się siłę uprzedzeń w obu grupach — C; i C2. W momencie /+1 grupie Ą pokazuje się film (grupa G% filmu nie ogląda). W momencie r+g ponownie mierzy się siłę uprzedzeń w obu grupach. Eksperyment ten ma pewną godną uwagi przewagę nad dotychczas omawianymi eksperymentami statycznymi: pozwala sprawdzić, czy grupy Gx i Ct są jednakowe pod względem początkowej wartości Y: ( Kj),0 i (K2)/() nic powinny się różnić w stopniu istotnym. Jeżeli bodziec eksperymentalny zastosowany w grupie Gt rzeczywiście oddziałał na Y, lo (Y%)t będzie inne (załóżmy, że mniejsze) niż (Yi)lg. Należy przypuszczać, że różnica D1 = (Y^h — (łi),+, spowodowana jest działaniem X. Przypuszczenie to można sprawdzić. W grupie kontrolnej G-, nie musi być (Y^),+t równe (Y^,. Jednostki w obu grupach mogą podlegać określonym „procesom dojrzewania" (zmianom zachodzącym w czasie, których przyczyny eksperyment nie uwzględnia) lub wpływom otoczenia w czasie trwania eksperymentu. Nie jest więc wykluczone, że również w grupie C, wystąpi różnica D._, = (Y^)h — (X*)/+,. Posługując się testem istotności trzeba zatem ustalić, czy Dx i D% różnią się od siebie istotnie. Jeżeli tak, to różnice tę można przypisać działaniu X. Specyfika tego wariantu polega na ujawnieniu przyczyny zmiany dokonującej się w sposób naturalny. Liczbę pomiarów dokonywanych, po wprowadzeniu bodźca eksperymentalnego można również zwiększyć, aby pokazać, jak zmienia się jego wpływ w danym czasie. Taki eksperyment dynamiczny obarczony jest tymi samymi wadami co analiza panelowa (patrz rozdział siódmy, s. 190). Osoby badane są dwukrotnie we względnie krótkim odstępie czasu za pomocą tego samego narzędzia eksperymentalnego. Może to mieć wpływ na wynik.
224
Eksperyment
uzyskany W czasie t.h,. Czy wpływ ten rzeczywiście miał miejsce, można sprawdzić stosując następujący wariant eksperymentalny: h
< G, h
'+a
Ui
Y,
X
Yl
Y,
~x
Y, Y, Yt
G, G <
X
~x
Obejmuje on dodatkowo jeszcze dwie grupy porównawcze, w których nie przeprowadzano pomiaru pierwszego. Owe dwie grupy porównawcze stwarzają sytuację analogiczną do prostego eksperymentu statycznego opisanego na początku. Porównując grupę pierwszą z trzecią i drugą z czwartą w momencie /+2 można stwierdzić, czy pomiar pierwszy (/„) miał wpływ na Y. Jeżeli tak, to wartości Y będą się między sobą różniły. Wielkość tego wpływu można określić za pomocą analizy wariancji czterech wartości Y w czasie t+t (patrz niżej)10. Zadania 1. Jakie zalety i wady wykazuje następujący układ eksperymentalny? Proszę porównać go z opisanym wyżej „eksperymentem z uwzględnieniem zmiennej czasu". (Por. także F. N. Kcrlinger: FoundalloM of Behmioral Research, s. 311). to
C2:
Y%
'+1
'+>
X
Yi
2. Przeprowadzając eksperyment w malej grupie należy wyjaśnić, czy pojawienie się wroga zewnętrznego wzmaga solidarność wewnąlrzgrupowa. (zmienna ilościowa). Ponieważ solidarność zależy prawdopodobnie w dużym stopniu od struktury wewnętrznej grupy (struktury współpracy i rywalizacji), wiec czynnik ten powinien być kontrolowany, to znaczy potraktowany jak druga zmienna niezależna. a. Proszę przedstawić w formie zapisu przebieg eksperymentu. 10
Dalsze warianty badań eksperymentalnych można znaleźć w pracy Kerlingera, w której autor przedstawia dokonania Campbella i Solomona w tej dziedzinie. Patrz F. N. Kerlinger: Foundations of Bchaviural Research, New York 1964, rozdz. 16 i 17.
Statystyczne opracowanie wyników. Rodzaje zmiennych
225
b. Z jakiej zbiorowości, biorąc pod uwagę względy praktyczne, należałoby wybierać grupy porównawcze i jakie czynniki należałoby kontrolować metodą doboru parami, jeżeli dobór losowy nie jest możliwy? c. Jakie konkretne środki należy zastosować, aby poddać grupy działaniu obu zmiennych różnicując ich nasilenie (w sprawie operowania strukturą grupy patrz krótkie omówienie eksperymentu M. Deutscha w G. C. Homans: Sociat Behcwior: lis Elementary Forms, London 1961, s. 132).
4. Statystyczne opracowanie wyników eksperymentu Rodzaje zmiennych. W dotychczas podanych przykładach zmienna niezależna miała chaiakter albo nominalny (X, ~X), albo porządkowy (X„mh, Xirednio, Xd,li0), zaś zmienna zależna Y—-charakter ilościowy. Opracowanie wyników eksperymentu, czyli po prostu sprawdzenie istotności różnic między porównywanymi grupami, zależy w znacznym stopniu od tego, z jakiego rodzaju kombinacją zmiennych niezależnych i zależnych mamy do czynienia. Tabela 21 Tabela 21 Poziomy pomiaru i metody opracowania wyników Zmienna niezależna X wielowartościowa dwu wartościowa
Zmienna zależna Y
porządkowa
nominalna i
dwu wartościowa
i
test x2
-
interwałowa/ ilorazowa
-
nominalna
wielowar-
porządkowa
l
1
analiza wariancji dla skal porządkowych
t ości owa interwalowa/ ilorazowa 15 — Wprowadzenie...
analiza wariancji
analiza | represji
1
1
226
Eksperyment
przedstawia wybrane metody opracowania wyników przy różnych
kombinacjach zmiennych. Test Xi (chi-kwadrat) wymieniony w tabeli omówimy w następnym rozdziale (s. 248). Ponieważ zaś nie omawialiśmy jeszcze żadnego przykładu ze zmienną zależną nominalną dwuwartościową lub wiclowartościową, scharakteryzujemy krótko specyfikę takiego przypadku. Posłużymy się prostym przykładem, w którym obie zmienne mają charakter dwuwartościowy (występuje, nie występuje): X i ^X oznacza „obejrzenie filmu" i „nieobejrzenic filmu", Y zaś i ">v= liczba jednostek w kolumnie bądź w wierszu, tzn. liczba osób poddanych działaniu X lub W o danej wartości.
Na zakończenie parę słów na temat warunków, które muszą być spełnione, aby można było stosować analizę wariancji: 1. Porównywane grupy muszą stanowić niezależnie dobrane próby losowe ze zbiorowości o rozkładzie normalnym. 2. Wariancje wewnątrzgrupowe muszą być w granicach błędu losowego stałe. Normalność rozkładu oraz stałość wariancji wewnątrzgrupowych sprawdza się za pomocą testów, których tu nie będziemy omawiać 18. Wszystkich naszych obliczeń dokonywaliśmy na przykładzie bardzo prostej analizy wariancji 19. Analiza wariancji może być stosowana 17
Patrz H. M. Blalock: Statystyka, s. 299-300. Patrz J. G. Peatman: Introduction, s. 12, 255, 329 i nast. 19 Dalsze możliwości analizy wariancji omawia w sposób przystępny dla początku jących F. N. Kerlinger w cytowanej już pracy Foundations of Bchavioral Research, rozdz. 11, 12 i 13 oraz A. L. Edwards w Experimental Design in Psychological Research, New York 1950, rozdz. 9 i nast. 18
sws Eksperyment laboratoryjny, naturalny, symulowany
233
również w odniesieniu do grup dużych, a zmienne niezależne mogą przybierać dużo więcej wartości. Przede wszystkim jednak pozwala ona na uwzględnienie więcej niż dwóch czynników warunkujących. Gdybyśmy w naszym przykładzie wprowadzili trzecią zmienną niezależną dwuwartościową, to otrzymalibyśmy dwanaście zamiast sześciu grup porównawczych. Gdyby trzecia zmienna niezależna miała rzeczywisty wpływ na Y, to nie wyjaśniona wariancja spowodowana błędem uległaby zmniejszeniu. Uzyskalibyśmy wówczas większą pewność co do wpływu X i W na Y, a siłę tego wpływu (wyrażoną np. przez R) moglibyśmy określić z większą dokładnością. Uogólniając można powiedzieć, że zasadą eksperymentu jest zmniejszanie nie wyjaśnionej wariancji zmiennych zależnych związanej z błędem poprzez wprowadzanie coraz to nowych zmiennych. Przy wariancji związanej z błędem równej zeru (co w rzeczywistości jest mało prawdopodobne) skutek (wartości Y) jest całkowicie wyjaśniony przez zmienne niezależne. Nawiasem mówiąc, dla analizy wariancji nie ma znaczenia, czy dane uzyskane zostały w drodze eksperymentu, czy w inny sposób (np. za pomocą wywiadu socjologicznego M), tyle że wyników ankiety nie można rozpatrywać w kategoriach zależności przyczynowych. Zadanie Jeżeli znane są już wyniki eksperymentu opisanego w zadaniu 2 na s. 224, potwierdzające wpływ obu czynników warunkujących, to proszę sporządzić z nich tabelę i przeprowadzić analizę wariancji (na zakończenie obliczyć współczynnik korelacji wewnątrzklasowej). Proszę pamiętać przy tym o wymaganiach dotyczących rodzaju zmiennych!
5. Eksperyment laboratoryjny, eksperyment w warunkach naturalnych i eksperyment symulowany Konieczność swobodnego operowania bodźcem eksperymentalnym oraz kontrolowania wszystkich pozostałych czynników skłania do przeprowadzania eksperymentów w warunkach laboratoryjnych. Na20
Por. dla ilustracji przykład podany przez P. Ncuralha w cytowanej pracy Sta-tistik, s. 314 i nast.
234
Eksperyment
leży przy lym mieć na Uwadze, że kontrola w eksperymencie nic może
polegać wyłącznie na. zapewnieniu jednakowości grup pod względem tych wszystkich indywidualnych cech osób badanych, których zmiany nie wchodzą w zakres eksperymentu. Kontroli}, muszą być objęte, tzn. muszą być jednakowe w porównywanych grupach, również ważne czynniki sytuacyjne. Także ten warunek łatwiejszy jest do spełnienia w warunkach laboratoryjnych niż w warunkach naturalnych. Z drugiej jednak strony, relacje społeczne, ze względu na ich charakter, tylko w bardzo ograniczonym stopniu można zrekonstruować w laboratorium. Przedmiotem badań mogą być w tych warunkach tylko jednostki oraz małe grupy ad hoc, zmiennymi zaś zależnymi ograniczona liczba indywidualnych sposobów zachowań (np. rozwiązywanie zadań, przystosowywanie się, zmiany opinii) oraz określone własności grup (spójność, rozwiązywanie zadań w grupie itd.). Skutkiem tych okoliczności najwięcej eksperymentów laboratoryjnych w dziedzinie nauk społecznych (któie stanowią lwią część wszystkich eksperymentów w naukach społecznych) dotyczy zagadnień psychologii społecznej i badań nad małymi grupami". Jednak wobec nich także wysuwany jest często zarzut, że sztuczność sytuacji laboratoryjnej, a przede wszystkim świadomość osób badanych, iż uczestniczą w eksperymencie, co więcej —charakter bodźca eksperymentalnego, który często „imituje" zaledwie bodźce rzeczywiste, owocują „sztucznymi" wynikami. Z zarzutem tym nie można zgodzić się bez zastrzeżeń, ujawnione związki przyczynowe rzeczywiście występują bowiem w sytuacjach odpowiadających warunkom eksperymentu, problematyczne bywa tylko ich uogólnienie na sytuacje naturalne. Wówczas gdy bada się wpływ nagrody na częstotliwość określonych zachowań, Wicie badań eksperymentalnych nad małymi grupami opisują D. Carlwright i A. Zander w pracy Group Dynamics, Evanst.on, 111. 1953. Również P. R. Hofstatter w Cruppendynwnik, Hamburg 1957 przedstawia skrótowo wicie eksperymentów. Najnowsze eksperymenty w dziedzinie badań nad małymi grupami publikuje się bieżąco w czasopismach, m. in. w „Sociometry" i „Journal of Personality and Social Psychology" (dawniej „Journal of Abnormal and Social Psychology"). Zwięzłą interpretację teoretyczną wielu eksperymentów z małymi grupami podaje G. C. Homans w Social Behcnior. Its Elementary Forms, London 1961. =1
Eksperyment laboratoryjny, naturalny, symulowany
235
można sobie łatwo wyobrazić, że pochwała eksperymentatora, uzyskane plusy, talony czy groszowe wynagrodzenie mają dla osób badanych zgoła inne (prawdopodobnie mniejsze) znaczenie niż pochwała rzeczywistego przełożonego, uzyskanie dobrej oceny na egzaminie lub wyższych poborów. Z uwagi na tę okoliczność — przy eksperymencie laboratoryjnym powstaje szczególnego rodzaju problem trafności, który wiąże się z operacjonalizacją zmiennych. Eksperymenty tzw. terenowe, czyli eksperymenty w warunkach naturalnych, nie są obciążone tym szczególnym problemem, jak również nie stwarzają takich ograniczeń w doborze tematów. Natomiast stosunkowo rzadko pozwalają badaczowi na samodzielne operowanie bodźcem eksperymentalnym. Bywa to niekiedy możliwe w takich eksperymentach, w których terenem są określone struktury organizacyjne, przede wszystkim zakłady pracy, w których do celów eksperymentalnych zmienia się np. styl kierowania, organizację grup roboczych, nagrody lub warunki pracy. Jeżeli badacz nie może swobodnie operować bodźcem, to musi szukać sytuacji, w których uruchamia go naturalny bieg wydarzeń (eksperyment „naturalny'')-Jest to niejednokrotnie możliwe w badaniach struktur organizacyjnych, w których przeprowadza się zmiany sposobu kierowania organizacją (np. zakładem pracy). Podobnie zmianę sytuacji społeczno--ekonomicznej określonej grupy ludności (np. rencistów) w wyniku wprowadzenia nowych przepisów prawnych (opieka społeczna, opieka nad ludźmi starymi) można uznać za eksperyment naturalny. Niezależnie jednak od tego, czy eksperyment naturalny pozwala badaczowi samodzielnie operować bodźcem czy nie, rzadko kiedy występuje w nim grupa kontrolna, która pod względem wszystkich nie będących przedmiotem eksperymentu zmiennych byłaby podobna do grupy badawczej. W tert sposób brakuje jednego z elementów konstytutywnych eksperymentu, co ogranicza możliwość wyciągania rzetelnych wniosków na temat występowania związków przyczynowych. Próbą połączenia zalet eksperymentu laboratoryjnego i naturalnego są eksperymenty symulowane. Przeprowadza się je w warunkach laboratoryjnych, ale osoby badane nie zdają sobie sprawy, że
236
Eksperyment
uczestniczą w eksperymencie Dobrym przykładem jest tu eksperyment Eva i Zelditchn!a, w którym symulowano istnienie organizacji badawczej celem zweryfikowania k i l k u hipotez dotyczących wpływu rożnych form autorytaryzmu. W bardziej ogólnym znaczeniu do eksperymentów symulowanych należą wszystkie eksperymenty laboratoryjne, w których odtwarza się lub stwarza w sposób sztuczny sytuacje naturalne nie poddające się bezpośrednio badaniu, przy czym osoby badane zdają sobie sprawę, że uczestniczą w eksperymencie, ale ich uwagę celowo kieruje się na sprawy nie będące przedmiotem badań. Jest tak wówczas, gdy osobom badanym poleca się wykonać zadanie, w istocie jednak bada się ich reakcję na zachowanie eksperymentatora — zachęcające, neutralne lub zniechęcające. Również ten zabieg ma na celu osłabienie sztuczności sytuacji w aspekcie badanej zależności.
6. Eksperyment post factum oraz quasi-ekspcryment W ekspeiymencie naturalnym brak wprawdzie z reguły grupy kontrolnej, ale można, zależnie od okoliczności, „grupę badaną" poddać dwukrotnym pomiarom — przed i po poddaniu jej działaniu bodźca eksperymentalnego. Przy tak zwanym eksperymencie post factum możliwość taka nie wchodzi w grę. Tu badacz mierzy zmienną zależną tylko raz, a mianowicie po tym, jak bodziec eksperymentalny już oddziałał w naturalnym toku wydarzeń. Jeśli badanie takie ma w ogóle jeszcze w jakimś stopniu przypominać eksperyment, konieczne jest porównanie przynajmniej dwóch grup, różniących się między sobą tym, że w jednej zmienna niezależna reprezentowała inną wartość niż w drugiej bądź tym, że jedna z nich była poddana działaniu 22 W. M. Evan, M. Zeklitch, jr.: /) Laboratory Expertment on Biireaucratlc Ant/io-rily, „American Sociological Review" 1961, t. 26, s. 883-893. Na temat eksperymentów laboratoryjnych, przede wszystkim symulowanych, z organizacjami patrz M. Zelditch, T. K. Hopkins: Laboratory Expertments witli Organizations, w: Comptex Orguiiizations. A Sociological Reader, A. Etzioni (red.), New York 1961, s. 464-47S.
zmiennej niezależnej, druga zaś nie. (W przeciwnym razie możemy mówić o wyjaśnianiu post factum, tzn. o hipotetycznej, dokonywanej po zajściu wydarzenia interpretacji przyczyn aktualnie obserwowanego czy stwierdzonego stanu rzeczy). Eksperyment post factum również nie pozwala na operowanie domniemanym czynnikiem warunkującym. Badacz, którego interesuje wpływ na wyniki w nauce takiej zmiennej niezależnej jak „rodzaj szkoły", nie może zmienną tą operować, tzn. poddawać jej działaniu różne losowo dobrane grupy uczniów. Może on przeprowadzić eksperyment naturalny testując przyszłych uczniów przed pójściem do szkoły, a następnie po dwóch latach uczęszczania do różnych szkół (szkoły wyznaniowej, gminnej, prywatnej lub publicznej). Wszelako trudności z opracowaniem narzędzia pomiaru, które dałoby porównywalne wyniki przy sześcio- i ośmiolatkach, względy czasowe czy jeszcze inne mogą go skłonić do wyboru eksperymentu post factum. Mógłby on polegać na porównaniu średnich wyników stuosobowych prób losowych uczniów w wieku lat ośmiu ze szkół rodzaju A i B. Nie ma jednak żadnej pewności, czy nie przypadek jedynie zdecydował, że ten uczeń chodzi do szkoły A, inny zaś do szkoły B. Mogą się oni różnić między sobą już przed pójściem do szkoły np. pod względem poziomu wykształcenia rodziców, który miał wpływ na to, do której szkoły zostali posłani i/lub, niezależnie od tego, na wyniki w nauce. Tych dwóch grup uczniów nie można więc uznać za grupy porównawcze i dlatego badanie to określa się jako quasi-eksperyment. Wyniki quasi-eksperymentu nie dają pewności, czy rodzaj szkoły ma wpływ na stwierdzone różnice wyników w nauce. Brak przy ąuasi-eksperymencie kontroli czynników na etapie poprzedzającym wystąpienie skutków zmiennych niezależnych można do pewnego stopnia zrekompensować kontrolą symboliczną ex post. Aby np. wykluczyć wpływ poziomu wykształcenia rodziców, które w jednej grupie uczniów może być wyższe niż w drugiej, cechę tę można przyjąć za constans, tzn. porównywać grupy uczniów z różnych rodzajów szkół, których rodzice mają ten sam poziom wykształcenia. Porównanie to przedstawia tab. 24; wartości liczbowe oznaczające wyniki w nauce ukazują, jaki wpływ ma na nie rodzaj szkoły i poziom wykształcenia rodziców.
238
Eksperyment Tabela 24 Symboliczna kontrola czynników w quasi-eksperymencie Wykształcenie rodziców wyższe średnie podstawowe Szkoła rodzaju A Szkoła rodzaju B
15 20
10 15
5 10
W ten sam sposób można kontrolować symbolicznie również pozostałe czynniki (równocześnie, a jeśli czynników tych jest zbyt wiele, to sukcesywnie). Każda z kontrolowanych w ten sposób cech staje się dodatkową zmienną niezależną. Wprawdzie nie likwiduje to podstawowej słabości ąuasi-eksperymentu, jaką jest brak prawdziwych grup porównawczych, ale wyniki można odpowiednio zróżnicować za pomocą analizy wariancji lub analizy regresji, zaś odwołując się do teorii zinterpretować zależności przyczynowe w stopniu przynajmniej prawdopodobnym. Podejście ąuasi-eksperymentalne znajduje zastosowanie zwłaszcza w badaniach ankietowych 23. Prawie każda ankieta wymaga skorelowania różnych cech osób badanych, aby można było stwierdzić zależności zachodzące między nimi. Jeżeli zależności te są z góry określone w programie badawczym (jak ta, o którą chodzi w tab. 24), stosuje się nie prostą próbę losową, lecz próbę warstwową nieproporcjonalną lub próbę kwotową, po to, aby porównywane grupy były możliwie tej samej wielkości. Badanie ankietowe z góry pomyślane jako quasieksperymentalna weryfikacja określonej zależności różni się więc od takiego, które dopiero później interpretowane jest w kategoriach ąuasieksperymentu, rodzajem próby i specyfiką pytań. Przy wielu pytaniach socjologicznych podejście ąuasi-eksperymentalne jest najlepszym sposobem uzyskiwania informacji. 23
Mało kiedy możliwe są rzeczywiste eksperymenty przy użyciu wywiadu socjologicznego. W takich sytuacjach bodziec eksperymentalny przewidziany jest w kwestionariuszu, np. w związku z określonym pytaniem podaje się respondentowi jakąś informację albo zadaje się pytania sugerujące. Kwestionariusz sporządzony do celów eksperymentalnych w dwóch wersjach przedstawia się co najmniej dwóm próbom reprezentatywnym, które występują wówczas w roli grup porównawczych.
Eksperyment post factum i quasi-eksperyment
239
Zadania 1. Jak stosując (a) eksperyment naturalny, (b) eksperyment symulowany można zweryfikować hipotezę, że zmiana roli powoduje zmianę postaw (dostosowanie do wzoru związanego z rolą)? 2. Można przypuszczać, że trzy główne czynniki określają orientację konsumentów (zmienna zależna ilościowa): zawód (samodzielny — niesamodzielny), miejsce zamieszkania (miasto—wieś) i stosunek do religii (wierzący—niewierzący). Proszę opracować ąuasi-ekspcrymentalne badanie ankietowe weryfikujące tę hipotezę (próba, operacjonalizacja zmiennych w postaci pytań). Proszę sporządzić tabelę prezentującą wyniki potwierdzające hipotezę. Proszę przeprowadzić analizę wariancji i obliczyć współczynnik korelacji we wnątrzklasowej.
mn-Mt-JSi
ł^m^-~
Opracowanie i analiza danych .
1. Opracowanie danych Zanim dane, które mają dostarczyć odpowiedzi na pytania badawcze, można będzie zinterpretować i na tej podstawie formułować wnioski — trzeba je odpowiednio przygotować pod względem formalnym i technicznym. Dane surowe występują np. w postaci wypełnionych kwestionariuszy, arkuszy obserwacji lub poszczególnych arkuszy analizy treści. Dokonanie analizy ilościowej wymaga najpierw policzenia tych danych i przedstawienia ich w formie tabelarycznej. Jeżeli dane surowe zebrano metodami niestandaryzowanymi, np. za pomocą wywiadu pogłębionego, pytań otwartych lub niesystematycznej obserwacji uczestniczącej, to najpierw trzeba opracować klucz kodowy jako podstawę klasyfikacji odpowiedzi, obserwacji itd. (patrz przede wszystkim rozdział drugi, s. 42 i nast. i rozdział ósmy, s. 196 i nast.). Jeżeli określone cechy jednostek badawczych mają być przedstawione za pomocą indeksu lub skali, to właściwe dane należy sprowadzić do miary złożonej, zanim będzie można zacząć je obliczać. Najprostszym przypadkiem (który zdarza się rzadko) obliczeń jest przenoszenie danych surowych na arkusz zawierający te same kategorie, których użyto w kwestionariuszu, schemacie obserwacji itp. i ustalenie częstotliwości, z jaką poszczególne kategorie występują. Analiza relacji wymaga już jednak klasyfikacji jednostek badawczych według dwóch lub więcej cech równocześnie. Klasyfikacja większej liczby jednostek badawczych bez pomocy maszyn liczących jest męcząca i czasochłonna. Dlatego dziś najczęściej wykorzystuje się do tego celu maszyny. Do prostych obliczeń (klasyfikacja jednostek
Opracowanie 'danych
241
badawczych według jednej lub kilku cech) używa się sortera lub kalkulatora. .Elektroniczna^, technika obliczeniowa wyręcza człowieka—■ umożliwia prawie natychmiastowe obliczenie złożonych miar analitycznych; tymi technicznymi możliwościami nie będziemy się tu jednak zajmować. Maszynowe dokonywanie obliczeń wymaga przetransponowania danych surowych na specjalne nośniki informacji, zazwyczaj karty perforowane (patrz rys. 14). W tym, celu dane muszą być najpierw za-
kodowane, według określonego klucza. Opracowując np. ankietę — każdej kategorii odpowiedzi na każde pytanie przyporządkowuje się określony symbol liczbowy. Tabela 25 przedstawia fragment takiego klucza kodowego. Kodujący przegląda kwestionariusz z kluczem kodowym w ręku i przy każdej odpowiedzi zaznacza odpowiedni symbol. Dane z każdego kwestionariusza zostają następnie przeniesione na arkusz kodowy, który zawiera tyle numerowanych rubryk, ile jest kolumn na karcie perforowanej (względnie tyle, ile wymaga tego opracowanie danych). Spójrzmy na fragment klucza kodowego (tab. 25): np. odpowiedź „tak, żyją oboje" na pytanie 10 zaznacza się liczbą 5 w kolumnie 9 arkusza kodowego. Dane z arkusza kodowego przenosi się następnie na kartę perforowaną. Całe to postępowanie można 16 — Wprowadzenie...
-. £•-'•'! ____ w?" i
242
Opracowanie i analiza danych Tabela 25
Fragment klucza kodowego l Kolumna
Symbol liczbowy
9
{pytanie 9) miejsce zamieszkania 1 2 3 '4 5 6 7 8
10 1 2
wielkie miasto gmina podmiejska/przedmieście małe miasto wieś (pytanie JO) czy żyją rodzice tak, oboje me, ojciec nie zyjc nie, matka nie żyje nie, oboje nie żyją (pytanie 11) rodzeństwo tak, mam rodzeństwo nie, nie mam rodzeństwa
skrócić opatrując poszczególne odpowiedzi symbolami już w kwestionariuszu (patrz s. 145 i nast.). Jeżeli kolejność pytań w kwestionariuszu odpowiada kolejności kolumn na karcie perforowanej, to dane z kwestionariusza można przenosić bezpośrednio na kartę perforowaną. Błędy przy kodowaniu, przenoszeniu symboli na arkusz kodowy i na kartę perforowaną podważają rzetelność wyników; tak samo, rzecz jasna, jak błędy w liczeniu, które zdarzają się także przy obliczaniu maszynowym. W celu wykrycia takich błędów powtaiza się cały proces wyrywkowo dla części danych i porównuje arkusze kodowe lub karty perforowane. O ile przy przenoszeniu, dziurkowaniu i liczeniu głównym źródłem błędów jest niedokładność, o tyle przy kodowaniu stosunkowo wysoki procent błędów bywa skutkiem nie1 Przy komputerowym opracowywaniu danych — w przeciwieństwie do opracowania za pomocą sortera — trudno posługiwać się większą liczbą symboli liczbowych w kolumnach (tzn. umieszczać więcej niż jedną informację w kolumnie, tak jak to pokazano na przykładzie, w którym jedna informacja dotyczy miejsca zamieszkania, druga zaś rodziców). Jeśli dane mają być opracowywane przy użyciu komputera, trzeba to odpowiednio uwzględnić przy sporządzaniu klucza kodowego.
Opracowanie danych
243
starannego przygotowania klucza kodowego, przede wszystkim nieprecyzyjnych definicji poszczególnych kategorii. Błędy tego rodzaju można zasadniczo zredukować, precyzując klucz kodowy i ponownie kodując poszczególne pytania. Podstawowe obliczenia służą do określenia prostych rozkładów częstotliwości wszystkich zmiennych występujących w badaniu. Wielowymiarowa klasyfikacja danych wymaga opracowania odpowiednich wskazówek mówiących, które zmienne z którymi należy zestawiać. Wyniki takich obliczeń nanosi się na wcześniej sporządzone tabele, jeżeli odpowiedniego wydruku wyników nie otrzymuje się wprost z maszyny. Słowną interpretację tabel ułatwia przeliczenie liczb bezwzględnych na udziały procentowe. Procentuje się w stosunku do zmiennej niezależnej (lub cechy założonej jako czynnik warunkujący). Jeżeli zmienna niezależna umieszczona jest w główce tabeli, to procenty muszą sumować się do 100 w kolumnach (licząc w układzie pionowym). Jeżeli zmienna niezależna umieszczona jest w kolumnie bocznej (po lewej stronie), to procenty muszą sumować się do 100 w wierszach poziomych 2. Niżej omówimy kilka sposobów opracowania danych gotowych (zakodowanych, policzonych i zestawionych w formie tabel). Pominiemy przy tym omówiony w poprzednich rozdziałach problem, trafności, aczkolwiek na każdym etapie jest to problem centralny z punktu widzenia interpretacji wyników badań empirycznych. Im bardziej wątpliwa jest trafność danych, tym mniej sensowne jest stosowanie skomplikowanych metod obliczeniowych. Poziom pomiaru danych warunkuje sposób ich opracowania. Jeżeli do pomiaru użyto skali nominalnej lub porządkowej, co'zdarza się najczęściej, to wyniki opracowuje się za pomocą omówionej w następnym paragrafie analizy tabelarycznej. Analizę tabelaryczną można zastosować także wobec danych mierzonych skalą interwałową lub ilorazową, gubi się jednak przy tym część informacji. Można tego uniknąć przez zastosowanie analizy regresji; omówimy ją zwięźle w dalszej kolejności. Relacje między danymi jakościowymi (nominalnymi lub 2
Przykłady prawidłowego i nieprawidłowego procentowania podaje H. Zeisel: Say It wilh Figures, New York 1957, rozdz. 1 i 2. 1G»
• 2-M
Opracowanie i analiza danych
porządkowymi) a ilościowymi ustala się albo za'pomocą analizy tabelarycznej, albo —jeżeli charakter ilościowy ma zmienna zależna ■— za pomocą analizy wariancji ontówioncj w rozdziale dziewiątym.
2. Analiza tabelaryczna Najprostszym rodzajem tabeli jest rozkład częstotliwości jednej cechy dostarczający informacji czysto opisowych. Jeżeli źródłem danych była próba losowa, to można (1) ustalić przedział ufności i (2) sprawdzić istotność wyniku (patrz rozdział trzeci). W ten sposób możemy dowiedzieć się jedynie, w jakim stopniu rozkład częstotliwości w próbie odzwierciedla „prawdziwy" rozkład wartości cechy w całej zbiorowości. Chcąc natomiast poznać relacje między poszczególnymi zmiennymi, trzeba sporządzić i przeanalizować tabele dwu-i wielodzielne. Związki przyczynowe. Jak była już mowa w rozdziale poprzednim, jedynie dane uzyskane w drodze eksperymentu pozwalają orzekać o związkach przyczynowych. We wszystkich pozostałych przypadkach empirycznie stwierdzone relacje między zmiennymi wskazują jedynie, która z nich jest zmienną zależną, a która niezależną. Nie wdając się w rozważania teoretyczne nad pojęciem przyczynowości3, przez związek przyczynowy będziemy tu (podobnie jak w rozdziale poprzednim, patrz s. 213) rozumieć zależność niesymetryczną. Wyróżnić można trzy główne rodzaje związków przyczynowych: ł) zależność jednoprzyczynowa: X warunkuje Y. Graficznie: X -> Y; 2) zależność wieloprzyczynowa: Xi Y warunkują Z. Graficznie: v
3 Różne koncepcje przyczynowości patrz E. Nagel: Struktura nauki, tłum. J. Giedymin, B. Rassalski, H. Eilstcin, Warszawa 1970, rozdz. 10.
Analiza tabelar}'czna. Związki przyczynowe
245
3) łańcuch przyczynowy: X warunkuje 7, a 7 warunkuje Z. Graficznie: X -* Y -> Z. Zmienna 7 nazywa się w tym układzie „zmienną interweniującą". Zależność jednoprzyczynową można ustalić za pomocą tabeli dwudzielne}. Zależność wieloprzyczynową z dwiema zmiennymi niezależnymi oraz trójczłonowy łańcuch przyczynowy można ujawnić posługując się tabelą trójdzielną.. Sposób postępowania przedstawimy szczegółowo dalej. Związek przyczynowy ma charakter deterministyczny, jeżeli: (1) zmienna spowoduje pojawienie się 7; graficznie: X -> 7; (2) brak zmiennej Xpowoduje brak 7; graficznie: ~X -» ~ 7(~ jest znakiem negacji). Jeżeli spełnione są warunki (1) i (2), to X jest przyczyną determinującą 7. Zmienna Z uwarunkowana jest łącznie przez dwie zmienne niezależne, X i 7, jeżeli: (ł) Xi Y -> Z, (2) -Z, ale 7 - ~Z, (3) Z", ale — 7 -> ~Z4. Na przykład: zawiedzione ambicje wywołują frustrację. Wyrażając to skrótowo: niepowodzenie (= X) i ambicje (== 7) wywołują frustrację (= Z). Przy braku jednej z dwu wymienionych zmiennych niezależnych, niepowodzenia albo ambicji, frustracja nie wystąpi. Badacz, który nie zna drugiej zmiennej niezależnej — powiedzmy ambicji — i obserwuje jedynie relację między X (niepowodzeniem) a Z (frustracją), stwierdzi np., że wśród respondentów, których spotkało niepowodzenie, jest 70 % sfrustrowanych i 30 % niesfrustro-wanych. Niepowodzenie wywołuje więc frustrację tylko w 70% przypadków (prawdopodobieństwo wystąpienia, frustracji p — 0,7). Jest to stochastyczny związek przyczynowy. W podanym przykładzie prawdopodobieństwo wystąpienia frustracji zależy od prawdopodobieństwa łącznego wystąpienia niepowodzenia i ambicji. Wśród respondentów, których spotkało niepowodzenie, 70% stanowią — o czym badacz nie wie — ludzie o wysokich ambicjach, 30% — ludzie o niskich ambicjach. Zależność między dwiema lub więcej zmiennymi przejawia się jako związek stochastyczny wówczas, gdy nie wszystkie cechy warun4
Por. R. L. Ackoff: Scientific Method, New York 1962, s. 16 i nast.
llSBi
2/16
_j«**iu.__ .M&_2=
Opracowanie i analiza danych
kujące uwzględnione zostały w badaniu. Badacz, który odkrył związek stochastyczny, będzie szukać pominiętych czynników warunkujących uwzględniając je w dalszych badaniach. Odkrycie tych czynników pozwoli z większym prawdopodobieństwem (większym p) przewidywać Z. Uzyskanie stuprocentowej pewności, tzn. odkrycie zależności deterministycznej, udaje się tylko w wyjątkowych przypadkach. Postępowanie tego rodzaju oparte jest na przekonaniu o deterministycznej strukturze świata, nawet jeśli nie jest możliwe pełne ujawnienie czynników determinujących. Odmiennym podejściem jest taka interpretacja związków stochastycznych, zgodnie z którą związek przyczynowy ma charakter stochastyczny nie dlatego, iż nie udało się odkryć wszystkich czynników warunkujących, lecz dlatego, że taka jest natura przedmiotu. Tak rozumianych związków stochastycznych nie można przekształcić w zdeterminowane związki przyczynowe. Spór ten, który toczy się przede wszystkim w fizyce, wspomnieliśmy niejako mimochodem ■'. Stwierdzenie zależności jednoprzyczynowej za pomocą tabeli dwudzielnej. Pizyjmijmy, że 60% badanych urzędników ma silne, a 40% słabe poczucie bezsilności społecznej (uzależnienia od decyzji innych ludzi). Zakładamy, że owo poczucie bezsilności uwarunkowane jest ich karierą zawodową: urzędnicy, którzy od dawna nie awansują zawodowo, mają silne poczucie bezsilności, ci zaś, którzy wcześnie awansowali zawodowo — słabe. Hipotezę tę można zweryfikować za pomocą tabeli dwudzielnej (tab. 26). Tabelę tę należy czytać następująco: 400 urzędników o silnym poczuciu bezsilności od dawna nie awansowało zawodowo; 200 urzędników, którzy... itd. Pytanie brzmi: czy tabela ta może potwierdzić sformułowaną wyżej hipotezę? . Na pytanie to można odpowiedzieć posługując się trzema metodami: 1) stwierdzając, czy w tabeli występuje „krzyżowanie się'1 relacji; 2) za pomocą statystycznego testu istotności; 3) obliczając współczynnik korelacji. Pierwsza metoda jest „optyczna", dwie pozostałe — rachunkowe. „Krzyżowanie się" relacji. W tabeli zawierającej cztery pola wyWyczerpujące omówienie lego tematu patrz E. Nagel: Struktura nauki, rozdz. 10.
Analiza tabelaryczna. Zależność jednoprzyczynowa
247 Tabela 26
Tabela dwudzielna Urzędnicy, którzy:
a
Poczucie
zależnienia
u silne
słabe
400
6
\
od dawna nie awansowali zawodowo
c
/
100
ostatnio awansowali zawodowo
S
1
600
500
d
\
200
*,
500
fl.
300
0
s2 | 40
N 1000
stępuje „skrzyżowanie", jeżeli większe wartości w pierwszej i drugiej kolumnie oraz mniejsze wartości w pierwszej i drugiej kolumnie przeplatają się „na krzyż". W tabeli 26 krzyżowanie się relacji zaznaczono dwiema strzałkami. Interpretacja ich treści może brzmieć następująco: większość urzędników o silnym poczuciu uzależnienia od dawna nie awansowała zawodowo. Większość urzędników o słabym poczuciu bezsilności w ostatnim czasie awansowała zawodowo. Krzyżowanie się tych relacji wskazuje na zależność, która — jeśli da się uzasadnić teoretycznie — może być uznana za związek przyczynowy. „Krzyżowanie się" relacji jest wygodnym, ale niedoskonałym sposobem stwierdzenia związku przyczynowego. Takiego rozkładu optycznego nie uzyska się, jeżeli któraś z cech może przybierać kilka wartościl!oraz jeżeli wielkości liczbowe w tabeli lóżnią się między sobą w niewielkim stopniu. 6
W tabelach dwudzielnych, w których obie cechy dzielą sit; na więcej niż. dwie kategorie, ale ich liczba w obu przypadkach jest taka sama, dowodem krzyżowania sic, relacji może być fakt, że na jednej przekątnej grupują się wielkości duże, nG drugiej zaś małe — ale tylko pod warunkiem, że obie cechy mają charakter porządkowy.
lL*^fllii#^ 24S
-* Opracowanie i analiza danych
Test istotności. W odniesieniu do tab. 26 można zastosować tcsl chikwadrat. Wzór tego testu brzmi: chi-kwadrat
(fa-Fa? , (fb~Fby Ą
./•;,
0)
Fk
./.';. fb ■ ■ -fh '-- wartość liczbowa w klatkach a, b . . . k , /■'„, Fi, .../"/C = wartość oczekiwana, tzn. wartość, której należy sic spodziewać w klatkach a, b ... k, jeżeli między cechami uwzględnionymi w tabeli nie zachodzi 'związek.
Wartość oczekiwaną oblicza się według następującego wzoru: Fk-Sk F.
(2)
N
gdzie: JR% = brzegowa liczebność wiersza, do którego należy A'~ta klatka tabeli, 'Sjc = brzegowa liczebność kolumny, do której należy k-tu klatka tabeli, N = ogólna liczba przypadków uwzględnionych w tabeli.
Na przykład dla rubryki a w tab. 26 wartość oczekiwana wynosi: N
Ą£ _ 500^00 _ 30Q 1000
Test chi-kwadrat według wzorów (1) i (2) zastosowany do danych tab. 26 daje wynik 166,6. Aby wielkość tę można było zinterpretować, trzeba najpierw ustalić stopnie swobody (symbol: df — degree of freedom): df = {liczba wierszy—!)• (liczba kolumn — 1)
(3)
Dla danych tab. 26: rf/=(2-l)-(2-ł) = l Teraz można zajrzeć do tablicy chi-kwadrat, która znajduje się w podręcznikach statystyki v. Przy jednym stopniu swobody (df~ 1) Patrz np. H. M. Blalock: Statystyka dla socjologów, tłum. M. Tabin, I. Topińska, K. Starzec, Warszawa 1975, s. 501. 7
Analiza tabelaryczna. Zależność jednoprzyczynowa
249
i wartości chi-kwadrat 166,6 prawdopodobieństwo wynosi 99,9% 8. Słowna interpretacja wyniku bizmi: prawdopodobieństwo, że cechy wymienione w tab. 26 są od siebie zależne wynosi 99,9%. Mówiąc dokładniej: „hipotezę zerową", że dane tab. 26 nie dowodzą zależności, lecz stanowią jedynie przypadkowy rozkład wartości liczbowych (wyrażający się w wartościach oczekiwanych Fa... ... Fk), można odrzucić z prawdopodobieństwem 99,9 %. Test chi-kwadrat wykazał więc kowariancję obu cech. Czy kowariancja ta świadczy o związku przyczynowym, tego nie można stwierdzić za pomocą testu chi-kwadrat. W tym przypadku trzeba się odwołać do teorii pośrednio łub bezpośrednio przyjętej przez badacza. Współczynnik korelacji. Trzecią metodą, za pomocą której można stwierdzić istnienie związku, jest obliczanie współczynnika.korelacji. ^Współczynnik korelacji {informuje o sile związku, podczas gdy test istotności o pewności (prawdopodobieństwie) jego istnienia. Test istotności pokazuje, z jaką pewnością badacz może orzekać, że dwie cechy są ze sobą powiązane, nic natomiast nic mówi o sile tego powiązania. Współczynnik korelacji pokazuje, w jakim stopniu cechy są ze sobą powiązane, nie informując, jaką można mieć pewność co do wystąpienia tego powiązania 9. Istnieje wiele różnych współczynników korelacji. Każdy z nich znajduje zastosowanie tylko w ściśle określonych warunkach. Niżej podajemy listę najczęściej używanych współczynników korelacji; wzory tych współczynników można znaleźć w podręcznikach statystyki (tab. 27). Nie istnieje taki współczynnik korelacji, który można by zastosować przy każdej (dowolnej) kombinacji danych mierzonych za pomocą skal różnego poziomu. Zawsze w takim przypadku zmienną 8 W tablicy chi-kwadrat przy rf/=lz reguły jako największą wartość można znaleźć 10,8. Przy tej wartości prawdopodobieństwo wynosi 99,9%. Ponieważ dla tab. 26 wartość chi-kwadrat wynosi 166,6, więc prawdopodobieństwo równa się co najmniej 99,9%. Tablice chi-kwadrat zamieszczane w podręcznikach statystyki nie wykraczają jednak poza prawdopodobieństwo 99,9%. 0 Nic znaczy to jednak, że między współczynnikiem korelacji i istotnością brak jakiegokolwiek związku. We wzorach niektórych współczynników korelacji występuje wartość chi-kwadrat (np. we „współczynniku kontyngencji" C).
• Tabela 27 Nazwa współczynnika korelacji
Warunki, w jakich może być stosowany
Wzór można znaleźć np. w pracy "
obie cechy nominalne o dowolnej liczbie wartości
Peaiman, s. 136 Zelditch, s. 176
Współczynnik phi ( porządkowy -* nominalny. Uzyskawszy określony stopień pewności, że dwie cechy są ze sobą w określonym stopniu powiązane — badacz może chcieć sformułować to słownie. Z rozmysłem posługuje się wówczas nie liczbami bezwzględnymi, lecz procentami, ponadto zaś wskazuje, którą z dwu cech uważa za zmienną niezależną, którą zaś za zależną. Interpretacja tab. 26 brzmiałaby zatem następująco: większość (80%) uizędników od dawna nie awansujących zawodowo ma silne poczucie bezsilności, natomiast większość (60%) tych, którzy niedawno awansowali, ma słabe poczucie bezsilności (i analogicznie w odniesieniu do dwu pozostałych rubiyk tabeli, b i c). Ponieważ chodzi tu o związek stochastyczny, ten sam wynik można także wyrazić następująco: wszyscy urzędnicy, jeśli od dawna nie awansowali zawodowo, przejawiać będą z prawdopodobieństwem p = +0,8 (z prawdopodobieństwem 80procentowym) silne poczucie bezsilności, jeżeli zaś ostatnio awansowali, to z prawdopodobieństwem p = +0,6 przejawiać będą słabe poczucie bezsilności. Ogólną strukturę stochastycznego związku przyczynowego między dwiema zmiennymi można wobec powyższego wyrazić następująco: u wszystkich jednostek określonej kategoiii, jeżeli X przybiera wartość X, to Y z określonym prawdopodobieństwem (p±) przybiera wartość Yu z określonym prawdopodobieństwem (/>») wartość y2 (itd. do F„), jeżeli zaś X przybiera wartość Xo, to Y z określonym prawdopodobieństwem przybiera ... (jak wyżej i tak aż do X„). Zadania Proszę odpowiedzieć na sześć następujących pytań dotyczących dwu podanych niżej tabel: 1. Który czynnik jest niezależny, a który zależny? 2. W którym kierunku należy procentować? Proszę wpisać do tabel „100%". 3. Czy w tabeli występuje relacja „krzyżowania się"? 4. Proszę obliczyć istotność zależności (za pomocą testu chi-kwadrat). 5. Który współczynnik korelacji należy zastosować do obliczenia siły zależności? 6. Proszę zinterpretować słownie stwierdzoną zależność jako związek slochasly nieobecność w pracy (niezamężne/zamężne) (mało/dużo) (rzadko/często) Jeżeli przypuszczenie to jest słuszne, to kobiety mające dużo zajęć domowych niezależnie od stanu cywilnego częściej musiałyby być nieobecne w pracy niż kobiety mające mało zajęć domowych. Ilość zajęć domowych zostaje więc przyjęta za zmienną testującą, a jej wartości „dużo" i „mało" za wartości stałe (tab. 31). W kolumnie „mało zajęć domowych" i w kolumnie „dużo zajęć domowych" tej tabeli nie może więc wystąpić kowariancja stanu cywilnego i nieobecności w pracy, ponieważ zmienne te nie są od siebie bezpośrednio zależne. Obie korelacje w tab. 31 rzeczywiście równe są zeru. 15
Przykład w nieco zmienionej postaci podajemy za H. Zeisel: Probkme der Aufschliisselung, w: Pas Intewtew, R. Konig (red.), Koln 1957, s. 305. 17 — Wprowadzenie...
JWT9.
■ 258
. N ieobecność W pracy Rzadko Często
■ H■■ ■ i ,„.K^L _
'■""•IHRWBH'
Opracowanie i analiza danych
Zajęcia mato stan cywilny niezamężna zamężna 900 300
300 100
Tabelo 31
domowe
dużo stan cywilny niezamężna zamężna 100 300
300 900
Analiza powyższa nie różni się, jak dotychczas, od analizy korelacji pozornej, również „wskaźnik" w postaci bliskiej zera korelacji cząstkowej jest ten sam. Świadczy on jedynie o braku bezpośredniego związku jedno- lub wieloprzyczynowego, nie pozwala jednak odróżnić korelacji pozornej od interwencji. Z pomocą może tu przyjść badaczowi tylko teoria, ponieważ sama analiza statystyczna bez sięgnięcia po eksperyment nie określi kierunku warunkowania między A' i t. I to jest właśnie ów piąty punkt, którego zabrakło na s. 256: 5. Odpowiedzi na pytanie, czy warunkowanie przebiega od X do t (interwencją) czy od t do X (korelacja pozorna), udzielić musi teoria. Wieloprzyczynowość. Związek wieloprzyczynowy polega na tym, że na Y oddziałuje zmienna X, ale nie wyłącznie zmienna X. Drugą zmienną niezależną jest t. Posługujemy się tu najprostszym przykładem wieloprzyczynowości, kiedy na Y oddziałują łącznie dwie zmienne niezależne, X i t. Związek ten można przedstawić graficznie:
Rysunek 18
Sięgnijmy po przykład. Tabela 32 ujawnia zależność między zadowoleniem z wykonywanego zawodu (X) a ogólnym zadowoleniem z życia (Y).
259
Analiza tabelaryczna. Tabela trójdzielna Tabela 32 Zadowolenie z wykonywanego zawodu
Ogólne zadowolenie z życia
małe Małe Duże
|
duże
280 170 450
120 380
400 550
500
950
Chi-kwadrat dla tab. 32 wynosi 140 (prawdopodobieństwo na poziomie 99,9%), współczynnik korelacji tetrachorycznej r, — 0,58. Zakłada się, że w danym przypadku zmienną niezależną jest zadowolenie z wykonywanego zawodu. Jest jednak rzeczą oczywistą, że ogólne zadowolenie z życia zależy jeszcze od innych czynników. Takim czynnikiem może być szczęście rodzinne, satysfakcjonujące stosunki przyjacielskie — słowem zadowolenie czerpane z przynależności do grup pierwotnych. Zmienna ta zostaje wprowadzona jako Tabela 33 a) Zadowolenie ze zw małe
Ogólne zadowolenie z życia
duże
zadowolenie z wykonywanego zawodu małe
Małe Duże
b) ązków pierwotnych
130 30
|
duże 20 120
zadowolenie z wykonywanego zawodu małe
j
duże
150 140
1
100 260
zmienna testująca t (tab. 33). Zależności w obu częściach tej tabeli są bardzo istotne, współczynniki korelacji cząstkowej (korelacja tetrachoryczna) wynoszą r =0,87 (tab. 33a) i r — 0,39 (tab. 33b). Wartości te wskazują na zależność wieloprzyczynową, co postaramy się wyjaśnić. Zależność między X i Y w tym stopniu podlega „zakłóceniu" przez jednoczesne oddziaływanie t na Y, w jakim zmiana t mimo 17*
260
Opracowanie i analiza danych
Stałego (nic ulegającego zmianie) X powoduje zmianę Y. Osłabia to korelację między X i Y w porównaniu z tą, jaka miałaby miejsce, gdyby wartością stałą był czynnik t, tzn. gdyby wykluczone zostały zmiany Y spowodowane zmianami t. Wobec powyższego, przyjmując stałe t —jak w tab. 33 — przynajmniej jedna z dwu korelacji cząstkowych X i Y powinna być silniejsza niż w wyjściowej tab. 32. Obliczenie współczynnika korelacji potwierdza to oczekiwanie. Chcąc poznać względną siłę oddziaływania jednej i drugiej zmiennej niezależnej na Y, porównuje się współczynniki korelacji między X i Y oraz między / i Y (aby obliczyć ten ostatni, trzeba sporządzić odpowiednią tabelę dwudzielną .zestawiając dane z tab. 33). Jeżeli współczynnik korelacji AT jest większy niż współczynnik korelacji tY, to X silniej oddziałuje na Y niż t. Jeżeli do związku X Y wprowadzi my całkowicie nieistotną zmienną testującą (np. rozmiar butów respondenta), co więcej nie mającą związku ani z X, ani z Y, wówczas żadna z korelacji cząstkowych w tabeli trójdzielnej nie będzie większa niż korelacja między Xi Y. W tym przypadku uzasadnione jest więc założenie związku wieloprzyczynowego, tzn. odrzucenie tej zmiennej t. Podsumujmy. Można założyć istnienie związku wieloprzyczynowego wówczas, gdy 16: 1) zmiennych niezależnych Xi t nie łączy żaden związek: [Xt] « 0; 2) przynajmniej jedna z korelacji cząstkowych jest (istotnie) większa niż koiclacja wyjściowa między X i Y: [XY; /,] większa niż [XY]. Jeżeli korelacje [XY;t}] i [AT] wymagają zastosowania innych wzorów korelacji (np. dlatego, że t mierzone jest na innym poziomic niż X i 7), to nie można ich porównywać. Wówczas warunek (2) brzmi: przynajmniej dwie korelacje cząstkowe [XY; ts]... [XY; t„] muszą różnić się między sobą w stopniu istotnym. Warunkiem wieloprzyczynowości jest brak związku, tzn. brak korelacji między zmiennymi niezależnymi. Nierzadko jednak korelacja taka występuje. Badacz musi wtedy albo pizyjąć do wiadomości, że struktura badanego związku wieloprzyczynowego ma charakter " Objaśnienia symboli patrz s. 255.
Analiza tabelaryczna. Tabela trójdzielna
261
wątpliwy albo próbować znaleźć przyczynę korelacji między X i t, wprowadzając dalsze zmienne. W związku wieloprzyczynowym kombinacja dwu albo więcej zmiennych niezależnych oddziałuje na zmienną zależną. Typ owej kombinacji może być dwojaki: 1. Przedstawiona wyżej tytułem przykładu kombinacja addytywna : każda ze zmiennych niezależnych sama może spowodować zmianę zmiennej zależnej. 2. Kombinacja interakcyjna: każdy z czynników oddziałuje aa zmienną zależną tylko wówczas, gdy występuje łącznie z inną (lub innymi) zmienną niezależną. Kombinacja interakcyjna ujawnia się w toku opracowywania danych na ogół w dwóch formach; każdą z nich zilustrujemy jednym przykładem. W badaniu dotyczącym rodzicielskich metod wychowawczych uzyskano następujące wyniki (tab. 34). Tabela 34 Wychowanie
a) Matka
b) Ojciec
przez
stopień autorytaryzmu niski i wysoki 10 50 60 40
stopień autorytaryzmu niski wysoki 50 50 30 30
Kary cielesne Inne kary
W zbiorowości rodziców traktowanej jako całość zależność między stopniem ich autorytaryzmu (zmienna niezależna) a stosowaniem wobec dzieci kar cielesnych (zmienna zależna) kształtuje się na poziomie dość umiarkowanym. 'Natomiast podział rodziców według płci ujawnia, że zależność ta dotyczy wyłącznie matek, nie dotyczy zaś ojców. Korelacja cząstkowa w grupie matek jest silniejsza niż zależność między autorytaryzmem a metodami wychowawczymi w całej zbiorowości; korelacja cząstkowa w grupie ojców równa jest zeru. Postawa autorytarna oddziałuje więc na postępowanie wychowawcze tylko wtedy, gdy występuje łącznie z jedną wartością drugiej zmiennej niezależnej (płcią rodzica).
.Jsfi»w-U„..i=.fc!W^L...
262
Opracowanie i analiza danych Tabela 35 Zarząd
a) Uczelnie publiczno
wspiera
nacisk silny
Silnie 5 Słabo
10 Uczelnie prywatne
! 1
11
nacisk slaby 10 5
[
silny
slaby
S 4
6 10
Drugi przykład 17 prezentuje tab. 35. Dopóki w ocenie uczelni amerykańskich ograniczano się do odpowiedzi na dwa pytania: (a) jak silny nacisk polityczny wobec nich stosowano (w czasach McCarthy'ego) (zmienna niezależna X) i (b) na ile zarząd uczelni wspierał ciało pedagogiczne w przeciwstawianiu się tym naciskom (zmienna zależna Y), powiązanie między tymi zmiennymi wydawało się zgoła niewielkie. Wówczas jednak, gdy wzięto pod uwagę podział uczelni na publiczne i prywatne (druga zmienna niezależna /), ujawniła.się wyraźna i odmienna w każdej z podgrup zależność. W tym przypadku wartość zmiennej t warunkuje kierunek zmiany Y spowodowanej wpływem X. Zależności tego rodzaju są interesujące teoretycznie zwłaszcza wówczas, gdy pozwalają wyróżnić czynniki, które przy formułowaniu zależności między dwiema cechami podpadają zazwyczaj pod klauzulę ceteris paribus. Odkrycie takiej zależności umożliwia sprecyzowanie zakresu ważności twierdzeń ogólnych. Większość zależności jednoprzyczynowych (i znaczna część pozornych nie-korelacji, patrz niżej) — jeśli nie można ich zaliczyć do grupy korelacji pozornych lub interwencji — okazuje się związkami tego rodzaju. Potwierdzenie. -Zmienna testująca potwierdza założoną zależność jednoprzyczynową między dwiema zmiennymi, jeżeli nie ujawnia ani korelacji pozornej, ani interwencji, ani zależności wieloprzyczy-nowej. Co prawda, jest to potwierdzenie warunkowe — zachowujące ważność tylko w odniesieniu do jednej określonej zmiennej testującej 17
Przykład poshodzi z książki P. F. Lazarsfelda i W. Thielensa: The Acattemk Mincl, Glencoe, 111. 1958, s. 185.
Analiza tabelaryczna. Tabela trójdzielna
263
użytej w badaniu. Potwierdzenie nigdy więc nie może być całkowite, ponieważ nigdy nie można mieć pewności, że nie pominięto żadaego z możliwych czynników testujących. Można je natomiast uznać za dostateczne, jeśli wyczerpano zestaw czynników, których oddziaływanie da się uzasadnić teoretycznie i wszystkie okazały się równie neutralne. O potwierdzeniu ze względu na konkretną zmienną testującą możemy mówić wtedy, gdy — w odróżnieniu od korelacji pozornej i interwencji — przynajmniej jeden współczynnik korelacji cząstkowej jest równy lub bliski zera. Gdy oba te współczynniki są różne od zera, nie jest możliwe, aby któryś z nich — jak przy wieloprzyczynowości — okazał się większy niż korelacja wyjściowa [XY] lub aby korelacje cząstkowe różniły się między sobą. Podsumujmy więc: zmienna testująca potwierdza zależność jednoprzyczynową, jeżeli: 1) korelacje cząstkowe są większe od zera i 2) żadna z nich nie jest większa od wyjściowej korelacji [XY] lub wszystkie korelacje cząstkowe są tej samej wielkości18. Pozorna nie-korelacja. Bywa, że tabela dwudzielna nie ujawnia teoretycznie przewidywanej zależności. Nie musi to być równoznaczne z falsyfikacją hipotezy, ponieważ związek istniejący w rzeczywistości może ulegać „zakłóceniom" pod wpływem jakiegoś czynnika nie uwzględnionego w tabeli. Przyjęcie tego czynnika za stały i wprowadzenie go jako zmiennej testującej ujawnia zależność (korelacje w poszczególnych częściach tabeli). Przykładem mogą być dane tab. 36. Dwudzielna tabela uwzględniająca „ogólne zadowolenie z życia" i „zadowolenie ze stosunków pierwotnych" daje w efekcie korelację bliską zera. Wprowadzenie zaś „zadowolenia z wykonywanego zawo du" jako trzeciej zmiennej ujawnia poszukiwaną zależność w tych częściach tabeli, w których występuje ona jako wartość stała. O tym, jaką cechę należy przyjąć za zmienną testującą pozorną nie-korelacj ę, musi zdecydować badacz odwołując się do teorii. 18 W przypadku idealnym wszystkie korelacje cząstkowe równe są korelacji pierwotnej: [XY, ti] = [XY, /,] = ... = [XY,tn] = [XY]. Korelacje cząstkowe są więc większe od zera (warunek wymieniony jako pierwszy), żadna zaś nie jest większa niż korelacja pierwotna- [XY] (warunek wymieniony jako drugi).
VI
Opracowanie i analiza danych Tabela 36 ) zawodu 1ŻC
0) .
b
Zadowolenia z w ykonywancgo ( >|'i lilie
zadowolenie
z tycio
male
di
zadowoli nic w związków pi crw itnyeh male c duże 130 30
zadowolenie ze związków pierwotnych
Male
150 140
Duta
male
duże
20 120
100 260
r = 0,50
r => 0,32
Zadania 1. Proszę obliczyć korelacj'e oraz korelacje cząstkowe dla umieszczonych niżej tabel. (Jeżeli dokładne obliczenie korelacji nie jest możliwe, można rozwiązać zadania z mniejszą dokładnością, przyglądając się danym w tabelach). .'. Proszę ustalić we wszystkich przypadkach strukturę zależności między czynni-I..inii. 3, Proszę zinterpretować te zależności słownie. 4. W przypadku zależności wieloprzyczynowej proszę obliczyć względną silę oddzia ływania zmiennych niezależnych. Tabela T. należy ustalić zależność między zadowoleniem z pracy a monotonią Zadowolenie z pracy Male Duże
Monotonia pracy duża
mała
50 40
20 40
Jako trzeci czynnik wprowadza się subiektywnie odczuwaną pewność, że nie utraci się miejsca pracy: Pewność, że nie utraci się miejsca pracy mała
Zadowolenie 2 pracy duża Male Duże
duża
monotonia 30 JO
■
monotonia mała
duża
mała
10 20
20 30
10 20
265
Analiza tabelaryczna. Tabela trójdzielna
Tabela 2: należy ustalić zależność między wynikami sportowymi i pozycją socjometryczną ucznia: Pozycja
Wyniki
socjometryczna Niska Wysoka
sportowe
zle
j
dobre
40 20
j \
20 30
Jako trzecią zmienną wprowadza się pochodzenie społeczne ucznia (według indeksu cech przynależności warstwowej): a)
b) Przynależność społeczna
warstwa niższa
Pozycja
wyniki sportowe zle Niska Wysoka
22 7
c)
warstwa średnia
warstwa wyższa
U wyniki spor/owe
wyniki sportowe
dobre
zle
dobre
12 18
10
i
1
10
dobre
zle
55
8
\
1
38
2
Tabela 3: należy ustalić zależność między deklarowanym celem rodzicielskich zabiegów wychowawczych a orientacją polityczną rodziców: Cel wychowania
Orientacja polityczna konserwatywna
„Dziecko grzeczne" „Dziecko samodzielne"
32 24
postępowa
! 24
75
1
Jako trzecią zmienną wprowadza się stopień aulorylai yzmu rodziców:
Stopień autorytaryzmu Cel
niski
wysoki
orientacja polityczna
.Dziecko grzeczne" „Dziecko samodzielne"
orientacja polityczna
konserwatywna
postępowa
konserwatywna
postępowa
2 12
12 70
30 12
12 5
,'. J***{
266
Opracowanie i analiza danych
3. Analiza kontekstual-na W rozdziale tym ograniczamy się niemal wyłącznie d.0 przykładów zależności między dwiema lub trzema cechami dotyczącymi jedno tek. Omówione dotychczas oraz te, które w dalszej kolejności omówimy, metody analizy danych można stosować jednak równie dobrze wówczas, gdy chodzi o zależności między cechami grupowymi. Wszelako opiócz hipotez odnoszących się do jednostek oraz hipotez odnoszących się do.grup są i takie, które dotyczą powiązań między jednymi i drugimi, czyli oddziaływania określonych cech otoczenia, sytuacji lub kontekstu społecznego na takie cechy osobowe, jak postawy czy sposoby zachowań. Badanie tego rodzaju zależności określa się mianem analizy kontekstualnej. Cechami kontekstowymi są przy tym cechy grupowe określające jednostki —■ poprzez ich przynależność do grupy reprezentującej określone cechy (np. ucznia poprzez rodzaj szkoły, do której uczęszcza, profesora poprzez nazwę uczelni, w której wykłada). W układzie zależności będących przedmiotem analizy kontekstualnej cechy kontekstowe giają z reguły rolę zmiennych niezależnych. (W układzie trzech cech cechami kontekstowymi mogą być obie zmienne niezależne). Analiza odnosi się więc zawsze do jednostek. Wówczas gdy w układzie dwu- lub tiójczynnikowym wszystkie cechy są cechami grupowymi, analiza nie ma charakteru kontekstualnego. Wyróżnikiem analizy kontekstualnej są nie jakieś szczególne metody analityczne, lecz szczególne zastosowanie metod. Z uwagi jednak na znaczenie teoretyczne analizy kontekstualnej zilustrujemy ją na specjalnym przykładzie. W badaniu dotyczącym partii zebrano dane o: (a) wielkości jej grup terenowych (grup i organizacji partyjnych), (b) uczestnictwie członków w zebraniach organizacji terenowych i (c) zadowoleniu członków z działalności ich organizacji terenowych. Cecha (a) jest (globalną) cechą grupową, dwie pozostałe to cechy jednostek. Można teraz ustalić relację między cechą grupową jako cechą kontekstową a jedną cechą jednostkową, np. pytając o częstotliwość udziału w zebraniach członków różnej wielkości organizacji terenowych (tab. 37). Gdyby w tym momencie chciało się zrezygnować z analizy kon-
Analiza kontekstualna
267 Tabela 37
Udział w zebraniach Często Rzadko N
Organizacja terenowa duża mała 210 390
220 180
600
400
tekstualnej i skoncentrować się na problemach związanych z poziomem grup, wystarczyłoby na podstawie informacji dotyczących członków określić „aktywność" każdej organizacji terenowej, przyjmując za miernik np. średnią częstotliwość udziału w zebraniach lub procent często biorących udział w zebraniach. W ten sposób dane indywidualne zagregowalibyśmy uzyskując cechę grupową. Teraz można ustalić relację między aktywnością i wielkością jako dwiema cechami grupowymi organizacji terenowych (tab. 38). Dane zawarte Tabela 38 Aktywność organizacji
Organizacja terenowa duża mała
Duża Mała
3 7
8 7
N
10
15
w tabeli odnoszą się więc tym razem nie do jednostek, lecz do organizacji terenowych. Wyniki obu tabel są zgodne: udział członków w zebraniach maleje wraz ze wzrostem wielkości organizacji lub, innymi słowy, większe organizacje cechuje mniejsza aktywność członków. W przypadku zależności trójczynnikowych nie zawsze występuje tego rodzaju zgodność między wynikami analizy kontekstualnej i analizy cech grupowych. Czytelnik może w tym momencie zapytać, czy w analizie kontekstualnej zmienna zależną musi być cecha indywidualna. Czy nie można by np. badać wpływu indywidualnej cechy „aktywność" na grupową cechę „rezultat" (np. efekty uzyskane przez organizację terenową w kampanii wyborczej)? Otóż rzecz w tym, że zależność tego
268
Opracowanie i analiza danych
rodzaju można badać dopiero wówczas, gdy cechę indywidualną „aktywność" zagreguje się jako cechę grupową (co automatycznie oznacza rezygnację z analizy kontckstuaincj) lub gdy cechę grupową „rezultat" przekształci się w cechę kontekstową, co musi pociągnąć za sobą zmianę tieści pytania (musiałoby ono wówczas dotyczyć wpływu, jaki na aktywność indywidualną ma przynależność do osiągającej sukcesy organizacji terenowej; pytanie odwrotne: jak osobista aktywność wpływa ria fakt, że się jest członkiem organizacji uzyskującej sukcesy lub nie uzyskującej sukcesów, nie ma sensu). Rozważmy teraz' bardziej interesujący przypadek relacji kon-tekstualnej tiójczynnikowej. Przyjmijmy, że badanie wykazało dodatnią (niezbyt silną) korelację między częstotliwością udziału w zebraniach a zadowoleniem z działalności swojej organizacji. Powstaje pytanie, czy zależność ta kształtuje się tak samo w organizacjach dużych i małych. Cechę grupową „wielkość organizacji" wprowadzamy więc jako zmienną testującą. Wynik wskazuje tab. 39: okazuje Tabela 39 Zadowolenie z pracy organizacji
Organ izacj
N
mała
udział w zebraniach częsty
Duże Małe
i terenowa
duża
45% 55% 210
|
rzadki 60% 40% 390
udzia) w zebraniach częsty 80% 20% 220
|
rzadki 30% 70% 180
się, że w małych organizacjach zadowolenie jest wprost proporcjonalne, w dużych zaś odwrotnie proporcjonalnie do częstotliwości udziału w zebraniach. Liczby zawarte w tabeli odnoszą się do członków, pozwalają jednak także klasyfikować organizacje terenowe ze względu na wszystkie trzy czynniki, jeżeli obie cechy indywidualne zagreguje się jako cechy grupowe. Będzie to miało, co prawda, ten skutek, że zatrze się zależność między tymi dwiema cechami, bowiem po przekształceniu w cechy grupowe wystąpią one pod postacią średnich lub udziałów procentowych, z danego zaś udziału procentowego zadowolo-
Sprawdzanie zależności wieloczynnikowych
269
nych nie da się odczytać, czy bardziej zadowoleni są członkowie aktywni czy bierni. Poza cechami grupowymi również cechy zrelatywizowane mogą występować w roli zmiennych kontekstowych, co zresztą zdarza sic raczej rzadko. W rozdziale szóstym wspomnieliśmy o analizie relacji, w której chodzi zasadniczo o zbieżność lub rozbieżność cech osób pozostających względem siebie w określonym stosunku. Kontynuując ją można dociekać, czy i jak określony związek cech podobnych (np. polityczna jednomyślność współmałżonków) wpływa na inne cechy lub sposoby zachowań każdej z osób (np. ich zachowania wyborcze). Określony związek cech podobnych jest czymś w rodzaju cechy otoczenia czy zmiennej kontekstowej1S. 4. Sprawdzanie zależności wieloczynnikowych Analizując dane uzyskane w drodze nieeksperymentalnej badacz często ma do czynienia z więcej niż trzema zmiennymi równocześnie. Sytuacja taka powstaje wówczas, gdy w związku trójczynnikowym zmienne zależne wykazują zbyt wielki udział procentowy wariancji nie wyjaśnionej (patrz rozdział dziewiąty s. 227). Jeśli tej nie wyjaśnionej wariancji nie można przypisać błędom pomiaru, znaczy to, że wzięte dotychczas pod uwagę zmienne niezależne determinują zmienną zależną tylko częściowo, ponadto zaś oddziałują na nią jeszcze inne, nie uwzględnione zmienne. O ile w badaniach eksperymentalnych potencjalny wpływ czynników nie objętych analizą kontrolowany jest za pomocą doboru losowego lub doboru parami, o tyle w badaniach nieeksperymentalnych wpływ ten nie podlega kontroli i ujawnia się jako nie wyjaśniona wariancja zmiennej zależnej. Tak więc metodą obliczania koielacji bądź korelacji cząstkowej niezmiernie trudno jest zdobyć pogląd na rzeczywiste zależności mięVJ Wiele przykładów analizy konlekstualnej zależności dwu- i trójczynnikowych (także z danymi zrelatywizowanymi oraz cechami grupowymi jako zmiennymi konlekstualnymi) znaleźć można w pracy S. M. Lipseta, M. Trowa i J. Colemana: Union Dcmocracy, Glencoe, 111. 1956 oraz w pracy P. F. Lazarsfelda i W. Thielensa: The Academic Mind.
jWftsW:
270
Opracowanie i analiza danych
dzy więcej niż Irzema zmiennymi. Przy zależności trójczynnikowej można uciec sic jeSZCŻC do indukcji. W odniesieniu do większej liczlry -zmiennych wskazana jest metoda opracowana przez Blalocka 2". Można powiedzieć, że jest ona swoistym rozwinięciem omówionej wyżej analizy tabelarycznej. Zasadnicza odmienność metody zaproponowanej pizez Blalocka polega na tym, że zależności między zmiennymi nie wywodzi się quasi--indukcyjnie z danych, lecz najpierw buduje się teoretycznie prawdopodobne modele tych zależności, a następnie — obliczając korelacje i korelacje cząstkowe — weryfikuje sic je na uzyskanym materiale empirycznym. W ten sposób można zadecydować, który z możliwych modeli najbardziej odpowiada danym empirycznym. Zastosowanie opisanej poniżej procedmy zależne jest od wielu założeń co do chaiakteru modeli, które mają być sprawdzone. 1. Metoda ta pozwala weiyfikować tylko „modele ^wiązków przyczynowych", tzn. związek między zmiennymi musi być jednokierunkowy: A ~» B, ale nie równocześnie: B -> A. Zależności funkcjonalne, przy których oddziaływanie A na B i B na A jest równoczesne, bez mierzalnej przerwy w czasie, nie mogą być przedmiotem weryfikacji. 2. Zależności między zmiennymi muszą być liniowe i addytywne, w przeciwnym bowiem razie nie można stosować współczynników korelacji liniowej. Zależności nieliniowe — np. paraboliczne — muszą być najpierw przekształcone logarytmicznie w związki liniowe. 3. Wszystkie istotne zmienne muszą być możliwie dokładnie zmieizone i bezpośrednio uwzględnione w modelu. 4. Jakikolwiek zakłócający wpływ zmiennych nie uwzględnionych w modelu może mieć charakter wyłącznie przypadkowy, tzn. nic może systematycznie zakłócać zależności przyczynowej prezentowanej przez dany model. Zmienne interweniujące w sposób systematyczny muszą być uwzględnione w modelu. 5. Zmienne nie uwzględnione w modelu nie mogą ze sobą korelować. 6. Wariancja poszczególnych zmiennych wywołana błędami pomiaru musi być możliwie mała. 211
1961.
II. M. Blalock: Causat ląferences in Nanexperirnental Research, Chapel Mili
Sprawdzanie zależności wieloczynnikowych
271
Warunkiem uzyskania odpowiedzi na pytanie, który z teoretycznie równie prawdopodobnych wieloczynnikowych modeli najbardziej odpowiada zebranym danym empirycznym, jest (1) skończona liczba zmiennych bezpośrednio zdefiniowanych w programie badawczym, (2) dokonanie pomiarów wszystkich tych zmiennych w badanej zbiorowości, (3) dokładne określenie w założeniach wstępnych kierunku zależności przyczynowych między zmiennymi. Model przyczynowy składający się np. z pięciu czynników można przedstawić graficznie dajmy na to tak:
Rysunek 19. Graficzny szkic modelu zależności przyczynowych
Model taki pozwala teoretycznie przewidzieć wartości współczynników korelacji, w tym także współczynników korelacji cząstkowej, które musiałyby wystąpić w danych empirycznych, gdyby struktura związków przyczynowych w tych danych odpowiadała przyjętemu modelowi. Dla ilustracji zasady takiego postępowania posłużymy się modelem czteroczynnikowym (rys. 20).
o— ----------------------------------------------------------a)
b).
c)
d)
Rysunek 20. Różne rodzaje zależności czteroczynnikowej
Przyglądając się modelowi 20a widzimy, że przy postulowanej zależności każda zmienna skorelowana jest (z nie znaną siłą) ze wszystkimi pozostałymi, w związku z czym brak jakichkolwiek wskazówek co do kierunków zależności przyczynowej. Nie można także stwierdzić, czy nie istnieją określone korelacje cząstkowe, jako że nie wy-
272
Opracowanie i analiza danych
■Stępuje zależność wyłącznie pośrednia (która znika po wprowadzeniu
zmiennej interweniującej)!1.
Możliwość taką" uzyskujemy natomiast po usunięciu zależności między A i C, tzn. wówczas gdy zakładamy, że taka bezpośrednia zależność nie istnieje (20b). W tej sytuacji po statystycznym wyeliminowaniu wpływu zmiennej B, musiałaby zniknąć korelacja między A i C, ponieważ A oddziałuje na C wyłącznie za pośrednictwem B. We wzorze wyraża się to następująco: '■ACB = 0 M
W schemacie eksperymentalnym byłoby to równoznaczne z uznaniem B za wartość stalą, co w przypadku, gdy zależność rzeczywista ■odpowiada takiemu modelowi, spowoduje, że zmiana A nie pociągnie za sobą zmiany C. Jeżeli w następnej kolejności wyeliminujemy zależność między A i D (20c), to otrzymamy model, w którym A jest również tylko pośrednio (i w dodatku podwójnie) powiązane z D. W tej sytuacji: AD-BC — 0 Znaczy to, że wówczas gdy zachowana zostaje stała wartość B i C, zniknie korelacja między A i D. Jeśli model ten odpowiada danym ■empirycznym, to obie korelacje cząstkowe — rAC.B i rAD.DC — muszą być równe zeru. Eliminując na koniec zależność między B i D (20d), otrzymujemy prosty łańcuch przyczynowy, który musi spełniać następujące trzy warunki: r
1'ACH — 0 ''AD-BC ~ 0 ' BD-C ~ "
Jednocześnie równe zeru będą w tym przypadku następujące korelacje: rAD.D i rAD.c. Taki prosty łańcuch przyczynowy ma to do siebie, że kontrola jednej zmiennej interweniującej likwiduje zależność 21
Można, co prawda, założyć, że np. korelacja między A i B musi być taka sama, jak korelacja cząstkowa tych dwu zmiennych przy przyjęciu za wartości stale C i D. 22 Sposób obliczania korelacji cząstkowej podają podręczniki statystyki. Patrz np. H. M. Blalock: Statystyka dla socjologów, s. 325-329.
Sprawdzanie zależności wieloczynnikowych'
273
między zmiennymi, dla których ta zmienna jest pośrednikiem. Zasada takiego łańcucha jest również, że korelacja między zmienną stanowiącą początek łańcucha i zmienną kończącą go jest iloczynem wszystkich korelacji między poszczególnymi zmiennymi interweniującymi : r
AD ~ rAB'rBC'rCD
Korelacja ta jest równocześnie zawsze mniejsza niż korelacja między poszczególnymi parami zmiennych zależnych bezpośrednio. Określony model przyczynowy pozwala więc przewidywać nie tylko, jakie korelacje nie wystąpią, ale także, które z nich muszą być iloczynem dwóch albo większej liczby innych korelacji. Pokażemy teraz sposób zastosowania omawianej metody w przypadkach bardziej skomplikowanych na przykładzie modelu sześcioczynnikowego (rys. 21).
Rysunek 21. Model sześcioczynnikowy
Spośród piętnastu możliwych powiązań między dwiema cechami model ten pokazuje siedem jako hipotetyczne związki przyczynowe. Pozwala on zatem przewidywać osiem korelacji cząstkowych i korelacji, które muszą być równe zeru. Jeśli model ten odpowiada danym empirycznym, to musimy uzyskać następujące wyniki: '■AD = 0 '
''AD «= 0
''en = 0
rCD = 0
''AIS-BCD
=
r
==
DE-ABC
r
0
BF-ACDE r
0
Ponadto model ten zakłada, że: — Wprowadzenie...
0
CF-ABDE ~
0
r
==
AE-B ~ rAC'rCE
18
274
Opracowanie i analiza danych
Niżej pokażemy na. przykładzie, jak na podstawie posiadanych danych można ustalić, który z dwóch teoretycznie równic prawdopodobnych modeli cztcroczynnikowych bardziej odpowiada poszukiwanej zależności. Zakładamy, że przyczyną wyników w nauce (Z) mogą być następujące zmienne: 1) spolcczno-ekonomiczny status ojca (W), 2) stosowane przez ojca metody wychowawcze (X), 3) pozycja (prestiż) syna w klasie (7). Teoretycznie równie prawdopodobne wydają się dwa modele (rys. 22). w-
model 1 _»_x ------------------>_ Y
Rysunek 22. Dwa modele tej samej zależności
Model pierwszy pozwala przewidywać, że M: r
xz ~ 1'XY'1'YZ
r
WY — r
} IUT ---
WX ' XY ' WX ' XY > YZ
TL modelu drugiego wynikają dwie korelacje, z których jednej nie da się wyprowadzić wprost z modelu pierwszego: xz
r
XY'rYZ
r WY'YYZ wz Tabela 40 ukazuje korelacje, jakie uzyskano na podstawie danych empirycznych.
23
Przewidywania mogłyby także dotyczyć nie siły określonych korelacji, lecz tego, które korelacje są wykluczone, np. rwz-Y — 0.
Sprawdzanie zależności wicloczynnikowych
275 Tabela 40
Macierz korelacji
w
X
Y
W
—
0,49
X Y Z
0,49 0,53 0,39
Z
0,53
0,39
—
0,61
0,61 0,51
0,51 0,80
0,80
—
—
Porównajmy teraz wielkości korelacji rxz, rWY, ryvz zawartych w macierzy z wielkościami korelacji wynikającymi z wcześniejszych przewidywań. Wyniki tego porównania ukazuje tab. 41. Wprawdzie istotności różnicy między tymi korelacjami obliczyć nie można, widać przecież, że mo'del dragi wykazuje większą zgodność z danymi empirycznymi niż model pierwszy. W modelu pierwszym korelacje między statusem społeczno-ekonomicznym ojca a pozycją syna w klasie (rWY) oraz między statusem spoleczno-ekonomicznym ojca a wynikami syna w nauce (rwz) są liczbowo większe niż można by to było uzasadnić teoretycznie. Model drugi, w którym występuje bezpośrednia zależność między Tabela 41 Porównanie wielkości korelacji oczekiwanych i rzeczywistych Przewidywania
'WY
' WX
^Wf.
r.vy ' iyy
' XY ly
Wartość rzeczywista
Wartość oczekiwana
model 1 0,51 0,53 0,39
0,49 = (0,61)-(0,80) 0,30 =(0,49)-(0,61) 0,24 =(0,49) -(0,61) -(0,80)
model 2 r
~~ rXY '
r
r
=r
* rYX
xz "' wz
18*
WY
YZ
0,51 0,39
0,49 = = (0,61) 0,42 = = (0,53)
(0,80) (0,80)
View more...
Comments