W 1906 roku angielski statystyk, socjolog, geograf, polimat, do tego kuzyn Charlesa Darwina, Sir Francis Galton przeprowadził w mieście Plymouth znajdującym się na południu Anglii pewien społeczny eksperyment. Zorganizował konkurs, do którego zaprosił 800 okolicznych mieszkańców, pokazał im truchło wołu i poprosił każdego o indywidualne oszacowanie jego wagi. Jak się później okazało, mediana odpowiedzi wyniosła wtedy 1196 funtów, co różniło się od rzeczywistej wagi zwierzęcia o 1 funt.
Link do opisu eksperymentu z “marcowego Nature (1907).”
W ten oryginalny sposób narodziła się hipoteza Wisdom of Crowds, czyli mądrości tłumu, a jej obecną popularność zawdzięczamy James Surowiecki, który to w 2004 roku napisał książkę o tym samym tytule “Wisdom of Crowds.” Teoria ta zakłada, że opinia grupy osób na tematy związane z rozumowaniem przestrzennym, szacowaniem wielkości czy wiedzą ogólną, może w odpowiednich warunkach być lepsza od eksperckiej opinii wyedukowanej w danym zagadnieniu jednostki.
Czym cechuje się mądry tłum?
Aby przejść do dalszych rozważań, potrzebujemy określić kluczowe cechy definiujące “mądry tłum”. “Wise Crowd” charakteryzuje się:
Różnorodnością opinii członków tłumu na badany temat. Każda osoba powinna mieć własny pogląd na dane zagadnienie nawet jeśli opiera go o ekscentryczną interpretację znanych faktów.
Niezależność. Opinia jednostki stanowiącej część tłumu powinna być wydawana niezależnie i poza wpływem pozostałych jednostek.
Decentralizacja. Źródłem odpowiedzi pojedynczych uczestników tłumu jest ich własna wiedza, doświadczenia oraz ich środowisko.
Agregacja. Odpowiedzi tłumu muszą być uzyskiwane w formie, która pozwoli na zbadanie ich pod kątem statystycznym – nie mogą być abstrakcyjne.
Zaufanie. Każda jednostka składająca się na tłum musi mieć zaufanie do pozostałych uczestników tłumu
“Czyli uważasz, że jesteś lepszy niż agent CIA?”
Ciekawym przykładem udowadniającym hipotezę “Wisdom of Crowds” jest Good Judgment Project. Trzy tysiące osób zaproszonych do tego projektu bez żadnego określonego klucza osobowości lub cech charakterystycznych, będących tak naprawdę przekrojową grupą społeczeństwa amerykańskiego, od kilku lat przewiduje prawdopodobieństwo zaistnienia i/lub skalę przeróżnych zdarzeń politycznych, które mogą się wydarzyć na świecie. Predykcje przez nich dostarczane są anonimowe i nieskażone opinią pozostałych prognostów. Odpowiadają na pytania typu:
Ile Syryjskich uchodźców przekroczy granicę Unii Europejskiej?
Czy będzie znaczący atak na terytorium Izraela ze strony organizacji terrorystycznych lub wrogiego państwa przed dniem 15 lipca 2019?
Czy Korea Północna wpuści Donalda Trumpa na swoje terytorium podczas jego wizyty w Korei Południowej?
Czy Rosjanie zaaneksują Krym?
Czy w Wenezueli nastąpi przewrót polityczny?
Itd.
W związku z tym, że FB ucina zasięgi ankiet, postanowiłem przenieść je tutaj na blog, gdzie liczba głosujących jest zdecydowanie większa. Do tego wydaje mi się to bardziej fair, bo tak naprawdę umieszczając ankietę w treści wpisu, zagłosują faktyczni czytelnicy Koszt Alternatywny! Dlatego od teraz każde głosowanie będzie przeprowadzane na blogu i będzie trwało do czasu ukazania się kolejnego.
Pytania są im zadawane przed potencjalnym zaistnieniem danej sytuacji w rzeczywistości. Co ciekawe najpopularniejszym i najczęściej jedynym narzędziem wpływającym na osądy pojedynczych prognostów jest po prostu wyszukiwarka Google.
Skuteczność całej grupy przeszła najśmielsze oczekiwania twórców inicjatywy. Uśrednione odpowiedzi 3000 prognostów są statystycznie dokładniejsze niż badanych ekspertów z amerykańskich agencji wywiadowczych (W tym CIA) mimo dostępu do baz danych, narzędzi analitycznych oraz zasobów tych jednostek. Co więcej 1% najlepiej odpowiadających w Good Judgement Project, którzy uzyskują tytuł tzw. “Superforecasters”, kolaborujących według wskazanej przez badaczy metodologii, uzyskuje o 30% bardziej precyzyjne rezultaty swoich przewidywań od grup eksperckich.
W oparciu o powyższy przykład, w którym zarówno liczebność jak i sposób doboru uczestników był książkowy, można pokusić się o kolejną hipotezę.
Przy odpowiednio dużej populacji tłumu, zadając jego uczestnikom określoną liczbę pytań na pochodne lub analogiczne zagadnienia, powinniśmy być w stanie wyznaczyć z niego “mniejszy tłum”, który jako grupa będzie w stanie przewyższać swoimi wynikami nie tylko ekspertów, pierwotny tłum, ale i specjalistyczne grupy.
Rynek predykcyjny.
Uwielbiam powyższe wideo za przykład otwierający. Parafrazując prowadzącego:
“Ceny towarów mogą przenosić informację o wydarzeniach na świecie, nawet tych z przyszłości. Weźmy np. Kontrakty terminowe na ceny soków pomarańczowych. Mogą one zawierać w sobie przewidywania na temat prognozowanej pogody na Florydzie w najbliższym sezonie. Nie w tym rzecz, że ten rynek został do tego zaprojektowany. Po prostu spekulanci, którzy ustawiają swoje pozycje cenowe na nim, muszą przyjmować jakieś założenia, co do pogody na Florydzie i to ma odzwierciedlenie w wycenie kontraktów terminowych na ceny soków pomarańczowych.”
Z kontekstu możemy się domyślić, że Floryda jest stanem o bardzo dużym znaczeniu dla uprawy cytrusów w USA. Jeżeli w takim razie pogoda będzie niesprzyjająca dla wegetacji owoców, to poprzez naturalny spadek podaży pomarańczy, przy niezmienionym popycie, ceny soków poszybują do góry.
Link do raportu “Citrus Fruits 2018 Summary.”
Wróćmy jednak do rynków predykcyjnych. Czym one właściwie są?
Rynek predykcyjny, to rynek giełdowy utworzony w celu handlu wynikami potencjalnych zdarzeń. Ceny rynkowe mogą wskazywać, jakie prawdopodobieństwo przewiduje tłum na zaistnienie danego incydentu. Kontrakty na rynkach predykcyjnych zawiera się pomiędzy 0% a 100%. Dzięki zróżnicowanej opinii uczestników tego rynku, wycena danego kontraktu jest odzwierciedleniem zagregowanej opinii tłumu.
Rodzaje rynków predykcyjnych:
Iowa Electronic Market, umożliwia nam zakup lub sprzedaż “udziałów” kandydatów w wyborach politycznych w USA. Działa to w ten sposób, że kupując po określonej stawce “udział” danego kandydata, jeśli wygra on daną elekcję otrzymujemy 1$, jeżeli przegra nie otrzymujemy nic.
Hipotetyczny przykład zastosowania:
Wybory Prezydenckie 2015 w Polsce. W narożniku pierwszym Prezydent Bronisław Komorowski, członek Platformy Obywatelskiej szykujący się do reelekcji. Po przeciwnej stronie, wtedy jeszcze nikomu nieznany Andrzej Duda, wykładowca na wydziale prawa Uniwersytetu Jagiellońskiego startujący z ramienia Prawa i Sprawiedliwości.
I tura wyborów, CBOS wypuszcza sondaż, w którym przewiduje 63% poparcia dla Bronisława Komorowskiego przy 70% frekwencji w wyborach. W programie Tomasza Lisa, słyszymy jak redaktor naczelny Gazety Wyborczej mówi coś takiego:
W oparciu o taki “feed” informacyjny, z dużym, załóżmy 80% prawdopodobieństwem zakładamy, że kandydat PO ma “wygraną w kieszeni.” Rejestrujemy się na Iowa Electronic Market i widzimy, że jest pozycja dotycząca Polskich wyborów prezydenckich. Uwzględniając wcześniejsze informacje i wynikające z nich nasze założenia, każdy udział Bronisława Komorowskiego sprzedawany poniżej 80 centów jest dla nas okazją inwestycyjną. Prosta matematyka, jeśli za wygraną dostajemy dolara, a kupujemy po 80 centów to przegrywając raz na pięć (20% czasu), będziemy na zero.
II tura wyborów, mijają trzy miesiące, a pracownia Estymator wypuszcza taki sondaż. Sytuacja mówiąc delikatnie, ulega zmianie. Na szczęście dla wszystkich zakonnic w Polsce, to nie śmierć jednej z nich na przejściu dla pieszych przechyliła szalę zwycięstwa w stronę Andrzeja Dudy tylko czynniki, o których nie przeczytacie na tym blogu, bo Koszt Alternatywny to blog o ekonomii behawioralnej, a nie polityczny! 😉
W takim wypadku dalsze zakupy udziałów Bronisława Komorowskiego po 80 centów byłoby szaleństwem. Załóżmy na potrzeby przykładu, że wciąż wierzymy w jego zwycięstwo, ale dajemy na nie 30% szans. Oznaczałoby to, że jeżeli chcielibyśmy dalej inwestować w zakład o wygraną naszego kandydata, to nie powinniśmy kupować jego akcji drożej niż po 30 centów.
Wróćmy na chwilę do filmu Marginal Revolution University, możemy się z niego dowiedzieć, że udowodniono, iż przewidywania uczestników Iowa Electronic Market, na każdym etapie wyborów są statystycznie dokładniejsze niż sondaże wyborcze.
“Pomyśl o tym, ludzie mając pieniądze za linią czują zachętę do uważnego myślenia o ich inwestycji. Gromadzą, procesują i interpretują niezbędne informacje z całego świata. (…) czego polityczne sondaże zrobić nie mogą.”
Hollywood Stock Exchange (HSX) – gra na “Hollywoodzkie dolary”, w której uczestnicy (800 000 userów) kupują i sprzedają udziały aktorów, reżyserów, opcje w filmach, utworach muzycznych lub zakładają się kto otrzyma statuetkę Oscara na najbliższej gali.
Co ciekawe, mimo że jest to zabawa i uczestnicy grają na wirtualne pieniądze to ich przewidywania okazują się bardzo dobre i tutaj pojawia się magia. O ile gra jest “for fun” to samo HSX nie jest organizacją non profit. Ich model monetyzacji jest bardzo prosty – pozyskane na platformie przewidywania, przekształcają w bazę danych, analizują ją, a następnie sprzedają uzyskaną w ten sposób wiedzę bezpośrednio Studiom Filmowym. Z tego co wyczytałem na ich stronie, z ich usług korzystają: Warner Bros, LionsGate, The Legendary Motion Picture Production czy też Screenvision.
Augur – przykład zdecentralizowanego rynku predykcyjnego zbudowanego w oparciu o blockchain Ethereum. Poniżej możecie obejrzeć ich materiał promocyjny:
https://www.youtube.com/watch?v=yegyih591Jo
Ile M&Ms jest w słoiku?
W powyższym filmie mamy przedstawione podobne (zamiast mediany odnosi się do średniej arytmetycznej) doświadczenie do tego, które Sir Galton przeprowadził przed ponad 100 laty. Autorzy filmu napełnili po brzegi relatywnie duży słoik M&M’sami. Następnie poprosili dwadzieścia cztery osoby o oszacowanie ich całkowitej liczby. Co istotne – mogły one dotykać pojemnik i korzystać z google. Metodologie szacunków ankietowanych były różne. Jedni próbowali uzyskać wynik wspierając się przewidywaniami objętości poszczególnych elementów eksperymentu, inni uznali, że waga będzie lepszym wyznacznikiem, a jeszcze inni po prostu zgadywali.
Rozstrzał odpowiedzi był spory, od 700 do 6300 sztuk. Średnia wyniosła 2137 i różniła się od właściwej odpowiedzi (2133) jedynie o 4 cukierki.
Jedna z odpowiadających trafiła dokładną liczbę. Co ciekawe, jej “metodologia” nie miała za wiele wspólnego z naukowym podejściem:
– Uznała “na oko”, że w słoiku jest 2 000 cukierków.
– Jako że nie lubi jak liczba zawiera w sobie zera, dodała do dwóch tysięcy sto.
– Jako że jej ulubiona cyfra to 3 to dwa pozostałe zera zamieniła w trójki.
Voila! Trafiony zatopiony!
Porażki inteligencji tłumu.
Oczywistym przykładem udowadniającym omylność tłumu są bańki spekulacyjne, Surowiecki w swojej książce bada sytuacje, w których tłum wytwarza bardzo niepoprawny osąd, który doprowadza do takich wydarzeń. Autor doszukuje się jego przyczyn w procesie poznania. Członkowie tłumu uczestniczącego w bańce spekulacyjnej, są z dużym prawdopodobieństwem świadomi opinii jego pozostałych uczestników i pod wpływem tej wiedzy zaczynają ich naśladować i dostosowywać swoje decyzje.
Inne przykłady porażek tłumu:
Jednorodność. Brak różnorodności, uniemożliwia zaistnienie odmiennych procesów myślowych lub prywatnych przemyśleń, które mogłyby skutkować alternatywnym zrozumieniem problemu.
Centralizacja. Zbiorowość może działać pod wpływem jej najsilniejszych przedstawicieli z charakterologicznego lub hierarchicznego punktu widzenia.
Podział na dywizje, np pomiędzy agencjami wywiadowczymi, może powodować blokadę swobodnego przepływu informacji, które skutkowałyby wtórną analizą innego zespołu i doprowadzały do dokładniejszych wniosków.
Imitacja. Jeżeli uczestnicy tłumu podejmują decyzję sekwencyjnie i poprzednie wybory poszczególnych jednostek są widoczne dla pozostałych, może wystąpić tzw. kaskada informacji. W takim przypadku, decyzje pierwszych decydentów, mogą się wydać w subiektywnym odczuciu kolejnych decydujących wyborami racjonalnymi, co będzie miało wpływ na ich osąd, gdyż łatwiej skopiować dobre istniejące rozwiązanie, niż starać się wynaleźć własne, które niekoniecznie okaże się lepsze.
Emocjonalność. Czynniki emocjonalne, takie jak poczucie przynależności do grupy może prowadzić do presji rówieśników, odwoływania się do instynktu stadnego, a w skrajnych przypadkach zbiorowej histerii całej grupy.
Na zakończenie chciałbym przeprowadzić prosty eksperyment w oparciu o ankietę. Jak Wam się wydaje o ile wzrosną ceny transakcyjne mieszkań na rynku wtórnym w Polsce w 2019 roku? Odpowiadajcie, a do wyników ankiety wrócimy jak GUS albo NBP opublikuje swój raport. Porównamy je z dostępnymi przewidywaniami ekspertów od rynku nieruchomości. Myślę że czytelnicy Kosztu Alternatywnego znokautują ich!
Zapraszam również do zapisania się do Newslettera, w szczególności dlatego, że osoby zapisane dostają przedpremierowo dostęp do analizy na bardzo pokrewny temat do powyższego pytania – może uda mi się za pomocą raportu “Czy w 2019 przepłacę za swoję M?” wpłynąć na Wasz osąd i zmanipulować wyniki badania! 😉
Dajcie znać w komentarzach, co myślicie o koncepcie “Wisdom of Crowds.” Czy znacie jakieś inne przykłady niesamowitej skuteczności osądu tłumu? A może przychodzą Wam na myśl jakieś przykłady zbiorowych porażek? Dzięki za to, że przeczytaliście do końca.
Pozdrawiam,
DP
Dobry tekst, przeczytałem też „o mnie”. Mam podobne doświadczenia i przemyślenia do tych, które opisujesz. Dobrze było tu trafić.
Rozpatrywanie kosztów alternatywnych ma jeszcze jedną ważną cechę, którą marginalizowałem do niedawna. Myślenie w tych kategoriach (alternatyw) wzmaga czujność i otwartość na inność/zmianę. Powoduje też, że choćby umownie, intuicyjnie szacujemy wartość posiadanych stanów (rzeczy, planów, aktywów). To taki „empire stare of mind”, bardzo pomocny np. w inwestowaniu/spekulacji. Nie jest możliwe bowiem rozpoznanie okazji lub korzystnej asymetrii korzyści do straty bez kontekstu. Rozpatrywanie kosztów alternatywnych jest tym kontekstem.
Dziękuję PK! Nic nie motywuje do dalszego pisania jak takie komentarze! 🙂
Co do myślenia w „kategoriach alternatyw.” To jest dokładnie tak jak piszesz. Chociaż ja poszedłem krok dalej i staram się też rozpatrywać swoje wybory „niematerialne” w oparciu o ich koszt alternatywny.