Gaussian Copula Model. MATEMATICKÁ ZBRAŇ HROMADNÉHO NIČENÍ

Před nedávnem jsem napsal text pro Academix Revue, kterou vydává liberecká univerzita. Se svolením šéfredaktora jej přetiskuju zde, kde by si jej (tedy textu, nikoliv šéfredaktora) mohlo všimnout více lidí.

V roce 2007 dosáhla celková hodnota exotické formy finančního pojištění s názvem Credit Default Swap (CDS) částky 67 bilionů dolarů (v angličtině trillion, 6.7×10^13 dolarů). Toto číslo převýšilo celosvětové HDP v daném roce asi o patnáct procent. Jinými slovy – někdo na finančních trzích se vsadil o částku, která byla vyšší než hodnota všeho, co se ten rok na světě vyprodukovalo. O co se naši přátelé na Wall Street sázeli? O to, jestli explodují jisté krabice finanční pyrotechniky jménem Collateralized Debt Obligations (CDOs). Vsadit se o částku, která je větší než svět, vyžaduje značnou míru jistoty na straně toho, kdo pojištění poskytuje. Čím byla tahle jistota podepřena? Kouzelným vzoreček s názvem Gaussian Copula Model. V krabicích CDO byly totiž naskládané hypotéky mnoha milionů Američanů a model s lechtivým názvem odhadoval sdruženou pravděpodobnost, že držitelé nějakých dvou náhodně vybraných hypoték oba přestanou být schopni své závazky splácet. Klíčovým členem v této kouzelné formulce byl koeficient gama, který z historických dat odhadoval korelaci mezi mírou nesplácení hypoték v různých koutech Spojených států. Tato korelace byla téměř po celé dvacáté století docela malá, protože nebylo mnoho důvodů, proč by hypotéky na Floridě měly nějak zásadně souviset s hypotékami v Kalifornii či Washingtonu.

Jenže v létě 2006 začaly ceny nemovitostí v celých Spojených státech klesat a miliony lidí se ocitly v situaci, kdy za své domy dlužily víc, než byla jejich aktuální hodnota. V této situaci se mnozí Američané racionálně rozhodli, že nemá cenu hypotéky dále splácet, a nemovitosti přenechali bankám. Počet nesplácených hypoték tedy dramaticky narostl, a to najednou, napříč celou zemí. Koeficient gama v kouzelném vzorečku vyskočil ze zanedbatelných hodnot směrem k jedničce a krabice CDO explodovaly všechny naráz. Finančníci, kteří vsadili HDP celé planety na to, že se tak nestane, prohráli.

Celá tahle sázka, ve které pár spekulantů prohrálo celou planetu, byla založená na matematickém modelu, který si jeho uživatelé spletli s realitou. Finanční ztráty, které tím způsobili, byly nesplatitelné, takže nezbývalo, než aby je za ně zaplatily státy. Ty ovšem taky neměly zrovna jedno celosvětové HDP navíc, takže udělaly to, co obvykle – připsaly tyhle nesplatitelné dluhy na dlouhý seznam nesplatitelných dluhů, které samy nasekaly už předtím. A tak jeden vzoreček, který má v ASCII kódu sotva 40 znaků, skokově zvýšil celkové zadlužení „vyspělého“ světa o desítky procent HDP. Jde tedy zřejmě o nejdražší vzoreček v dějinách lidstva.

Dalo by se tedy předpokládat, že si po tomto fiasku začneme dávat trochu větší pozor na předpovědi různých matematických modelů a jejich autorů. Ve skutečnosti jsme udělali opak. Na podzim roku 2019 se z čínského Wuhanu začal šířit virus, který dostal po svých starších sourozencích jméno SARS-CoV-2. Jeho starší sourozenci byly pěkné bestie, takže na začátku epidemie propadl celý svět poměrně oprávněné panice – kdyby byla smrtnost nového viru srovnatelná s jeho starším bratříčkem, skutečně by hrozil kolaps civilizace. A právě v této chvíli se po celém světě vynořila různá více či méně pochybná akademická individua se svými oblíbenými matematickými modely a začala do veřejného prostoru chrlit divoké predikce. Novináři predikce prozkoumali, neomylně z nich vybrali jen ty nejapokalyptičtější a začali je dramatickým hlasem předčítat bezradným politikům. V následném zápalu „boje s epidemií“ se zcela ztratila jakákoliv kritická diskuse o povaze matematických modelů, jejich předpokladů, o validaci modelů, riziku overfittingu a zejména o kvantifikaci nejistoty.

Většina matematických modelů, které se vyrojily z akademických kruhů, byly více či méně složité verze naivní hry jménem SIR. Tato tři písmenka jsou zkratkou pro Susceptible–Infected–Recovered a pocházejí ze začátku dvacátého století, kdy se díky absenci počítačů daly řešit jen ty nejjednodušší diferenciální rovnice. SIR modely považují obyvatele za různobarevné kuličky, které se nacházejí v dokonalé promíchané nádobě a narážejí do sebe. Když se srazí červená (nemocná) se zelenou (zdravou), jsou z toho dvě červené. Každá červená po čase zčerná a přestane si ostatních všímat. A to je celé. Všechny kuličky dělají to samé – tupě poletují a náhodně vrážejí do ostatních. V modelu dokonce není nijak zachycen prostor – neexistují ani města, ani vesnice. Tento zcela naivní model udělá pokaždé to samé. Vyprodukuje (maximálně) jednu vlnu nákaz, která po čase opadne a navždy zmizí.

A v této chvíli udělali kapitáni koronavirové response tu samou chybu jako bankéři před patnácti lety: Spletli si model s realitou. „Odborníci“ hleděli na predikce modelů, které ukazovaly jednu jedinou velkou vlnu epidemie, ale zároveň sledovali skutečná data, ve kterých přicházela jedna vlna za druhou. Místo aby z tohoto rozporu mezi modelem a realitou vyvodili správný závěr – že tyto modely jsou k ničemu – začali fantazírovat, že se realita od modelů odchyluje proto, že se projevují „efekty opatření“, kterými oni sami epidemii „řídí“. Mluvilo se o „předčasném rozvolnění“, „efektu opatření“ a jiných v zásadě teologických záležitostech. Mezi akademickou veřejností se pochopitelně ihned našli oportunisti, kteří přispěchali s vylhanými články o tom, jak jsou tato opatření účinná.

Virus si mezitím dělal, co chtěl, a matematických modelů si nevšímal. Málokdo si to uvědomuje, ale za celou dobu epidemie se neobjevil ani jeden model, který by byl schopen aspoň přibližně správně předpovědět, kdy současná vlna vyvrcholí nebo jestli přijde další vlna, případně kdy. Na rozdíl od Gaussian Copula Models, které – krom toho, že se zábavně jmenují – fungovaly aspoň dokud ceny nemovitostí rostly, modely šíření epidemie neměly s realitou nic společného od samého začátku. Mnozí jejich autoři je později začali alespoň zpětně fitovat na historická data, čímž dokonale zmátli nematematickou veřejnost, která typicky nerozlišuje mezi ex-post nafitovaným modelem (kde skutečná historická data s modelovanými krásně sedí) a predikcí do budoucna. Skupina „modelářů“ napojená na český ÚZIS tímto trikem vodila za nos poslance, senátory, ministry, novináře a veřejnost po celou dobu epidemie. Pokusy lidí, kteří mají s matematickým modelováním alespoň nějaké zkušenosti, uvést tyto omyly na pravou míru, vedly do ztracena, protože tou dobou už byla jakákoliv diskuse bezpečně zrušena pomocí nálepek dezinformátorů, šiřitelů fake-news.

Zatímco během finanční krize způsobilo nesmyslné používání matematických modelů především ekonomické škody, během epidemie už nešlo jen o peníze. Na základě nesmyslných modelů byla přijímána všemožná „opatření“, která mnoha lidem poškodila duševní či fyzické zdraví.

I přes to měla nakonec tato globální ztráta soudnosti nějaký pozitivní efekt – povědomí o potenciální škodlivosti matematických modelů se dostalo z akademických kanceláří do širokých veřejných kruhů. Zatímco před pár lety byl pojem „matematického modelu“ obestřen nábožnou úctou, po třech letech epidemie je důvěra veřejnosti ve schopnosti „odborníků“ něco předvídat prakticky na nule. Neselhaly však jen modely – selhala i velká část akademické a vědecké komunity, která místo opatrného a skeptického evidence-based přístupu plnila veřejný prostor nadšenou podporou kdejaké pitomosti, která zrovna politiky napadla. Ztráta důvěry veřejnosti v současnou vědu, medicínu a její představitele bude asi nejvýraznějším důsledkem epidemie.

A to je přesně chvíle, kdy je třeba se znovu a pořádně podívat na matematické modely, jejichž důsledky mohou být násobně ničivější než vše, co jsme dosud popisovali. Jde samozřejmě o klimatické modely. Diskusi o „globální změně klimatu“ lze rozdělit do tří částí.

1. Skutečný vývoj teploty na naší planetě. Posledních pár desítek let máme z mnoha míst planety rozumně přesná a stabilní přímá měření. Čím dále chceme jít do minulosti, tím více se musíme spolehnout na různé metody rekonstrukce teploty, logicky tedy roste nejistota. Místy se objeví jisté pochybnosti stran toho, jaká teplota je vlastně předmětem diskuse – teplota se totiž neustále mění v prostoru i v čase a vůbec není jedno, jak se jednotlivá měření zkombinují do nějaké „globální“ hodnoty. Vzhledem k tomu, že jakkoliv definovaná „globální teplota“ je projevem komplexního dynamického systému, který je daleko od termodynamické rovnováhy, je celkem vyloučeno, aby byla konstantní. Jsou tedy jen dvě možnosti – v každém okamžiku od vzniku planety Země „globální teplota“ – jakkoliv definovaná – buďto zrovna roste, nebo zrovna klesá. Obecně panuje široká shoda na tom, že se během dvacátého století celkově oteplilo, byť geografické rozdíly jsou výrazně větší, než se obecně přiznává. Podrobnější diskuse o tomto bodu není předmětem tohoto eseje, neboť se přímo netýká matematických modelů.

2. Hypotéza o tom, že zvýšení koncentrace oxidu uhličitého v atmosféře vede k růstu globální teploty. Toto je legitimní vědecká hypotéza, jejíž testování je na matematickém modelování založeno více, než byste si mohli myslet. Proto se tomuto bodu budeme věnovat podrobněji níže.

3. Racionalita různých „opatření“, které politici a aktivisté všeho druhu navrhují, abychom globální změně klimatu zabránili či alespoň zmírnili její dopady. Tento bod opět není předmětem mého eseje, ale je nutné si uvědomit, že mnoho navrhovaných (a leckdy již implementovaných) „opatření“ proti změně klimatu bude mít řádově dramatičtější důsledky než cokoliv, co jsme udělali během epidemie covidu. S tímto vědomím se tedy pojďme podívat, do jaké míry je hypotéza z bodu 2 opřena o něco jiného než jen matematické modelování.

Na první pohled zde není třeba matematických modelů, protože mechanismus, kterým CO2 ohřívá planetu, je dobře pochopen už od Josepha Fouriera, který jej popsal jako první. Již dětem na základní škole kreslíme do učebnic obrázek skleníku, na který se shora usmívá sluníčko. Krátkovlnné záření ze sluníčka projde sklem, zahřeje vnitřek skleníku, ale dlouhovlnné záření (vyzařované ohřátým interiérem skleníku) je sklem pohlcováno, „nemůže ven“, a proto je ve skleníku teplo. A podobnou roli jako sklo ve skleníku hraje, milé děti, oxid uhličitý v atmosféře. Tohle „vysvětlení“, po němž se celý skleníkový efekt jmenuje a kterému s laskavým svolením čtenáře říkám „skleníkový efekt pro mateřské školky“, trpí drobným problémem – je úplně špatně. Ve skleníku je totiž teplo z úplně jiného důvodu. Skleněný plášť zabraňuje konvekci – teplý vzduch nemůže stoupat vzhůru. Tento fakt byl experimentálně ověřen už na začátku dvacátého století tím, že se vedle normálního skleníku postavil identický skleník z materiálu, který infračervené záření propouští. Rozdíl v teplotách uvnitř obou skleníků byl zanedbatelný.

Dobře. Ve skleníku tedy není teplo díky skleníkovému efektu (pro uklidnění různých fakt-čekistů sděluji, že tohle se nahlas říkat může, je to dokonce napsáno i na wikipedii). To ale neznamená, že oxid uhličitý neabsorbuje infračervené záření a nechová se v atmosféře tak, jak jsme si představovali, že se chová sklo ve skleníku. Oxid uhličitý skutečně absorbuje záření v několika pásmech vlnových délek. Tuto vlastnost má i vodní pára, metan a další plyny. Skleníkový efekt (mylně pojmenovaný po skleníku) je bezpečně prokázaný experimentální fakt a bez skleníkových plynů v atmosféře by byla teplota na povrchu planety o několik desítek stupňů nižší.

Z toho logicky plyne, že když se koncentrace CO2 v atmosféře zvýší, zachytí molekuly CO2 ještě více infračervených fotonů, které tedy nebudou moci uniknout do vesmíru, a teplota planety dále vzroste. Většina lidí se s tímto vysvětlením spokojí a nadále považují hypotézu z bodu 2 výše za prokázanou. Této verzi příběhu říkám „skleníkový efekt pro filosofické fakulty“. Problém je samozřejmě v tom, že oxidu uhličitého (a dalších skleníkových plynů) je v atmosféře tolik, že žádný foton s příslušnou frekvencí nemá šanci proniknout atmosférou, aniž by byl pohlcen nějakou molekulou skleníkového plynu a posléze opět vyzářen. K určitému navýšení absorpce infračerveného záření v atmosféře indukovaného rostoucí koncentrací CO2 tak může dojít pouze na okrajích příslušných absorpčních pásem. S touto znalostí – která ovšem není mezi politiky a novináři příliš rozšířená – přestává být samozřejmé, proč by zvýšení koncentrace CO2 mělo vést k růstu teploty.

Ve skutečnosti je ovšem situace ještě složitější a je tedy třeba přijít s další verzí vysvětlení, kterou pracovně nazývám „skleníkový efekt pro přírodovědecké fakulty“. Tato verze pro dospělé zní následovně: Proces absorbce a opětovné emise fotonů probíhá ve všech vrstvách atmosféry a atomy skleníkových plynů si fotony „předávají“ tak dlouho, až konečně jednou jeden z takto vyzářených fotonů někde v horní vrstvě atmosféry odletí do vesmíru. Koncentrace skleníkových plynů s rostoucí výškou samozřejmě klesá. Když tedy trochu CO2 přidáme, posune se hranice, ze které již fotony mohou uniknout do vesmíru, o něco výše. A protože čím výše jdeme, tím je větší zima, budou takto vyzářené fotony odnášet méně energie, což bude mít za následek, že více tepla zůstane neodneseno – planeta tedy bude teplejší.

Všimněte si, že původní verze s usměvavým sluníčkem nad skleníkem se nám trochu zkomplikovala. Dost lidí se v této chvíli začne škrábat na hlavě a přemýšlet, jestli je výše uvedené vysvětlení skutečně tak jasné. Při zvýšení koncentrace CO2 možná budou odlétat „chladnější“ fotony (protože se místo jejich emise posune výše), nebude jich ale ze stejného důvodu odlétat více? Nemělo by se dle tohoto vysvětlení oteplovat více v horních vrstvách atmosféry? Jak s tímto vysvětlením souvisí teplotní inverze, kdy asi tak od 12 kilometrů výše začíná teplota opět růst? Skutečně lze v těchto úvahách zanedbat veškerou konvekci, která představuje přesuny ohromného množství tepelné energie v atmosféře? A tak dále.

Když se tímto způsobem budete ptát dosti dlouho, začnou se odpovědi více a více opírat o matematické modely, které obsahují řadu experimentálně (tedy s určitou chybou) změřených parametrů. Ty zahrnují například spektrum absorpce světla v CO2 (a všech ostatních skleníkových plynech) včetně jeho závislosti na koncentraci nebo detailní teplotní profil atmosféry s výškou. Dovolím si zde tedy vyslovit velmi radikální tvrzení. Hypotéza o tom, že zvýšení koncentrace oxidu uhličitého v atmosféře vede k růstu globální teploty není podepřena nějakým jednoduše a srozumitelně vysvětlitelným fyzikálním zdůvodněním, které by bylo jasné člověku s běžným vysokoškolským vzděláním technického či přírodovědného směru. Tato hypotéza je v konečném důsledku podepřena matematickým modelováním, které více či méně přesně zachycuje některé z mnoha komplikovaných dějů v atmosféře.

To ovšem vrhá na celý problém úplně jiné světlo. V kontextu toho, jak dramatické omyly byly v nedávné minulosti opřeny o matematické modelování, je třeba věnovat „skleníkovému efektu“ mnohem větší pozornost. Tvrzení o tom, že „science is settled“ jsme slyšeli mnohokrát během covidu a různé predikce, které se později ukázaly jako zcela absurdní, byly opírány o „vědecký konsensus“. Rád bych upozornil, že téměř všechny významné vědecké objevy začínaly právě jako osamocené hlasy jdoucí proti dobovému vědeckého konsensu. Konsensus ve vědě mnoho neznamená – věda je postavena na pečlivé falsifikaci hypotéz pomocí správně provedených experimentů a správně vyhodnocených dat.

Závěrem konstatuji, že matematické modelování je dobrý sluha, ale zlý pán. Hypotéza o globální změně klimatu způsobené rostoucí koncentrací CO2 v atmosféře je jistě zajímavá a plausibilní. Rozhodně se však nejedná o experimentální fakt a v žádném případě není na místě jakkoliv cenzurovat otevřenou a poctivou odbornou debatu na toto téma. Pokud se totiž i v tomto případě nakonec ukáže, že matematický model nebyl relevantní, naděláme ve jménu „opatření“ proti změně klimatu škody, které již nebudou vratné.

 

AUTOR: Tomáš Fürst

 

ZDROJ

 

 

 


 

Autor příspěvku: ANS