Zovšeobecnené lineárne modely - kurz 3600 rub. od Otvorené vzdelávanie, školenie 3 týždne, cca 6 hodín týždenne, Dátum 29. novembra 2023.
Rôzne / / December 01, 2023
Jednou z podmienok použiteľnosti konvenčných lineárnych modelov je nezávislosť pozorovaní od seba, na základe ktorých je model vybraný. V praxi však často dochádza k situáciám, keď je usporiadanie zbierky materiálu také, že porušenie tejto podmienky je nevyhnutné. Predstavte si, že ste sa rozhodli zostaviť model, ktorý popisuje vzťah medzi výkonom v telesnej výchove a výsledkami IQ testov medzi študentmi. Na vyriešenie tohto problému ste urobili množstvo vzoriek vo viacerých inštitúciách. Je možné tieto údaje spojiť do jednej analýzy zostavenej podľa tradičnej schémy? Samozrejme, že nie. Študenti na každej univerzite si môžu byť v niečom podobní. Dokonca aj povaha vzťahu medzi skúmanými veličinami môže byť trochu odlišná. Tento typ údajov, v ktorých existujú vnútroskupinové korelácie, by sa mal analyzovať pomocou lineárnych zmiešaných modelov. Ukážeme, že niektoré prediktory by mali byť zahrnuté do modelu ako takzvané „náhodné faktory“. Dozviete sa, že náhodné faktory môžu byť hierarchicky podriadené. Budeme diskutovať o tom, ako môžu byť takéto zmiešané modely zostavené pre závislé premenné, ktoré sledujú rôzne typy distribúcií. Okrem toho si ukážeme, že náhodná časť modelu môže byť ešte zložitejšia – môže mať komponent, ktorý modeluje správanie rozptylu v reakcii na vplyv kovariátu. Na konci kurzu nájdete projekt, v ktorom si môžete precvičiť zostavovanie zmiešaných modelov výberom jedného z niekoľkých súborov údajov. Na základe analýzy týchto údajov môžete vytvoriť správu podľa tradície reprodukovateľného výskumu.
docent, Katedra zoológie bezstavovcov, Fakulta biológie, St. Petersburg State University, Ph.D.
Vedecké záujmy: štruktúra a dynamika spoločenstiev morského bentosu, priestorové škály, sukcesia, medzidruhové a vnútrodruhové biotické interakcie, rast a rozmnožovanie morských bezstavovcov, demografická štruktúra populácií, mikroevolúcia, bioštatistika.
Kurz pozostáva zo 4 modulov:
1) Úvod do zovšeobecnených lineárnych modelov
Generalizované lineárne modely (GLM) vám umožňujú modelovať správanie veličín, ktoré nesledujú normálne rozdelenie. Aby sme vám uľahčili prvé kroky vo svete GLM, analyzujeme ich štruktúru na príklade GLM pre normálne rozdelené veličiny – takto môžete kresliť paralely s jednoduchými lineárnymi modelmi. Dozviete sa, čo je to funkcia prepojenia, ako funguje maximálna pravdepodobnosť a ako testovať GLM hypotézy pomocou Waldových testov a testov pomeru pravdepodobnosti.
2) Problém výberu modelu
V tomto module budeme hovoriť o metodologických otázkach spojených s budovaním modelov. Model je zjednodušená reprezentácia reality a voľba medzi rôznymi konkurenčnými metódami takéhoto zjednodušenia je častou úlohou analytika. V tomto module sa naučíte porovnávať modely pomocou informačných kritérií. Budeme diskutovať o hlavných možnostiach analýzy pri výbere modelov a hovoríme o ťažkostiach vznikajúcich v súvislosti so skrytou mnohosťou modelov. Nakoniec vás naučíme rozpoznať hlavné typy zneužívania výberu modelov (data-fishing, p-hacking).
3) Zovšeobecnené lineárne modely na počítanie údajov
V tomto module si rozoberieme základné metódy modelovania spočítateľných veličín. Najprv si povieme, prečo konvenčné lineárne modely nie sú vhodné na počítanie dát. Vlastnosti spočítateľných rozdelení vám pomôžu pochopiť rozdiely medzi typmi GLM pre spočítateľné údaje a funkciami ich diagnostiky. Funkciu prepojenia uvidíte, ako funguje, keď si vizualizujete predpovede GLM na stupnici funkcie prepojenia a na stupnici premennej odozvy.
4) Zovšeobecnené lineárne modely s binárnou odozvou
Niekedy je potrebné simulovať, či sa nejaká udalosť vyskytla alebo nie, či futbalový tím alebo prehral, či sa pacient po liečbe zotavil alebo nie, či sa klient dopustil kúpiť alebo nie. Konvenčné lineárne modely nie sú vhodné na modelovanie takýchto binárnych údajov (udalosti s dvoma výstupmi), ale to sa dá ľahko urobiť pomocou zovšeobecnených lineárnych modelov. V tomto module sa naučíte modelovať pravdepodobnosti udalostí, ktoré sa vyskytnú tak, že ich predstavíte ako pravdepodobnosť. Pozrieme sa, ako funguje funkcia logit link a ako sa pri jej použití interpretujú koeficienty GLM. Nakoniec si budete môcť precvičiť analýzu zovšeobecnených lineárnych modelov s rôznymi distribúciami dokončením projektu analýzy údajov. Výsledky tejto analýzy bude potrebné prezentovať ako správu vo formáte html napísanú pomocou rmarkdown/knitr.
• Zistite, aké zručnosti sú potrebné, aby ste mohli začať s analytikou a Data Science• Naučte sa používať Excel, SQL, Power BI, Google Data Studio na prácu s údaje a napíšte svoj prvý kód v Pythone• Získajte podrobného sprievodcu a naučte sa, ako vstúpiť do oblasti vedy o údajoch a vybrať si rolu v odbore Dátová veda
4,4
1 490 ₽