Strojové učenie v praxi - kurz 41 500 rub. z IBS Training Center, školenie 24 hodín, Dátum 26.11.2023.
Rôzne / / December 02, 2023
Kurz je postavený na niekoľkých praktických prípadoch obsahujúcich tabuľky s počiatočnými údajmi.
V každom prípade prechádzame celým životným cyklom projektu strojového učenia:
výskum, čistenie a príprava dát,
výber tréningovej metódy vhodnej pre danú úlohu (lineárna regresia pre regresiu, náhodný les pre klasifikáciu, K-means a DBSCAN pre zhlukovanie),
tréning zvolenou metódou,
vyhodnotenie výsledkov,
optimalizácia modelu,
prezentácia výsledku zákazníkovi.
Počas diskusnej časti kurzu diskutujeme o praktických problémoch, ktorým študenti čelia a ktoré je možné riešiť diskutovanými metódami.
Preberané témy:
1. Kontrola úlohy (teória – 1 hodina)
Aké problémy dobre rieši strojové učenie a aké problémy sa snažia vyriešiť?
Čo sa stane, ak namiesto Data Scientist zamestnáte nešpecialistu v danej oblasti (iba vývojára/analytika/manažéra) s očakávaním, že sa to bude učiť.
2. Príprava, čistenie, prieskum dát (teória – 1 hodina, prax – 1 hodina)
Ako porozumieť zdrojovým obchodným údajom (a vo všeobecnosti v nich zistiť akúkoľvek objednávku).
Postupnosť spracovania.
Čo môže a malo by sa delegovať na doménových analytikov a čo najlepšie urobí samotný Data Scientist.
Priority pri riešení konkrétneho problému.
3. Klasifikátory a regresory (teória – 2 hodiny, prax – 2 hodiny)
Praktická časť - dobre sformulované úlohy s pripravenými údajmi.
Rozdiel medzi úlohami (binárna/nebinárna/pravdepodobnostná klasifikácia, regresia), prerozdelenie úloh medzi triedy.
Príklady klasifikácie praktických problémov.
4. Klastrovanie (teória – 1 hodina, prax – 2 hodiny)
Kde a ako vykonať zhlukovanie: prieskum údajov, kontrola vyhlásenia o probléme, kontrola výsledkov.
Aké prípady možno zredukovať na zhlukovanie.
5. Hodnotenie modelu (teória – 1 hodina, prax – 1 hodina)
Obchodné metriky a technické metriky.
Metriky pre klasifikačné a regresné problémy, matica chýb.
Interné a externé metriky kvality klastrovania.
Krížová validácia.
Posudzovanie rekvalifikácie.
6. Optimalizácia (teória – 5 hodín, prax – 3 hodiny)
Čo robí jeden model lepším ako druhý: parametre, vlastnosti, zostavy.
Správa nastavení.
Prax výberu funkcií.
Prehľad nástrojov na nájdenie najlepších parametrov, vlastností a metód.
7. Grafy, reporty, práca so živými úlohami (teória – 2 hodiny, prax – 2 hodiny)
Ako jasne vysvetliť, čo sa deje: sebe, tímu, klientovi.
Krajšie odpovede na nezmyselné otázky.
Ako prezentovať tri terabajty výsledkov na jednej snímke.
Poloautomatické testy, ktoré kontrolné body procesu sú skutočne potrebné.
Od živých úloh až po úplný proces výskumu a vývoja („Výskum a vývoj v praxi“) - analýza a analýza úloh od publika.