Data Scientist od nuly po PRO - kurz 233 640 RUB. zo SkillFactory, školenie 24 mesiacov, Dátum 15.8.2023.
Rôzne / / November 29, 2023
Po základnom kurze si budete môcť vybrať užšiu špecializáciu Data Science - ML Engineer, CV Engineer alebo NLP Engineer
Inžinier M.L — Vývojár strojového učenia
Vytvorte model predikcie úverového ratingu
Vyriešte problém klasifikácie spamových SMS správ
Vypracujte si systém odporúčania vhodných produktov pri nákupe
Vytvorte model na zvýšenie predaja v maloobchode
Vytvárajte obrázky na základe textového popisu pomocou neurónovej siete DALL-E
CV inžinier — Špecialista na počítačové videnie
Naučte sa riešiť všetky základné problémy v oblasti počítačového videnia
Získate znalosti o reálnom toku práce s modelmi životopisov, aktuálnych prístupoch a pokročilých nástrojoch potrebných na tvorbu služieb životopisu
V záverečnom projekte vytvorte virtuálneho trénera schopného posúdiť správnosť cvikov na videu
Inžinier NLP — Špecialista na spracovanie prirodzeného jazyka
Spoznajte spracovanie prirodzeného jazyka
Pochopte úlohy NLP - klasifikácia, sumarizácia a generovanie textu, vytváranie systémov pre strojový preklad a systémy na zodpovedanie otázok
V záverečnom projekte samostatne vyviniete nástroje na automatizované vyhľadávanie súvislostí k daným témam.
BASE
V tejto fáze sa naučíte základy programovania v Pythone, naučíte sa predspracovať a analyzovať údaje a tiež sa zoznámite s hlavnými úlohami dátového vedca.
Úvod - 1 týždeň
Budete si môcť sami formulovať skutočné vzdelávacie ciele, zistíte, akú hodnotu má DS pre podnikanie, zoznámiť sa s hlavnými úlohami dátového vedca a pochopiť, ako sa vyvíja akýkoľvek projekt DS.
ÚVOD-1. Ako efektívne študovať - onboarding v tréningu
ÚVOD-2. Prehľad profesie. Typy problémov v Data Science. Etapy a prístupy k rozvoju projektu Data Science
Vývojový dizajn - 5 týždňov
Naučíte sa pracovať so základnými dátovými typmi pomocou Pythonu a budete môcť používať cyklické konštrukcie, podmienené príkazy a funkcie vo svojej každodennej práci.
PYTHON-1. Základy jazyka Python
PYTHON-2. Ponorenie sa do dátových typov
PYTHON-3. Podmienečné vyhlásenia
PYTHON-4. Cykly
PYTHON-5. Funkcie a funkčné programovanie
PYTHON-6. Prax
PYTHON-7. Sprievodca štýlom Pythonu (bonus)
Základná matematika - 7 týždňov
MATEMATIKA-1. Čísla a výrazy
MATEMATIKA-2. Rovnice a nerovnice
MATEMATIKA-3. Základné pojmy teórie funkcií
MATEMATIKA-4. Základy geometrie: planimetria, trigonometria a stereometria
MATEMATIKA-5. Množiny, logika a prvky štatistiky
MATEMATIKA-6. Kombinatorika a základy teórie pravdepodobnosti
MATEMATIKA-7. Riešenie problémov
Práca s dátami - 8 týždňov
V tejto fáze si osvojíte základné dátové zručnosti: ako dáta pripraviť, vyčistiť a transformovať tak, aby boli vhodné na analýzu. Keď už hovoríme o analýze: údaje budete analyzovať pomocou populárnych knižníc Matplotlib, Seaborn, Plotly.
PYTHON-8. Data Science Tools
PYTHON-9. Knižnica NumPy
PYTHON-10. Úvod do Pandy
PYTHON-11. Základné techniky pre prácu s dátami v Pandas
PYTHON-12. Pokročilé dátové techniky v Pandách
PYTHON-13. Čistenie dát
PYTHON-14. Vizualizácia údajov
PYTHON-15. Princípy OOP v Pythone a ladiaci kód (voliteľný modul)
Projekt 1. Analýza množín údajov o uzavretých problémoch
Načítanie dát - 6 týždňov
Budete si môcť stiahnuť dáta z rôznych formátov a zdrojov. A SQL, štruktúrovaný dopytovací jazyk, vám s tým pomôže. Naučíte sa používať agregačné funkcie, spojenia tabuliek a komplexné spojenia.
PYTHON-16. Ako sťahovať údaje zo súborov rôznych formátov
PYTHON-17. Získavanie údajov z webových zdrojov a rozhraní API
SQL-0. Ahoj SQL!
SQL-1. Základy SQL
SQL-2. Súhrnné funkcie
SQL-3. Spájanie stolov
SQL-4. Komplexné spoje
Projekt 2. Načítavajú sa nové údaje. Spresnenie analýzy
Štatistická analýza údajov - 7 týždňov
Intelligence Data Analysis (EDA) je to, na čo sa zameriate. Oboznámite sa so všetkými fázami takejto analýzy a naučíte sa, ako ju vykonávať pomocou knižníc Statsmodels, Scikit Learn, Seaborn, Matplotlib, SciPy, Pandas. Okrem toho budete môcť pracovať na Kaggle, obľúbenej službe pre účasť v súťažiach.
EDA-1. Úvod do analýzy spravodajských údajov. Algoritmy a metódy EDA
EDA-2. Matematická štatistika v kontexte EDA. Typy funkcií
EDA-3. Feature Engineering
EDA-4. Štatistická analýza dát v Pythone
EDA-5. Štatistická analýza dát v Pythone. Časť 2
EDA-6. Dizajn experimentov
EDA-7. Platforma Kaggle
Projekt 2
Úvod do strojového učenia – 9 týždňov
Oboznámite sa s knižnicami ML na modelovanie závislostí údajov. Budete môcť trénovať hlavné typy modelov ML, vykonávať validáciu, interpretovať výsledky práce a vyberať dôležité vlastnosti (dôležitosť funkcie).
ML-1. Teória strojového učenia
ML-2. Učenie pod dohľadom: Regresia
ML-3. Učenie pod dohľadom: Klasifikácia
ML-4. Učenie bez dozoru: Techniky zhlukovania a redukcie dimenzií
ML-5. Validácia dát a vyhodnotenie modelu
ML-6. Výber a výber vlastností
ML-7. Optimalizácia hyperparametrov modelu
ML-8. Kuchárka ML
Projekt 3. Problém klasifikácie
HLAVNÁ JEDNOTKA
Lineárna algebra, matematická analýza, diskrétna matematika - znie to strašidelne, ale nebojte sa: analyzujeme všetky tieto predmety a naučíme vás, ako s nimi pracovať! V druhej fáze sa ponoríte do matematiky a základov strojového učenia, dozviete sa viac o profesiách DS a prostredníctvom kariérového poradenstva si vyberiete druhý ročník štúdia.
Matematika a strojové učenie. 1. časť - 6 týždňov
Budete vedieť riešiť praktické úlohy pomocou manuálneho výpočtu a Pythonu (vektorové a maticové výpočty, práca s množinami, štúdium funkcií pomocou diferenciálnej analýzy).
MATH&ML-1. Lineárna algebra v kontexte lineárnych metód. Časť 1
MATH&ML-2. Lineárna algebra v kontexte lineárnych metód. Časť 2
MATH&ML-3. Matematická analýza v kontexte optimalizačného problému 1. časť
MATH&ML-4. Matematická analýza v kontexte optimalizačného problému. Časť 2
MATH&ML-5. Matematická analýza v kontexte optimalizačného problému. Časť 3
Projekt 4. Regresný problém
Matematika a strojové učenie. 2. časť - 6 týždňov
Oboznámite sa so základnými pojmami teórie pravdepodobnosti a matematickej štatistiky, algoritmami klastrovanie, a tiež sa naučiť hodnotiť kvalitu vykonaného klastrovania a prezentovať výsledky v grafickej podobe.
MATH&ML-6. Teória pravdepodobnosti v kontexte naivného Bayesovho klasifikátora
MATH&ML-7. Algoritmy založené na rozhodovacích stromoch
MATH&ML-8. Zosilnenie a stohovanie
MATH&ML-9. Techniky zhlukovania a redukcie rozmerov. Časť 1
MATH&ML-10. Techniky zhlukovania a redukcie rozmerov. Časť 2
Projekt 5. Súborové metódy
Diskrétna matematika - 4 týždne
MATH&MGU-1 Zostavy a kombinatorika
Logika MATH&MGU-2
Grafy MATH&MGU-3. Časť 1
Grafy MATH&MGU-4. Časť 2
ML v podnikaní - 8 týždňov
Naučíte sa používať knižnice ML na riešenie problémov časových radov a odporúčacích systémov. Budete môcť trénovať ML model a overovať ho, ako aj vytvoriť funkčný prototyp a spustiť model vo webovom rozhraní. A tiež získajte zručnosti A/B testovania, aby ste mohli model vyhodnotiť.
MATH&ML-11. Časové rady. Časť 1
MATH&ML-12. Časové rady. Časť 2
MATH&ML-13. Systémy odporúčaní. Časť 1
MATH&ML-14. Systémy odporúčaní. Časť 2
PROD-1. Príprava modelu na výrobu
PROD-2. PrototypeStreamlit+Heroku
PROD-3. Obchodné porozumenie. Prípad
Projekt 6. Téma na výber: Časové rady alebo Systémy odporúčaní
PRO LEVEL
V tretej etape sa zoznámite s jednou z metód strojového učenia – deep learning (DL). A tiež na vás čaká plnohodnotný blok vybranej špecializácie: zvládnete zručnosti strojového učenia (ML), zoznámiť sa s rutinou CV (počítačové videnie) alebo sa zdokonaliť v NLP*, prirodzenom spracovaní Jazyk.
Druhý rok štúdia - na výber 3 špecializácie
Kariérne poradenstvo
ML, CV alebo NLP: v tejto fáze sa musíte konečne rozhodnúť, ktorou cestou sa vydať ďalej. Povieme vám o každej špecializácii a ponúkneme vám riešenie niekoľkých praktických problémov, ktoré vám uľahčia rozhodovanie.
Trať ML - inžinier
V ML stope sa naučíte riešiť hĺbkové problémy strojového učenia, osvojíte si kompetencie dátového inžiniera a zdokonalíte svoje zručnosti v práci s knižnicami Pythonu. Dozviete sa tiež, ako vytvoriť MVP (minimálnu životaschopnú verziu produktu), naučíte sa všetky zložitosti výstupu modelu ML do výroby a dozviete sa, ako inžinieri ML pracujú v reálnom živote.
Úvod do hlbokého učenia
Základy dátového inžinierstva
Ďalšie kapitoly Python a ML
Ekonomické vyhodnotenie efektov a vývoj MVP
ML do výroby
Hĺbkové štúdium vývoja ML a absolventského projektu na zvolenú tému
Dráhové CV – inžinier
Na stope CV sa naučíte riešiť problémy počítačového videnia, ako je klasifikácia obrázkov, segmentácia a detekcia, generovanie a štylizácia obrazu, reštaurovanie a zlepšovanie kvality fotografie. Okrem toho sa naučíte, ako zaviesť neurónové siete do produkcie.
Úvod do hlbokého učenia
Základy dátového inžinierstva
Ďalšie kapitoly Python a ML
Ekonomické vyhodnotenie efektov a vývoj MVP
ML do výroby
Hĺbkové štúdium vývoja ML a absolventského projektu na zvolenú tému
Trať NLP - inžinier
Počas tréningu na dráhe NLP sa naučíte riešiť hlavné problémy spracovania prirodzeného jazyka, v vrátane klasifikácie, sumarizácie a generovania textu, strojového prekladu a vytvárania dialógu systémov
Úvod do hlbokého učenia
Matematika neurónových sietí pre NLP
Hard & Software na riešenie problémov NLP
NLP úlohy a algoritmy
Neurónové siete vo výrobe
Hĺbkové štúdium vývoja NLP a absolventského projektu na zvolenú tému
Ak si vyberiete špecializáciu CV alebo ML, môžete absolvovať kurz NLP bez podpory mentora zadarmo.
Hlboké učenie a neurónové siete
Kde sa používajú neurónové siete? Ako trénovať neurónovú sieť? Čo je hlboké učenie? Odpovede na tieto otázky sa dozviete v bonusovej sekcii DL.
Úvod do dátového inžinierstva
Dozviete sa, aký je rozdiel medzi rolami dátového vedca a dátového inžiniera, aké nástroje tento pri svojej práci používa a aké úlohy denne rieši. Slová „snehová vločka“, „hviezda“ a „jazero“ nadobudnú nový význam :)