Helion


Szczegóły kursu video

Machine learning i język R. Kurs video. Pierwsze kroki z pakietem mlr

Machine learning i język R. Kurs video. Pierwsze kroki z pakietem mlr


Obierz kurs na efektywną pracę z danymi

Żyjemy w społeczeństwie informacyjnym, co oznacza, że zewsząd otaczają nas dane. W zetknięciu z nimi bylibyśmy bezradni, gdyby nie statystyka — nauka zajmująca się przekształcaniem ich w praktyczną wiedzę. Z zastosowania w statystyce metod algorytmicznych wyrosło uczenie maszynowe, które stanowi potężny zestaw narzędzi służących zyskiwaniu wglądu w strukturę danych (wykrywaniu wzorców i zależności), przewidywaniu zjawisk i zachowań oraz automatyzacji pracy.

Jednym z języków umożliwiających przetwarzanie i analizę danych jest otwarty język programowania R. Dzięki temu, że współtworzą go tysiące użytkowników z całego świata, R zapewnia dostęp do ogromnej liczby gotowych narzędzi analitycznych, pozwalających przekształcić suche, anonimowe dane w konkretną wiedzę przydatną dla ludzi biznesu, naukowców i pasjonatów. Uzupełnienie języka R stanowi między innymi pakiet mlr — zyskujące na popularności, uznane narzędzie do analizy danych, automatyzujące i upraszczające wiele typowych zadań.

Czy chcesz zanurzyć się z nami w ciemny labirynt danych i szczęśliwie dotrzeć do jego jasnego końca? Jeśli tak, zapraszamy — poznajcie się: oto język R i jego nieodłączny towarzysz, pakiet mlr!

Co Cię czeka podczas naszego profesjonalnego szkolenia?

W trakcie niniejszego kursu video:

  • zapoznasz się z pracą, jaką wykonuje analityk danych;
  • poznasz efektywne metody przetwarzania danych;
  • nauczysz się importować i łączyć dane z różnych źródeł;
  • będziesz pracować w języku R i zapoznasz się z pakietem mlr.

Co więcej…

  • opanujesz zagadnienia typowe dla machine learning: wybór metody, uczenie modelu, jego ocenę, porównanie modeli, optymalizację predykcji.


Machine learning i R. Kurs video. Pierwsze kroki z pakietem mlr kończy się na poziomie podstawowym, stanowiącym bazę do dalszego, samodzielnego rozwoju. Po ukończeniu szkolenia jego słuchacz będzie w stanie poradzić sobie z przygotowaniem danych do dalszej obróbki. Znajomość pakietu mlr pozwoli mu przyśpieszyć i zautomatyzować pracę z danymi.

Kto i jak pracuje z danymi

Najbardziej ogólna, ale także najbardziej prawdziwa odpowiedź brzmi: (prawie) każdy! Umiejętności analizowania danych wymaga się na różnorodnych stanowiskach. W medycynie, czy szerzej — nauce, praca z danymi polega przede wszystkim na stosowaniu odpowiednich metod „klasycznej” statystyki. Czasem silniejszy nacisk kładzie się na przetwarzanie danych (hurtownie danych, przetwarzanie danych przed analizą), czasem z kolei na tworzenie modeli predykcyjnych (na przykład przewidywanie zachowań klientów). Jednak w zasadzie zawsze dużą część pracy zajmuje sprowadzenie danych do odpowiedniej postaci (od importu po uzupełnianie braków). W samej analizie ważne są aspekty obliczeniowe, tj. dopasowanie modelu do dużych danych, optymalizacja jego własności predykcyjnych, ocena jego działania. By móc szybko i sprawnie wywiązywać się z powierzonych zadań, trzeba dysponować odpowiednimi narzędziami — autor kursu proponuje język R oraz przynależny do niego pakiet mlr, jako popularne, darmowe i stale rozwijające się; niniejszy kurs stanowi świetny wstęp do ich poznania, dalszą naukę można śmiało kontynuować samodzielnie.

Wprowadzenie do przetwarzania danych

Niniejsze szkolenie jest podzielone na dwa główne bloki tematyczne. Po krótkim wprowadzeniu i zainstalowaniu niezbędnych pakietów przejdziemy do zagadnienia przetwarzania danych. Dowiemy się, jak zaimportować dane zapisane w różnych formatach i jak je wyczyścić. Wspólnie wykonamy podstawowe operacje, takie jak filtrowanie, edycja kolumn, grupowanie i zmiana postaci danych. Na koniec tej części kursu zapoznamy się z pakietem data.table. Drugi blok tematyczny jest poświęcony uczeniu maszynowemu z pakietem mlr. W tej części kursu mowa między innymi o zadaniach uczenia, o tym, jak skonstruowane są jego obiekty, oraz o metodach uczenia maszynowego — modelach liniowych i ich modyfikacjach, drzewach, lasach i SVM. Będziemy trenować, oceniać i porównywać modele, dostroimy do modelu hiperparametry, wreszcie poznamy funkcje zaawansowane: obliczenia równoległe, imputację danych, bagging, selekcję zmiennych, na koniec zaś wykonamy diagnostykę modelu i spróbujemy zrozumieć jego strukturę.

Zdobywanie wiedzy zawartej w danych wymaga dobrych narzędzi. W R znajdziesz te narzędzia!

  • 1. Wprowadzenie
    • 1.1. Wprowadzenie i instalacja niezbędnych pakietów00:02:53
  • 2. Przetwarzanie danych
    • 2.1. Import danych w różnych formatach00:07:33
    • 2.2. Czyste dane. Łączenie tabel i podsumowania00:04:27
    • 2.3. Podstawowe operacje (filtrowanie, edycja kolumn, grupowanie, zmiana postaci danych)00:08:34
    • 2.4. Wprowadzenie do pakietu data.table00:06:10
  • 3. mlr - podstawy
    • 3.1. Dlaczego mlr?00:02:03
    • 3.2. Zadania uczenia00:06:20
    • 3.3. Konstrukcja obiektów uczenia00:04:06
    • 3.4. Metody uczenia maszynowego: modele liniowe i ich modyfikacje00:06:00
    • 3.5. Metody uczenia maszynowego: drzewa, lasy i SVM00:05:22
    • 3.6. Trenowanie, ocena i porównywanie modeli00:06:31
    • 3.7. Strojenie hiperparametrów modelu00:06:01
    • 3.8. Zaawansowane funkcje: obliczenia równoległe, imputacja danych, bagging, selekcja zmiennych00:08:07
    • 3.9. Diagnostyka modelu: analiza reszt00:03:03
    • 3.10. Wyjaśnianie predykcji00:05:55
  • 4. Podsumowanie
    • 4.1. Podsumowanie. Co dalej?00:01:29