Szczegóły ebooka

SQL. Analiza danych za pomocą zapytań. Warsztaty praktyczne. Wydanie II

SQL. Analiza danych za pomocą zapytań. Warsztaty praktyczne. Wydanie II

Matt Goldwasser, Upom Malik, Benjamin Johnston

Ebook

Obecnie mamy dostęp do terabajtów danych. To nieprzebrane źródło cennych informacji, które mogą decydować o upadku albo o rozkwicie firmy. Aby jednak wydobyć z danych potrzebną wiedzę, trzeba się wykazać kompetencjami. Są to cenne umiejętności - profesjonalny analityk danych może przebierać w atrakcyjnych ofertach pracy. Spośród różnych technik analizy danych warto się przyjrzeć zastosowaniu zapytań SQL. SQL to język tworzony i rozwijany dla potrzeb pracy z bazami danych, jest więc szczególnie przydatnym narzędziem w przyborniku analityka danych.

Ta książka jest znakomitym przewodnikiem dla początkującego analityka danych. Dzięki niej dowiesz się, jak skutecznie przesiewać i uzyskiwać informacje z surowych danych. Nauczysz się formułować hipotezy i generować opisowe statystyki, a także pisać złożone zapytania SQL, które pozwalają na zagregowanie danych z bazy SQL z danymi pochodzącymi z innych źródeł. Zobaczysz, jak pracować z danymi w różnych formatach, i nauczysz się analizy geoprzestrzennej i analizy tekstu. Poznasz też tajniki pozyskiwania informacji z wykorzystaniem takich metod jak profilowanie i automatyzacja.

W książce:

  • przygotowanie danych za pomocą zapytań SQL
  • funkcje agregujące i funkcje okna w SQL
  • bazy danych i Excel oraz kod w R i w Pythonie
  • praca ze złożonymi typami danych
  • optymalizacja zapytań SQL
  • metodyczne rozwiązywanie problemów

SQL: znakomite narzędzie w profesjonalnej analizie danych!

  • Wprowadzenie
    • O książce
      • Odbiorcy
      • O rozdziałach
      • Konwencje stosowane w książce
      • Przygotowywanie środowiska
      • Instalowanie systemu PostgreSQL 12
      • Pobieranie i instalowanie systemu PostgreSQL dla systemu Windows
      • Konfigurowanie zmiennej Path
      • Instalowanie systemu PostgreSQL w systemie Linux
      • Instalowanie systemu PostgreSQL w systemie macOS
      • Instalowanie Pythona
        • Instalowanie Pythona w systemie Windows
        • Instalowanie Pythona w systemie Linux
        • Instalowanie Pythona w systemie macOS
      • Instalowanie systemu Git
        • Instalowanie systemu Git w systemach Windows i macOS X
        • Instalowanie systemu Git w systemie Linux
      • Pobieranie przykładowych zbiorów danych dla systemu Windows
      • Pobieranie przykładowych zbiorów danych dla systemu Linux
      • Pobieranie przykładowych zbiorów danych dla systemu macOS
      • Uruchamianie plików SQL
      • Instalowanie bibliotek
      • Pliki z kodem
  • 1. Wprowadzenie do SQL-a dla analityków
    • Wprowadzenie
    • Świat danych
      • Rodzaje danych
      • Analityka danych i statystyka
      • Rodzaje statystyki
      • Zadanie 1.01 klasyfikowanie nowego zbioru danych
    • Metody z obszaru statystyki opisowej
      • Analiza jednoczynnikowa
      • Rozkład danych
      • Ćwiczenie 1.01 tworzenie histogramu
        • Kwantyle
      • Ćwiczenie 1.02 obliczanie kwartyli dla sprzedaży dodatków
      • Tendencja centralna
      • Ćwiczenie 1.03 obliczanie miar tendencji centralnej dla sprzedaży dodatków
      • Dyspersja
      • Ćwiczenie 1.04 obliczanie dyspersji dla sprzedaży dodatków
      • Analiza dwuczynnikowa
      • Wykresy punktowe
        • Współczynnik korelacji Pearsona
      • Ćwiczenie 1.05 obliczanie współczynnika korelacji Pearsona dla dwóch zmiennych
        • Interpretowanie i analizowanie współczynnika korelacji
          • Dane w postaci szeregów czasowych
      • Zadanie 1.02 eksplorowanie danych sprzedażowych z salonu samochodowego
      • Praca z niepełnymi danymi
    • Testy istotności statystycznej
      • Często używane testy istotności statystycznej
    • Relacyjne bazy danych i SQL
      • Wady i zalety baz SQL-owych
    • Podstawowe typy danych w SQL-u
      • Typy liczbowe
      • Typy znakowe
      • Typ logiczny
      • Daty i godziny
      • Struktury danych format JSON i tablice
    • Wczytywanie tabel kwerenda SELECT
      • Podstawowa budowa i działanie kwerendy SELECT
      • Podstawowe słowa kluczowe w kwerendach SELECT
        • Instrukcje SELECT i FROM
        • Klauzula WHERE
        • Klauzule AND i OR
        • Klauzule IN i NOT IN
        • Klauzula ORDER BY
        • Klauzula LIMIT
        • Klauzule IS NULL i IS NOT NULL
      • Ćwiczenie 1.06 kwerenda SELECT z podstawowymi słowami kluczowymi dotycząca tabeli salespeople
      • Zadanie 1.03 kwerenda SELECT z podstawowymi słowami kluczowymi dotycząca tabeli customers
    • Tworzenie tabel
      • Tworzenie pustych tabel
        • Ograniczenia kolumn
      • Ćwiczenie 1.07 tworzenie tabeli w SQL-u
      • Tworzenie tabel za pomocą kwerendy SELECT
    • Aktualizowanie tabel
      • Dodawanie i usuwanie kolumn
      • Dodawanie nowych danych
      • Aktualizowanie istniejących wierszy
      • Ćwiczenie 1.08 aktualizowanie tabeli w celu podniesienia ceny pojazdu
    • Usuwanie danych i tabel
      • Usuwanie wartości z wiersza
      • Usuwanie wierszy z tabeli
      • Usuwanie tabel
      • Ćwiczenie 1.09 usuwanie niepotrzebnej tabeli
      • Zadanie 1.04 tworzenie i modyfikowanie tabel na potrzeby działań marketingowych
    • SQL i analityka
    • Podsumowanie
  • 2. Przygotowywanie danych za pomocą SQL-a
    • Wprowadzenie
    • Łączenie danych
      • Łączenie tabel za pomocą słowa kluczowego JOIN
      • Rodzaje złączeń
        • Złączenia wewnętrzne
        • Złączenia zewnętrzne
        • Złączenia krzyżowe
      • Ćwiczenie 2.01 używanie złączeń do analizy sprzedaży w salonach
      • Podkwerendy
      • Sumy
      • Ćwiczenie 2.02 generowanie listy gości na przyjęcie dla klientów VIP za pomocą klauzuli UNION
      • Wyrażenia WITH
    • Przekształcanie danych
      • Funkcja CASE WHEN
      • Ćwiczenie 2.03 używanie funkcji CASE WHEN do pobierania list klientów z danego regionu
      • Funkcja COALESCE
      • Funkcja NULLIF
      • Funkcje LEAST i GREATEST
      • Funkcja CASTING
      • Funkcje DISTINCT i DISTINCT ON
      • Zadanie 2.01 używanie SQL-a do tworzenia modelu wspomagającego sprzedaż
    • Podsumowanie
  • 3. Agregacja i funkcje okna
    • Wprowadzenie
    • Funkcje agregujące
      • Ćwiczenie 3.01 używanie funkcji agregujących do analizowania danych
    • Funkcje agregujące z klauzulą GROUP BY
      • Klauzula GROUP BY
      • Klauzula GROUP BY dla kilku kolumn
      • Ćwiczenie 3.02 obliczanie cen dla typów produktów za pomocą klauzuli GROUP BY
      • Klauzula GROUPING SETS
      • Funkcje agregujące dla zbiorów uporządkowanych
    • Klauzula HAVING
      • Ćwiczenie 3.03 obliczanie wyników i wyświetlanie danych z użyciem klauzuli HAVING
    • Stosowanie funkcji agregujących do oczyszczania danych i sprawdzania ich jakości
      • Znajdowanie brakujących wartości za pomocą klauzuli GROUP BY
      • Pomiar jakości danych za pomocą funkcji agregujących
      • Zadanie 3.01 analizowanie danych sprzedażowych z użyciem funkcji agregujących
    • Funkcje okna
      • Podstawy funkcji okna
      • Ćwiczenie 3.04 analizowanie zmian współczynnika podawania danych przez klientów w czasie
      • Słowo kluczowe WINDOW
    • Obliczanie statystyk z użyciem funkcji okna
      • Ćwiczenie 3.05 określanie pozycji na podstawie daty zatrudnienia
      • Ramka okna
      • Ćwiczenie 3.06 motywowanie pracowników lunchem
      • Zadanie 3.02 analizowanie sprzedaży z wykorzystaniem ramek okna i funkcji okna
    • Podsumowanie
  • 4. Importowanie i eksportowanie danych
    • Wprowadzenie
    • Polecenie COPY
      • Kopiowanie danych za pomocą narzędzia psql
      • Konfigurowanie poleceń COPY i \copy
      • Użycie poleceń COPY i \copy do masowego wczytywania danych do bazy
      • Ćwiczenie 4.01 eksportowanie danych do pliku w celu dalszego przetwarzania ich w Excelu
    • Zastosowanie języka R do bazy danych
      • Po co korzystać z języka R?
      • Wprowadzenie do języka R
    • Zastosowanie języka Python do bazy danych
      • Po co korzystać z języka Python?
      • Wprowadzenie do języka Python
      • Ułatwianie dostępu do baz PostgreSQL w Pythonie za pomocą narzędzi SQLAlchemy i pandas
      • Czym jest SQLAlchemy?
      • Używanie Pythona w narzędziu Jupyter Notebook
      • Pobieranie danych z bazy i ich zapisywanie w bazie za pomocą pakietu pandas
      • Ćwiczenie 4.02 wczytywanie i wizualizowanie danych w Pythonie
      • Zapisywanie danych w bazie za pomocą Pythona
      • Zwiększanie szybkości zapisu w Pythonie za pomocą polecenia COPY
      • Odczyt i zapis plików CSV w Pythonie
    • Najlepsze praktyki z obszaru importowania i eksportowania danych
      • Pomijanie podawania hasła
      • Zadanie 4.01 używanie zewnętrznego zbioru danych do wykrywania trendów sprzedażowych
    • Podsumowanie
  • 5. Analityka z wykorzystaniem złożonych typów danych
    • Wprowadzenie
    • Wykorzystywanie typów danych z datami i czasem do analiz
      • Wprowadzenie do typu date
      • Przekształcanie typów danych
      • Przedziały
      • Ćwiczenie 5.01 analiza danych z szeregów czasowych
    • Przeprowadzanie analiz geoprzestrzennych w PostgreSQL
      • Długość i szerokość geograficzna
      • Reprezentowanie długości i szerokości geograficznej w PostgreSQL
      • Ćwiczenie 5.02 analizy geoprzestrzenne
    • Stosowanie tablicowych typów danych w PostgreSQL
      • Wprowadzenie do tablic
      • Ćwiczenie 5.03 analizowanie sekwencji z użyciem tablic
    • Stosowanie formatu JSON w PostgreSQL
      • JSONB wstępnie przetworzone dane w formacie JSON
      • Dostęp do danych z pól w formacie JSON lub JSONB
      • Stosowanie języka JSONPath do pól w formacie JSONB
      • Tworzenie i modyfikowanie danych w polu w formacie JSONB
      • Ćwiczenie 5.04 przeszukiwanie obiektów JSONB
    • Analiza tekstu za pomocą PostgreSQL
      • Tokenizacja tekstu
      • Ćwiczenie 5.05 analizowanie tekstu
      • Wyszukiwanie tekstu
      • Optymalizowanie wyszukiwania tekstu w PostgreSQL
      • Zadanie 5.01 wyszukiwanie i analiza transakcji sprzedaży
    • Podsumowanie
  • 6. Wydajny SQL
    • Wprowadzenie
    • Metody skanowania baz danych
      • Plany wykonywania kwerend
      • Skanowanie sekwencyjne i inne metody skanowania
      • Ćwiczenie 6.01 interpretowanie działania planera kwerend
      • Zadanie 6.01 plany wykonywania kwerendy
      • Skanowanie indeksu
      • Indeks w postaci B-drzewa
      • Ćwiczenie 6.02 kwerenda ze skanowaniem indeksu
      • Zadanie 6.02 skanowanie indeksu
      • Indeks z haszowaniem
      • Ćwiczenie 6.03 tworzenie kilku indeksów z haszowaniem, aby zbadać ich wydajność
      • Zadanie 6.03 stosowanie indeksów z haszowaniem
      • Skuteczne korzystanie z indeksów
    • Wydajne złączenia
      • Ćwiczenie 6.04 ocenianie zastosowania złączeń wewnętrznych
      • Zadanie 6.04 stosowanie wydajnych złączeń
    • Funkcje i wyzwalacze
      • Definicje funkcji
      • Ćwiczenie 6.05 tworzenie funkcji, które nie przyjmują argumentów
      • Zadanie 6.05 definiowanie funkcji zwracającej maksymalną wartość sprzedaży
      • Ćwiczenie 6.06 tworzenie funkcji przyjmujących argumenty
      • Polecenia \df i \sf
      • Zadanie 6.06 tworzenie funkcji przyjmujących argumenty
      • Wyzwalacze
      • Ćwiczenie 6.07 tworzenie wyzwalaczy do aktualizowania pól
      • Zadanie 6.07 tworzenie wyzwalacza do śledzenia średniej liczby kupionych sztuk
      • Kończenie pracy kwerend
      • Ćwiczenie 6.08 anulowanie długo działającej kwerendy
      • Zadanie 6.08 kończenie długo działającej kwerendy
    • Podsumowanie
  • 7. Metoda naukowa i rozwiązywanie problemów w praktyce
    • Wprowadzenie
    • Studium przypadku
      • Metoda naukowa
      • Ćwiczenie 7.01 wstępne zbieranie danych za pomocą technik SQL-a
      • Ćwiczenie 7.02 pobieranie informacji sprzedażowych
      • Zadanie 7.01 ilościowa ocena spadku sprzedaży
      • Ćwiczenie 7.03 analiza czasu rozpoczęcia sprzedaży
      • Zadanie 7.02 analiza hipotezy dotyczącej różnicy w cenie sprzedaży
      • Ćwiczenie 7.04 analiza zależności wzrostu sprzedaży od współczynnika otwarć e-maili
      • Ćwiczenie 7.05 analiza skuteczności e-mailowej kampanii marketingowej
      • Wnioski
      • Badania terenowe
    • Podsumowanie
  • Dodatek
    • Rozdział 1. Wprowadzenie do SQL-a dla analityków
      • Zadanie 1.01 klasyfikowanie nowego zbioru danych
        • Rozwiązanie
      • Zadanie 1.02 eksplorowanie danych sprzedażowych z salonu samochodowego
        • Rozwiązanie
      • Zadanie 1.03 kwerenda SELECT z podstawowymi słowami kluczowymi dotycząca tabeli customers
        • Rozwiązanie
      • Zadanie 1.04 tworzenie i modyfikowanie tabel na potrzeby działań marketingowych
        • Rozwiązanie
    • Rozdział 2. Przygotowywanie danych za pomocą SQL-a
      • Zadanie 2.01 używanie SQL-a do tworzenia modelu wspomagającego sprzedaż
        • Rozwiązanie
    • Rozdział 3. Agregacja i funkcje okna
      • Zadanie 3.01 analizowanie danych sprzedażowych z użyciem funkcji agregujących
        • Rozwiązanie
      • Zadanie 3.02 analizowanie sprzedaży z wykorzystaniem ramek okna i funkcji okna
        • Rozwiązanie
    • Rozdział 4. Importowanie i eksportowanie danych
      • Zadanie 4.01 używanie zewnętrznego zbioru danych do wykrywania trendów sprzedażowych
        • Rozwiązanie
    • Rozdział 5. Analizy z wykorzystaniem złożonych typów danych
      • Zadanie 5.01 wyszukiwanie i analiza transakcji sprzedaży
        • Rozwiązanie
    • Rozdział 6. Wydajny SQL
      • Zadanie 6.01 plany wykonywania kwerendy
        • Rozwiązanie
      • Zadanie 6.02 skanowanie indeksu
        • Rozwiązanie
      • Zadanie 6.03 stosowanie indeksów z haszowaniem
        • Rozwiązanie
      • Zadanie 6.04 stosowanie wydajnych złączeń
        • Rozwiązanie
      • Zadanie 6.05 definiowanie funkcji zwracającej maksymalną wartość sprzedaży
        • Rozwiązanie
      • Zadanie 6.06 tworzenie funkcji przyjmujących argumenty
        • Rozwiązanie
      • Zadanie 6.07 tworzenie wyzwalacza do śledzenia średniej liczby kupionych sztuk
        • Rozwiązanie
      • Zadanie 6.08 kończenie długo działającej kwerendy
        • Rozwiązanie
    • Rozdział 7. Metoda naukowa i rozwiązywanie problemów w praktyce
      • Zadanie 7.01 ilościowa ocena spadku sprzedaży
        • Rozwiązanie
      • Zadanie 7.02 analiza hipotezy dotyczącej różnicy w cenie sprzedaży
        • Rozwiązanie
  • Tytuł: SQL. Analiza danych za pomocą zapytań. Warsztaty praktyczne. Wydanie II
  • Autor: Matt Goldwasser, Upom Malik, Benjamin Johnston
  • Tytuł oryginału: The Applied SQL Data Analytics Workshop: Develop your practical skills and prepare to become a professional data analyst, 2nd Edition
  • Tłumaczenie: Tomasz Walczak
  • ISBN: 978-83-283-8475-0, 9788328384750
  • Data wydania: 2021-11-26
  • Format: Ebook
  • Identyfikator pozycji: sqlan2
  • Wydawca: Helion