Szczegóły ebooka

SQL dla analityków danych. Opanuj możliwości SQL-a, aby wydobywać informacje z danych. Wydanie III

SQL dla analityków danych. Opanuj możliwości SQL-a, aby wydobywać informacje z danych. Wydanie III

Jun Shan, Matt Goldwasser, Upom Malik, Benjamin Johnston

Ebook

Język SQL zwykle służy do pracy z bazami danych, jednak można go używać również do wydajnego przetwarzania ich wielkich zbiorów. W tym celu trzeba dobrze poznać to narzędzie. Wysiłek włożony w zrozumienie SQL-a na pewno się opłaci - dzięki analizie danych można wydobywać z nich bezcenną wiedzę, która bezpośrednio przekłada się na zyski firmy.

Ta książka stanowi świetne wprowadzenie do analizy danych. Dzięki niej nauczysz się korzystać z surowych danych, nawet jeśli nie masz odpowiedniego doświadczenia. Zaczniesz od formułowania hipotez i generowania statystyk opisowych, a następnie przystąpisz do pisania zapytań w języku SQL w celu agregowania, przeliczania i łączenia danych z różnych zbiorów. Zapoznasz się też z zaawansowanymi technikami, takimi jak analiza geoprzestrzenna i analiza tekstu. W książce omówiono również profilowanie i automatyzację, które umożliwiają szybsze i wydajniejsze pobieranie informacji. To wszystko pozwoli Ci na skuteczne korzystanie z SQL-a w codziennych scenariuszach biznesowych.

Najciekawsze zagadnienia:

  • gruntowne wprowadzenie do analityki danych
  • przygotowywanie danych do analizy
  • optymalizacja kwerend i złożone typy danych
  • funkcje agregujące, funkcja okna i inne metody analizy danych w SQL
  • jak odkrywać prawdę za pomocą SQL-a

SQL: spójrz na dane okiem wyszkolonego analityka!

Wprowadzenie

ROZDZIAŁ 1. Poznawanie i opisywanie danych

  • Wprowadzenie
  • Analityka danych i statystyka
    • Zadanie 1.01 - klasyfikowanie nowego zbioru danych
  • Rodzaje statystyki
    • Metody z obszaru statystyki opisowej
    • Analiza jednoczynnikowa
    • Ćwiczenie 1.01 - tworzenie histogramu
    • Ćwiczenie 1.02 - obliczanie kwartyli dla sprzedaży dodatków
    • Ćwiczenie 1.03 - obliczanie miar tendencji centralnej dla sprzedaży dodatków
    • Ćwiczenie 1.04 - obliczanie dyspersji dla sprzedaży dodatków
    • Analiza dwuczynnikowa
    • Ćwiczenie 1.05 - obliczanie współczynnika korelacji Pearsona dla dwóch zmiennych
    • Interpretowanie i analizowanie współczynnika korelacji
    • Zadanie 1.02 - eksplorowanie danych sprzedażowych z salonu samochodowego
  • Praca z niepełnymi danymi
  • Testy istotności statystycznej
    • Często używane testy istotności statystycznej
  • SQL i analityka
  • Podsumowanie

ROZDZIAŁ 2. Wprowadzenie do SQL-a dla analityków

  • Wprowadzenie
  • Świat danych
    • Rodzaje danych
  • Relacyjne bazy danych i SQL
    • Wady i zalety baz SQL-owych
  • System zarządzania relacyjnymi bazami danych PostgreSQL
    • Ćwiczenie 2.01 - uruchamianie pierwszej kwerendy SELECT
    • Instrukcja SELECT
    • Klauzula WHERE
    • Klauzule AND i OR
    • Klauzule IN i NOT IN
    • Klauzula ORDER BY
    • Klauzula LIMIT
    • Klauzule IS NULL i IS NOT NULL
    • Ćwiczenie 2.02 - kwerenda SELECT z podstawowymi słowami kluczowymi dotycząca tabeli salespeople
    • Zadanie 2.01 - kwerenda SELECT z podstawowymi słowami kluczowymi dotycząca tabeli customers
  • Tworzenie tabel
    • Tworzenie pustych tabel
  • Podstawowe typy danych w SQL-u
    • Typy liczbowe
    • Typy znakowe
    • Typ logiczny
    • Daty i godziny
  • Struktury danych - format JSON i tablice
  • Ograniczenia kolumn
    • Prosta instrukcja CREATE
    • Ćwiczenie 2.03 - tworzenie tabeli w SQL-u
    • Tworzenie tabel za pomocą kwerendy SELECT
  • Aktualizowanie tabel
    • Dodawanie i usuwanie kolumn
    • Dodawanie nowych danych
    • Aktualizowanie istniejących wierszy
    • Ćwiczenie 2.04 - aktualizowanie tabeli w celu podniesienia ceny pojazdu
    • Usuwanie danych i tabel
    • Usuwanie wartości z wiersza
    • Usuwanie wierszy z tabeli
    • Usuwanie tabel
    • Ćwiczenie 2.05 - usuwanie niepotrzebnej tabeli pomocniczej
    • Zadanie 2.02 - tworzenie i modyfikowanie tabel na potrzeby działań marketingowych
  • SQL i analityka
  • Podsumowanie

ROZDZIAŁ 3. Przygotowywanie danych za pomocą SQL-a

  • Wprowadzenie
  • Łączenie danych
    • Łączenie tabel za pomocą słowa kluczowego JOIN
    • Rodzaje złączeń
    • Ćwiczenie 3.01 - używanie złączeń do analizy sprzedaży w salonach
    • Podkwerendy
    • Sumy
    • Ćwiczenie 3.02 - generowanie listy gości na przyjęcie dla klientów VIP za pomocą klauzuli UNION
    • Wyrażenia WITH
  • Oczyszczanie danych
    • Funkcja CASE WHEN
    • Ćwiczenie 3.03 - używanie funkcji CASE WHEN do pobierania list klientów z danego regionu
    • Funkcja COALESCE
    • Funkcja NULLIF
    • Funkcje LEAST i GREATEST
    • Funkcja CASTING
  • Przekształcanie danych
    • Funkcje DISTINCT i DISTINCT ON
    • Zadanie 3.01 - używanie SQL-a do tworzenia modelu wspomagającego sprzedaż
  • Podsumowanie

ROZDZIAŁ 4. Analiza danych z wykorzystaniem funkcji agregujących

  • Wprowadzenie
  • Funkcje agregujące
    • Ćwiczenie 4.01 - używanie funkcji agregujących do analizowania danych
  • Funkcje agregujące z klauzulą GROUP BY
    • Klauzula GROUP BY
    • Klauzula GROUP BY dla kilku kolumn
    • Ćwiczenie 4.02 - obliczanie cen dla typów produktów za pomocą klauzuli GROUP BY
    • Klauzula GROUPING SETS
    • Funkcje agregujące dla zbiorów uporządkowanych
  • Funkcje agregujące z klauzulą HAVING
    • Ćwiczenie 4.03 - obliczanie wyników i wyświetlanie danych z użyciem klauzuli HAVING
  • Stosowanie funkcji agregujących do oczyszczania danych i sprawdzania ich jakości
    • Znajdowanie brakujących wartości za pomocą klauzuli GROUP BY
    • Sprawdzanie unikatowości danych za pomocą funkcji agregujących
    • Zadanie 4.01 - analizowanie danych sprzedażowych z użyciem funkcji agregujących
  • Podsumowanie

ROZDZIAŁ 5. Analizowanie danych za pomocą funkcji okna

  • Wprowadzenie
  • Funkcje okna
    • Podstawy funkcji okna
    • Ćwiczenie 5.01 - analizowanie zmian współczynnika podawania danych przez klientów w czasie
    • Słowo kluczowe WINDOW
  • Obliczanie statystyk z użyciem funkcji okna
    • Ćwiczenie 5.02 - określanie pozycji na podstawie daty rejestracji
  • Ramka okna
    • Ćwiczenie 5.03 - motywowanie pracowników lunchem
    • Zadanie 5.01 - analizowanie sprzedaży z wykorzystaniem ramek okna i funkcji okna
  • Podsumowanie

ROZDZIAŁ 6. Importowanie i eksportowanie danych

  • Wprowadzenie
  • Polecenie COPY
    • Uruchamianie polecenia psql
    • Instrukcja COPY
    • Instrukcja \COPY w narzędziu psql
    • Tworzenie tymczasowych widoków
    • Konfigurowanie poleceń COPY i \COPY
    • Użycie poleceń COPY i \COPY do masowego wczytywania danych do bazy
    • Ćwiczenie 6.01 - eksportowanie danych do pliku w celu dalszego przetwarzania ich w Excelu
  • Zastosowanie języka Python do bazy danych
    • Wprowadzenie do języka Python
    • Ułatwianie dostępu do baz PostgreSQL w Pythonie za pomocą narzędzi SQLAlchemy i pandas
    • Czym jest SQLAlchemy?
    • Stosowanie Pythona z wykorzystaniem pakietów SQLAlchemy i pandas
    • Pobieranie danych z bazy i ich zapisywanie w bazie za pomocą pakietu pandas
    • Zapisywanie danych w bazie za pomocą Pythona
    • Ćwiczenie 6.02 - wczytywanie, wizualizowanie i zapisywanie danych za pomocą Pythona
    • Zwiększanie szybkości zapisu w Pythonie za pomocą polecenia COPY
    • Odczyt i zapis plików CSV w Pythonie
    • Najlepsze praktyki z obszaru importowania i eksportowania danych
  • Pomijanie podawania hasła
    • Zadanie 6.01 - używanie zewnętrznego zbioru danych do wykrywania trendów sprzedażowych
  • Podsumowanie

ROZDZIAŁ 7. Analizy z wykorzystaniem złożonych typów danych

  • Wprowadzenie
  • Wykorzystywanie typów danych z datami i czasem do analiz
    • Wprowadzenie do typu date
    • Przekształcanie typów danych
    • Przedziały
    • Ćwiczenie 7.01 - analiza danych z szeregów czasowych
  • Przeprowadzanie analiz geoprzestrzennych w PostgreSQL
    • Długość i szerokość geograficzna
    • Reprezentowanie długości i szerokości geograficznej w PostgreSQL
    • Ćwiczenie 7.02 - analizy geoprzestrzenne
  • Stosowanie tablicowych typów danych w PostgreSQL
    • Wprowadzenie do tablic
    • Ćwiczenie 7.03 - analizowanie sekwencji z użyciem tablic
  • Stosowanie formatu JSON w PostgreSQL
    • JSONB - wstępnie przetworzone dane w formacie JSON
    • Dostęp do danych z pól w formacie JSON lub JSONB
    • Stosowanie języka JSONPath do pól w formacie JSONB
    • Tworzenie i modyfikowanie danych w polu w formacie JSONB
    • Ćwiczenie 7.04 - przeszukiwanie obiektów JSONB
  • Analiza tekstu za pomocą PostgreSQL
    • Tokenizacja tekstu
    • Ćwiczenie 7.05 - analizowanie tekstu
    • Wyszukiwanie tekstu
    • Optymalizowanie wyszukiwania tekstu w PostgreSQL
    • Zadanie 7.01 - wyszukiwanie i analiza transakcji sprzedaży
  • Podsumowanie

ROZDZIAŁ 8. Wydajny SQL

  • Wprowadzenie
  • Znaczenie wysoce wydajnego kodu w SQL-u
  • Metody skanowania baz danych
    • Plany wykonywania kwerend
    • Ćwiczenie 8.01 - interpretowanie działania planera kwerend
    • Zadanie 8.01 - plany wykonywania kwerendy
    • Skanowanie indeksu
    • Indeks w postaci B-drzewa
    • Ćwiczenie 8.02 - tworzenie indeksu na potrzeby skanowania
    • Zadanie 8.02 - stosowanie skanowania indeksu
    • Indeks z haszowaniem
    • Ćwiczenie 8.03 - tworzenie kilku indeksów z haszowaniem, aby zbadać ich wydajność
    • Zadanie 8.03 - stosowanie indeksów z haszowaniem
    • Skuteczne korzystanie z indeksów
  • Kończenie pracy kwerend
    • Ćwiczenie 8.04 - anulowanie długo działającej kwerendy
  • Funkcje i wyzwalacze
    • Definicje funkcji
    • Ćwiczenie 8.05 - tworzenie funkcji, które nie przyjmują argumentów
    • Zadanie 8.04 - definiowanie funkcji zwracającej maksymalną wartość sprzedaży
    • Ćwiczenie 8.06 - tworzenie funkcji przyjmujących argumenty
    • Zadanie 8.05 - tworzenie funkcji przyjmujących argumenty
    • Wyzwalacze
    • Ćwiczenie 8.07 - tworzenie wyzwalaczy do aktualizowania pól
    • Zadanie 8.06 - tworzenie wyzwalacza do śledzenia średniej liczby kupionych sztuk
  • Podsumowanie

ROZDZIAŁ 9. Odkrywanie prawdy za pomocą SQL-a - studium przypadku

  • Wprowadzenie
  • Studium przypadku
    • Metoda naukowa
    • Ćwiczenie 9.01 - wstępne zbieranie danych za pomocą technik SQL-a
    • Ćwiczenie 9.02 - pobieranie informacji sprzedażowych
    • Zadanie 9.01 - ilościowa ocena spadku sprzedaży
    • Ćwiczenie 9.03 - analiza czasu rozpoczęcia sprzedaży
    • Zadanie 9.02 - analiza hipotezy dotyczącej różnicy w cenie sprzedaży
    • Ćwiczenie 9.04 - analiza zależności wzrostu sprzedaży od współczynnika otwarć e-maili
    • Ćwiczenie 9.05 - analiza skuteczności e-mailowej kampanii marketingowej
    • Wnioski
    • Badania terenowe
  • Podsumowanie

Dodatek

Skorowidz

  • Tytuł: SQL dla analityków danych. Opanuj możliwości SQL-a, aby wydobywać informacje z danych. Wydanie III
  • Autor: Jun Shan, Matt Goldwasser, Upom Malik, Benjamin Johnston
  • Tytuł oryginału: SQL for Data Analytics: Harness the power of SQL to extract insights from data, 3rd Edition
  • Tłumaczenie: Tomasz Walczak
  • ISBN: 978-83-289-0174-2, 9788328901742
  • Data wydania: 2023-09-12
  • Format: Ebook
  • Identyfikator pozycji: sqlan3
  • Wydawca: Helion