Szczegóły ebooka

Myślenie statystyczne. Jak analizować dane i wydobywać z nich wiedzę. Wydanie III

Myślenie statystyczne. Jak analizować dane i wydobywać z nich wiedzę. Wydanie III

Allen B. Downey

Ładowanie...
EBOOK

Dla większości z nas statystyka jest poddziedziną matematyki związaną z opracowywaniem teoretycznych podstaw prawdopodobieństwa i wnioskowania statystycznego. Analitycy danych podchodzą do tego inaczej: dla nich statystyka jest niezbędnym zestawem narzędzi i praktyk, które służą do pracy z danymi, odpowiadania na pytania i ułatwiają podejmowanie najlepszych decyzji.

To trzecie wydanie przewodnika cenionego przez analityków danych, inżynierów oprogramowania i pasjonatów danologii. Dzięki niemu szybko nauczysz się korzystać z bibliotek NumPy, SciPy i Pandas. Poznasz różne metody eksploracji i wizualizacji danych, odkrywania zależności i trendów, a także prezentowania wyników. Struktura książki odpowiada rzeczywistemu procesowi pracy ze zbiorem danych: od importowania i oczyszczenia, przez analizę wieloczynnikową, aż po wizualizację uzyskanych wyników. Wszystkie rozdziały są dostępne w formie notatników Jupytera, dzięki czemu możesz jednocześnie czytać tekst, uruchamiać kod i pracować nad ćwiczeniami.

W książce znajdziesz również takie zagadnienia jak:

  • analiza rozkładów danych i wizualizacja wzorców za pomocą bibliotek Pythona
  • korzystanie z modeli regresji
  • analiza szeregów czasowych i analiza przeżycia
  • tworzenie zrozumiałych wizualizacji danych
  • rozwiązywanie typowych problemów związanych z analizą danych

Jeśli chcesz się szybko nauczyć statystyki i stosowania jej w praktyce, to ta książka jest dla Ciebie!

Zachary del Rosario, adiunkt w Olin College of Engineering

Przedmowa

1. Eksploracyjna analiza danych

  • Dowody
  • Badania NSFG
  • Wczytywanie danych
  • Sprawdzanie poprawności
  • Transformacja
  • Statystyki podsumowujące
  • Interpretacja
  • Słowniczek
  • Ćwiczenia

2. Rozkłady

  • Tabele częstości
  • Rozkłady danych z badań NSFG
  • Wartości odstające
  • Pierwsze dzieci
  • Wielkość efektu
  • Prezentacja wyników
  • Słowniczek
  • Ćwiczenia

3. Funkcje masy prawdopodobieństwa

  • Funkcje masy prawdopodobieństwa
  • Generowanie podsumowań dotyczących obiektu Pmf
  • Paradoks wielkości grup
  • Dane z badań NSFG
  • Inne formy wizualizacji
  • Słowniczek
  • Ćwiczenia

4. Dystrybuanta

  • Percentyle i wyniki centylowe
  • Dystrybuanty
  • Porównywanie dystrybuant
  • Statystyki oparte na percentylach
  • Liczby losowe
  • Słowniczek
  • Ćwiczenia

5. Modelowanie rozkładów prawdopodobieństwa

  • Rozkład dwumianowy
  • Rozkład Poissona
  • Rozkład wykładniczy
  • Rozkład normalny
  • Rozkład logarytmicznie normalny
  • Po co tworzyć modele?
  • Słowniczek
  • Ćwiczenia

6. Funkcje gęstości prawdopodobieństwa

  • Porównywanie rozkładów
  • Funkcja gęstości prawdopodobieństwa
  • Funkcja gęstości prawdopodobieństwa dla rozkładu wykładniczego
  • Porównanie funkcji masy prawdopodobieństwa i funkcji gęstości prawdopodobieństwa
  • Estymacja jądrowa gęstości
  • Model reprezentacji rozkładów
  • Słowniczek
  • Ćwiczenia

7. Zależności między zmiennymi

  • Wykresy punktowe
  • Wykresy decylowe
  • Korelacja
  • Siła korelacji
  • Korelacja rangowa
  • Korelacja i przyczynowość
  • Słowniczek
  • Ćwiczenia

8. Szacowanie

  • Ważenie pingwinów
  • Odporność
  • Szacowanie wariancji
  • Rozkłady próbkowania
  • Błąd standardowy
  • Przedziały ufności
  • Źródła błędów
  • Słowniczek
  • Ćwiczenia

9. Testowanie hipotez

  • Rzuty monetą
  • Testowanie różnicy średnich
  • Inne statystyki testowe
  • Badanie korelacji
  • Testy proporcji
  • Słowniczek
  • Ćwiczenia

10. Metoda najmniejszych kwadratów

  • Metoda najmniejszych kwadratów
  • Współczynnik determinacji
  • Minimalizowanie błędu średniokwadratowego
  • Szacowanie
  • Wizualizowanie niepewności
  • Przekształcenia
  • Słowniczek
  • Ćwiczenia

11. Regresja wieloraka

  • StatsModels
  • Regresja wieloraka
  • Zmienne kontrolne
  • Zależności nieliniowe
  • Regresja logistyczna
  • Słowniczek
  • Ćwiczenia

12. Analiza szeregów czasowych

  • Energia elektryczna
  • Dekompozycja danych
  • Predykcje
  • Model multiplikatywny
  • Autoregresja
  • Średnia ruchoma
  • Retrodykcje z wykorzystaniem autoregresji
  • ARIMA
  • Generowanie predykcji z wykorzystaniem funkcji ARIMA
  • Słowniczek
  • Ćwiczenia

13. Analiza przeżycia

  • Funkcje przeżycia
  • Funkcja hazardu
  • Dane o stanie cywilnym
  • Bootstrapping z wagami
  • Szacowanie funkcji hazardu
  • Szacowanie funkcji przeżycia
  • Pakiet lifelines
  • Przedziały ufności
  • Przewidywany pozostały czas do zdarzenia
  • Słowniczek
  • Ćwiczenia

14. Metody analityczne

  • Wykresy prawdopodobieństwa normalnego
  • Rozkłady normalne
  • Rozkład średnich z prób
  • Rozkład różnic
  • Centralne twierdzenie graniczne
  • Ograniczenia centralnego twierdzenia granicznego
  • Zastosowanie centralnego twierdzenia granicznego
  • Test korelacji
  • Test chi-kwadrat
  • Informatyka i analiza algorytmów
  • Słowniczek
  • Ćwiczenia
  • Tytuł:Myślenie statystyczne. Jak analizować dane i wydobywać z nich wiedzę. Wydanie III
  • Autor:Allen B. Downey
  • Tytuł oryginału:Think Stats: Exploratory Data Analysis, 3rd Edition
  • Tłumaczenie:Tomasz Walczak
  • ISBN:978-83-289-3114-5, 9788328931145
  • Data wydania:2025-11-10
  • Format:Ebook
  • Identyfikator pozycji: stamy3
  • Wydawca: Helion
Ładowanie...
Ładowanie...