Verleger: 8
Remigiusz Żulicki
Czy sztuczna inteligencja pozbawia nas pracy? Algorytmy przejmują władzę nad światem? Czy big data sprawia, że jesteśmy bezustannie inwigilowani, a ogromna ilość danych zastępuje ekspertów i naukowców? Cokolwiek sądzimy na te tematy, jedno jest pewne - istnieje heterogeniczne środowisko ludzi zajmujących się tzw. "sztuczną inteligencją" czy tzw. "big data" od strony technicznej oraz metodologicznej. Pole ich działania nazywane jest data science, a oni - data scientists. Publikacja to pierwsza monografia socjologiczna dotycząca data science i pierwsza praca w naukach społecznych, w której data science zostało zbadane jako społeczny świat w rozumieniu Adele E. Clarke. Podejście to pozwala spojrzeć na data science, nazwane dekadę wstecz w "Harvard Business Review" "najseksowniejszym zawodem XXI wieku", zarówno z perspektywy jego uczestników, jak i z lotu ptaka, w relacji do akademii, biznesu, prawa, mediów czy polityki.
Data science od podstaw. Analiza danych w Pythonie
Joel Grus
Współczesne ogromne zbiory danych zawierają odpowiedzi na prawie każde pytanie. Równocześnie nauka o danych jest dziedziną, która cokolwiek onieśmiela. Znajduje się gdzieś pomiędzy subtelnymi umiejętnościami hakerskimi, twardą wiedzą z matematyki i statystyki a merytoryczną znajomością zagadnień z danej branży. Co więcej, dziedzina ta niezwykle dynamicznie się rozwija. Trud włożony w naukę o danych niewątpliwie się jednak opłaca: biegły analityk danych może liczyć na dobrze płatną, inspirującą i bardzo atrakcyjną pracę. Dzięki tej książce opanujesz najważniejsze zagadnienia związane z matematyką i statystyką, będziesz także rozwijać umiejętności hakerskie. W ten sposób zyskasz podstawy pozwalające na rozpoczęcie przygody z analizą danych. Gruntownie zapoznasz się z potrzebnymi narzędziami i algorytmami. Pozwoli Ci to lepiej zrozumieć ich działanie. Poszczególne przykłady, którymi zilustrowano omawiane zagadnienia, są przejrzyste, dobrze opisane i zrozumiałe. Podczas lektury książki poznasz biblioteki, które umożliwią zaimplementowanie omówionych technik podczas analizy dużych zbiorów danych. Szybko się przekonasz, że aby zostać analitykiem danych, wystarczy odrobina ciekawości, sporo chęci, mnóstwo ciężkiej pracy i... ta książka. Najważniejsze zagadnienia: Praktyczne wprowadzenie do Pythona Podstawy algebry liniowej, statystyki i rachunku prawdopodobieństwa w analizie danych Podstawy uczenia maszynowego Implementacje algorytmów modeli, w tym naiwny klasyfikator bayesowski, regresja liniowa, regresja logistyczna, drzewa decyzyjne, sieci neuronowe i grupowanie, MapReduce Systemy rekomendacji i mechanizmy przetwarzania języka naturalnego Korzystanie z mediów społecznościowych i baz danych. Python. Wyciśniesz z danych każdą kroplę wiedzy!
Data science od podstaw. Analiza danych w Pythonie. Wydanie II
Joel Grus
Analityka danych jest uważana za wyjątkowo obiecującą dziedzinę wiedzy. Rozwija się błyskawicznie i znajduje coraz to nowsze zastosowania. Profesjonaliści biegli w eksploracji danych i wydobywaniu z nich pożytecznych informacji mogą liczyć na interesującą pracę i bardzo atrakcyjne warunki zatrudnienia. Jednak aby zostać analitykiem danych, trzeba znać matematykę i statystykę, a także nauczyć się programowania. Umiejętności w zakresie uczenia maszynowego i uczenia głębokiego również są ważne. W przypadku tak specyficznej dziedziny, jaką jest nauka o danych, szczególnie istotne jest zdobycie gruntownych podstaw i dogłębne ich zrozumienie. W tym przewodniku opisano zagadnienia związane z podstawami nauki o danych. Wyjaśniono niezbędne elementy matematyki i statystyki. Przedstawiono także techniki budowy potrzebnych narzędzi i sposoby działania najistotniejszych algorytmów. Książka została skonstruowana tak, aby poszczególne implementacje były jak najbardziej przejrzyste i zrozumiałe. Zamieszczone tu przykłady napisano w Pythonie: jest to język dość łatwy do nauki, a pracę na danych ułatwia szereg przydatnych bibliotek Pythona. W drugim wydaniu znalazły się nowe tematy, takie jak uczenie głębokie, statystyka i przetwarzanie języka naturalnego, a także działania na ogromnych zbiorach danych. Zagadnienia te często pojawiają się w pracy współczesnego analityka danych. W książce między innymi: elementy algebry liniowej, statystyki i rachunku prawdopodobieństwa zbieranie, oczyszczanie i eksploracja danych algorytmy modeli analizy danych podstawy uczenia maszynowego systemy rekomendacji i przetwarzanie języka naturalnego analiza sieci społecznościowych i algorytm MapReduce Nauka o danych: bazuj na solidnych podstawach!
Data Science. Programowanie, analiza i wizualizacja danych z wykorzystaniem języka R
Michael Freeman, Joel Ross
Aby surowe dane przekuć w gotową do wykorzystania wiedzę, potrzebna jest umiejętność ich analizy, przekształcania i niekiedy również wizualizacji. Nagrodą za włożony w to wysiłek jest lepsze rozumienie różnych złożonych zagadnień z wielu dziedzin wiedzy. Co więcej, znajomość procesów programowego przetwarzania danych pozwala na szybkie wykrywanie i opisywanie wzorców danych, praktycznie niemożliwych do dostrzeżenia innymi technikami. Dla wielu badaczy jednak barierą na drodze do skorzystania z tych atrakcyjnych możliwości jest konieczność pisania kodu. Oto podręcznik programowania w języku R dla analityków danych, szczególnie przydatny dla osób, które nie mają doświadczenia w tej dziedzinie. Dokładnie opisano tu potrzebne narzędzia i technologie. Zamieszczono wskazówki dotyczące instalacji i konfiguracji oprogramowania do pisania kodu, wykonywania go i zarządzania nim, a także śledzenia wersji projektów i zmian w nich oraz korzystania z innych podstawowych mechanizmów. Poszczególne kroki tworzenia kodu w języku R wyjaśniono dokładnie i przystępnie. Dzięki tej książce można płynnie przejść do konkretnych zadań i budować potrzebne aplikacje. Zrozumienie prezentowanych w niej treści ułatwiają liczne przykłady i ćwiczenia, co pozwala szybko przystąpić do skutecznego analizowania własnych zbiorów danych. W tej książce między innymi: przygotowanie środowiska pracy i rozpoczęcie programowania w R podstawy zarządzania projektami, kontrola wersji i generowanie dokumentacji ramki danych, pakiety dplyr i tidyr kod do wizualizacji danych i pakiet ggplot2 tworzenie aplikacji i techniki współpracy w zespołach specjalistów Po prostu R i dane. Wyciśniesz każdą kroplę wiedzy!
Stephen Klosterman
If data is the new oil, then machine learning is the drill. As companies gain access to ever-increasing quantities of raw data, the ability to deliver state-of-the-art predictive models that support business decision-making becomes more and more valuable.In this book, you’ll work on an end-to-end project based around a realistic data set and split up into bite-sized practical exercises. This creates a case-study approach that simulates the working conditions you’ll experience in real-world data science projects.You’ll learn how to use key Python packages, including pandas, Matplotlib, and scikit-learn, and master the process of data exploration and data processing, before moving on to fitting, evaluating, and tuning algorithms such as regularized logistic regression and random forest. Now in its second edition, this book will take you through the end-to-end process of exploring data and delivering machine learning models. Updated for 2021, this edition includes brand new content on XGBoost, SHAP values, algorithmic fairness, and the ethical concerns of deploying a model in the real world.By the end of this data science book, you’ll have the skills, understanding, and confidence to build your own machine learning models and gain insights from real data.
Stephen Klosterman
Data Science Projects with Python is designed to give you practical guidance on industry-standard data analysis and machine learning tools, by applying them to realistic data problems. You will learn how to use pandas and Matplotlib to critically examine datasets with summary statistics and graphs, and extract the insights you seek to derive. You will build your knowledge as you prepare data using the scikit-learn package and feed it to machine learning algorithms such as regularized logistic regression and random forest. You’ll discover how to tune algorithms to provide the most accurate predictions on new and unseen data. As you progress, you’ll gain insights into the working and output of these algorithms, building your understanding of both the predictive capabilities of the models and why they make these predictions.By then end of this book, you will have the necessary skills to confidently use machine learning algorithms to perform detailed data analysis and extract meaningful insights from unstructured data.
Mercury Learning and Information, Christopher Greco
This book introduces popular data science tools and guides readers on how to use them effectively. It covers data analysis using Microsoft Excel, KNIME, R, and OpenOffice, applying statistical concepts such as confidence intervals, normal distribution, T-Tests, linear regression, histograms, and geographic analysis with real data from Federal Government sources.The course begins with the basics, including importing data and conducting various statistical tests. It progresses to specific methods for each tool, ensuring a comprehensive understanding of data analysis. Capstone exercises provide hands-on experience, reinforcing the concepts learned throughout the book.Understanding these tools and concepts is crucial for effective data analysis. This book takes readers from the basics to advanced statistical methods, combining theoretical insights with practical applications. Companion files with source code and data sets enhance the learning experience, making this book an essential resource for mastering data analysis with popular software applications.
Data Science w Pythonie. Kurs video. Algorytmy uczenia maszynowego
Oleg Żero
Obierz kurs na... przyszłość Powszechna cyfryzacja nie dotyka jedynie wybranych gałęzi przemysłu, ale dosłownie przeniknęła nasze życie niemal w każdym aspekcie. Skutkiem tego procesu jest pojawienie się ogromnej ilości danych, które, odpowiednio wykorzystane, stanowią nowy rodzaj materii w nieprzerwanym cyklu postępu. Uczenie maszynowe stało się jednocześnie obszarem szczególnego zainteresowania ze strony zarówno firm, jak i uczelni. Dzięki specjalnym algorytmom i technikom możliwe stało się wykorzystanie zasobów, jakimi są dane, do opracowywania rozwiązań poprawiających efektywność w wielu dziedzinach: od robotyki, przez medycynę, aż po rozrywkę. Przykładami rozwiązań, które już dziś wykorzystują uczenie maszynowe, są chociażby silniki rekomendacyjne działające na platformach takich jak YouTube, Netflix, Spotify czy Amazon. Silniki te skutecznie dobierają treści, tak że wokół produktów tworzą się całe społeczności wiernie oddanych klientów. To wszystko dzieje się obecnie. W niedalekiej przyszłości wiele - także dość skomplikowanych - czynności zostanie zautomatyzowanych. Zawody, również te potencjalnie wymagające wysokich kwalifikacji, nawet jeśli nie będą w całości wykonywane przez maszyny, będą przez nie wspomagane. Jest niemal pewne, że specjaliści między innymi w dziedzinie uczenia maszynowego, którzy już dziś są intensywnie poszukiwani, staną się jeszcze bardziej pożądani w przyszłości. Dołącz do ich grona! Data science w Pythonie. Kurs video. Algorytmy uczenia maszynowego kończy się na poziomie średnio zaawansowanym, a nawet nieco wyżej, jeśli chodzi o wiedzę i umiejętności, jakich wymaga się na przykład od analityka biznesowego, naukowca, inżyniera danych czy webdevelopera. Natomiast jeśli mowa o wiedzy stricte z zakresu data science, autor kursu określa poziom jego absolwenta na podstawowy. Uwaga, by móc w pełni skorzystać ze szkolenia, trzeba znać podstawy języka Python (w tym orientować się w bibliotekach: numpy, pandas, matplotlib) i matematykę na poziomie pierwszego - drugiego roku studiów na kierunkach ścisłych. Takie pojęcia jak gradient, pochodna, szereg, prawdopodobieństwo czy notacja nie powinny być Ci obce! Czym właściwie zajmuje się specjalista w dziedzinie data science? Odpowiedź na to pytanie jest krótka i - jak to w matematyce - policzalna. Aż 70 procent czasu pracy spędza się w tym zawodzie na zbieraniu i analizie danych, by potem, przez kolejne 20 procent, tworzyć i testować modele, które "ubiera się" w programy, a następnie wykorzystuje do otrzymywania przewidywań z modeli. Przykładami takich modeli, jakie stosuje się już dziś w kontekście biznesowym, są między innymi silniki rekomendacyjne (Netflix, YouTube, eBay, Amazon, Spotify itd.), modele do klasyfikacji obrazów medycznych w celu rozpoznawania ewentualnych infekcji, systemy do automatycznych tłumaczeń (patrz Google) czy popularne boty - i wiele innych. Od teorii, przez praktykę, aż po gotowe rozwiązania Kurs składa się z trzech bloków szkoleniowych. Zaczniemy od teorii data science. Tu przygotuj się na serię wykładów, w których autor wprowadza pojęcia na poziomie równań, wyjaśniając je od podstaw. Bazując na wiedzy zdobytej w części teoretycznej, przejdziemy do praktyki - będziesz pisać algorytm "od zera", a przy tym pogłębisz rozumienie koncepcji matematycznych i przy okazji napiszesz kod. Wreszcie przyjdzie czas na część trzecią, podczas której będziemy sprytni i sięgniemy po tzw. gotowce - przede wszystkim scikit-learn i Keras. Przy użyciu tych bibliotek rozwiążemy zadany problem, skupiając się zarówno na samym zagadnieniu, jak i ogólnym podejściu do problemu. W kursie połączysz teorię z praktyką. Dzięki temu osiągniesz dwa cele: wyrobisz w sobie intuicję matematyczną, która w razie potrzeby pozwoli Ci przenieść to rozumienie również poza Pythona, oraz zyskasz pewne doświadczenie w wykorzystywaniu powszechnie dostępnych narzędzi i w ten sposób zwiększysz skuteczność swojej pracy. Kurs jest podzielony na 16 rozdziałów. W pierwszym rozdziale stworzysz proste środowisko pracy. Dalej, w rozdziałach 2 - 8, poznasz podstawowe algorytmy, takie jak sieci neuronowe, oraz zrozumiesz, na czym polega ogólne podejście machinelearningowe. W rozdziałach 9 - 13 poznasz kolejne, nieco alternatywne, lecz równie często wykorzystywane algorytmy, których idea opiera się na innych zasadach. Na koniec, w ramach rozdziałów: 14, 15 i 16, stworzysz własny silnik rekomendacyjny, który następnie usprawnisz z wykorzystaniem popularnych metod pracy z tekstem (NLP), by uzyskać półgotowy produkt na koniec kursu.