EbookiAnaliza danych

Analiza danych

Analiza danych jest ekscytującą dyscypliną, która umożliwia zrozumienie pewnych zjawisk, uzyskanie wglądu i wiedzy na podstawie surowych danych. Pojęcie to oznacza dokładnie przetwarzanie danych za pomocą technik matematycznych i statystycznych w celu uzyskania cennych wniosków, podjęcia ważnych decyzji i opracowania przydatnych produktów. Termin ten wywodzi się od angielskiego data science, często traktowanego jako synonim takich terminów, jak analityka biznesowa, badania operacyjne, business intelligence, wywiad konkurencyjny, analiza i modelowanie danych, a także pozyskiwanie wiedzy. Dzięki takim technologiom, jak języki Python czy R, platformy Hadoop i Spark masz szansę wyciągnąć maksimum wniosków, dostrzec szanse na rozwój swojej organizacji albo przewidzieć i zapobiec zagrożeniom.

siatka lista

529

EBOOK

Nowe usługi 2.0. Przewodnik po analizie zbiorów danych

Toby Segaran

Wykorzystaj dane z sieci do własnych potrzeb! Internet to nic innego jak gigantyczny zbiór danych. Każdy, kto znajdzie sposób na ich umiejętne wykorzystanie, ma szansę zbudować aplikację, która odniesie światowy sukces. Serwisy randkowe, portale społecznościowe, porównywarki cen — to tylko drobna część serwisów, które możesz wykorzystać przy tworzeniu nowej usługi. Jak analizować dane i wyciągnąć wnioski? Na wiele podobnych pytań odpowiada ta jedyna w swoim rodzaju książka. W trakcie lektury poznasz najlepsze sposoby filtrowania danych, tworzenia rekomendacji, wykrywania grup oraz wyszukiwania i klasyfikowania. Na kolejnych stronach znajdziesz bogaty zbiór informacji poświęconych algorytmom analizującym dane. Ponadto będziesz mieć możliwość zapoznania się z różnymi sposobami optymalizacji, modelowania przy użyciu drzew decyzyjnych oraz tworzenia modeli cenowych. Książka ta w rękach wprawnego programisty może stanowić niesamowite narzędzie. Otwiera wrota do świata pełnego danych i zależności pomiędzy nimi! Dzięki tej książce: poznasz najlepsze i najskuteczniejsze algorytmy do analizy danych zbudujesz model cen nauczysz się korzystać z drzew decyzyjnych zastosujesz dane z sieci do budowy nowych usług Wyciągnij właściwe wnioski z posiadanych danych! „Brawo! Nic lepszego nie przychodzi mi na myśl w przypadku programisty, który zaczyna dopiero przygodę z opisanymi w książce algorytmami i metodami. Sam (jako stary »wyjadacz« od sztucznej inteligencji) sięgnąłbym po nią w pierwszej kolejności, żeby odświeżyć swoją znajomość szczegółów.” Dan Russell, główny specjalista ds. technologii, firma Google „W książce Toby’ego w znakomity sposób dokonano rozbicia złożonego zagadnienia dotyczącego algorytmów uczenia maszynowego na praktyczne i łatwe do zrozumienia przykłady, które mogą być bezpośrednio używane do analizowania interakcji społecznościowej w obecnym internecie. Jeśli ta książka trafiła w moje ręce dwa lata wcześniej, zaoszczędziłbym mój cenny czas, gdy podążałem bezowocnymi ścieżkami.” Tim Wolters, szef ds. technologii, firma Collective Intellect

530

EBOOK

Nowoczesna analiza danych w Excelu. Power Query, Power Pivot i inne narzędzia

George Mount

Organizacje stosują zaawansowane narzędzia i techniki, aby umożliwić podejmowanie decyzji na podstawie danych. Jeszcze do niedawna MS Excel nie był w stanie sprostać wymaganiom analityków, obecnie jest wschodzącą gwiazdą w świecie nowoczesnej analizy danych. Kluczem do sukcesu stało się opanowanie takich narzędzi jak Power Pivot czy Power Query. Dzięki tej praktycznej książce przekonasz się, że w Excelu możesz przeprowadzić dogłębną analizę danych i wyciągnąć z nich cenną wiedzę. Wystarczy, że skorzystasz z najnowszych funkcji i narzędzi Excela. W poradniku pokazano, jak za pomocą Power Query budować przepływy pracy porządkujące dane i jak projektować w skoroszycie relacyjne modele danych przy użyciu Power Pivot. Ponadto odkryjesz nowe możliwości przeprowadzania analiz, w tym dynamiczne funkcje tablicowe i pozyskiwanie wartościowych informacji z wykorzystaniem sztucznej inteligencji. Dowiesz się również, jak za sprawą integracji z Pythonem zautomatyzować analizę danych i budować raporty. W książce: tworzenie procesów porządkujących dane w Excelu za pomocą Power Query relacyjne modele danych i wskaźniki analityczne w Power Pivot korzystanie z dynamicznych funkcji tablicowych zastosowanie AI do identyfikacji wzorców i trendów w danych integracja funkcjonalności Pythona z Excelem Książka jest łatwa w odbiorze, praktyczna i pomocna dla analityków, a także zwykłych użytkowników! Meghan Finley, autorka i redaktorka tekstów technicznych

531

EBOOK

Nowoczesne analizy biznesowe. Zwiększanie wartości danych przy użyciu Pythona i R

Deanne Larson

"Lektura obowiązkowa dla wszystkich analityków biznesowych i danetyków." Balaji Dhamodharan, światowy lider w dziedzinie danetyki, NXP Semiconductors "Ta książka to niezastąpione źródło wiedzy dla każdego, kto pragnie opanować szybko zmieniający się świat analityki." Lipi Deepaakshi Patnaik, starszy inżynier oprogramowania, Zeta Wydobycie wartości biznesowej z ogromu danych to trudny i wymagający proces. Przekształcenie surowych danych w użyteczne informacje wymaga od analityka biegłego posługiwania się wieloma technologiami, takimi jak bazy danych, narzędzia programistyczne czy komercyjne narzędzia analityczne. Ten praktyczny przewodnik pokazuje programistom rozumiejącym koncepcje analizy, jak rozwijać umiejętności niezbędne do uzyskania wartości biznesowej. Autorka, zajmująca się danetyką zarówno od strony praktycznej, jak i naukowej, pomaga połączyć światy biznesu i techniki, aby spełnić te wymagania. Rozwiń umiejętności posługiwania się językami R i Python na z życia wziętych przykładach. Dowiedz się również, jak wykorzystywać właściwe metodologie w celu skutecznego realizowania celów. Metodyka uczenia się połączona z narzędziami open source jest kluczem do dostarczania rzeczywistych wartości biznesowych. Książka ta pokazuje, jak: - Stosować metodologie analityki biznesowej, aby osiągnąć pomyślne wyniki - Czyścić i przekształcać dane przy użyciu R i Pythona - Używać R i Pythona do wykonywania eksploracyjnej analizy danych - Tworzyć modele predykcyjne do rozwiązywania problemów biznesowych w R i Pythonie - Używać Pythona, R i narzędzi analitycznych do obsługi wielkich wolumenów danych - Współpracować z inżynierami danych i danetykami - Mierzyć skuteczność analiz biznesowych Dr. Deanne Larson jest eksperktą w dziedzinie danetyki oraz edukatorką, która pomaga największym firmom odblokować wartości biznesowe dzięki analityce. Dzięki wykładom w zakresie analiz, sztucznej inteligencji i przywództwa prowadzonym na takich uczelniach, jak MIT, Harvard, Stanford i NYU, stała się poszukiwanym wykładowcą i oddanym mentorem swojej dziedziny.

532

EBOOK

Nowoczesne architektury danych. Przewodnik po hurtowni danych, siatce danych oraz Data Fabric i Data Lakehouse

James Serra

Architektury data fabric i data lakehouse, a także siatka danych pojawiły się niedawno jako alternatywy hurtowni danych. Te nowe architektury mają swoje mocne strony, ale podczas projektowania rzeczywistych rozwiązań musisz pamiętać o odróżnianiu faktów od przesadnych pochwał i niejasności. Nie zawsze jest to proste i oczywiste zadanie. Niezwykłość tej książki polega na przekształcaniu złożonych zagadnień technicznych w jasne i zrozumiałe objaśnienia. Annie Xu, starszy inżynier danych, Google Dzięki temu praktycznemu przewodnikowi profesjonaliści zajmujący się danymi dobrze zrozumieją wady i zalety poszczególnych rozwiązań. Omówiono tu typowe zagadnienia dotyczące architektur danych, w tym ich rozwój i możliwości. Żadna architektura nie jest na tyle uniwersalna, by być odpowiednia w każdej sytuacji, dlatego w książce znajdziesz rzetelne porównanie cech poszczególnych architektur. Dowiesz się, jakie kompromisy towarzyszą każdej z nich, niezależnie od popularności. W ten sposób o wiele łatwiej przyjdzie Ci wybór rozwiązania, które najlepiej odpowiada Twoim potrzebom. Najciekawsze zagadnienia: praktyczne działanie architektur danych, ich mocne i słabe strony wybór najlepszej architektury pod kątem konkretnego zastosowania różnice między hurtowniami i "jeziorami" danych wspólne koncepcje architektur danych i ich historyczny rozwój sesje projektowania architektury, organizacja zespołów i najważniejsze uwarunkowania Połóż tę książkę na biurku. Będziesz często po nią sięgać! Sawyer Nyquist, autor, właściciel The Data Shop

533

EBOOK

Numerical Computing with Python. Harness the power of Python to analyze and find hidden patterns in the data

Pratap Dangeti, Allen Yu, Claire Chung, Aldrin...

Data mining, or parsing the data to extract useful insights, is a niche skill that can transform your career as a data scientist Python is a flexible programming language that is equipped with a strong suite of libraries and toolkits, and gives you the perfect platform to sift through your data and mine the insights you seek. This Learning Path is designed to familiarize you with the Python libraries and the underlying statistics that you need to get comfortable with data mining.You will learn how to use Pandas, Python's popular library to analyze different kinds of data, and leverage the power of Matplotlib to generate appealing and impressive visualizations for the insights you have derived. You will also explore different machine learning techniques and statistics that enable you to build powerful predictive models.By the end of this Learning Path, you will have the perfect foundation to take your data mining skills to the next level and set yourself on the path to become a sought-after data science professional.This Learning Path includes content from the following Packt products:• Statistics for Machine Learning by Pratap Dangeti• Matplotlib 2.x By Example by Allen Yu, Claire Chung, Aldrin Yim• Pandas Cookbook by Theodore Petrou

534

EBOOK

Numpy Beginner's Guide (Update). Build efficient, high-speed programs using the high-performance NumPy mathematical library

Ivan Idris

This book is for the scientists, engineers, programmers, or analysts looking for a high-quality, open source mathematical library. Knowledge of Python is assumed. Also, some affinity, or at least interest, in mathematics and statistics is required. However, I have provided brief explanations and pointers to learning resources.

535

EBOOK

Odsłaniamy SQL Server 2019: Klastry Big Data i uczenie maszynowe

Bob Ward

Nabierz prędkości dzięki przełomowym zmianom w SQL Server 2019. Nie jest to już jedynie silnik bazodanowy, ale nowatorskie narzędzie wyposażone we wsparcie dla uczenia maszynowego, analiz Big Data, możliwość działania w systemie Linux, kontenery, Kubernetes, Javę czy wirtualizację danych w Azure. Ta książka nie zajmuje się tradycyjną administracją bazami danych w środowisku SQL Server. Koncentruje się na tym wszystkim, co nowe w jednej z najskuteczniej modernizowanych platform danych w branży. To książka dla profesjonalistów danych, którzy znają już podstawy SQL Server i chcą się rozwijać, rozbudowując umiejętności w najgorętszych obszarach nowych technologii. Zagłębimy się w szczegóły kluczowych nowych możliwości SQL Server 2019 przy użyciu podejścia „nauka przez przykład”. Zajmiemy się zagadnieniami Intelligent Performance, zabezpieczeń, dostępności i funkcjonalności oczekiwanych przez współczesnych programistów. Omówimy usprawnienia w SQL Server 2019 dla systemu Linux oraz wykorzystanie kontenerów i klastrów Kubernetes. Pokażemy, jak zwirtualizować dostęp do danych przy użyciu Polybase dla Oracle, MongoDB, Hadoop i Azure, co pozwala zredukować potrzebę stosowania kosztownych aplikacji ETL. Nauczymy się również, jak budować wszechstronne rozwiązania Big Data Clusters, sztandarowej funkcjonalności wydania 2019, zapewniającej dostęp do środowisk Spark, SQL Server HDFS i dowiemy się, jak wbudować inteligencję w nasze własne dane i wdrażać kompletne aplikacje uczenia maszynowego. Dowiedz się, jak: • Implementować Big Data Clusters przy użyciu SQL Server, Spark i HDFS • Tworzyć węzły danych z połączeniami do Oracle, Azure, Hadoop i innych źródeł • Łączyć SQL i Spark w celu zbudowania platformy uczenia maszynowego dla aplikacji AI • Zwiększyć wydajność bez zmieniania aplikacji przy użyciu Intelligent Performance • Podnieść zabezpieczenia SQL Server dzięki mechanizmom Secure Enclaves i Data Classification • Zmaksymalizować czas działania bazy danych poprzez indeksowanie online i Accelerated Database Recovery • Budować nowoczesne aplikacje przy użyciu narzędzi Graph, ML Services i T-SQL Extensibility dla języka Java • Zwiększyć możliwości wdrażania SQL Server w systemie Linux • Uruchamiać SQL Server w kontenerach i Kubernetes • Korzystać z najnowszych narzędzi i metod migracji bazy danych do SQL Server 2019 • Zastosować wiedzę na temat SQL Server 2019 w środowisku Azure

536

EBOOK

OpenGL Data Visualization Cookbook. Over 35 hands-on recipes to create impressive, stunning visuals for a wide range of real-time, interactive applications using OpenGL

Raymond Chun Hing Lo, William Lo

OpenGL is a great multi-platform, cross-language, and hardware-accelerated graphics interface for visualizing large 2D and 3D datasets. Data visualization has become increasingly challenging using conventional approaches as datasets become larger and larger, especially with the Big Data evolution. From a mobile device to a sophisticated high-performance computing cluster, OpenGL libraries provide developers with an easy-to-use interface to create stunning visuals in 3D in real time for a wide range of interactive applications.This book provides a series of easy-to-follow, hands-on tutorials to create appealing OpenGL-based visualization tools with minimal development time. We will first illustrate how to quickly set up the development environment in Windows, Mac OS X, and Linux. Next, we will demonstrate how to visualize data for a wide range of applications using OpenGL, starting from simple 2D datasets to increasingly complex 3D datasets with more advanced techniques. Each chapter addresses different visualization problems encountered in real life and introduces the relevant OpenGL features and libraries in a modular fashion.By the end of this book, you will be equipped with the essential skills to develop a wide range of impressive OpenGL-based applications for your unique data visualization needs, on platforms ranging from conventional computers to the latest mobile/wearable devices.