Big data
Wnioskowanie przyczynowe w Pythonie. Praktyczne wykorzystanie w branży technologicznej
Matheus Facure
Wnioskowanie przyczynowe przydaje się w sytuacji, gdy trzeba określić wpływ decyzji biznesowej na konkretny wynik, na przykład wielkość sprzedaży. Działania te są dobrze znane nauce, ale dopiero od niedawna świat poznaje korzyści z ich zastosowania w branży technologicznej. Przyczyniły się do tego postępy w uczeniu maszynowym, automatyzacji procesów i danologii. Teraz, aby uzyskać wymierne korzyści, wystarczy kilka wierszy kodu w Pythonie. Poznaj narzędzia najbardziej znanych analityków danych korzystających z Pythona! prof. Nick Huntington-Klein, autor The Effect: An Introduction to Research Design and Causality Tę książkę docenią w szczególności analitycy danych. Wyjaśniono w niej potencjał wnioskowania przyczynowego w zakresie szacowania wpływu i efektów w biznesie. Opisano klasyczne metody wnioskowania przyczynowego, w tym testy A/B, regresja liniowa, wskaźnik skłonności, metoda syntetycznej kontroli i metoda różnicy w różnicach, przy czym skoncentrowano się przede wszystkim na praktycznym aspekcie tych technik. Znalazło się tu również omówienie nowoczesnych rozwiązań, takich jak wykorzystanie uczenia maszynowego do szacowania heterogenicznych efektów. Każda metoda została zilustrowana opisem zastosowania w branży technologicznej. W książce między innymi: podstawy wnioskowania przyczynowego problemy biznesowe jako zagadnienia z obszaru wnioskowania przyczynowego eksperymenty geograficzne i eksperymenty z przełączaniem oddziaływania badanie błędu systematycznego modele graficzne i wizualizacja związków przyczynowych Najlepsza książka poświęcona najnowocześniejszym metodom, działaniu na rzeczywistych danych i rozwiązywaniu praktycznych problemów! Sean J. Taylor, główny badacz w Motif Analytics
Wnioskowanie przyczynowe w Pythonie. Praktyczne wykorzystanie w branży technologicznej
Matheus Facure
Wnioskowanie przyczynowe przydaje się w sytuacji, gdy trzeba określić wpływ decyzji biznesowej na konkretny wynik, na przykład wielkość sprzedaży. Działania te są dobrze znane nauce, ale dopiero od niedawna świat poznaje korzyści z ich zastosowania w branży technologicznej. Przyczyniły się do tego postępy w uczeniu maszynowym, automatyzacji procesów i danologii. Teraz, aby uzyskać wymierne korzyści, wystarczy kilka wierszy kodu w Pythonie. Poznaj narzędzia najbardziej znanych analityków danych korzystających z Pythona! prof. Nick Huntington-Klein, autor The Effect: An Introduction to Research Design and Causality Tę książkę docenią w szczególności analitycy danych. Wyjaśniono w niej potencjał wnioskowania przyczynowego w zakresie szacowania wpływu i efektów w biznesie. Opisano klasyczne metody wnioskowania przyczynowego, w tym testy A/B, regresja liniowa, wskaźnik skłonności, metoda syntetycznej kontroli i metoda różnicy w różnicach, przy czym skoncentrowano się przede wszystkim na praktycznym aspekcie tych technik. Znalazło się tu również omówienie nowoczesnych rozwiązań, takich jak wykorzystanie uczenia maszynowego do szacowania heterogenicznych efektów. Każda metoda została zilustrowana opisem zastosowania w branży technologicznej. W książce między innymi: podstawy wnioskowania przyczynowego problemy biznesowe jako zagadnienia z obszaru wnioskowania przyczynowego eksperymenty geograficzne i eksperymenty z przełączaniem oddziaływania badanie błędu systematycznego modele graficzne i wizualizacja związków przyczynowych Najlepsza książka poświęcona najnowocześniejszym metodom, działaniu na rzeczywistych danych i rozwiązywaniu praktycznych problemów! Sean J. Taylor, główny badacz w Motif Analytics
Wprowadzenie do systemów baz danych. Wydanie VII
Ramez Elmasri, Shamkant B. Navathe
Mijają lata, a bazy danych wciąż stanowią serce większości systemów informatycznych. Rozwój technologii sprawia jednak, że zaprojektowanie systemu baz danych, jego wdrożenie i administrowanie nim wymaga biegłości w wielu dziedzinach. Niezbędne są solidne podstawy modelowania i projektowania baz danych, umiejętność posłużenia się językami i modelami udostępnianymi przez systemy zarządzania bazami danych, a także znajomość technik implementacji samych systemów. Od profesjonalisty wymaga się także wiedzy o najnowszych technologiach, takich jak NoSQL i oczywiście big data. Ważnym uzupełnieniem tego szerokiego wachlarza jest też znajomość technologii powiązanych z systemami bazodanowymi. Ta książka jest siódmym, zaktualizowanym wydaniem klasycznego podręcznika do nauki baz danych. Jest to szczegółowa prezentacja najważniejszych aspektów systemów i aplikacji bazodanowych oraz powiązanych technologii. To znakomity podręcznik dla studentów i świetne kompendium dla praktyków. Sporo miejsca poświęcono w nim systemom rozproszonym oraz technologiom opartym na systemie Hadoop i modelu MapReduce. Nie zabrakło opisu takich zagadnień, jak model IR, wyszukiwanie z użyciem słów kluczowych, porównanie baz danych z modelem IR, modele wyszukiwania, ocena wyszukiwania i algorytmy rankingowe. Wykładowcom przyda się szereg ułatwiających pracę dydaktyczną diagramów, prezentacji i rysunków. W książce między innymi: wprowadzenie do modeli, systemów i języków z obszaru baz danych; model związków encji i programowanie baz danych; bazy relacyjne, obiektowo-relacyjne, obiektowe i XML w bazach danych; algorytmy przetwarzania zapytań i techniki optymalizacji; bezpieczeństwo baz danych. Baza danych? Stosuj tylko najskuteczniejsze rozwiązania!
Wprowadzenie do uczenia maszynowego według Esposito
Dino Esposito, Francesco Esposito
Opanuj koncepcje uczenia maszynowego i rozwiązuj rzeczywiste problemy Uczenie maszynowe stwarza niesamowite możliwości, a książka Wprowadzenie do uczenia maszynowego zawiera praktyczną wiedzę o ich wykorzystaniu. Dino i Francesco Esposito zaczynają od krótkiego omówienia podstawowych zagadnień sztucznej inteligencji oraz zasad każdego projektu uczenia maszynowego. Następ-nie wprowadzają do potężnej biblioteki ML.NET opracowanej przez firmę Microsoft. Omawiają między innymi przetwarzanie danych, uczenie i weryfikację. Prezentują rodziny algorytmów, które można uczyć w celu rozwią-zywania rzeczywistych problemów, a także techniki uczenia głębokiego wykorzystujące sieci neuronowe. Na koniec autorzy omawiają wartościowe usługi czasu wykonywania, dostępne za pośrednictwem chmury obli-czeniowej Azure, a także rozważają długoterminowe perspektywy biznesowe związane z uczeniem maszyno-wym. Dino Esposito, 14-krotnie wyróżniony tytułem Microsoft MVP, oraz Francesco Esposito ułatwią nam: Zgłębianie poznanych zasad uczenia się ludzi oraz budowy inteligentnego oprogramowania Odkrycie problemów, które można rozwiązać z wykorzystaniem uczenia maszynowego Zrozumienie potoku uczenia maszynowego, czyli kroków prowadzących do uzyskania gotowego modelu Użycie AutoML w celu automatycznego wybrania najlepszego potoku dla dowolnego problemu i zbioru danych Opanowanie biblioteki ML.NET, zaimplementowanie jej potoku oraz wykorzystanie zadań i algorytmów Zgłębianie matematycznych podstaw uczenia maszynowego Prognozowanie, ulepszanie sposobów podejmowania decyzji i stosowanie metod probabilistycznych Grupowanie danych poprzez klasyfikację i klasteryzację Poznanie podstaw uczenia głębokiego, włącznie z projektowaniem sieci neuronowych Wykorzystanie usług w chmurze AI w celu szybszego tworzenia lepszych rzeczywistych rozwiązań O książce Dla profesjonalistów zamierzających tworzyć aplikacje wykorzystujące uczenie maszynowe: zarówno dla programistów chcących zdobyć umiejętności z zakresu analizy danych, jak i dla analityków danych, którzy chcą zdobyć odpowiednie umiejętności programistyczne Zawiera przykładowe scenariusze kodu uczenia maszynowego wykorzystujące bibliotekę ML.NET O autorach Dino Esposito, 14-krotnie wyróżniony tytułem Microsoft MVP, jest autorem ponad 20 książek, włącznie z best-sellerem wydawnictwa Microsoft Press, zatytułowanym Microsoft .NET: Architecting Applications for the Enter-prise. Od 22 lat jest autorem kolumny Cutting Edge, a także prowadzi regularne wykłady w firmie Microsoft i na niezależnych wydarzeniach branżowych na całym świecie. Od ponad 25 lat jest programistą, a obecnie kon-centruje się na sztucznej inteligencji w kontekście inteligentnych rozwiązań dla miast i energetyki, pracując na stanowisku stratega do spraw korporacyjnych rozwiązań cyfrowych w BaxEnergy. Francesco Esposito jest 21-letnim programistą zawieszonym między zagadnieniami zaawansowanej matema-tyki i tajnikami nauk o danych. Interesuje się przede wszystkim hydrologią i służbą zdrowia. Francesco założył Youbiquitous, firmę zajmującą się oprogramowaniem i sztuczną inteligencją, a także prowadzi małą firmę in-westycyjną. Cały przykładowy kod, włącznie z kompletnymi aplikacjami, jest dostępny pod adresem MicrosoftPressStore.com/IntroMachineLearning/downloads Obraz na okładce autorstwa Andreya Pronin/aAlamy Stock Vector
Valliappa Lakshmanan, Sara Robinson, Michael Munn
Rozwiązania typowych problemów dotyczących przygotowania danych, konstruowania modeli i MLOps Wzorce projektowe opisane w tej książce obejmują najlepsze praktyki i rozwiązania powtarzalnych problemów w uczeniu maszynowym. Autorzy, troje inżynierów z firmy Google, skatalogowali sprawdzone metody, aby pomóc badaczom danych sprostać typowym problemom występującym w całym procesie uczenia maszynowego. Te wzorce projektowe kodyfikują doświadczenie setek ekspertów w prostych, przystępnych radach. W tej książce znajdziesz szczegółowe wyjaśnienia 30 wzorców reprezentacji danych i problemów, operacjonalizacji, powtarzalności, odtwarzalności, elastyczności, objaśnialności i bezstronności. Każdy wzorzec obejmuje opis problemu, różnorodne potencjalne rozwiązania oraz rekomendacje dotyczące wyboru najlepszej techniki w danej sytuacji. Nauczysz się: • Rozpoznawać i minimalizować typowe problemy występujące podczas uczenia, oceniania oraz wdrażania modeli uczenia maszynowego • Przedstawiać dane dla różnych typów modeli uczenia maszynowego, w postaci reprezentacji wektorowych, krzyżowania cech i nie tylko • Wybierać prawidłowy typ modelu dla konkretnych problemów • Konstruować wydajną pętlę uczenia z zastosowaniem punktów kontrolnych, strategii rozkładu i strojenia hiperparametrów • Wdrażać skalowalne systemy uczenia maszynowego, które można uczyć ponownie i aktualizować, aby odzwierciedlać nowe dane • Interpretować predykcje modeli dla interesariuszy i zapewniać, że modele traktują użytkowników bezstronnie • Zwiększać dokładność, odtwarzalność i elastyczność „Dzięki wspaniałym, różnorodnym przykładom ta książka jest obowiązkową lekturą dla badaczy danych i inżynierów uczenia maszynowego dążących do zrozumienia sprawdzonych rozwiązań złożonych problemów uczenia maszynowego.” —David Kanter Dyrektor wykonawczy, ML Commons „Jeśli chcesz oszczędzić sobie siniaków na drodze do konstruowania rozwiązań uczenia maszynowego, Lak, Sara i Michael to osoby, na które możesz liczyć.” —Will Grannis Dyrektor zarządzający, Cloud CTO Office, Google Valliappa (Lak) Lakshmanan jest globalnym kierownikiem działu analizy danych i rozwiązań sztucznej inteligencji w Google Cloud. Sara Robinson jest rzeczniczką deweloperów w zespole Google Cloud, skupiającą się na uczeniu maszynowym. Michael Munn jest inżynierem rozwiązań uczenia maszynowego w Google, gdzie pomaga klientom projektować, implementować i wdrażać modele uczenia maszynowego.
Partha Pritam Deka, Joyce Weiner, Prof. Roberto...
XGBoost offers a powerful solution for regression and time series analysis, enabling you to build accurate and efficient predictive models. In this book, the authors draw on their combined experience of 40+ years in the semiconductor industry to help you harness the full potential of XGBoost, from understanding its core concepts to implementing real-world applications.As you progress, you'll get to grips with the XGBoost algorithm, including its mathematical underpinnings and its advantages over other ensemble methods. You'll learn when to choose XGBoost over other predictive modeling techniques, and get hands-on guidance on implementing XGBoost using both the Python API and scikit-learn API. You'll also get to grips with essential techniques for time series data, including feature engineering, handling lag features, encoding techniques, and evaluating model performance. A unique aspect of this book is the chapter on model interpretability, where you'll use tools such as SHAP, LIME, ELI5, and Partial Dependence Plots (PDP) to understand your XGBoost models. Throughout the book, you’ll work through several hands-on exercises and real-world datasets.By the end of this book, you'll not only be building accurate models but will also be able to deploy and maintain them effectively, ensuring your solutions deliver real-world impact.
XML Basics. A Comprehensive Guide to Understanding and Implementing XML
Mercury Learning and Information, S. Banzal
This book focuses on essential XML standards relevant to almost all developers. It investigates XML technologies applicable across a wide range of applications, rather than those limited to specific domains. While XML is a markup language, it is widely used by programmers. The book also covers supporting technologies layered on top of XML, such as XLinks, XSLT, Namespaces, Schemas, XHTML, RDDL, XPointers, XPath, SAX, and DOM.The journey begins with understanding XML and its syntax. It then explores Document Type Definitions (DTDs), Namespaces, and XHTML. Following this, the book delves into CSS Style Sheets, XML Schema Basics, XSL and XSLT, SOAP, DOM Programming Interface, SAX, XPath, XLink, XQuery, XPointer, XForms, XSL-FO, and using XML with Databases. The final chapters cover Web Services, providing a comprehensive understanding of how XML integrates into various applications.Mastering these standards and technologies is crucial for developers working with XML. This book transitions readers from basic XML syntax to advanced applications, blending theoretical concepts with practical examples. It is an essential resource for developers looking to leverage XML in their projects.
Your Excel Survival Kit. A Guide to Surviving and Thriving in an Excel World
MrExcel's Holy Macro! Books, Anne Walsh
This book starts off with the basics of data entry, formulas, and charts, it provides practical tips to simplify workflows and create clear visuals. Progress to advanced techniques like data cleaning, handling missing entries, and using logical functions, including modern dynamic arrays.Learn to summarize and visualize data with pivot tables, troubleshoot common issues, and customize layouts. Explore VLOOKUP, XLOOKUP, and methods for tackling common challenges. Advanced chapters introduce Power Query for data merging, automation, and quick insights, while Power Pivot enables combining multiple datasets for detailed reports.Finally, unlock Power BI to create professional-grade dashboards and visualizations. Designed for beginners and advanced users alike, this book equips you with the skills to streamline processes, analyze data effectively, and make informed decisions.
Akash Tandon, Sandy Ryza, Uri Laserson, Sean...
Potrzeby w zakresie analizy dużych zbiorów danych i wyciągania z nich użytecznych informacji stale rosną. Spośród dostępnych narzędzi przeznaczonych do tych zastosowań szczególnie przydatny jest PySpark - interfejs API systemu Spark dla języka Python. Apache Spark świetnie się nadaje do analizy dużych zbiorów danych, a PySpark skutecznie ułatwia integrację Sparka ze specjalistycznymi narzędziami PyData. By jednak można było w pełni skorzystać z tych możliwości, konieczne jest zrozumienie interakcji między algorytmami, zbiorami danych i wzorcami używanymi w analizie danych. Oto praktyczny przewodnik po wersji 3.0 systemu Spark, metodach statystycznych i rzeczywistych zbiorach danych. Omówiono w nim zasady rozwiązywania problemów analitycznych za pomocą interfejsu PySpark, z wykorzystaniem dobrych praktyk programowania w systemie Spark. Po lekturze można bezproblemowo zagłębić się we wzorce analityczne oparte na popularnych technikach przetwarzania danych, takich jak klasyfikacja, grupowanie, filtrowanie i wykrywanie anomalii, stosowane w genomice, bezpieczeństwie systemów IT i finansach. Dodatkowym plusem są opisy wykorzystania przetwarzania obrazów i języka naturalnego. Zaletą jest też szereg rzeczywistych przykładów dużych zbiorów danych i ich zaawansowanej analizy. Dzięki książce poznasz: model programowania w ekosystemie Spark podstawowe metody stosowane w nauce o danych pełne implementacje analiz dużych publicznych zbiorów danych konkretne przypadki użycia narzędzi uczenia maszynowego kod, który łatwo dostosujesz do swoich potrzeb PySpark: systemowa odpowiedź na problemy inżyniera danych!