Big data

1089
Wird geladen...
E-BOOK

Wzorce projektowe uczenia maszynowego. Rozwiązania typowych problemów dotyczących przygotowania danych, konstruowania modeli i MLOps

Valliappa Lakshmanan, Sara Robinson, Michael Munn

Rozwiązania typowych problemów dotyczących przygotowania danych, konstruowania modeli i MLOps Wzorce projektowe opisane w tej książce obejmują najlepsze praktyki i rozwiązania powtarzalnych problemów w uczeniu maszynowym. Autorzy, troje inżynierów z firmy Google, skatalogowali sprawdzone metody, aby pomóc badaczom danych sprostać typowym problemom występującym w całym procesie uczenia maszynowego. Te wzorce projektowe kodyfikują doświadczenie setek ekspertów w prostych, przystępnych radach. W tej książce znajdziesz szczegółowe wyjaśnienia 30 wzorców reprezentacji danych i problemów, operacjonalizacji, powtarzalności, odtwarzalności, elastyczności, objaśnialności i bezstronności. Każdy wzorzec obejmuje opis problemu, różnorodne potencjalne rozwiązania oraz rekomendacje dotyczące wyboru najlepszej techniki w danej sytuacji. Nauczysz się: •  Rozpoznawać i minimalizować typowe problemy występujące podczas uczenia, oceniania oraz wdrażania modeli uczenia maszynowego •  Przedstawiać dane dla różnych typów modeli uczenia maszynowego, w postaci reprezentacji wektorowych, krzyżowania cech i nie tylko •  Wybierać prawidłowy typ modelu dla konkretnych problemów •  Konstruować wydajną pętlę uczenia z zastosowaniem punktów kontrolnych, strategii rozkładu i strojenia hiperparametrów •  Wdrażać skalowalne systemy uczenia maszynowego, które można uczyć ponownie i aktualizować, aby odzwierciedlać nowe dane •  Interpretować predykcje modeli dla interesariuszy i zapewniać, że modele traktują użytkowników bezstronnie •  Zwiększać dokładność, odtwarzalność i elastyczność   „Dzięki wspaniałym, różnorodnym przykładom ta książka jest obowiązkową lekturą dla badaczy danych i inżynierów uczenia maszynowego dążących do zrozumienia sprawdzonych rozwiązań złożonych problemów uczenia maszynowego.” ­—David Kanter Dyrektor wykonawczy, ML Commons „Jeśli chcesz oszczędzić sobie siniaków na drodze do konstruowania rozwiązań uczenia maszynowego, Lak, Sara i Michael to osoby, na które możesz liczyć.” ­—Will Grannis Dyrektor zarządzający, Cloud CTO Office, Google Valliappa (Lak) Lakshmanan jest globalnym kierownikiem działu analizy danych i rozwiązań sztucznej inteligencji w Google Cloud. Sara Robinson jest rzeczniczką deweloperów w zespole Google Cloud, skupiającą się na uczeniu maszynowym. Michael Munn jest inżynierem rozwiązań uczenia maszynowego w Google, gdzie pomaga klientom projektować, implementować i wdrażać modele uczenia maszynowego.

1090
Wird geladen...
E-BOOK

XGBoost for Regression Predictive Modeling and Time Series Analysis. Learn how to build, evaluate, and deploy predictive models with expert guidance

Partha Pritam Deka, Joyce Weiner, Prof. Roberto...

XGBoost offers a powerful solution for regression and time series analysis, enabling you to build accurate and efficient predictive models. In this book, the authors draw on their combined experience of 40+ years in the semiconductor industry to help you harness the full potential of XGBoost, from understanding its core concepts to implementing real-world applications.As you progress, you'll get to grips with the XGBoost algorithm, including its mathematical underpinnings and its advantages over other ensemble methods. You'll learn when to choose XGBoost over other predictive modeling techniques, and get hands-on guidance on implementing XGBoost using both the Python API and scikit-learn API. You'll also get to grips with essential techniques for time series data, including feature engineering, handling lag features, encoding techniques, and evaluating model performance. A unique aspect of this book is the chapter on model interpretability, where you'll use tools such as SHAP, LIME, ELI5, and Partial Dependence Plots (PDP) to understand your XGBoost models. Throughout the book, you’ll work through several hands-on exercises and real-world datasets.By the end of this book, you'll not only be building accurate models but will also be able to deploy and maintain them effectively, ensuring your solutions deliver real-world impact.

1091
Wird geladen...
E-BOOK

XML Basics. A Comprehensive Guide to Understanding and Implementing XML

Mercury Learning and Information, S. Banzal

This book focuses on essential XML standards relevant to almost all developers. It investigates XML technologies applicable across a wide range of applications, rather than those limited to specific domains. While XML is a markup language, it is widely used by programmers. The book also covers supporting technologies layered on top of XML, such as XLinks, XSLT, Namespaces, Schemas, XHTML, RDDL, XPointers, XPath, SAX, and DOM.The journey begins with understanding XML and its syntax. It then explores Document Type Definitions (DTDs), Namespaces, and XHTML. Following this, the book delves into CSS Style Sheets, XML Schema Basics, XSL and XSLT, SOAP, DOM Programming Interface, SAX, XPath, XLink, XQuery, XPointer, XForms, XSL-FO, and using XML with Databases. The final chapters cover Web Services, providing a comprehensive understanding of how XML integrates into various applications.Mastering these standards and technologies is crucial for developers working with XML. This book transitions readers from basic XML syntax to advanced applications, blending theoretical concepts with practical examples. It is an essential resource for developers looking to leverage XML in their projects.

1092
Wird geladen...
E-BOOK

Your Excel Survival Kit. A Guide to Surviving and Thriving in an Excel World

MrExcel's Holy Macro! Books, Anne Walsh

This book starts off with the basics of data entry, formulas, and charts, it provides practical tips to simplify workflows and create clear visuals. Progress to advanced techniques like data cleaning, handling missing entries, and using logical functions, including modern dynamic arrays.Learn to summarize and visualize data with pivot tables, troubleshoot common issues, and customize layouts. Explore VLOOKUP, XLOOKUP, and methods for tackling common challenges. Advanced chapters introduce Power Query for data merging, automation, and quick insights, while Power Pivot enables combining multiple datasets for detailed reports.Finally, unlock Power BI to create professional-grade dashboards and visualizations. Designed for beginners and advanced users alike, this book equips you with the skills to streamline processes, analyze data effectively, and make informed decisions.

1093
Wird geladen...
E-BOOK

Zaawansowana analiza danych w PySpark. Metody przetwarzania informacji na szeroką skalę z wykorzystaniem Pythona i systemu Spark

Akash Tandon, Sandy Ryza, Uri Laserson, Sean...

Potrzeby w zakresie analizy dużych zbiorów danych i wyciągania z nich użytecznych informacji stale rosną. Spośród dostępnych narzędzi przeznaczonych do tych zastosowań szczególnie przydatny jest PySpark - interfejs API systemu Spark dla języka Python. Apache Spark świetnie się nadaje do analizy dużych zbiorów danych, a PySpark skutecznie ułatwia integrację Sparka ze specjalistycznymi narzędziami PyData. By jednak można było w pełni skorzystać z tych możliwości, konieczne jest zrozumienie interakcji między algorytmami, zbiorami danych i wzorcami używanymi w analizie danych. Oto praktyczny przewodnik po wersji 3.0 systemu Spark, metodach statystycznych i rzeczywistych zbiorach danych. Omówiono w nim zasady rozwiązywania problemów analitycznych za pomocą interfejsu PySpark, z wykorzystaniem dobrych praktyk programowania w systemie Spark. Po lekturze można bezproblemowo zagłębić się we wzorce analityczne oparte na popularnych technikach przetwarzania danych, takich jak klasyfikacja, grupowanie, filtrowanie i wykrywanie anomalii, stosowane w genomice, bezpieczeństwie systemów IT i finansach. Dodatkowym plusem są opisy wykorzystania przetwarzania obrazów i języka naturalnego. Zaletą jest też szereg rzeczywistych przykładów dużych zbiorów danych i ich zaawansowanej analizy. Dzięki książce poznasz: model programowania w ekosystemie Spark podstawowe metody stosowane w nauce o danych pełne implementacje analiz dużych publicznych zbiorów danych konkretne przypadki użycia narzędzi uczenia maszynowego kod, który łatwo dostosujesz do swoich potrzeb PySpark: systemowa odpowiedź na problemy inżyniera danych!

1094
Wird geladen...
E-BOOK

Zaawansowane techniki przetwarzania języka naturalnego. Od podstaw do modeli LLM i zastosowań biznesowych w Pythonie

Lior Gazit, Meysam Ghaffari

Uczenie maszynowe i duże modele językowe rewolucjonizują biznes i nasze codzienne życie. Potencjał tych innowacji jest trudny do oszacowania: modele LLM stały się wiodącym trendem w tworzeniu aplikacji i analizie danych. Integrowanie zaawansowanych modeli z systemami produkcyjnymi bywa jednak często wymagającym, a nawet niewdzięcznym zadaniem. Na szczęście dzięki tej książce poradzisz sobie z takimi wyzwaniami! Najpierw zapoznasz się z matematycznymi podstawami algorytmów ML i NLP. Zaznajomisz się również z ogólnymi technikami uczenia maszynowego i dowiesz się, w jakim stopniu dotyczą one dużych modeli językowych. Kolejnym zagadnieniem będzie przetwarzanie danych tekstowych, w tym metody przygotowywania tekstu do analizy, po czym przyswoisz zasady klasyfikowania tekstu. Ponadto poznasz zaawansowane aspekty teorii, projektowania i stosowania LLM, wreszcie ― przyszłe trendy w NLP. Aby zdobyć praktyczne umiejętności, będziesz ćwiczyć na przykładach rzeczywistych zagadnień biznesowych i rozwiązań NLP. W książce: podstawy matematyczne uczenia maszynowego i NLP zaawansowane techniki przetwarzania wstępnego i analizy danych tekstowych projektowanie systemów ML i NLP w Pythonie przetwarzanie tekstu z użyciem metod uczenia głębokiego modele LLM i ich implementacja w różnych aplikacjach AI trendy w NLP i potencjał tej technologii Odkryj przyszłe trendy w NLP widziane oczami ekspertów!

1095
Wird geladen...
E-BOOK

Zaawansowane uczenie maszynowe z językiem Python

John Hearty

Uczenie maszynowe przyczyniło się do powstania wielu innowacyjnych technologii. Pojazdy autonomiczne, mechanizmy rozpoznawania obrazów, badania genetyczne, a także dynamiczne dostosowywanie prezentowanych treści do preferencji odbiorcy to tylko niektóre przykłady. Możliwości związane z rozwojem tych technik sprawiają, że analityka danych i zaawansowane uczenie maszynowe stają się wyjątkowo cenną wiedzą. Dotyczy to szczególnie nowatorskich technik analizy danych, takich jak głębokie uczenie, algorytmy częściowo nadzorowane i metody zespołowe. Niniejsza książka jest przystępnie napisanym podręcznikiem, dzięki któremu poznasz niektóre zaawansowane techniki uczenia maszynowego. Szczególną uwagę poświęcono tu algorytmom uczenia maszynowego: zostały dokładnie wyjaśnione, opisano ich zastosowanie oraz topologię, metody uczenia i miary wydajności. Każdy rozdział uzupełniono o wykaz źródeł, pomocny w dalszym zgłębianiu tematu. Dodatkowo przedstawiono wiele cennych wskazówek dotyczących specyfiki pracy analityka danych. Do prezentacji przykładów wybrano język Python z uwagi na jego wszechstronność, elastyczność, prostotę oraz możliwość stosowania do specjalistycznych zadań. Najważniejsze zagadnienia przedstawione w książce: identyfikacja struktur i wzorców w zbiorach danych stosowanie sieci neuronowych praca z językiem naturalnym modele zespołowe i poprawa ich elastyczności narzędzia uczenia maszynowego w Pythonie Zaawansowane uczenie maszynowe — poznaj algorytmy przyszłości! John Hearty — jest autorytetem w dziedzinie analityki danych i inżynierii infrastruktury. Przez pewien czas zajmował się modelowaniem zachowań gracza i infrastrukturą dużych zbiorów danych w Microsofcie. Ważniejszymi jego projektami były modelowanie umiejętności gracza w grach asymetrycznych i modele segmentacji graczy mające na celu zindywidualizowanie rozgrywki. Obecnie Hearty jest niezależnym ekspertem, szczególnie cenionym przez zespoły zajmujące się eksploracją danych. W wolnym czasie tworzy modele uczenia maszynowego w Pythonie.

1096
Wird geladen...
E-BOOK

Zapytania w języku T-SQL w Microsoft SQL Server 2014 i SQL Server 2012

Itzik Ben-Gan, Adam Machanic, Dejan Sarka, Kevin...

Poznaj tajniki T-SQL, aby poradzić sobie z najtrudniejszymi zapytaniami i problemami dostrajania wydajności. Wyciśnij maksymalną wydajność i efektywność z każdego tworzonego zapytania T-SQL. Czterech wiodących ekspertów prezentuje pogłębiony przegląd wewnętrznej architektury T SQL i zaawansowane, praktyczne techniki optymalizowania reaktywności i zużycia zasobów. Dzięki właściwemu rozumieniu języka i jego podstaw autorzy przedstawiają unikatowe rozwiązania, tworzone i dostrajane przez lata. Cały kod i prezentowane techniki zostały w pełni zaktualizowane, aby odzwierciedlić nowe usprawnienia T-SQL dostępne w Microsoft SQL Server 2014 i SQL Server 2012. Twórz szybszy i wydajniejszy kod T-SQL: - Przejdź od programowania proceduralnego do języka zbiorów i logiki - Doskonal wydajną metodologię dostrajania zapytań - Oceniaj złożoność algorytmiczną, by móc przewidzieć wydajność rozwiązania - Porównaj techniki agregowania danych, łącznie z nową koncepcją grupowania zbiorów - Wydajnie realizuj analizy danych - Wydobądź wszystko z zoptymalizowanych narzędzi masowego importowania danych - Uniknij pułapek prowadzących do wadliwego, wolno wykonywanego kodu - Twórz zoptymalizowane zapytania statystyczne bez dodatkowego oprogramowania - Użyj obiektów programowalnych do przyśpieszenia zapytań - Wykorzystaj ulepszenia wydajności w zapytaniach OLTP - Opanuj użyteczne i eleganckie podejście do manipulowania grafami Przykłady kodu dostępne są do pobrania pod adresem tsql.solidq.com/books/tq3 O tej książce - Dla doświadczonych praktyków T-SQL - Obejmuje zaktualizowaną tematykę książek Microsoft SQL Server 2008 od środka: Zapytania w języku T-SQL oraz Programowanie w języku T-SQL - Wyjaśnia wiele zagadnień egzaminacyjnych dla certyfikacji MCSE 70-464 oraz MCSA/MCSE 70-461 O autorach Itzik Ben-Gan, SQL Server MVP od roku 1999, współtwórca SolidQ oraz cyków szkoleniowych Advanced T-SQL Querying, Programming and Tuning oraz T-SQL Fundamentals courses. Prowadzi wiele szkoleń na temat T-SQL i wykładów na konferencjach TechEd, SQLPASS i SQL Server Connections. Dejan Sarka, MCT, SQL Server MVP, jest konsultantem w dziedzinie baz danych/BI, szkoleniowcem i programistą specjalizującym się w modelowaniu, drążeniu danych i zapewnianiu jakości. Jest autorem lub współautorem 11 książek i założycielem Slovenian SQL Server and .NET Users Group. Adam Machanic, SQL Server MVP, jest programistą, autorem i wykładowcą skupiającym się na wydajności i projektowaniu wielkoskalowych hurtowni danych. Jest twórcą nagrodzonej procedury składowanej sp_WhoIsActive. Kevin Farlee, Storage Engine Program Manager w zespole SQL Server, ma ponad 25 lat doświadczenia w dziedzinie baz danych i magazynowania informacji.