Bazy danych
Inżynieria niezawodnych baz danych. Projektowanie systemów odpornych na błędy
Laine Campbell, Charity Majors
Informatyczna rewolucja dosięgła również systemy bazodanowe. Przez długi czas administrator bazy danych interesował się głównie wewnętrznymi mechanizmami bazy, optymalizacją zapytań czy analizą podsystemów składowania danych. Z kolei oprogramowaniem stron, infrastrukturą czy usługami sieciowymi zajmowali się zupełnie inni ludzie, pracujący w odmienny sposób. Nowe technologie wymuszają jednak zmianę sposobu pracy i myślenia. Trzeba położyć nacisk na automatyzację, inżynierię oprogramowania, ciągłą integrację i ciągłe udostępnianie. Poza tym trzeba zapewnić ochronę przetwarzanych danych - ich wartość i znaczenie wciąż szybko rosną. W tej praktycznej książce dokładnie wyjaśniono współczesne podejście do tworzenia architektury baz danych i ich eksploatacji. Jeśli chcesz stać się znakomitym inżynierem niezawodności baz danych, czyli DBRE (z Database Reliability Engineer), znajdziesz tu schemat zasad i praktyk projektowania, budowania i eksploatacji magazynów danych zgodnie z paradygmatami inżynierii niezawodności i kultury DevOps. Zapoznasz się z podstawowymi zagadnieniami z obszaru eksploatacji, z metodami utrwalania baz danych, nauczysz się stosować najważniejsze technologie skalowalnego i wydajnego składowania oraz pobierania danych z zachowaniem odporności na błędy. Dzięki temu szybko i skutecznie zajmiesz się architekturą i eksploatacją każdej nowoczesnej bazy. W książce między innymi: wprowadzenie do inżynierii niezawodności baz danych inżynieria infrastruktury i zarządzanie nią oceny ryzyka i strategie zarządzania bezpieczeństwem danych metody przechowywania, indeksowania i replikacji danych popularne wzorce architektoniczne rozproszonych baz danych praktyczne wykorzystanie zasad inżynierii niezawodności w organizacji Stań się znakomitym inżynierem niezawodności! Laine Campbell od 18 lat zajmuje się środowiskami produkcyjnymi baz danych i systemów rozproszonych o dużej skali. Obecnie jest starszym dyrektorem ds. inżynierii środowisk produkcyjnych w firmie Fastly. Charity Majors jest CEO i założycielką firmy honeycomb.io. Wcześniej zajmowała się eksploatacją należącej do Facebooka platformy Parse, gdzie zarządzała rozbudowanym zestawem replik baz MongoDB, a także bazami Redis, Cassandra i MySQL.
Jak analizować dane z biblioteką Pandas. Praktyczne wprowadzenie. Wydanie II
Daniel Y. Chen
Wprawny analityk potrafi się posługiwać zbiorami danych o wysokiej dynamice i różnorodności. Działanie to ułatwia biblioteka open source Pandas, która pozwala, przy użyciu języka Python, zrealizować niemal każde zadanie wymagające analizy danych. Pandas może pomóc w zapewnieniu wiarygodności danych, wizualizowaniu ich pod kątem efektywnego podejmowania decyzji i analizowaniu wielu zbiorów danych. Oto drugie, zaktualizowane i uzupełnione wydanie przewodnika po bibliotece Pandas. Dzięki tej przystępnej książce nauczysz się w pełni korzystać z możliwości oferowanych przez bibliotekę, nawet jeśli dopiero zaczynasz przygodę z analizą danych w Pythonie. Naukę rozpoczniesz z użyciem rzeczywistego zbioru danych, aby wkrótce rozwiązywać złożone problemy danologii, takie jak obsługa brakujących danych, stosowanie regularyzacji czy też używanie metod nienadzorowanego uczenia maszynowego do odnajdywania podstawowej struktury w zbiorze danych. Pracę z poszczególnymi zagadnieniami ułatwia to, że zostały one zilustrowane prostymi, ale praktycznymi przykładami. W książce: importowanie i eksportowanie danych, przygotowywanie ich zbiorów tworzenie wykresów za pomocą bibliotek matplotlib, seaborn i Pandas konwersja typów danych skalowanie operacji przetwarzania danych zaawansowane możliwości biblioteki Pandas powiązane z datami i czasem dopasowywanie modeli liniowych przy użyciu bibliotek statsmodels i scikit-learn Analizuj zbiory danych i odkrywaj ukrytą w nich wiedzę!
Java: Data Science Made Easy. Data collection, processing, analysis, and more
Richard M. Reese, Jennifer L. Reese, Alexey...
Data science is concerned with extracting knowledge and insights from a wide variety of data sources to analyse patterns or predict future behaviour. It draws from a wide array of disciplines including statistics, computer science, mathematics, machine learning, and data mining. In this course, we cover the basic as well as advanced data science concepts and how they are implemented using the popular Java tools and libraries.The course starts with an introduction of data science, followed by the basic data science tasks of data collection, data cleaning, data analysis, and data visualization. This is followed by a discussion of statistical techniques and more advanced topics including machine learning, neural networks, and deep learning. You will examine the major categories of data analysis including text, visual, and audio data, followed by a discussion of resources that support parallel implementation. Throughout this course, the chapters will illustrate a challenging data science problem, and then go on to present a comprehensive, Java-based solution to tackle that problem. You will cover a wide range of topics – from classification and regression, to dimensionality reduction and clustering, deep learning and working with Big Data. Finally, you will see the different ways to deploy the model and evaluate it in production settings.By the end of this course, you will be up and running with various facets of data science using Java, in no time at all.This course contains premium content from two of our recently published popular titles:- Java for Data Science- Mastering Java for Data Science
Język SQL. Przyjazny podręcznik. Wydanie II
Larry Rockoff
Najlepsze relacyjne bazy danych, takie jak Oracle czy MS SQL Server, są nierozłącznie związane z językiem SQL. Język ten stworzono po to, aby budować i użytkować bazy przechowujące ogromne ilości danych. Bez wątpienia SQL jest dość złożony, obejmuje wiele elementów i funkcji, jednak jego znajomość jest niezwykle ważna dla każdego, kto zajmuje się bazami danych, tworzy je czy nimi administruje. Również te osoby, które korzystają z narzędzi do raportowania w bazach danych, powinny przynajmniej dobrze zrozumieć podstawy tego języka. Niniejsza książka jest kolejnym wydaniem popularnego podręcznika, dzięki któremu zrozumiesz SQL, jego składnię i najważniejsze aspekty wykorzystywania. Poszczególne tematy zorganizowano w intuicyjny sposób, przedstawiając je w logicznej kolejności. Przykłady zastosowania języka dobrano tak, aby za pomocą małej próbki kodu umożliwić zrozumienie danej instrukcji SQL. W tym wydaniu zaktualizowano informacje o składni SQL stosowanej w Microsoft SQL Server 2016, MySQL 5.7 i Oracle 12c. Uzupełniono zagadnienia dotyczące logiki warunkowej, a także przedstawiono kilka nowych tematów, takich jak wspólne wyrażenia tablicowe czy wstawianie komentarzy do zapytań. Najważniejsze zagadnienia ujęte w książce: podstawowe informacje o relacyjnych bazach danych, składnia instrukcji SELECT i jej możliwości, agregacje danych i sum częściowych, stosowanie złączeń, podzapytań, widoków i logiki zbiorów, procedury składowane, aktualizacja danych i utrzymanie bazy, projektowanie baz danych i sposoby prezentacji danych. Poznaj SQL, a zrozumiesz bazy danych! Larry Rockoff jest ekspertem w dziedzinie języka SQL i analityki biznesowej. Specjalizuje się w stosowaniu narzędzi do raportowania w celu analizy danych znajdujących się w złożonych bazach danych. Ukończył studia MBA na Uniwersytecie Chicago. Jest autorem książek poświęconych językowi SQL i zastosowaniu oprogramowania Microsoft Access i Excel. Obecnie odpowiada za rozwój hurtowni danych oraz aplikacji służących do raportowania dla największej sieci aptek w USA.
Język SQL. Przyjazny podręcznik. Wydanie III
Larry Rockoff
SQL stanowi podstawowe narzędzie komunikowania się z relacyjnymi bazami danych. Jest to dość skomplikowany język o rozbudowanych możliwościach. Pozwala na pobieranie z bazy zestawów danych wyszukiwanych na podstawie wyrafinowanych kryteriów. Umożliwia też modyfikację zarówno danych, jak i struktury bazy, w której są gromadzone. To potężne narzędzie powinni znać nie tylko programiści baz danych, ale również specjaliści zajmujący się ich analizą, jednak zdobycie praktycznych umiejętności posługiwania się SQL często nastręcza trudności. To trzecie, poprawione i zaktualizowane wydanie praktycznego przewodnika po języku SQL i relacyjnych bazach danych. Przemyślana, uporządkowana struktura podręcznika sprzyja sprawnemu nabywaniu wiedzy i doskonaleniu umiejętności - pracę z nim ułatwiają przystępny sposób prezentowania materiału i czytelne, łatwe do zrozumienia przykłady kodu SQL. Bardzo przydatnym elementem książki są odniesienia do składni (dialektów SQL) stosowanych w trzech najpowszechniejszych bazach danych: Microsoft SQL Server 2019, MySQL 8.0 i Oracle 18c. W tym wydaniu pojawiło się szersze omówienie typowych zadań analitycznych, uzupełniono też informacje o zastosowaniu Excela do wizualnej prezentacji danych, opisano więcej przydatnych funkcji, a także zaktualizowano i ulepszono dodatkowe materiały edukacyjne. W książce między innymi: operacje na danych przy użyciu zapytań SQL funkcje i procedury składowane grupowanie i agregowanie danych projektowanie relacyjnych baz danych tworzenie zestawień danych przy użyciu arkuszy kalkulacyjnych praca z Microsoft SQL Server, MySQL i Oracle Chcesz się nauczyć SQL? Z tą książką zrobisz to bez problemu!
Anghel Leonard, Lukas Eder
jOOQ is an excellent query builder framework that allows you to emulate database-specific SQL statements using a fluent, intuitive, and flexible DSL API. jOOQ is fully capable of handling the most complex SQL in more than 30 different database dialects.jOOQ Masterclass covers jOOQ from beginner to expert level using examples (for MySQL, PostgreSQL, SQL Server, and Oracle) that show you how jOOQ is a mature and complete solution for implementing the persistence layer. You’ll learn how to use jOOQ in Spring Boot apps as a replacement for SpringTemplate and Spring Data JPA. Next, you’ll unleash jOOQ type-safe queries and CRUD operations via jOOQ’s records, converters, bindings, types, mappers, multi-tenancy, logging, and testing. Later, the book shows you how to use jOOQ to exploit powerful SQL features such as UDTs, embeddable types, embedded keys, and more. As you progress, you’ll cover trending topics such as identifiers, batching, lazy loading, pagination, and HTTP long conversations. For implementation purposes, the jOOQ examples explained in this book are written in the Spring Boot context for Maven/Gradle against MySQL, Postgres, SQL Server, and Oracle.By the end of this book, you’ll be a jOOQ power user capable of integrating jOOQ in the most modern and sophisticated apps including enterprise apps, microservices, and so on.
Julia for Data Science. high-performance computing simplified
Anshul Joshi
Julia is a fast and high performing language that's perfectly suited to data science with a mature package ecosystem and is now feature complete. It is a good tool for a data science practitioner. There was a famous post at Harvard Business Review that Data Scientist is the sexiest job of the 21st century. (https://hbr.org/2012/10/data-scientist-the-sexiest-job-of-the-21st-century).This book will help you get familiarised with Julia's rich ecosystem, which is continuously evolving, allowing you to stay on top of your game.This book contains the essentials of data science and gives a high-level overview of advanced statistics and techniques. You will dive in and will work on generating insights by performing inferential statistics, and will reveal hidden patterns and trends using data mining. This has the practical coverage of statistics and machine learning. You will develop knowledge to build statistical models and machine learning systems in Julia with attractive visualizations.You will then delve into the world of Deep learning in Julia and will understand the framework, Mocha.jl with which you can create artificial neural networks and implement deep learning.This book addresses the challenges of real-world data science problems, including data cleaning, data preparation, inferential statistics, statistical modeling, building high-performance machine learning systems and creating effective visualizations using Julia.
Krishna Shah
Unleash the full potential of Kibana—an indispensable tool for data analysts to seamlessly explore vast datasets, uncover key insights, identify trends and anomalies, and share results. This book guides you through its user-friendly interface, interactive visualizations, and robust features, including real-time data monitoring and advanced analytics, showing you how Kibana revolutionizes your approach to navigating and analyzing complex datasets.Starting with the foundational steps of installing, configuring, and running Kibana, this book progresses systematically to explain the search and data visualization capabilities for data stored in the Elasticsearch cluster. You’ll then delve into the practical details of creating data views and optimizing spaces to better organize the analysis environment. As you advance, you'll get to grips with using the discover interface and learn how to build different types of extensive visualizations using Lens.By the end of this book, you’ll have a complete understanding of how Kibana works, helping you leverage its capabilities to build an analytics and visualization solution from scratch for your data-driven use case.