Bazy danych

121
Ładowanie...
EBOOK

Inżynieria danych w praktyce. Kluczowe koncepcje i najlepsze technologie

Joe Reis, Matt Housley

Ze względu na gwałtowny rozwój inżynierii danych, jaki nastąpił w ciągu ostatniej dekady, wielu inżynierów oprogramowania, badaczy i analityków danych zaczęło odczuwać potrzebę kompleksowego spojrzenia na tę praktykę. Dzięki tej praktycznej książce zawierającej opis najlepszych technologii dostępnych w ramach frameworka cyklu życia inżynierii danych, dowiesz się, jak planować i budować systemy, które mają zaspokoić potrzeby Twojej organizacji i klientów. Autorzy, Joe Reis i Matt Housley, przeprowadzą Cię przez cykl życia inżynierii danych i pokażą, jak połączyć różne technologie chmurowe, aby spełnić potrzeby konsumentów danych w dolnej części strumienia przetwarzania. Dzięki lekturze tej książki dowiesz się, jak zastosować koncepcje generowania, pozyskiwania, orkiestracji, przekształcania, przechowywania i zarządzania danymi - kluczowe w każdym środowisku danych, niezależnie od wykorzystywanej technologii. Dzięki książce: Uzyskasz zwięzły przegląd całego środowiska inżynierii danych. Nauczysz się oceniać problemy inżynierii danych i stosować kompleksowe frameworki najlepszych praktyk. Dowiesz się jak przebić się przez szum marketingowy i wybrać odpowiednie technologie, architekturę danych i procesy? Nauczysz się wykorzystywać cykl życia inżynierii danych do zaprojektowania i zbudowania solidnej architektury. Poznasz mechanizmy zarządzania danymi i bezpieczeństwa w całym cyklu życia inżynierii danych. "Świat danych ewoluuje już od jakiegoś czasu. Najpierw byli projektanci. Następnie administratorzy baz danych. Potem CIO. Następnie architekci danych. Ta książka sygnalizuje kolejny krok w ewolucji i dojrzałości branży. Jest to lektura obowiązkowa dla każdego, kto uczciwie podchodzi do swojego zawodu i kariery". Bill Inmon, twórca hurtowni danych "Inżynieria danych w praktyce" to świetne wprowadzenie do branży przenoszenia, przetwarzania i obsługi danych. Gorąco polecam ją każdemu, kto chce być na bieżąco z inżynierią danych lub analizą oraz wszystkim osobom zajmującym się danymi, którzy chcą uzupełnić luki w swojej wiedzy". Jordan Tigani, założyciel i dyrektor generalny firmy MotherDuck oraz inżynier-założyciel i współtwórca firmy BigQuery

122
Ładowanie...
EBOOK

Inżynieria niezawodnych baz danych. Projektowanie systemów odpornych na błędy

Laine Campbell, Charity Majors

Informatyczna rewolucja dosięgła również systemy bazodanowe. Przez długi czas administrator bazy danych interesował się głównie wewnętrznymi mechanizmami bazy, optymalizacją zapytań czy analizą podsystemów składowania danych. Z kolei oprogramowaniem stron, infrastrukturą czy usługami sieciowymi zajmowali się zupełnie inni ludzie, pracujący w odmienny sposób. Nowe technologie wymuszają jednak zmianę sposobu pracy i myślenia. Trzeba położyć nacisk na automatyzację, inżynierię oprogramowania, ciągłą integrację i ciągłe udostępnianie. Poza tym trzeba zapewnić ochronę przetwarzanych danych - ich wartość i znaczenie wciąż szybko rosną. W tej praktycznej książce dokładnie wyjaśniono współczesne podejście do tworzenia architektury baz danych i ich eksploatacji. Jeśli chcesz stać się znakomitym inżynierem niezawodności baz danych, czyli DBRE (z Database Reliability Engineer), znajdziesz tu schemat zasad i praktyk projektowania, budowania i eksploatacji magazynów danych zgodnie z paradygmatami inżynierii niezawodności i kultury DevOps. Zapoznasz się z podstawowymi zagadnieniami z obszaru eksploatacji, z metodami utrwalania baz danych, nauczysz się stosować najważniejsze technologie skalowalnego i wydajnego składowania oraz pobierania danych z zachowaniem odporności na błędy. Dzięki temu szybko i skutecznie zajmiesz się architekturą i eksploatacją każdej nowoczesnej bazy. W książce między innymi: wprowadzenie do inżynierii niezawodności baz danych inżynieria infrastruktury i zarządzanie nią oceny ryzyka i strategie zarządzania bezpieczeństwem danych metody przechowywania, indeksowania i replikacji danych popularne wzorce architektoniczne rozproszonych baz danych praktyczne wykorzystanie zasad inżynierii niezawodności w organizacji Stań się znakomitym inżynierem niezawodności! Laine Campbell od 18 lat zajmuje się środowiskami produkcyjnymi baz danych i systemów rozproszonych o dużej skali. Obecnie jest starszym dyrektorem ds. inżynierii środowisk produkcyjnych w firmie Fastly. Charity Majors jest CEO i założycielką firmy honeycomb.io. Wcześniej zajmowała się eksploatacją należącej do Facebooka platformy Parse, gdzie zarządzała rozbudowanym zestawem replik baz MongoDB, a także bazami Redis, Cassandra i MySQL.

123
Ładowanie...
EBOOK

Jak analizować dane z biblioteką Pandas. Praktyczne wprowadzenie. Wydanie II

Daniel Y. Chen

Wprawny analityk potrafi się posługiwać zbiorami danych o wysokiej dynamice i różnorodności. Działanie to ułatwia biblioteka open source Pandas, która pozwala, przy użyciu języka Python, zrealizować niemal każde zadanie wymagające analizy danych. Pandas może pomóc w zapewnieniu wiarygodności danych, wizualizowaniu ich pod kątem efektywnego podejmowania decyzji i analizowaniu wielu zbiorów danych. Oto drugie, zaktualizowane i uzupełnione wydanie przewodnika po bibliotece Pandas. Dzięki tej przystępnej książce nauczysz się w pełni korzystać z możliwości oferowanych przez bibliotekę, nawet jeśli dopiero zaczynasz przygodę z analizą danych w Pythonie. Naukę rozpoczniesz z użyciem rzeczywistego zbioru danych, aby wkrótce rozwiązywać złożone problemy danologii, takie jak obsługa brakujących danych, stosowanie regularyzacji czy też używanie metod nienadzorowanego uczenia maszynowego do odnajdywania podstawowej struktury w zbiorze danych. Pracę z poszczególnymi zagadnieniami ułatwia to, że zostały one zilustrowane prostymi, ale praktycznymi przykładami. W książce: importowanie i eksportowanie danych, przygotowywanie ich zbiorów tworzenie wykresów za pomocą bibliotek matplotlib, seaborn i Pandas konwersja typów danych skalowanie operacji przetwarzania danych zaawansowane możliwości biblioteki Pandas powiązane z datami i czasem dopasowywanie modeli liniowych przy użyciu bibliotek statsmodels i scikit-learn Analizuj zbiory danych i odkrywaj ukrytą w nich wiedzę!

124
Ładowanie...
EBOOK

Java: Data Science Made Easy. Data collection, processing, analysis, and more

Richard M. Reese, Jennifer L. Reese, Alexey...

Data science is concerned with extracting knowledge and insights from a wide variety of data sources to analyse patterns or predict future behaviour. It draws from a wide array of disciplines including statistics, computer science, mathematics, machine learning, and data mining. In this course, we cover the basic as well as advanced data science concepts and how they are implemented using the popular Java tools and libraries.The course starts with an introduction of data science, followed by the basic data science tasks of data collection, data cleaning, data analysis, and data visualization. This is followed by a discussion of statistical techniques and more advanced topics including machine learning, neural networks, and deep learning. You will examine the major categories of data analysis including text, visual, and audio data, followed by a discussion of resources that support parallel implementation. Throughout this course, the chapters will illustrate a challenging data science problem, and then go on to present a comprehensive, Java-based solution to tackle that problem. You will cover a wide range of topics – from classification and regression, to dimensionality reduction and clustering, deep learning and working with Big Data. Finally, you will see the different ways to deploy the model and evaluate it in production settings.By the end of this course, you will be up and running with various facets of data science using Java, in no time at all.This course contains premium content from two of our recently published popular titles:- Java for Data Science- Mastering Java for Data Science

125
Ładowanie...
EBOOK

Język SQL. Przyjazny podręcznik. Wydanie II

Larry Rockoff

Najlepsze relacyjne bazy danych, takie jak Oracle czy MS SQL Server, są nierozłącznie związane z językiem SQL. Język ten stworzono po to, aby budować i użytkować bazy przechowujące ogromne ilości danych. Bez wątpienia SQL jest dość złożony, obejmuje wiele elementów i funkcji, jednak jego znajomość jest niezwykle ważna dla każdego, kto zajmuje się bazami danych, tworzy je czy nimi administruje. Również te osoby, które korzystają z narzędzi do raportowania w bazach danych, powinny przynajmniej dobrze zrozumieć podstawy tego języka. Niniejsza książka jest kolejnym wydaniem popularnego podręcznika, dzięki któremu zrozumiesz SQL, jego składnię i najważniejsze aspekty wykorzystywania. Poszczególne tematy zorganizowano w intuicyjny sposób, przedstawiając je w logicznej kolejności. Przykłady zastosowania języka dobrano tak, aby za pomocą małej próbki kodu umożliwić zrozumienie danej instrukcji SQL. W tym wydaniu zaktualizowano informacje o składni SQL stosowanej w Microsoft SQL Server 2016, MySQL 5.7 i Oracle 12c. Uzupełniono zagadnienia dotyczące logiki warunkowej, a także przedstawiono kilka nowych tematów, takich jak wspólne wyrażenia tablicowe czy wstawianie komentarzy do zapytań. Najważniejsze zagadnienia ujęte w książce: podstawowe informacje o relacyjnych bazach danych, składnia instrukcji SELECT i jej możliwości, agregacje danych i sum częściowych, stosowanie złączeń, podzapytań, widoków i logiki zbiorów, procedury składowane, aktualizacja danych i utrzymanie bazy, projektowanie baz danych i sposoby prezentacji danych. Poznaj SQL, a zrozumiesz bazy danych! Larry Rockoff jest ekspertem w dziedzinie języka SQL i analityki biznesowej. Specjalizuje się w stosowaniu narzędzi do raportowania w celu analizy danych znajdujących się w złożonych bazach danych. Ukończył studia MBA na Uniwersytecie Chicago. Jest autorem książek poświęconych językowi SQL i zastosowaniu oprogramowania Microsoft Access i Excel. Obecnie odpowiada za rozwój hurtowni danych oraz aplikacji służących do raportowania dla największej sieci aptek w USA.  

126
Ładowanie...
EBOOK

Język SQL. Przyjazny podręcznik. Wydanie III

Larry Rockoff

SQL stanowi podstawowe narzędzie komunikowania się z relacyjnymi bazami danych. Jest to dość skomplikowany język o rozbudowanych możliwościach. Pozwala na pobieranie z bazy zestawów danych wyszukiwanych na podstawie wyrafinowanych kryteriów. Umożliwia też modyfikację zarówno danych, jak i struktury bazy, w której są gromadzone. To potężne narzędzie powinni znać nie tylko programiści baz danych, ale również specjaliści zajmujący się ich analizą, jednak zdobycie praktycznych umiejętności posługiwania się SQL często nastręcza trudności. To trzecie, poprawione i zaktualizowane wydanie praktycznego przewodnika po języku SQL i relacyjnych bazach danych. Przemyślana, uporządkowana struktura podręcznika sprzyja sprawnemu nabywaniu wiedzy i doskonaleniu umiejętności - pracę z nim ułatwiają przystępny sposób prezentowania materiału i czytelne, łatwe do zrozumienia przykłady kodu SQL. Bardzo przydatnym elementem książki są odniesienia do składni (dialektów SQL) stosowanych w trzech najpowszechniejszych bazach danych: Microsoft SQL Server 2019, MySQL 8.0 i Oracle 18c. W tym wydaniu pojawiło się szersze omówienie typowych zadań analitycznych, uzupełniono też informacje o zastosowaniu Excela do wizualnej prezentacji danych, opisano więcej przydatnych funkcji, a także zaktualizowano i ulepszono dodatkowe materiały edukacyjne. W książce między innymi: operacje na danych przy użyciu zapytań SQL funkcje i procedury składowane grupowanie i agregowanie danych projektowanie relacyjnych baz danych tworzenie zestawień danych przy użyciu arkuszy kalkulacyjnych praca z Microsoft SQL Server, MySQL i Oracle Chcesz się nauczyć SQL? Z tą książką zrobisz to bez problemu!

127
Ładowanie...
EBOOK

jOOQ Masterclass. A practical guide for Java developers to write SQL queries for complex database interactions

Anghel Leonard

jOOQ is an excellent query builder framework that allows you to emulate database-specific SQL statements using a fluent, intuitive, and flexible DSL API. jOOQ is fully capable of handling the most complex SQL in more than 30 different database dialects.jOOQ Masterclass covers jOOQ from beginner to expert level using examples (for MySQL, PostgreSQL, SQL Server, and Oracle) that show you how jOOQ is a mature and complete solution for implementing the persistence layer. You’ll learn how to use jOOQ in Spring Boot apps as a replacement for SpringTemplate and Spring Data JPA. Next, you’ll unleash jOOQ type-safe queries and CRUD operations via jOOQ’s records, converters, bindings, types, mappers, multi-tenancy, logging, and testing. Later, the book shows you how to use jOOQ to exploit powerful SQL features such as UDTs, embeddable types, embedded keys, and more. As you progress, you’ll cover trending topics such as identifiers, batching, lazy loading, pagination, and HTTP long conversations. For implementation purposes, the jOOQ examples explained in this book are written in the Spring Boot context for Maven/Gradle against MySQL, Postgres, SQL Server, and Oracle.By the end of this book, you’ll be a jOOQ power user capable of integrating jOOQ in the most modern and sophisticated apps including enterprise apps, microservices, and so on.

128
Ładowanie...
EBOOK

Julia for Data Science. high-performance computing simplified

Anshul Joshi

Julia is a fast and high performing language that's perfectly suited to data science with a mature package ecosystem and is now feature complete. It is a good tool for a data science practitioner. There was a famous post at Harvard Business Review that Data Scientist is the sexiest job of the 21st century. (https://hbr.org/2012/10/data-scientist-the-sexiest-job-of-the-21st-century).This book will help you get familiarised with Julia's rich ecosystem, which is continuously evolving, allowing you to stay on top of your game.This book contains the essentials of data science and gives a high-level overview of advanced statistics and techniques. You will dive in and will work on generating insights by performing inferential statistics, and will reveal hidden patterns and trends using data mining. This has the practical coverage of statistics and machine learning. You will develop knowledge to build statistical models and machine learning systems in Julia with attractive visualizations.You will then delve into the world of Deep learning in Julia and will understand the framework, Mocha.jl with which you can create artificial neural networks and implement deep learning.This book addresses the challenges of real-world data science problems, including data cleaning, data preparation, inferential statistics, statistical modeling, building high-performance machine learning systems and creating effective visualizations using Julia.