Big data

769
Ładowanie...
EBOOK

Pentaho Data Integration Beginner's Guide. Get up and running with the Pentaho Data Integration tool using this hands-on, easy-to-read guide with this book and ebook - Second Edition

María Carina Roldán

Capturing, manipulating, cleansing, transferring, and loading data effectively are the prime requirements in every IT organization. Achieving these tasks require people devoted to developing extensive software programs, or investing in ETL or data integration tools that can simplify this work.Pentaho Data Integration is a full-featured open source ETL solution that allows you to meet these requirements. Pentaho Data Integration has an intuitive, graphical, drag-and-drop design environment and its ETL capabilities are powerful. However, getting started with Pentaho Data Integration can be difficult or confusing.Pentaho Data Integration Beginner's Guide - Second Edition provides the guidance needed to overcome that difficulty, covering all the possible key features of Pentaho Data Integration.Pentaho Data Integration Beginner's Guide - Second Edition starts with the installation of Pentaho Data Integration software and then moves on to cover all the key Pentaho Data Integration concepts. Each chapter introduces new features, allowing you to gradually get involved with the tool. First, you will learn to do all kinds of data manipulation and work with plain files. Then, the book gives you a primer on databases and teaches you how to work with databases inside Pentaho Data Integration. Moreover, you will be introduced to data warehouse concepts and you will learn how to load data in a data warehouse. After that, you will learn to implement simple and complex processes. Finally, you will have the opportunity of applying and reinforcing all the learned concepts through the implementation of a simple datamart.With Pentaho Data Integration Beginner's Guide - Second Edition, you will learn everything you need to know in order to meet your data manipulation requirements.

770
Ładowanie...
EBOOK

Pentaho Data Integration Quick Start Guide. Create ETL processes using Pentaho

María Carina Roldán

Pentaho Data Integration(PDI) is an intuitive and graphical environment packed with drag and drop design and powerful Extract-Transform-Load (ETL) capabilities. Given its power and flexibility, initial attempts to use the Pentaho Data Integration tool can be difficult or confusing. This book is the ideal solution.This book reduces your learning curve with PDI. It provides the guidance needed to make you productive, covering the main features of Pentaho Data Integration. It demonstrates the interactive features of the graphical designer, and takes you through the main ETL capabilities that the tool offers.By the end of the book, you will be able to use PDI for extracting, transforming, and loading the types of data you encounter on a daily basis.

771
Ładowanie...
EBOOK

Pierwsze kroki w Power BI. Kompletny przewodnik po praktycznej analityce biznesowej. Wydanie II

Greg Deckler

Dzisiejszy, dynamiczny świat biznesu wysoko ceni wartość informacji płynących z danych. Rozwiązania z obszaru analityki biznesowej ułatwiają kierownictwu przedsiębiorstwa podejmowanie najlepszych decyzji, a to z kolei przekłada się na sukces rynkowy i zyski. Analitycy danych, którzy potrafią przełożyć strumień danych na przydatne informacje, zaprezentowane za pomocą czytelnych raportów, są dziś wysoko cenieni w każdej organizacji dążącej do rozwoju. To drugie, w pełni zaktualizowane wydanie przewodnika dla początkujących, dzięki któremu szybko zdobędziesz praktyczne umiejętności korzystania z rozbudowanej platformy Power BI. Najpierw zapoznasz się z podstawami analityki biznesowej i sposobami realizowania projektów w tym obszarze. Nauczysz się krok po kroku pobierać, oczyszczać i przekształcać dane, a potem generować ich atrakcyjne wizualizacje. Szybko wprawisz się w tworzeniu eleganckich raportów zrozumiałych dla osób podejmujących decyzje biznesowe. Dowiesz się również, jak zainstalować platformę Power BI, zarządzać nią i wdrożyć ją w organizacji. Ponadto przekonasz się, jak ciekawe są ścieżki kariery dostępne dla specjalistów w tej dziedzinie, a także otrzymasz garść porad na temat dalszej nauki. Dzięki książce: płynnie rozpoczniesz pracę z platformą Power BI zrozumiesz zasady analityki biznesowej nauczysz się przekształcać dane za pomocą edytora Power Query zaczniesz tworzyć zoptymalizowane modele danych zastosujesz język DAX do obliczeń na potrzeby analizy danych dowiesz się, jak korzystać z pulpitów nawigacyjnych, aplikacji, metryk i kart wyników Z Power BI nauczysz się profesjonalnej analizy biznesowej!

773
Ładowanie...
EBOOK

Podręcznik architekta rozwiązań. Poznaj reguły oraz strategie projektu architektury i rozpocznij niezwykłą karierę. Wydanie II

Saurabh Shrivastava, Neelanjali Srivastav

Usługi natywnej chmury pozwalają na uzyskiwanie imponującej wydajności i skalowalności przy niskim koszcie. Świadome tego przedsiębiorstwa poszukują architektów rozwiązań chmurowych, którzy spełniają wysokie wymagania. Taka osoba musi posiadać rozległą znajomość technologii i umiejętność wiązania tej wiedzy z wymaganiami biznesu w sposób zapewniający maksimum korzyści. Dzięki tej książce dowiesz się, jak tworzyć niezawodne, skalowalne i odporne rozwiązania, a także jak projektować systemy następnej generacji przeznaczone dla środowiska chmury. Poznasz efektywne strategie dla produktu i nauczysz się je w pełni implementować w swojej organizacji. Zrozumiesz też, w jaki sposób architekt rozwiązań wpisuje się w środowisko elastycznie działającej firmy. W tym wydaniu pojawiły się również nowe rozdziały, poświęcone takim technologiom jak internet rzeczy, obliczenia kwantowe, inżynieria danych i uczenie maszynowe. Znajdziesz tu uaktualnione informacje dotyczące architektury natywnej chmury i magazynu danych łańcucha bloków. W efekcie lektury nauczysz się tworzyć projekty efektywnych rozwiązań, spełniających zdefiniowane wymagania biznesowe. Najciekawsze zagadnienia: zadania architekta rozwiązań w korporacji implementacja reguł i wzorców projektowych strategie zabezpieczania architektury modernizacja starych aplikacji za pomocą chmury big data, uczenie maszynowe, IoT i obliczenia kwantowe w nowoczesnej architekturze Jeśli chcesz mieć łatwe życie, nie zostawaj architektem. Zaha Hadid, wielokrotnie nagradzana architektka

774
Ładowanie...
EBOOK

Podstawy wizualizacji danych. Zasady tworzenia atrakcyjnych wykresów

Claus O. Wilke

Aby skutecznie przekazać wiedzę płynącą z zebranych danych, szczególnie w przypadku nauk przyrodniczych, ekonomicznych i społecznych, warto sięgnąć po narzędzia do wizualizacji. Nie jest to trywialne zadanie: często trzeba korzystać z coraz większych i coraz bardziej złożonych zbiorów danych, a dostępne narzędzia do wizualizacji zapewniają oszałamiający wybór rozwiązań i opcji, w których łatwo się pogubić. Co więcej, podczas przygotowywania prezentacji należy wziąć pod uwagę szczególne właściwości ludzkiego umysłu w zakresie postrzegania i przyswajania informacji. Efektywna wizualizacja danych jest bardzo istotną sprawą: nierzadko od jakości przekazywanych w ten sposób informacji zależy trafność podejmowanych decyzji. Ten poradnik pomoże Ci uniknąć często spotykanych problemów z wizualizacją danych. Zawiera wskazówki, dzięki którym szybko zaczniesz tworzyć świetnie wyglądające i bogate w treść wykresy. Nauczysz się bezbłędnego dobierania najlepszego w danej sytuacji sposobu wizualizacji, poznasz reguły stosowania kolorów, wielkości i rodzaju czcionki, zachowywania odpowiednich proporcji poszczególnych części wykresu — i przekonasz się, że dobrymi decyzjami co do jego estetyki możesz zapewnić mu przejrzystość i elegancję. Znajdziesz tu również obszerny katalog wizualizacji, co ułatwi zapoznanie się z powszechnie używanymi metodami wizualizowania danych. Ważną częścią książki jest zestaw przykładów dobrze i źle przygotowanych wykresów z wyczerpującymi wyjaśnieniami. Najciekawsze koncepcje opisane w książce: kolor jako cenne narzędzie wyróżniania danych dostarczanie kluczowych informacji na wiele sposobów dobór technik wizualizacji do różnych rodzajów danych reguły pomocne w projektowaniu estetycznych wykresów technika stosowania wykresów w większym dokumencie A więc jak wygląda wykres, który decyduje o sukcesie prezentacji?

775
Ładowanie...
EBOOK

Polars Cookbook. Over 60 practical recipes to transform, manipulate, and analyze your data using Python Polars 1.x

Yuki Kakegawa, Marco Gorelli

The Polars Cookbook is a comprehensive, hands-on guide to Python Polars, one of the first resources dedicated to this powerful data processing library. Written by Yuki Kakegawa, a seasoned data analytics consultant who has worked with industry leaders like Microsoft and Stanford Health Care, this book offers targeted, real-world solutions to data processing, manipulation, and analysis challenges. The book also includes a foreword by Marco Gorelli, a core contributor to Polars, ensuring expert insights into Polars' applications. From installation to advanced data operations, you’ll be guided through data manipulation, advanced querying, and performance optimization techniques. You’ll learn to work with large datasets, conduct sophisticated transformations, leverage powerful features like chaining, and understand its caveats. This book also shows you how to integrate Polars with other Python libraries such as pandas, numpy, and PyArrow, and explore deployment strategies for both on-premises and cloud environments like AWS, BigQuery, GCS, Snowflake, and S3. With use cases spanning data engineering, time series analysis, statistical analysis, and machine learning, Polars Cookbook provides essential techniques for optimizing and securing your workflows. By the end of this book, you'll possess the skills to design scalable, efficient, and reliable data processing solutions with Polars.

776
Ładowanie...
EBOOK

PostgreSQL 11 Server Side Programming Quick Start Guide. Effective database programming and interaction

Luca Ferrari

PostgreSQL is a rock-solid, scalable, and safe enterprise-level relational database. With a broad range of features and stability, it is ever increasing in popularity.This book shows you how to take advantage of PostgreSQL 11 features for server-side programming. Server-side programming enables strong data encapsulation and coherence.The book begins with the importance of server-side programming and explains the risks of leaving all the checks outside the database. To build your capabilities further, you will learn how to write stored procedures, both functions and the new PostgreSQL 11 procedures, and create triggers to perform encapsulation and maintain data consistency.You will also learn how to produce extensions, the easiest way to package your programs for easy and solid deployment on different PostgreSQL installations.