Big data
William Ayd, Matthew Harrison, Wes McKinney
Unlock the full power of pandas 2.x with this hands-on cookbook, designed for Python developers, data analysts, and data scientists who need fast, efficient solutions for real-world data challenges. This book provides practical, ready-to-use recipes to streamline your workflow. With step-by-step guidance, you'll master data wrangling, visualization, performance optimization, and scalable data analysis using pandas’ most powerful features. From importing and merging large datasets to advanced time series analysis and SQL-like operations, this cookbook equips you with the tools to analyze, manipulate, and visualize data like a pro. Learn how to boost efficiency, optimize memory usage, and seamlessly integrate pandas with NumPy, PyArrow, and databases. This book will help you transform raw data into actionable insights with ease.*Email sign-up and proof of purchase required
Theodore Petrou
This book will provide you with unique, idiomatic, and fun recipes for both fundamental and advanced data manipulation tasks with pandas 0.20. Some recipes focus on achieving a deeper understanding of basic principles, or comparing and contrasting two similar operations. Other recipes will dive deep into a particular dataset, uncovering new and unexpected insights along the way.The pandas library is massive, and it's common for frequent users to be unaware of many of its more impressive features. The official pandas documentation, while thorough, does not contain many useful examples of how to piece together multiple commands like one would do during an actual analysis. This book guides you, as if you were looking over the shoulder of an expert, through practical situations that you are highly likely to encounter.Many advanced recipes combine several different features across the pandas 0.20 library to generate results.
Francesco Corti
This hands-on tutorial, filled with exercises and examples, introduces the reader to a variety of concepts within Pentaho Reporting. With screenshots that show you how reports look at design time as well as how they should look when rendered as PDF, Excel, HTML, Text, Rich-Text-File, XML, and CSV, this book also contains complete example source code that you can copy and paste into your environment to get up-and-running quickly. Updated to cover the features of Pentaho 8, this book will teach you everything you need to know to build fast, efficient reports using Pentaho. If your interest lies in the technical details of creating reports and you want to see how to solve common reporting problems with a minimum of fuss, this is the book for you.
María Carina Roldán
Capturing, manipulating, cleansing, transferring, and loading data effectively are the prime requirements in every IT organization. Achieving these tasks require people devoted to developing extensive software programs, or investing in ETL or data integration tools that can simplify this work.Pentaho Data Integration is a full-featured open source ETL solution that allows you to meet these requirements. Pentaho Data Integration has an intuitive, graphical, drag-and-drop design environment and its ETL capabilities are powerful. However, getting started with Pentaho Data Integration can be difficult or confusing.Pentaho Data Integration Beginner's Guide - Second Edition provides the guidance needed to overcome that difficulty, covering all the possible key features of Pentaho Data Integration.Pentaho Data Integration Beginner's Guide - Second Edition starts with the installation of Pentaho Data Integration software and then moves on to cover all the key Pentaho Data Integration concepts. Each chapter introduces new features, allowing you to gradually get involved with the tool. First, you will learn to do all kinds of data manipulation and work with plain files. Then, the book gives you a primer on databases and teaches you how to work with databases inside Pentaho Data Integration. Moreover, you will be introduced to data warehouse concepts and you will learn how to load data in a data warehouse. After that, you will learn to implement simple and complex processes. Finally, you will have the opportunity of applying and reinforcing all the learned concepts through the implementation of a simple datamart.With Pentaho Data Integration Beginner's Guide - Second Edition, you will learn everything you need to know in order to meet your data manipulation requirements.
Pentaho Data Integration Quick Start Guide. Create ETL processes using Pentaho
María Carina Roldán
Pentaho Data Integration(PDI) is an intuitive and graphical environment packed with drag and drop design and powerful Extract-Transform-Load (ETL) capabilities. Given its power and flexibility, initial attempts to use the Pentaho Data Integration tool can be difficult or confusing. This book is the ideal solution.This book reduces your learning curve with PDI. It provides the guidance needed to make you productive, covering the main features of Pentaho Data Integration. It demonstrates the interactive features of the graphical designer, and takes you through the main ETL capabilities that the tool offers.By the end of the book, you will be able to use PDI for extracting, transforming, and loading the types of data you encounter on a daily basis.
Pierwsze kroki w Power BI. Kompletny przewodnik po praktycznej analityce biznesowej. Wydanie II
Greg Deckler
Dzisiejszy, dynamiczny świat biznesu wysoko ceni wartość informacji płynących z danych. Rozwiązania z obszaru analityki biznesowej ułatwiają kierownictwu przedsiębiorstwa podejmowanie najlepszych decyzji, a to z kolei przekłada się na sukces rynkowy i zyski. Analitycy danych, którzy potrafią przełożyć strumień danych na przydatne informacje, zaprezentowane za pomocą czytelnych raportów, są dziś wysoko cenieni w każdej organizacji dążącej do rozwoju. To drugie, w pełni zaktualizowane wydanie przewodnika dla początkujących, dzięki któremu szybko zdobędziesz praktyczne umiejętności korzystania z rozbudowanej platformy Power BI. Najpierw zapoznasz się z podstawami analityki biznesowej i sposobami realizowania projektów w tym obszarze. Nauczysz się krok po kroku pobierać, oczyszczać i przekształcać dane, a potem generować ich atrakcyjne wizualizacje. Szybko wprawisz się w tworzeniu eleganckich raportów zrozumiałych dla osób podejmujących decyzje biznesowe. Dowiesz się również, jak zainstalować platformę Power BI, zarządzać nią i wdrożyć ją w organizacji. Ponadto przekonasz się, jak ciekawe są ścieżki kariery dostępne dla specjalistów w tej dziedzinie, a także otrzymasz garść porad na temat dalszej nauki. Dzięki książce: płynnie rozpoczniesz pracę z platformą Power BI zrozumiesz zasady analityki biznesowej nauczysz się przekształcać dane za pomocą edytora Power Query zaczniesz tworzyć zoptymalizowane modele danych zastosujesz język DAX do obliczeń na potrzeby analizy danych dowiesz się, jak korzystać z pulpitów nawigacyjnych, aplikacji, metryk i kart wyników Z Power BI nauczysz się profesjonalnej analizy biznesowej!
Saurabh Shrivastava, Neelanjali Srivastav
Usługi natywnej chmury pozwalają na uzyskiwanie imponującej wydajności i skalowalności przy niskim koszcie. Świadome tego przedsiębiorstwa poszukują architektów rozwiązań chmurowych, którzy spełniają wysokie wymagania. Taka osoba musi posiadać rozległą znajomość technologii i umiejętność wiązania tej wiedzy z wymaganiami biznesu w sposób zapewniający maksimum korzyści. Dzięki tej książce dowiesz się, jak tworzyć niezawodne, skalowalne i odporne rozwiązania, a także jak projektować systemy następnej generacji przeznaczone dla środowiska chmury. Poznasz efektywne strategie dla produktu i nauczysz się je w pełni implementować w swojej organizacji. Zrozumiesz też, w jaki sposób architekt rozwiązań wpisuje się w środowisko elastycznie działającej firmy. W tym wydaniu pojawiły się również nowe rozdziały, poświęcone takim technologiom jak internet rzeczy, obliczenia kwantowe, inżynieria danych i uczenie maszynowe. Znajdziesz tu uaktualnione informacje dotyczące architektury natywnej chmury i magazynu danych łańcucha bloków. W efekcie lektury nauczysz się tworzyć projekty efektywnych rozwiązań, spełniających zdefiniowane wymagania biznesowe. Najciekawsze zagadnienia: zadania architekta rozwiązań w korporacji implementacja reguł i wzorców projektowych strategie zabezpieczania architektury modernizacja starych aplikacji za pomocą chmury big data, uczenie maszynowe, IoT i obliczenia kwantowe w nowoczesnej architekturze Jeśli chcesz mieć łatwe życie, nie zostawaj architektem. Zaha Hadid, wielokrotnie nagradzana architektka
Podstawy wizualizacji danych. Zasady tworzenia atrakcyjnych wykresów
Claus O. Wilke
Aby skutecznie przekazać wiedzę płynącą z zebranych danych, szczególnie w przypadku nauk przyrodniczych, ekonomicznych i społecznych, warto sięgnąć po narzędzia do wizualizacji. Nie jest to trywialne zadanie: często trzeba korzystać z coraz większych i coraz bardziej złożonych zbiorów danych, a dostępne narzędzia do wizualizacji zapewniają oszałamiający wybór rozwiązań i opcji, w których łatwo się pogubić. Co więcej, podczas przygotowywania prezentacji należy wziąć pod uwagę szczególne właściwości ludzkiego umysłu w zakresie postrzegania i przyswajania informacji. Efektywna wizualizacja danych jest bardzo istotną sprawą: nierzadko od jakości przekazywanych w ten sposób informacji zależy trafność podejmowanych decyzji. Ten poradnik pomoże Ci uniknąć często spotykanych problemów z wizualizacją danych. Zawiera wskazówki, dzięki którym szybko zaczniesz tworzyć świetnie wyglądające i bogate w treść wykresy. Nauczysz się bezbłędnego dobierania najlepszego w danej sytuacji sposobu wizualizacji, poznasz reguły stosowania kolorów, wielkości i rodzaju czcionki, zachowywania odpowiednich proporcji poszczególnych części wykresu — i przekonasz się, że dobrymi decyzjami co do jego estetyki możesz zapewnić mu przejrzystość i elegancję. Znajdziesz tu również obszerny katalog wizualizacji, co ułatwi zapoznanie się z powszechnie używanymi metodami wizualizowania danych. Ważną częścią książki jest zestaw przykładów dobrze i źle przygotowanych wykresów z wyczerpującymi wyjaśnieniami. Najciekawsze koncepcje opisane w książce: kolor jako cenne narzędzie wyróżniania danych dostarczanie kluczowych informacji na wiele sposobów dobór technik wizualizacji do różnych rodzajów danych reguły pomocne w projektowaniu estetycznych wykresów technika stosowania wykresów w większym dokumencie A więc jak wygląda wykres, który decyduje o sukcesie prezentacji?
Yuki Kakegawa, Marco Gorelli
The Polars Cookbook is a comprehensive, hands-on guide to Python Polars, one of the first resources dedicated to this powerful data processing library. Written by Yuki Kakegawa, a seasoned data analytics consultant who has worked with industry leaders like Microsoft and Stanford Health Care, this book offers targeted, real-world solutions to data processing, manipulation, and analysis challenges. The book also includes a foreword by Marco Gorelli, a core contributor to Polars, ensuring expert insights into Polars' applications. From installation to advanced data operations, you’ll be guided through data manipulation, advanced querying, and performance optimization techniques. You’ll learn to work with large datasets, conduct sophisticated transformations, leverage powerful features like chaining, and understand its caveats. This book also shows you how to integrate Polars with other Python libraries such as pandas, numpy, and PyArrow, and explore deployment strategies for both on-premises and cloud environments like AWS, BigQuery, GCS, Snowflake, and S3. With use cases spanning data engineering, time series analysis, statistical analysis, and machine learning, Polars Cookbook provides essential techniques for optimizing and securing your workflows. By the end of this book, you'll possess the skills to design scalable, efficient, and reliable data processing solutions with Polars.
Luca Ferrari
PostgreSQL is a rock-solid, scalable, and safe enterprise-level relational database. With a broad range of features and stability, it is ever increasing in popularity.This book shows you how to take advantage of PostgreSQL 11 features for server-side programming. Server-side programming enables strong data encapsulation and coherence.The book begins with the importance of server-side programming and explains the risks of leaving all the checks outside the database. To build your capabilities further, you will learn how to write stored procedures, both functions and the new PostgreSQL 11 procedures, and create triggers to perform encapsulation and maintain data consistency.You will also learn how to produce extensions, the easiest way to package your programs for easy and solid deployment on different PostgreSQL installations.
Chitij Chauhan, Dinesh Kumar
PostgreSQL is one of the most powerful and easy to use database management systems. It has strong support from the community and is being actively developed with a new release every year. PostgreSQL supports the most advanced features included in SQL standards. It also provides NoSQL capabilities and very rich data types and extensions. All of this makes PostgreSQL a very attractive solution in software systems.If you run a database, you want it to perform well and you want to be able to secure it. As the world’s most advanced open source database, PostgreSQL has unique built-in ways to achieve these goals. This book will show you a multitude of ways to enhance your database’s performance and give you insights into measuring and optimizing a PostgreSQL database to achieve better performance. This book is your one-stop guide to elevate your PostgreSQL knowledge to the next level. First, you’ll get familiarized with essential developer/administrator concepts such as load balancing, connection pooling, and distributing connections to multiple nodes. Next, you will explore memory optimization techniques before exploring the security controls offered by PostgreSQL. Then, you will move on to the essential database/server monitoring and replication strategies with PostgreSQL. Finally, you will learn about query processing algorithms.
Potoki danych. Leksykon kieszonkowy. Przenoszenie i przetwarzanie danych na potrzeby ich analizy
James Densmore
Poprawnie zaprojektowane i wdrożone potoki danych mają kluczowe znaczenie dla pomyślnej analizy danych, a także w trakcie uczenia maszynowego. Pozyskanie ogromnych ilości danych z różnych źródeł najczęściej nie stanowi problemu. Nieco trudniejsze jest zaprojektowanie procesu ich przetwarzania w celu dostarczenia kontekstu w taki sposób, aby efektywnie korzystać z posiadanych danych w codziennej pracy organizacji i podejmować dzięki nim rozsądne decyzje. Oto zwięzły przewodnik przeznaczony dla inżynierów danych, którzy chcą poznać zasady implementacji potoków danych. Wyjaśnia najważniejsze pojęcia związane z potokami danych, opisuje zasady ich tworzenia i implementacji, prezentuje także najlepsze praktyki stosowane przez liderów w branży analizy danych. Dzięki książce zrozumiesz, w jaki sposób potoki danych działają na nowoczesnym stosie danych, poznasz też typowe zagadnienia, które trzeba przemyśleć przed podjęciem decyzji dotyczących implementacji. Dowiesz się, jakie są zalety samodzielnego opracowania rozwiązania, a jakie - zakupu gotowego produktu. Poznasz również podstawowe koncepcje, które mają zastosowanie dla frameworków typu open source, produktów komercyjnych i samodzielnie opracowywanych rozwiązań. Dowiedz się: czym jest potok danych i na czym polega jego działanie jak się odbywa przenoszenie i przetwarzanie danych w nowoczesnej infrastrukturze jakie narzędzia są szczególnie przydatne do tworzenia potoków danych jak używać potoków danych do analizy i tworzenia raportów jakie są najważniejsze aspekty obsługi potoków, ich testowania i rozwiązywania problemów Poznaj najlepsze praktyki projektowania i implementacji potoków danych!
Power BI for Finance. Design effective dashboards, models, and forecasts for finance teams
Martin Kratky
Martin Kratky brings his global experience of over 20 years as co-founder of Managility and creator of Acterys to empower CFOs and accountants with Power BI for Finance through this hands-on guide to streamlining and enhancing financial processes.Starting with the foundation of every effective BI solution, a well-designed data model, the book shows you how to structure star schemas and integrate common financial data sources like ERP and accounting systems. You’ll then learn to implement key financial logic using DAX and M, covering calendars, KPIs, and variance calculations. The book offers practical advice on creating clear and compliant financial reports, such as income statements, balance sheets, and cash flows with visual design and formatting best practices.With dedicated chapters on advanced workflows, you’ll learn how to handle multi-currency setups, perform group consolidations, and implement planning models like rolling forecasts, annual budgets, and sales and operations planning (S&OP). As you advance, you’ll gain insights from real-world case studies covering company valuations, Excel integration, and the use of write-back methods with Dynamics Business Performance Planning and Acterys. The concluding chapters highlight how AI and Copilot enhance financial analytics.*Email sign-up and proof of purchase required
Power BI i Power Pivot dla Excela. Analiza danych
Alberto Ferrari, Marco Russo
Profesjonalne modelowanie danych — pewny sukces w biznesie! Możliwości Excela są imponujące, a odkąd Microsoft udostępnił narzędzia w rodzaju Analysis Services, Power BI czy Power Pivot, arkusz ten stał się znakomitym narzędziem do analizy, modelowania oraz innych form przetwarzania dużych i złożonych zbiorów danych. Są to umiejętności, które przydadzą się w wielu dziedzinach życia, nie tylko w biznesie. Ich opanowanie nie jest zbyt trudne, a może stać się źródłem wielkiej radości i prawdziwej satysfakcji zwłaszcza dla każdego, kto lubi pracować z liczbami. Oczywiście osoby, które osiągną wysoki poziom umiejętności w tym zakresie, będą mogły liczyć na bardzo konkretne profity! Ta książka jest świetnym wprowadzeniem do modelowania danych w Excelu za pomocą narzędzi Power BI i Power Pivot. Dowiesz się z niej, jak optymalnie analizować zgromadzone dane i skutecznie wydobyć z nich potrzebne informacje. Zapoznasz się z ważnymi pojęciami i przyswoisz podstawowe techniki kształtowania modeli danych w Excelu i Power BI. Dzięki licznym praktycznym i przydatnym przykładom uzyskasz nową perspektywę — spojrzysz na zgromadzone dane okiem wytrawnego modelarza. Co więcej, szybko się przekonasz, że należyte zbudowanie modelu wcale nie jest trudne, a w efekcie przynosi prawidłowe odpowiedzi na wiele ważnych pytań! W tej książce między innymi: zasady i popularne techniki modelowania danych tabele faktów w złożonym modelu danych metody śledzenia atrybutów historycznych migawki i ich zastosowania analiza zdarzeń o określonym czasie trwania dobieranie rodzaju modelu do konkretnych pytań biznesowych Alberto Ferrari i Marco Russo od dwóch dekad zajmują się procesami business intelligence i Analysis Services. Obaj posiadają tytuły Microsoft MVP i SSAS Maestro. Często występują na prestiżowych konferencjach. Ferrari jest autorytetem w dziedzinie modelowania danych oraz usług analitycznych w dużych i złożonych hurtowniach danych, Russo specjalizuje się w analizie danych dla potrzeb wywiadu gospodarczego.
Power BI i sztuczna inteligencja. Jak w pełni wykorzystać funkcje AI dostępne w Power BI
Mary-Jo Diepeveen
Microsoft Power BI zdobył uznanie jako znakomite narzędzie do analizy i przetwarzania złożonych zbiorów danych, ale to nie koniec jego możliwości. Power BI nadaje się do wydobywania z modeli sztucznej inteligencji informacji, które mogą się stać wartościowym materiałem wspomagającym podejmowanie najlepszych decyzji biznesowych. Aby jednak w pełni skorzystać z funkcji dostępnych w Power BI, trzeba posiąść podstawową wiedzę o sztucznej inteligencji. Książka stanowi wprowadzenie do pracy z funkcjami SI dostępnymi w Power BI; jest skierowana do osób znających to środowisko. Dowiesz się z niej, w jaki sposób sztuczna inteligencja może być używana w Power BI i jakie funkcje są w nim domyślnie dostępne. Nauczysz się też eksplorować i przygotowywać dane do projektów SI. Pokazano tu, jak umieszczać dane z analizy tekstu i widzenia komputerowego w raportach Power BI, co ułatwia korzystanie z zewnętrznej bazy wiedzy. Omówiono również procesy tworzenia i wdrażania modeli AutoML wytrenowanych na platformie Azure ML, a także umieszczania ich w edytorze Power Query. Nie zabrakło kwestii związanych z prywatnością, bezstronnością i odpowiedzialnością w korzystaniu z SI. W książce między innymi: unikanie tendencyjności w przetwarzaniu danych szeregi czasowe i prognozowanie w Power BI wykrywanie anomalii analiza tekstu w Power Query trenowanie własnych modeli integracja Azure ML z Power BI i generowanie przewidywań Przekonaj się, jaki potencjał tkwi w analizie zbiorów danych!