Publisher: 16

9665
Loading...
EBOOK

Data Lake for Enterprises. Lambda Architecture for building enterprise data systems

Vivek Mishra, Tomcy John, Pankaj Misra

The term Data Lake has recently emerged as a prominent term in the big data industry. Data scientists can make use of it in deriving meaningful insights that can be used by businesses to redefine or transform the way they operate. Lambda architecture is also emerging as one of the very eminent patterns in the big data landscape, as it not only helps to derive useful information from historical data but also correlates real-time data to enable business to take critical decisions. This book tries to bring these two important aspects — data lake and lambda architecture—together.This book is divided into three main sections. The first introduces you to the concept of data lakes, the importance of data lakes in enterprises, and getting you up-to-speed with the Lambda architecture. The second section delves into the principal components of building a data lake using the Lambda architecture. It introduces you to popular big data technologies such as Apache Hadoop, Spark, Sqoop, Flume, and ElasticSearch. The third section is a highly practical demonstration of putting it all together, and shows you how an enterprise data lake can be implemented, along with several real-world use-cases. It also shows you how other peripheral components can be added to the lake to make it more efficient.By the end of this book, you will be able to choose the right big data technologies using the lambda architectural patterns to build your enterprise data lake.

9666
Loading...
EBOOK

Data Lakehouse in Action. Architecting a modern and scalable data analytics platform

Pradeep Menon

The Data Lakehouse architecture is a new paradigm that enables large-scale analytics. This book will guide you in developing data architecture in the right way to ensure your organization's success.The first part of the book discusses the different data architectural patterns used in the past and the need for a new architectural paradigm, as well as the drivers that have caused this change. It covers the principles that govern the target architecture, the components that form the Data Lakehouse architecture, and the rationale and need for those components. The second part deep dives into the different layers of Data Lakehouse. It covers various scenarios and components for data ingestion, storage, data processing, data serving, analytics, governance, and data security. The book's third part focuses on the practical implementation of the Data Lakehouse architecture in a cloud computing platform. It focuses on various ways to combine the Data Lakehouse pattern to realize macro-patterns, such as Data Mesh and Data Hub-Spoke, based on the organization's needs and maturity level. The frameworks introduced will be practical and organizations can readily benefit from their application.By the end of this book, you'll clearly understand how to implement the Data Lakehouse architecture pattern in a scalable, agile, and cost-effective manner.

9667
Loading...
EBOOK

Data Literacy in Practice. A complete guide to data literacy and making smarter decisions with data through intelligent actions

Angelika Klidas, Kevin Hanegan

Data is more than a mere commodity in our digital world. It is the ebb and flow of our modern existence. Individuals, teams, and enterprises working with data can unlock a new realm of possibilities. And the resultant agility, growth, and inevitable success have one origin—data literacy.This comprehensive guide is written by two data literacy pioneers, each with a thorough footprint within the data and analytics commercial world and lectures at top universities in the US and the Netherlands. Complete with best practices, practical models, and real-world examples, Data Literacy in Practice will help you start making your data work for you by building your understanding of data literacy basics and accelerating your journey to independently uncovering insights.You’ll learn the four-pillar model that underpins all data and analytics and explore concepts such as measuring data quality, setting up a pragmatic data management environment, choosing the right graphs for your readers, and questioning your insights.By the end of the book, you'll be equipped with a combination of skills and mindset as well as with tools and frameworks that will allow you to find insights and meaning within your data for data-informed decision making.

9668
Loading...
AUDIOBOOK

Data Literacy in Practice Audiobook. A complete guide to data literacy and making smarter decisions with data through intelligent actions

Angelika Klidas, Kevin Hanegan

Data is more than a mere commodity in our digital world. It is the ebb and flow of our modern existence. Individuals, teams, and enterprises working with data can unlock a new realm of possibilities. And the resultant agility, growth, and inevitable success have one origin—data literacy.This comprehensive guide is written by two data literacy pioneers, each with a thorough footprint within the data and analytics commercial world and lectures at top universities in the US and the Netherlands. Complete with best practices, practical models, and real-world examples, Data Literacy in Practice will help you start making your data work for you by building your understanding of data literacy basics and accelerating your journey to independently uncovering insights.You’ll learn the four-pillar model that underpins all data and analytics and explore concepts such as measuring data quality, setting up a pragmatic data management environment, choosing the right graphs for your readers, and questioning your insights.By the end of the book, you'll be equipped with a combination of skills and mindset as well as with tools and frameworks that will allow you to find insights and meaning within your data for data-informed decision making.

9669
Loading...
EBOOK

Data Literacy With Python. A Comprehensive Guide to Understanding and Analyzing Data with Python

Mercury Learning and Information, Oswald Campesato

This book ushers readers into the world of data, emphasizing its importance in modern industries and how its management leads to insightful decision-making. Using Python 3, the book introduces foundational data tasks and progresses to advanced model training concepts. Detailed, step-by-step Python examples help readers master training models, starting with the kNN algorithm and moving to other classifiers with minimal code adjustments. Tools like Sweetviz, Skimpy, Matplotlib, and Seaborn are introduced for hands-on chart and graph rendering.The course begins with working with data, detecting outliers and anomalies, and cleaning datasets. It then introduces statistics and progresses to using Matplotlib and Seaborn for data visualization. Each chapter builds on the previous one, ensuring a comprehensive understanding of data management and analysis.These concepts are crucial for making data-driven decisions. This book transitions readers from basic data handling to advanced model training, blending theoretical knowledge with practical skills. Companion files with source code and data sets enhance the learning experience, making this book an invaluable resource for mastering data science with Python.

9670
Loading...
EBOOK

Data Management Strategy at Microsoft. Best practices from a tech giant's decade-long data transformation journey

Aleksejs Plotnikovs

Microsoft pioneered data innovation and investment ahead of many in the industry, setting a remarkable standard for data maturity. Written by a data leader with over 15 years of experience following Microsoft’s data journey, this book delves into every crucial aspect of this journey, including change management, aligning with business needs, enhancing data value, and cultivating a data-driven culture.This book emphasizes that success in a data-driven enterprise goes beyond relying solely on modern technology and highlights the importance of prioritizing genuine business needs to propel necessary modernizations through change management practices. You’ll see how data-driven innovation does not solely reside within central IT engineering teams but also among the data's business owners who rely on data daily for their operational needs. This guide empower these professionals with clean, easily discoverable, and business-ready data, marking a significant breakthrough in how data is perceived and utilized throughout an enterprise. You’ll also discover advanced techniques to nurture the value of data as unique intellectual property, and differentiate your organization with the power of data.Its storytelling approach and summary of essential insights at the end of each chapter make this book invaluable for business and data leaders to advocate for crucial data investments.

9671
Loading...
EBOOK

Data Mining. Eksploracja danych w sieciach społecznościowych. Wydanie III

Matthew A. Russell, Mikhail Klassen

Internetu nie można rozważać wyłącznie jako tworu techniki. Powstanie tej sieci doprowadziło do rozwoju różnych zjawisk społecznych. Z tej perspektywy na szczególną uwagę zasługują media społecznościowe. Są źródłem informacji, które, właściwie spożytkowane, mogą przynieść niezły dochód. Mogą też dać odpowiedzi na wiele pytań zadawanych przez naukowców z różnych branż. Sama eksploracja tych danych przynosi sporo satysfakcji i radości. Zaskakujące przy tym jest to, że przygotowanie zestawu potrzebnych narzędzi i nauka posługiwania się nimi zabiera naprawdę niewiele czasu i nie wymaga specjalnych talentów! To trzecie, zaktualizowane wydanie popularnego podręcznika dla osób, które chcą zająć się wydobywaniem danych z sieci społecznościowych. Uwzględniono tu zmiany interfejsów API wprowadzone do poszczególnych platform i dodano rozdział o eksploracji Instagrama. Dowiesz się, jak dzięki danym z mediów społecznościowych określić sieć powiązań użytkowników, zorientować się, kto o czym mówi i gdzie się znajduje. Treść bogato zilustrowano przykładami kodu w Pythonie, a także plikami Jupyter Notebook lub kontenerów Dockera. Ciekawym elementem książki jest zbiór receptur dotyczących rozwiązywania konkretnych problemów z Twitterem. W tej książce między innymi: wprowadzenie do świata mediów społecznościowych przybliżenie bogactwa danych zawartych w mediach społecznościowych eksploracja danych za pomocą narzędzi Pythona 3 zaawansowane techniki eksploracji danych, w tym współczynniki TFIDF, podobieństwo kosinusów i rozpoznawanie obrazów tworzenie wizualizacji pozyskanych danych Jakie informacje dziś znajdziesz dzięki danym z Facebooka?

9672
Loading...
VIDEO COURSE

Data mining. Kurs video. Eksploracja danych z językiem R

Alicja Wolny-Dominiak

Obierz kurs na... eksplorację danych Żyjemy w świecie informacji. Przewagę w nim ma ten, kto dysponuje pożądanymi informacjami i (równocześnie) potrafi z nich zrobić odpowiedni użytek. Ten pierwszy etap - pozyskiwanie danych - w erze cyfrowej jest związany z czerpaniem ich z baz danych i odkrywaniem prawidłowości kryjących się w tym, co wydobywa się z hurtowni danych. Tym właśnie jest data mining (inaczej: eksploracja danych). Wraz z rozwojem dużych baz danych proces ten zyskał szerokie zastosowanie w wielu dziedzinach życia, od nauki po biznes. Opierając się na eksplorowaniu i analizie danych, firma może choćby lepiej poznać zwyczaje i preferencje swoich klientów, a dzięki temu przygotować dla nich atrakcyjniejszą ofertę czy przyjaźniej się z nimi komunikować. Na rynku jest dostępnych wiele programów, które pozwalają na przeprowadzenie pełnego modelu procesu data mining. Istotnym etapem jest tu znajomość metod i algorytmów, z których można skorzystać przy rozwiązywaniu danego problemu. Ogólną wiedzę praktyczną w tym zakresie daje nauka modelowania z programem R. Zastosowanie danego algorytmu wymaga „świadomego” użytkownika, a nie jedynie użycia gotowego okna dialogowego i kliknięcia przycisku OK. Nasz kurs ma na celu przybliżenie zagadnień związanych z algorytmami dataminingowymi w praktycznym modelowaniu z zastosowaniem języka R. Zdobyte podczas szkolenia umiejętności można wykorzystać od razu w swojej pracy lub potraktować jako bazę lepszego zrozumienia specjalistycznego oprogramowania w obszarze data mining. Co Cię czeka podczas naszego profesjonalnego szkolenia W ramach proponowanego przez nas kursu między innymi: Dowiesz się, czym jest data mining i jak działa model procesu eksploracji danych CRISP-DM Przyjrzysz się procesom związanym z pracą z danymi: imputacji wartości NA w danych, skalowaniu/normalizacji danych Zrozumiesz, czym są statystyki opisowe, statystyki opisowe w grupach Zagłębisz się w problemy związane z klasyfikacją, prawdopodobieństwem i macierzą pomyłek Poznasz tematy związane z drzewem decyzyjnym Co więcej... Nauczysz się modelować dane za pomocą metody k-średnich i metody aglomeracyjnej Data mining. Kurs video. Eksploracja danych z językiem R kończy się na poziomie podstawowym. Pozwala zrozumieć ideę procesu data mining, przybliża także najpopularniejsze algorytmy obliczeniowe w klasyfikacji i clusteringu (analizie skupień). Jeśli chodzi o część praktyczną, celem szkolenia jest nauczyć Cię stosowania algorytmów z udziałem języka R. Co istotne, by w pełni skorzystać z kursu, musisz znać podstawy tego języka. W świecie, w którym informacja jest złotem... Zdobytą na kursie wiedzę warto od razu zastosować w praktyce. Będzie z pewnością przydatna dla osób pracujących albo starających się o pracę na stanowisku analityka danych, junior data scientist, analityka BI (business intelligence) itd. Szkolenie da słuchaczowi solidne podstawy do tego, aby bez problemu zgłębiać wiedzę i umiejętności w zakresie data mining z uwzględnieniem dowolnej właściwie dziedziny nauki i biznesu: od ekonomii, przez inżynierię, aż po medycynę. Znajomość przedstawionych w kursie zagadnień przyda się również studentom - szczególnie w ramach przedmiotów ilościowych, opartych na wyciąganiu wiedzy z danych.