Analiza danych
Java Data Science Cookbook. Explore the power of MLlib, DL4j, Weka, and more
Rushdi Shams
If you are looking to build data sciencemodels that are good for production,Java has come to the rescue. With the aidof strong libraries such as MLlib, Weka,DL4j, and more, you can efficientlyperform all the data science tasks youneed to.This unique book provides modernrecipes to solve your common andnot-so-common data science-relatedproblems. We start with recipes to helpyou obtain, clean, index, and search data.Then you will learn a variety of techniquesto analyze, learn from, and retrieveinformation from data. You will alsounderstand how to handle big data, learndeeply from data, and visualize data.Finally, you will work through uniquerecipes that solve your problems whiletaking data science to production, writingdistributed data science applications,and much more - things that will come inhandy at work.
Java: Data Science Made Easy. Data collection, processing, analysis, and more
Richard M. Reese, Jennifer L. Reese, Alexey...
Data science is concerned with extracting knowledge and insights from a wide variety of data sources to analyse patterns or predict future behaviour. It draws from a wide array of disciplines including statistics, computer science, mathematics, machine learning, and data mining. In this course, we cover the basic as well as advanced data science concepts and how they are implemented using the popular Java tools and libraries.The course starts with an introduction of data science, followed by the basic data science tasks of data collection, data cleaning, data analysis, and data visualization. This is followed by a discussion of statistical techniques and more advanced topics including machine learning, neural networks, and deep learning. You will examine the major categories of data analysis including text, visual, and audio data, followed by a discussion of resources that support parallel implementation. Throughout this course, the chapters will illustrate a challenging data science problem, and then go on to present a comprehensive, Java-based solution to tackle that problem. You will cover a wide range of topics – from classification and regression, to dimensionality reduction and clustering, deep learning and working with Big Data. Finally, you will see the different ways to deploy the model and evaluate it in production settings.By the end of this course, you will be up and running with various facets of data science using Java, in no time at all.This course contains premium content from two of our recently published popular titles:- Java for Data Science- Mastering Java for Data Science
Rahul Raj
Java is one of the most widely used programming languages in the world. With this book, you will see how to perform deep learning using Deeplearning4j (DL4J) – the most popular Java library for training neural networks efficiently.This book starts by showing you how to install and configure Java and DL4J on your system. You will then gain insights into deep learning basics and use your knowledge to create a deep neural network for binary classification from scratch. As you progress, you will discover how to build a convolutional neural network (CNN) in DL4J, and understand how to construct numeric vectors from text. This deep learning book will also guide you through performing anomaly detection on unsupervised data and help you set up neural networks in distributed systems effectively. In addition to this, you will learn how to import models from Keras and change the configuration in a pre-trained DL4J model. Finally, you will explore benchmarking in DL4J and optimize neural networks for optimal results.By the end of this book, you will have a clear understanding of how you can use DL4J to build robust deep learning applications in Java.
Richard M. Reese , Shilpi Saxena, Jennifer...
para 1: Get the lowdown on Java and explore big data analytics with Java for Data Science. Packed with examples and data science principles, this book uncovers the techniques & Java tools supporting data science and machine learning. Para 2: The stability and power of Java combines with key data science concepts for effective exploration of data. By working with Java APIs and techniques, this data science book allows you to build applications and use analysis techniques centred on machine learning. Para 3: Java for Data Science gives you the understanding you need to examine the techniques and Java tools supporting big data analytics. These Java-based approaches allow you to tackle data mining and statistical analysis in detail. Deep learning and Java data mining are also featured, so you can explore and analyse data effectively, and build intelligent applications using machine learning. para 4: What?s Inside ? Understand data science principles with Java support ? Discover machine learning and deep learning essentials ? Explore data science problems with Java-based solutions
Język R i analiza danych w praktyce. Wydanie II
Nina Zumel, John Mount
Analiza danych albo nauka o danych jest interdyscyplinarną dziedziną, dzięki której hipotezy i dane przekształca się w zrozumiałe przewidywania. Predykcyjna analiza danych przynosi wymierne korzyści w wielu dziedzinach, od polityki począwszy, a na udzielaniu kredytów skończywszy. Osobą odpowiedzialną za tę magię jest analityk danych - człowiek, który zbiera i przygotowuje dane, wybiera technikę modelowania, pisze kod, weryfikuje wyniki swojej pracy, wreszcie komunikuje je interesariuszom. Jak widać, profesja analityka danych jest wyjątkowo atrakcyjna i wyjątkowo wymagająca. Aby określić umiejętności praktyczne wymagane w zawodzie analityka danych, najlepiej prześledzić realizacje konkretnych projektów z wykorzystaniem rzeczywistych danych. Ta książka jest samouczkiem prezentującym praktyczne aspekty dziesiątek technik, które wykorzystują profesjonalni analitycy danych. Główny nacisk autorzy położyli na zadania: ich zaplanowanie, przygotowanie, realizację i prezentację wyników. Dzięki praktycznemu podejściu z tej pozycji skorzystają zarówno analitycy biznesowi, jak i badacze danych. Pokazano tu, w jakich przypadkach i w jaki sposób należy stosować techniki statystyczne oraz metody uczenia maszynowego. W każdym rozdziale omówiono nowe narzędzia w kontekście rzeczywistych, praktycznych projektów. W rezultacie powstał potężny zbiór przydatnych ćwiczeń napisanych w języku R, opatrzonych wartościowymi wskazówkami, komentarzami i podpowiedziami. W książce między innymi: zasady zarządzania procesem analizy danych zadania analityka danych przekształcanie danych w celu przygotowania ich do analizy techniki statystyczne i metody uczenia maszynowego w języku R zaawansowane metody modelowania tajniki skutecznego prezentowania wyników analiz R: jesteś gotów na właściwe wyniki analizy danych?
Język R. Kompletny zestaw narzędzi dla analityków danych
Hadley Wickham, Garrett Grolemund
Analiza danych jest stosunkowo młodą, interdyscyplinarną dziedziną, której celem jest wydobycie i wykorzystanie wiedzy ukrytej w surowych danych pozyskanych z różnych źródeł. Można w ten sposób zrozumieć istotę zjawisk, przewidzieć wystąpienie zdarzeń czy pozyskać informacje niedostępne w inny sposób. W wielu przypadkach wnioski wyciągnięte z analizy danych okazują się bezcenne, co doceniają profesjonaliści z licznych branż. Przygotowanie danych, przeanalizowanie ich i odpowiednie przedstawienie płynącej z nich wiedzy bywa sporym wyzwaniem, jednak dzięki takim narzędziom jak język R i związane z nim pakiety zadanie to staje się znacząco prostsze. Niniejsza książka jest przystępnie napisanym przewodnikiem po języku R i narzędziach służących do analizy danych. Zawarto tu wyczerpujące wprowadzenie do języka R, programu RStudio i tidyverse. Zaprezentowano zestaw pakietów R, które znacznie poprawiają komfort pracy podczas analizy danych. Wyjaśniono znaczenie poszczególnych etapów analizy danych: ich importowania, oczyszczania, przekształcania, modelowania, wizualizowania, a także skutecznego komunikowania wiedzy płynącej z danych. Mimo że książka dotyczy narzędzi programistycznych, skorzystają z niej nie tylko programiści. Doceni ją każdy, kto chce zyskać solidne podstawy przygotowania i analizy danych. Najważniejsze zagadnienia: przekształcanie zbiorów danych techniki analizy danych w języku R eksplorowanie danych, formułowanie i testowanie hipotez integracja opisów, kodu i wyników badań w języku R Markdown graficzna prezentacja danych z wykorzystaniem ggplot2 R — wszystko, czego potrzebujesz w profesjonalnej analizie danych!
Język R. Receptury. Analiza danych, statystyka i przetwarzanie grafiki. Wydanie II
JD Long, Paul Teetor
Język R jest potężnym narzędziem używanym w statystyce, przetwarzaniu grafiki i programowaniu statystycznym; stanowi konkurencję dla komercyjnych systemów do obliczeń tego rodzaju. Zawiera wszystkie narzędzia, których potrzebują statystycy. Równocześnie jest to specyficzny język, przez co jego użytkowanie może sprawiać problemy. Zarówno proste, jak i złożone zadania są łatwe do wykonania, jeśli tylko wiadomo, w jaki sposób je zrobić. Jeżeli jednak trzeba stopniowo dochodzić do właściwego rozwiązania, może to kosztować sporo cierpliwości i zniechęcać. Oto zbiór 275 receptur instruktażowych, z których każda pomaga w rozwiązaniu konkretnego problemu. Wszystkie zostały starannie przetestowane i wielokrotnie dowodziły swojej przydatności. Każda z omawianych receptur została poprzedzona krótkim wprowadzeniem i omówieniem zastosowanych mechanizmów działania. Nie jest to klasyczny podręcznik programowania, jednak z pewnością przyśpieszy naukę praktycznego wykorzystania możliwości R. Jeśli masz już pewne doświadczenie z tym językiem, odświeżysz swoją wiedzę i uzyskasz szerszą perspektywę. Wśród receptur znajdziesz obejmujące szeroki zakres zadania - od podstawowych operacji na danych wejściowych i wyjściowych, poprzez statystykę ogólną, aż po grafikę i regresję liniową. Dowiesz się również, jak wykorzystać język R do wizualizacji danych za pomocą ciekawych wykresów graficznych. W tej książce między innymi: przygotowywanie danych wejściowych i upraszczanie danych wyjściowych macierze, listy, wektory czynnikowe, ramki danych testy statystyczne, przedziały ufności, prawdopodobieństwa modele statystyczne z wykorzystaniem regresji liniowej i analizy wariancji stosowanie zaawansowanych technik statystycznych R: błyskawicznie osiągniesz znakomite wyniki!
Bogumił Kamiński, Przemysław Szufel
Julia, with its dynamic nature and high-performance, provides comparatively minimal time for the development of computational models with easy-to-maintain computational code. This book will be your solution-based guide as it will take you through different programming aspects with Julia.Starting with the new features of Julia 1.0, each recipe addresses a specific problem, providing a solution and explaining how it works. You will work with the powerful Julia tools and data structures along with the most popular Julia packages. You will learn to create vectors, handle variables, and work with functions. You will be introduced to various recipes for numerical computing, distributed computing, and achieving high performance. You will see how to optimize data science programs with parallel computing and memory allocation. We will look into more advanced concepts such as metaprogramming and functional programming. Finally, you will learn how to tackle issues while working with databases and data processing, and will learn about on data science problems, data modeling, data analysis, data manipulation, parallel processing, and cloud computing with Julia.By the end of the book, you will have acquired the skills to work more effectively with your data
Julia for Data Science. high-performance computing simplified
Anshul Joshi
Julia is a fast and high performing language that's perfectly suited to data science with a mature package ecosystem and is now feature complete. It is a good tool for a data science practitioner. There was a famous post at Harvard Business Review that Data Scientist is the sexiest job of the 21st century. (https://hbr.org/2012/10/data-scientist-the-sexiest-job-of-the-21st-century).This book will help you get familiarised with Julia's rich ecosystem, which is continuously evolving, allowing you to stay on top of your game.This book contains the essentials of data science and gives a high-level overview of advanced statistics and techniques. You will dive in and will work on generating insights by performing inferential statistics, and will reveal hidden patterns and trends using data mining. This has the practical coverage of statistics and machine learning. You will develop knowledge to build statistical models and machine learning systems in Julia with attractive visualizations.You will then delve into the world of Deep learning in Julia and will understand the framework, Mocha.jl with which you can create artificial neural networks and implement deep learning.This book addresses the challenges of real-world data science problems, including data cleaning, data preparation, inferential statistics, statistical modeling, building high-performance machine learning systems and creating effective visualizations using Julia.
Toomey, Nikhil Borkar, Nikhil Akki, Juan Tomás...
Jupyter has garnered a strong interest in the data science community of late, as it makes common data processing and analysis tasks much simpler. This book is for data science professionals who want to master various tasks related to Jupyter to create efficient, easy-to-share, scientific applications.The book starts with recipes on installing and running the Jupyter Notebook system on various platforms and configuring the various packages that can be used with it. You will then see how you can implement different programming languages and frameworks, such as Python, R, Julia, JavaScript, Scala, and Spark on your Jupyter Notebook. This book contains intuitive recipes on building interactive widgets to manipulate and visualize data in real time, sharing your code, creating a multi-user environment, and organizing your notebook. You will then get hands-on experience with Jupyter Labs, microservices, and deploying them on the web. By the end of this book, you will have taken your knowledge of Jupyter to the next level to perform all key tasks associated with it.
Toomey
Jupyter Notebook is a web-based environment that enables interactive computing in notebook documents. It allows you to create documents that contain live code, equations, and visualizations. This book is a comprehensive guide to getting started with data science using the popular Jupyter notebook. If you are familiar with Jupyter notebook and want to learn how to use its capabilities to perform various data science tasks, this is the book for you! From data exploration to visualization, this book will take you through every step of the way in implementing an effective data science pipeline using Jupyter. You will also see how you can utilize Jupyter's features to share your documents and codes with your colleagues. The book also explains how Python 3, R, and Julia can be integrated with Jupyter for various data science tasks.By the end of this book, you will comfortably leverage the power of Jupyter to perform various tasks in data science successfully.
Kibana 7 Quick Start Guide. Visualize your Elasticsearch data with ease
Anurag Srivastava
The Elastic Stack is growing rapidly and, day by day, additional tools are being added to make it more effective. This book endeavors to explain all the important aspects of Kibana, which is essential for utilizing its full potential.This book covers the core concepts of Kibana, with chapters set out in a coherent manner so that readers can advance their learning in a step-by-step manner. The focus is on a practical approach, thereby enabling the reader to apply those examples in real time for a better understanding of the concepts and to provide them with the correct skills in relation to the tool. With its succinct explanations, it is quite easy for a reader to use this book as a reference guide for learning basic to advanced implementations of Kibana. The practical examples, such as the creation of Kibana dashboards from CSV data, application RDBMS data, system metrics data, log file data, APM agents, and search results, can provide readers with a number of different drop-off points from where they can fetch any type of data into Kibana for the purpose of analysis or dashboarding.
Krishna Shah
Unleash the full potential of Kibana—an indispensable tool for data analysts to seamlessly explore vast datasets, uncover key insights, identify trends and anomalies, and share results. This book guides you through its user-friendly interface, interactive visualizations, and robust features, including real-time data monitoring and advanced analytics, showing you how Kibana revolutionizes your approach to navigating and analyzing complex datasets.Starting with the foundational steps of installing, configuring, and running Kibana, this book progresses systematically to explain the search and data visualization capabilities for data stored in the Elasticsearch cluster. You’ll then delve into the practical details of creating data views and optimizing spaces to better organize the analysis environment. As you advance, you'll get to grips with using the discover interface and learn how to build different types of extensive visualizations using Lens.By the end of this book, you’ll have a complete understanding of how Kibana works, helping you leverage its capabilities to build an analytics and visualization solution from scratch for your data-driven use case.
Yuvraj Gupta
Use the functionalities of Kibana to discover data and build attractive visualizations and dashboards for real-world scenariosAbout This BookPerform real-time data analytics and visualizations, on streaming data, using KibanaBuild beautiful visualizations and dashboards with simplicity and ease without any type of coding involvedLearn all the core concepts as well as detailed information about each component used in KibanaWho This Book Is ForWhether you are new to the world of data analytics and data visualization or an expert, this book will provide you with the skills required to use Kibana with ease and simplicity for real-time data visualization of streaming data.This book is intended for those professionals who are interested in learning about Kibana,its installations, and how to use it . As Kibana provides a user-friendly web page, no prior experience is required.What You Will LearnUnderstand the basic concepts of elasticsearch used in Kibana along with step by step guide to install Kibana in Windows and UbuntuExplore the functionality of all the components used in Kibana in detail, such as the Discover, Visualize, Dashboard,and Settings pagesAnalyze data using the powerful search capabilities of elasticsearchUnderstand the different types of aggregations used in Kibana for visualizationCreate and build different types of amazing visualizations and dashboards easilyCreate, save, share, embed, and customize the visualizations added to the dashboardCustomize and tweak the advanced settings of Kibana to ensure ease of useIn DetailWith the increasing interest in data analytics and visualization of large data around the globe, Kibana offers the best features to analyze data and create attractive visualizations and dashboards through simple-to-use web pages. The variety of visualizations provided, combined with the powerful underlying elasticsearch capabilities will help professionals improve their skills with this technology.This book will help you quickly familiarize yourself to Kibana and will also help you to understand the core concepts of this technology to build visualizations easily.Starting with setting up of Kibana and elasticsearch in Windows and Ubuntu, you will then use the Discover page to analyse your data intelligently. Next, you will learn to use the Visualization page to create beautiful visualizations without the need for any coding. Then, you will learn how to use the Dashboard page to create a dashboard and instantly share and embed the dashboards. You will see how to tweak the basic and advanced settings provided in Kibana to manage searches, visualizations, and dashboards. Finally, you will use Kibana to build visualizations and dashboards for real-world scenarios.You will quickly master the functionalities and components used in Kibana to create amazing visualizations based on real-world scenarios. With ample screenshots to guide you through every step, this book will assist you in creating beautiful visualizations with ease.Style and approachThis book is a comprehensive step-by-step guide to help you understand Kibana. It’s explained in an easy-to-follow style along with supporting images. Every chapter is explained sequentially , covering the basics of each component of Kibana and providing detailed explanations of all the functionalities of Kibana that appeal.
KNIME Essentials. Perform accurate data analysis using the power of KNIME
Gábor Bakos
KNIME is an open source data analytics, reporting, and integration platform, which allows you to analyze a small or large amount of data without having to reach out to programming languages like R.KNIME Essentials teaches you all you need to know to start processing your first data sets using KNIME. It covers topics like installation, data processing, and data visualization including the KNIME reporting features. Data processing forms a fundamental part of KNIME, and KNIME Essentials ensures that you are fully comfortable with this aspect of KNIME before showing you how to visualize this data and generate reports.KNIME Essentials guides you through the process of the installation of KNIME through to the generation of reports based on data. The main parts between these two phases are the data processing and the visualization. The KNIME variants of data analysis concepts are introduced, and after the configuration and installation description comes the data processing which has many options to convert or extend it. Visualization makes it easier to get an overview for parts of the data, while reporting offers a way to summarize them in a nice way.
Alberto Ferrari, Marco Russo
Kompletny przewodnik po DAX to najbardziej wyczerpujący i autorytatywny podręcznik języka Microsoft DAX w zastosowaniach BI i analityce. Podczas gdy inne książki omawiają tylko podstawy, ten przewodnik zapewnia wiedzę na poziomie eksperckim potrzebnych średnio i wysoko zaawansowanym użytkownikom Excela i profesjonalistom BI, od podstaw po innowacyjne techniki wysokiej wydajności. Dwaj czołowi konsultanci i wykładowcy Microsoft BI przedstawiają język DAX poprzez realistyczne i przydatne przykłady, prezentujące typowe obliczenia pozwalające użytkownikom od razu uzyskiwać wyniki. Alberto Ferrari i Marco Russo rozjaśniają złożone zagadnienia pokazując czytelnikom, co się dzieje pod maską silnika DAX, gdy wykonywane są wyrażenia. Ferrari i Russo starannie przechodzą przez typowe scenariusze, w których działanie DAX może być trudne do zrozumienia; pokazują, jak optymalizować modele danych, aby wyrażenia DAX były szybko wykonywane; demonstrują, jak pisać szybki i odporny kod DAX; wyjaśniają, jak usuwać wąskie gardła z istniejącego kodu. Pokazują działanie DAX zarówno w środowisku SQL Server, jak i Microsoft Excel, ułatwiając pracę bez względu na to, którą platformę Microsoft BI preferuje czytelnik.