Видавець: 16
Kirk Munroe
Tableau is unlike most other BI platforms that have a single data modeling tool and enterprise data model (for example, LookML from Google’s Looker). That doesn’t mean Tableau doesn’t have enterprise data governance; it is both robust and highly flexible. This book will help you effectively use Tableau governance models to build a data-driven organization.Data Modeling with Tableau is an extensive guide, complete with step-by-step explanations of essential concepts, practical examples, and hands-on exercises. As you progress through the chapters, you’ll learn the role that Tableau Prep Builder and Tableau Desktop each play in data modeling. You’ll also explore the components of Tableau Server and Tableau Cloud that make data modeling more robust, secure, and performant. Moreover, by extending data models for Ask and Explain Data, you’ll gain the knowledge required to extend analytics to more people in their organizations, leading to better data-driven decisions. Finally, this book will guide you through the entire Tableau stack and the techniques required to build the right level of governance into Tableau data models for the correct use cases.By the end of this Tableau book, you’ll have a firm understanding of how to leverage data modeling in Tableau to benefit your organization.
Michele Pinto, Sammy El Khammal
In the age of information, strategic management of data is critical to organizational success. The constant challenge lies in maintaining data accuracy and preventing data pipelines from breaking. Data Observability for Data Engineering is your definitive guide to implementing data observability successfully in your organization.This book unveils the power of data observability, a fusion of techniques and methods that allow you to monitor and validate the health of your data. You’ll see how it builds on data quality monitoring and understand its significance from the data engineering perspective. Once you're familiar with the techniques and elements of data observability, you'll get hands-on with a practical Python project to reinforce what you've learned. Toward the end of the book, you’ll apply your expertise to explore diverse use cases and experiment with projects to seamlessly implement data observability in your organization.Equipped with the mastery of data observability intricacies, you’ll be able to make your organization future-ready and resilient and never worry about the quality of your data pipelines again.
Data Oriented Development with Angularjs
Manoj Waikar
This book helps beginner-level AngularJS developers organize AngularJS applications by discussing important AngularJS concepts and best practices. If you are an experienced AngularJS developer but haven't written directives or haven't created custom HTML controls before, then this book is ideal for you.
Dr. Argenis Leon , Luis Aguirre Contreras
Optimus is a Python library that works as a unified API for data cleaning, processing, and merging data. It can be used for handling small and big data on your local laptop or on remote clusters using CPUs or GPUs.The book begins by covering the internals of Optimus and how it works in tandem with the existing technologies to serve your data processing needs. You'll then learn how to use Optimus for loading and saving data from text data formats such as CSV and JSON files, exploring binary files such as Excel, and for columnar data processing with Parquet, Avro, and OCR. Next, you'll get to grips with the profiler and its data types - a unique feature of Optimus Dataframe that assists with data quality. You'll see how to use the plots available in Optimus such as histogram, frequency charts, and scatter and box plots, and understand how Optimus lets you connect to libraries such as Plotly and Altair. You'll also delve into advanced applications such as feature engineering, machine learning, cross-validation, and natural language processing functions and explore the advancements in Optimus. Finally, you'll learn how to create data cleaning and transformation functions and add a hypothetical new data processing engine with Optimus.By the end of this book, you'll be able to improve your data science workflow with Optimus easily.
Data Quality in the Age of AI. Building a foundation for AI strategy and data culture
Andrew Jones
As organizations worldwide seek to revamp their data strategies to leverage AI advancements and benefit from newfound capabilities, data quality emerges as the cornerstone for success. Without high-quality data, even the most advanced AI models falter. Enter Data Quality in the Age of AI, a detailed report that illuminates the crucial role of data quality in shaping effective data strategies.Packed with actionable insights, this report highlights the critical role of data quality in your overall data strategy. It equips teams and organizations with the knowledge and tools to thrive in the evolving AI landscape, serving as a roadmap for harnessing the power of data quality, enabling them to unlock their data's full potential, leading to improved performance, reduced costs, increased revenue, and informed strategic decisions.
Rohan Chopra , Aaron England, Mohamed Noordeen...
Data Science with Python begins by introducing you to data science and teaches you to install the packages you need to create a data science coding environment. You will learn three major techniques in machine learning: unsupervised learning, supervised learning, and reinforcement learning. You will also explore basic classification and regression techniques, such as support vector machines, decision trees, and logistic regression.As you make your way through the book, you will understand the basic functions, data structures, and syntax of the Python language that are used to handle large datasets with ease. You will learn about NumPy and pandas libraries for matrix calculations and data manipulation, discover how to use Matplotlib to create highly customizable visualizations, and apply the boosting algorithm XGBoost to make predictions. In the concluding chapters, you will explore convolutional neural networks (CNNs), deep learning algorithms used to predict what is in an image. You will also understand how to feed human sentences to a neural network, make the model process contextual information, and create human language processing systems to predict the outcome.By the end of this book, you will be able to understand and implement any new data science algorithm and have the confidence to experiment with tools or libraries other than those covered in the book.
Data Science - zawód przyszłości. Kurs video. Jak rozpocząć karierę w pracy z danymi
Anna Kotarba
Obierz kurs na karierę mistrza danych Data science, big data - odkąd naszą wirtualną rzeczywistość opanowały wiedzące o nas wszystko ciasteczka, wyszukiwarka Google i media społecznościowe, te słowa budzą emocje i nadzieję u wielu osób zajmujących się biznesem. Kto ma dostęp do danych, ten trafił na żyłę złota. A kto potrafi je odpowiednio sortować, filtrować i - co najważniejsze - wyciągać z nich wnioski, ten może naprawdę dużo! Nic dziwnego, że specjaliści w tej dziedzinie są sowicie wynagradzani - w 2020 roku data scientist był trzecim najlepiej opłacanym zawodem w branży IT w Stanach Zjednoczonych. Siłą rzeczy zawód data scientist (po polsku mówi się czasem „mistrz danych”) zyskuje na popularności. Coraz więcej firm i organizacji dostrzega wagę zbierania i analizowania pozyskanych danych w kontekście przyszłości i strategicznego planowania działalności. Stąd ogłoszeń z propozycjami zatrudnienia dla specjalistów z tej dziedziny nie brakuje, a fraza „data scientist zarobki” jest szalenie popularna! Liczba miejsc pracy rośnie proporcjonalnie do tego, jak zwiększa się ilość danych. Czyli naprawdę szybko! Dlatego przy wyborze informatycznej specjalizacji warto rozważyć karierę „mistrza danych”. Nie tylko dla pieniędzy. Także dlatego, że daje ona możliwość ciągłego rozwoju i nauki nowych aspektów. Co Cię czeka podczas naszego profesjonalnego szkolenia video z Data Science? Szkoląc się w ramach tego kursu online Data Science: Poznasz specyfikę pracy na stanowisku data scientist Zdobędziesz umiejętność rozróżniania obszarów pracy z danymi Opanujesz podstawy pracy z językami: Python, R, SQL Zaznajomisz się ze środowiskami big data Co więcej... W trakcie szkolenia dowiesz się też, jak stworzyć atrakcyjne dla przyszłych pracodawców CV i portfolio data scientist Data Science - zawód przyszłości. Kurs video. Jak rozpocząć karierę w pracy z danymi jest wprowadzeniem do pracy w dziedzinie data science, kończy się więc na poziomie podstawowym. Wyposaży Cię jednak w wiedzę niezbędną do dalszego, samodzielnego rozwoju i podpowie, po jakie narzędzia sięgać, aby doskonalić warsztat profesjonalisty. Nauka o danych Data science to dziedzina prawdziwie interdyscyplinarna, w której używa się naukowych metod, procesów, algorytmów i systemów do wydobywania wiedzy, a także spostrzeżeń ustrukturyzowanych i nieustrukturyzowanych danych. Z wiedzy zdobytej na podstawie analizy danych zaś korzysta się w szerokim przekroju zastosowań. Data science blisko wiąże się z takimi pojęciami jak data mining (eksploracja danych), machine learning (samouczenie się maszyn) i big data (praca na dużych zbiorach danych). To dziedzina niezwykle rozległa, oferująca naprawdę duże możliwości, jeśli chodzi o karierę i rozwój. Idealna dla kogoś, kto czuje, że jego powołaniem jest analiza. Jeśli wiesz, że to właśnie Ty, nie czekaj, tylko działaj! Uruchom kurs video Data Science - zawód przyszłości i w krótkim czasie (bez setek godzin poświęconych na poszukiwanie rozmaitych materiałów) zanurz się w fascynujący świat danych. I wreszcie zacznij poruszać się wśród nich jak profesjonalista! Zobacz także kursy video MySQL dostępne w naszej ofercie.
David Natingga
Machine learning applications are highly automated and self-modifying, and continue to improve over time with minimal human intervention, as they learn from the trained data. To address the complex nature of various real-world data problems, specialized machine learning algorithms have been developed. Through algorithmic and statistical analysis, these models can be leveraged to gain new knowledge from existing data as well.Data Science Algorithms in a Week addresses all problems related to accurate and efficient data classification and prediction. Over the course of seven days, you will be introduced to seven algorithms, along with exercises that will help you understand different aspects of machine learning. You will see how to pre-cluster your data to optimize and classify it for large datasets. This book also guides you in predicting data based on existing trends in your dataset. This book covers algorithms such as k-nearest neighbors, Naive Bayes, decision trees, random forest, k-means, regression, and time-series analysis.By the end of this book, you will understand how to choose machine learning algorithms for clustering, classification, and regression and know which is best suited for your problem
Data Science for Decision Makers. Enhance your leadership skills with data science and AI expertise
Jon Howells
As data science and artificial intelligence (AI) become prevalent across industries, executives without formal education in statistics and machine learning, as well as data scientists moving into leadership roles, must learn how to make informed decisions about complex models and manage data teams. This book will elevate your leadership skills by guiding you through the core concepts of data science and AI.This comprehensive guide is designed to bridge the gap between business needs and technical solutions, empowering you to make informed decisions and drive measurable value within your organization. Through practical examples and clear explanations, you'll learn how to collect and analyze structured and unstructured data, build a strong foundation in statistics and machine learning, and evaluate models confidently. By recognizing common pitfalls and valuable use cases, you'll plan data science projects effectively, from the ground up to completion. Beyond technical aspects, this book provides tools to recruit top talent, manage high-performing teams, and stay up to date with industry advancements.By the end of this book, you’ll be able to characterize the data within your organization and frame business problems as data science problems.
Mercury Learning and Information, P. G. Madhavan
This book introduces data science to professionals in engineering, physics, mathematics, and related fields. It serves as a workbook with MATLAB code, linking subject knowledge to data science, machine learning, and analytics, with applications in IoT. Part One integrates machine learning, systems theory, linear algebra, digital signal processing, and probability theory. Part Two develops a nonlinear, time-varying machine learning solution for modeling real-life business problems.Understanding data science is crucial for modern applications, particularly in IoT. This book presents a dynamic machine learning solution to handle these complexities. Topics include machine learning, systems theory, linear algebra, digital signal processing, probability theory, state-space formulation, Bayesian estimation, Kalman filter, causality, and digital twins.The journey begins with data science and machine learning, covering systems theory and linear algebra. Advanced concepts like the Kalman filter and Bayesian estimation lead to developing a dynamic machine learning model. The book ends with practical applications using digital twins.
Shane Molinari, Jim Packer
In today's world full of online threats, the complexity of harmful software presents a significant challenge for detection and analysis. This insightful guide will teach you how to apply the principles of data science to online security, acting as both an educational resource and a practical manual for everyday use.Data Science for Malware Analysis starts by explaining the nuances of malware, from its lifecycle to its technological aspects before introducing you to the capabilities of data science in malware detection by leveraging machine learning, statistical analytics, and social network analysis. As you progress through the chapters, you’ll explore the analytical methods of reverse engineering, machine language, dynamic scrutiny, and behavioral assessments of malicious software. You’ll also develop an understanding of the evolving cybersecurity compliance landscape with regulations such as GDPR and CCPA, and gain insights into the global efforts in curbing cyber threats.By the end of this book, you’ll have a firm grasp on the modern malware lifecycle and how you can employ data science within cybersecurity to ward off new and evolving threats.
Mirza Rahim Baig , Gururajan Govindan ,...
Unleash the power of data to reach your marketing goals with this practical guide to data science for business.This book will help you get started on your journey to becoming a master of marketing analytics with Python. You'll work with relevant datasets and build your practical skills by tackling engaging exercises and activities that simulate real-world market analysis projects.You'll learn to think like a data scientist, build your problem-solving skills, and discover how to look at data in new ways to deliver business insights and make intelligent data-driven decisions.As well as learning how to clean, explore, and visualize data, you'll implement machine learning algorithms and build models to make predictions. As you work through the book, you'll use Python tools to analyze sales, visualize advertising data, predict revenue, address customer churn, and implement customer segmentation to understand behavior.By the end of this book, you'll have the knowledge, skills, and confidence to implement data science and machine learning techniques to better understand your marketing data and improve your decision-making.
Tommy Blanchard, Debasish Behera, Pranshu Bhatnagar
Data Science for Marketing Analytics covers every stage of data analytics, from working with a raw dataset to segmenting a population and modeling different parts of the population based on the segments.The book starts by teaching you how to use Python libraries, such as pandas and Matplotlib, to read data from Python, manipulate it, and create plots, using both categorical and continuous variables. Then, you'll learn how to segment a population into groups and use different clustering techniques to evaluate customer segmentation. As you make your way through the chapters, you'll explore ways to evaluate and select the best segmentation approach, and go on to create a linear regression model on customer value data to predict lifetime value. In the concluding chapters, you'll gain an understanding of regression techniques and tools for evaluating regression models, and explore ways to predict customer choice using classification algorithms. Finally, you'll apply these techniques to create a churn model for modeling customer product choices.By the end of this book, you will be able to build your own marketing reporting and interactive dashboard solutions.
Gabriela Castillo Areco
Data is the new oil and Web3 is generating it at an unprecedented rate. Complete with practical examples, detailed explanations, and ideas for portfolio development, this comprehensive book serves as a step-by-step guide covering the industry best practices, tools, and resources needed to easily navigate the world of data in Web3.You’ll begin by acquiring a solid understanding of key blockchain concepts and the fundamental data science tools essential for Web3 projects. The subsequent chapters will help you explore the main data sources that can help address industry challenges, decode smart contracts, and build DeFi- and NFT-specific datasets. You’ll then tackle the complexities of feature engineering specific to blockchain data and familiarize yourself with diverse machine learning use cases that leverage Web3 data.The book includes interviews with industry leaders providing insights into their professional journeys to drive innovation in the Web 3 environment. Equipped with experience in handling crypto data, you’ll be able to demonstrate your skills in job interviews, academic pursuits, or when engaging potential clients.By the end of this book, you’ll have the essential tools to undertake end-to-end data science projects utilizing blockchain data, empowering you to help shape the next-generation internet.
Data Science Fundamentals Pocket Primer. An Essential Guide to Data Science Concepts and Techniques
Mercury Learning and Information, Oswald Campesato
This book, part of the Pocket Primer series, introduces the basic concepts of data science using Python 3 and other applications. It offers a fast-paced introduction to data analytics, statistics, data visualization, linear algebra, and regular expressions. The book features numerous code samples using Python, NumPy, R, SQL, NoSQL, and Pandas. Companion files with source code and color figures are available.Understanding data science is crucial in today's data-driven world. This book provides a comprehensive introduction, covering key areas such as Python 3, data visualization, and statistical concepts. The practical code samples and hands-on approach make it ideal for beginners and those looking to enhance their skills.The journey begins with working with data, followed by an introduction to probability, statistics, and linear algebra. It then delves into Python, NumPy, Pandas, R, regular expressions, and SQL/NoSQL, concluding with data visualization techniques. This structured approach ensures a solid foundation in data science.
Remigiusz Żulicki
Czy sztuczna inteligencja pozbawia nas pracy? Algorytmy przejmują władzę nad światem? Czy big data sprawia, że jesteśmy bezustannie inwigilowani, a ogromna ilość danych zastępuje ekspertów i naukowców? Cokolwiek sądzimy na te tematy, jedno jest pewne - istnieje heterogeniczne środowisko ludzi zajmujących się tzw. "sztuczną inteligencją" czy tzw. "big data" od strony technicznej oraz metodologicznej. Pole ich działania nazywane jest data science, a oni - data scientists. Publikacja to pierwsza monografia socjologiczna dotycząca data science i pierwsza praca w naukach społecznych, w której data science zostało zbadane jako społeczny świat w rozumieniu Adele E. Clarke. Podejście to pozwala spojrzeć na data science, nazwane dekadę wstecz w "Harvard Business Review" "najseksowniejszym zawodem XXI wieku", zarówno z perspektywy jego uczestników, jak i z lotu ptaka, w relacji do akademii, biznesu, prawa, mediów czy polityki.
Data science od podstaw. Analiza danych w Pythonie
Joel Grus
Współczesne ogromne zbiory danych zawierają odpowiedzi na prawie każde pytanie. Równocześnie nauka o danych jest dziedziną, która cokolwiek onieśmiela. Znajduje się gdzieś pomiędzy subtelnymi umiejętnościami hakerskimi, twardą wiedzą z matematyki i statystyki a merytoryczną znajomością zagadnień z danej branży. Co więcej, dziedzina ta niezwykle dynamicznie się rozwija. Trud włożony w naukę o danych niewątpliwie się jednak opłaca: biegły analityk danych może liczyć na dobrze płatną, inspirującą i bardzo atrakcyjną pracę. Dzięki tej książce opanujesz najważniejsze zagadnienia związane z matematyką i statystyką, będziesz także rozwijać umiejętności hakerskie. W ten sposób zyskasz podstawy pozwalające na rozpoczęcie przygody z analizą danych. Gruntownie zapoznasz się z potrzebnymi narzędziami i algorytmami. Pozwoli Ci to lepiej zrozumieć ich działanie. Poszczególne przykłady, którymi zilustrowano omawiane zagadnienia, są przejrzyste, dobrze opisane i zrozumiałe. Podczas lektury książki poznasz biblioteki, które umożliwią zaimplementowanie omówionych technik podczas analizy dużych zbiorów danych. Szybko się przekonasz, że aby zostać analitykiem danych, wystarczy odrobina ciekawości, sporo chęci, mnóstwo ciężkiej pracy i... ta książka. Najważniejsze zagadnienia: Praktyczne wprowadzenie do Pythona Podstawy algebry liniowej, statystyki i rachunku prawdopodobieństwa w analizie danych Podstawy uczenia maszynowego Implementacje algorytmów modeli, w tym naiwny klasyfikator bayesowski, regresja liniowa, regresja logistyczna, drzewa decyzyjne, sieci neuronowe i grupowanie, MapReduce Systemy rekomendacji i mechanizmy przetwarzania języka naturalnego Korzystanie z mediów społecznościowych i baz danych. Python. Wyciśniesz z danych każdą kroplę wiedzy!
Data science od podstaw. Analiza danych w Pythonie. Wydanie II
Joel Grus
Analityka danych jest uważana za wyjątkowo obiecującą dziedzinę wiedzy. Rozwija się błyskawicznie i znajduje coraz to nowsze zastosowania. Profesjonaliści biegli w eksploracji danych i wydobywaniu z nich pożytecznych informacji mogą liczyć na interesującą pracę i bardzo atrakcyjne warunki zatrudnienia. Jednak aby zostać analitykiem danych, trzeba znać matematykę i statystykę, a także nauczyć się programowania. Umiejętności w zakresie uczenia maszynowego i uczenia głębokiego również są ważne. W przypadku tak specyficznej dziedziny, jaką jest nauka o danych, szczególnie istotne jest zdobycie gruntownych podstaw i dogłębne ich zrozumienie. W tym przewodniku opisano zagadnienia związane z podstawami nauki o danych. Wyjaśniono niezbędne elementy matematyki i statystyki. Przedstawiono także techniki budowy potrzebnych narzędzi i sposoby działania najistotniejszych algorytmów. Książka została skonstruowana tak, aby poszczególne implementacje były jak najbardziej przejrzyste i zrozumiałe. Zamieszczone tu przykłady napisano w Pythonie: jest to język dość łatwy do nauki, a pracę na danych ułatwia szereg przydatnych bibliotek Pythona. W drugim wydaniu znalazły się nowe tematy, takie jak uczenie głębokie, statystyka i przetwarzanie języka naturalnego, a także działania na ogromnych zbiorach danych. Zagadnienia te często pojawiają się w pracy współczesnego analityka danych. W książce między innymi: elementy algebry liniowej, statystyki i rachunku prawdopodobieństwa zbieranie, oczyszczanie i eksploracja danych algorytmy modeli analizy danych podstawy uczenia maszynowego systemy rekomendacji i przetwarzanie języka naturalnego analiza sieci społecznościowych i algorytm MapReduce Nauka o danych: bazuj na solidnych podstawach!
Data Science. Programowanie, analiza i wizualizacja danych z wykorzystaniem języka R
Michael Freeman, Joel Ross
Aby surowe dane przekuć w gotową do wykorzystania wiedzę, potrzebna jest umiejętność ich analizy, przekształcania i niekiedy również wizualizacji. Nagrodą za włożony w to wysiłek jest lepsze rozumienie różnych złożonych zagadnień z wielu dziedzin wiedzy. Co więcej, znajomość procesów programowego przetwarzania danych pozwala na szybkie wykrywanie i opisywanie wzorców danych, praktycznie niemożliwych do dostrzeżenia innymi technikami. Dla wielu badaczy jednak barierą na drodze do skorzystania z tych atrakcyjnych możliwości jest konieczność pisania kodu. Oto podręcznik programowania w języku R dla analityków danych, szczególnie przydatny dla osób, które nie mają doświadczenia w tej dziedzinie. Dokładnie opisano tu potrzebne narzędzia i technologie. Zamieszczono wskazówki dotyczące instalacji i konfiguracji oprogramowania do pisania kodu, wykonywania go i zarządzania nim, a także śledzenia wersji projektów i zmian w nich oraz korzystania z innych podstawowych mechanizmów. Poszczególne kroki tworzenia kodu w języku R wyjaśniono dokładnie i przystępnie. Dzięki tej książce można płynnie przejść do konkretnych zadań i budować potrzebne aplikacje. Zrozumienie prezentowanych w niej treści ułatwiają liczne przykłady i ćwiczenia, co pozwala szybko przystąpić do skutecznego analizowania własnych zbiorów danych. W tej książce między innymi: przygotowanie środowiska pracy i rozpoczęcie programowania w R podstawy zarządzania projektami, kontrola wersji i generowanie dokumentacji ramki danych, pakiety dplyr i tidyr kod do wizualizacji danych i pakiet ggplot2 tworzenie aplikacji i techniki współpracy w zespołach specjalistów Po prostu R i dane. Wyciśniesz każdą kroplę wiedzy!
Stephen Klosterman
If data is the new oil, then machine learning is the drill. As companies gain access to ever-increasing quantities of raw data, the ability to deliver state-of-the-art predictive models that support business decision-making becomes more and more valuable.In this book, you’ll work on an end-to-end project based around a realistic data set and split up into bite-sized practical exercises. This creates a case-study approach that simulates the working conditions you’ll experience in real-world data science projects.You’ll learn how to use key Python packages, including pandas, Matplotlib, and scikit-learn, and master the process of data exploration and data processing, before moving on to fitting, evaluating, and tuning algorithms such as regularized logistic regression and random forest. Now in its second edition, this book will take you through the end-to-end process of exploring data and delivering machine learning models. Updated for 2021, this edition includes brand new content on XGBoost, SHAP values, algorithmic fairness, and the ethical concerns of deploying a model in the real world.By the end of this data science book, you’ll have the skills, understanding, and confidence to build your own machine learning models and gain insights from real data.
Stephen Klosterman
Data Science Projects with Python is designed to give you practical guidance on industry-standard data analysis and machine learning tools, by applying them to realistic data problems. You will learn how to use pandas and Matplotlib to critically examine datasets with summary statistics and graphs, and extract the insights you seek to derive. You will build your knowledge as you prepare data using the scikit-learn package and feed it to machine learning algorithms such as regularized logistic regression and random forest. You’ll discover how to tune algorithms to provide the most accurate predictions on new and unseen data. As you progress, you’ll gain insights into the working and output of these algorithms, building your understanding of both the predictive capabilities of the models and why they make these predictions.By then end of this book, you will have the necessary skills to confidently use machine learning algorithms to perform detailed data analysis and extract meaningful insights from unstructured data.
Mercury Learning and Information, Christopher Greco
This book introduces popular data science tools and guides readers on how to use them effectively. It covers data analysis using Microsoft Excel, KNIME, R, and OpenOffice, applying statistical concepts such as confidence intervals, normal distribution, T-Tests, linear regression, histograms, and geographic analysis with real data from Federal Government sources.The course begins with the basics, including importing data and conducting various statistical tests. It progresses to specific methods for each tool, ensuring a comprehensive understanding of data analysis. Capstone exercises provide hands-on experience, reinforcing the concepts learned throughout the book.Understanding these tools and concepts is crucial for effective data analysis. This book takes readers from the basics to advanced statistical methods, combining theoretical insights with practical applications. Companion files with source code and data sets enhance the learning experience, making this book an essential resource for mastering data analysis with popular software applications.
Data Science w Pythonie. Kurs video. Algorytmy uczenia maszynowego
Oleg Żero
Obierz kurs na... przyszłość Powszechna cyfryzacja nie dotyka jedynie wybranych gałęzi przemysłu, ale dosłownie przeniknęła nasze życie niemal w każdym aspekcie. Skutkiem tego procesu jest pojawienie się ogromnej ilości danych, które, odpowiednio wykorzystane, stanowią nowy rodzaj materii w nieprzerwanym cyklu postępu. Uczenie maszynowe stało się jednocześnie obszarem szczególnego zainteresowania ze strony zarówno firm, jak i uczelni. Dzięki specjalnym algorytmom i technikom możliwe stało się wykorzystanie zasobów, jakimi są dane, do opracowywania rozwiązań poprawiających efektywność w wielu dziedzinach: od robotyki, przez medycynę, aż po rozrywkę. Przykładami rozwiązań, które już dziś wykorzystują uczenie maszynowe, są chociażby silniki rekomendacyjne działające na platformach takich jak YouTube, Netflix, Spotify czy Amazon. Silniki te skutecznie dobierają treści, tak że wokół produktów tworzą się całe społeczności wiernie oddanych klientów. To wszystko dzieje się obecnie. W niedalekiej przyszłości wiele - także dość skomplikowanych - czynności zostanie zautomatyzowanych. Zawody, również te potencjalnie wymagające wysokich kwalifikacji, nawet jeśli nie będą w całości wykonywane przez maszyny, będą przez nie wspomagane. Jest niemal pewne, że specjaliści między innymi w dziedzinie uczenia maszynowego, którzy już dziś są intensywnie poszukiwani, staną się jeszcze bardziej pożądani w przyszłości. Dołącz do ich grona! Data science w Pythonie. Kurs video. Algorytmy uczenia maszynowego kończy się na poziomie średnio zaawansowanym, a nawet nieco wyżej, jeśli chodzi o wiedzę i umiejętności, jakich wymaga się na przykład od analityka biznesowego, naukowca, inżyniera danych czy webdevelopera. Natomiast jeśli mowa o wiedzy stricte z zakresu data science, autor kursu określa poziom jego absolwenta na podstawowy. Uwaga, by móc w pełni skorzystać ze szkolenia, trzeba znać podstawy języka Python (w tym orientować się w bibliotekach: numpy, pandas, matplotlib) i matematykę na poziomie pierwszego - drugiego roku studiów na kierunkach ścisłych. Takie pojęcia jak gradient, pochodna, szereg, prawdopodobieństwo czy notacja nie powinny być Ci obce! Czym właściwie zajmuje się specjalista w dziedzinie data science? Odpowiedź na to pytanie jest krótka i - jak to w matematyce - policzalna. Aż 70 procent czasu pracy spędza się w tym zawodzie na zbieraniu i analizie danych, by potem, przez kolejne 20 procent, tworzyć i testować modele, które "ubiera się" w programy, a następnie wykorzystuje do otrzymywania przewidywań z modeli. Przykładami takich modeli, jakie stosuje się już dziś w kontekście biznesowym, są między innymi silniki rekomendacyjne (Netflix, YouTube, eBay, Amazon, Spotify itd.), modele do klasyfikacji obrazów medycznych w celu rozpoznawania ewentualnych infekcji, systemy do automatycznych tłumaczeń (patrz Google) czy popularne boty - i wiele innych. Od teorii, przez praktykę, aż po gotowe rozwiązania Kurs składa się z trzech bloków szkoleniowych. Zaczniemy od teorii data science. Tu przygotuj się na serię wykładów, w których autor wprowadza pojęcia na poziomie równań, wyjaśniając je od podstaw. Bazując na wiedzy zdobytej w części teoretycznej, przejdziemy do praktyki - będziesz pisać algorytm "od zera", a przy tym pogłębisz rozumienie koncepcji matematycznych i przy okazji napiszesz kod. Wreszcie przyjdzie czas na część trzecią, podczas której będziemy sprytni i sięgniemy po tzw. gotowce - przede wszystkim scikit-learn i Keras. Przy użyciu tych bibliotek rozwiążemy zadany problem, skupiając się zarówno na samym zagadnieniu, jak i ogólnym podejściu do problemu. W kursie połączysz teorię z praktyką. Dzięki temu osiągniesz dwa cele: wyrobisz w sobie intuicję matematyczną, która w razie potrzeby pozwoli Ci przenieść to rozumienie również poza Pythona, oraz zyskasz pewne doświadczenie w wykorzystywaniu powszechnie dostępnych narzędzi i w ten sposób zwiększysz skuteczność swojej pracy. Kurs jest podzielony na 16 rozdziałów. W pierwszym rozdziale stworzysz proste środowisko pracy. Dalej, w rozdziałach 2 - 8, poznasz podstawowe algorytmy, takie jak sieci neuronowe, oraz zrozumiesz, na czym polega ogólne podejście machinelearningowe. W rozdziałach 9 - 13 poznasz kolejne, nieco alternatywne, lecz równie często wykorzystywane algorytmy, których idea opiera się na innych zasadach. Na koniec, w ramach rozdziałów: 14, 15 i 16, stworzysz własny silnik rekomendacyjny, który następnie usprawnisz z wykorzystaniem popularnych metod pracy z tekstem (NLP), by uzyskać półgotowy produkt na koniec kursu.
Data Science w Pythonie. Kurs video. Przetwarzanie i analiza danych
Oleg Żero
Obierz kurs na... wyższy level pracy z danymi W każdej minucie użytkownicy Snapchata dzielą się ponad pół milionem zdjęć, oglądanych jest ponad 4 miliony filmów na YouTubie, a bywalcy Twittera wysyłają ponad 400 tysięcy tweetów. A to tylko ułamek danych, jakie są na bieżąco generowane. Ich wielka ilość z jednej strony jest wyzwaniem dla serwerów, z drugiej - ma ogromny potencjał dla osób pracujących z danymi. Dzięki nim udaje się usprawnić niemal każdą dziedzinę życia, by wspomnieć choćby medycynę, logistykę, robotykę, e-commerce. Rozwiązania pozwalające pracować z danymi opierają się na różnych podejściach: od prostych modeli czysto statystycznych po skomplikowane algorytmy sztucznej inteligencji, a sama praca na danych wymaga połączenia umiejętności analitycznych i programistycznych. W każdym przypadku punktem wyjścia jest analiza i eksploracja danych, która pozwala w skuteczny sposób przejrzeć i zgłębić ich zasób, by szybko i skutecznie docierać do konkretnych informacji. Umiejętności te zdobędziesz w ramach tego kursu. W trakcie nauki będziemy bazować na możliwościach, jakie oferują język Python i jego biblioteki (numpy, pandas, matplotlib, seaborn), które stanowią absolutną podstawę do dalszej pracy z danymi. Są też wykorzystywane przez inne, bardziej zaawansowane narzędzia uczenia maszynowego. Szkolenie jest adresowane do kilku grup zawodowych. Odnajdą się w nim zarówno osoby, które już zajmowały się analizą danych, na przykład w Excelu, i chcą rozwijać się w tym kierunku, jak i programiści języków innych niż Python, chcący poznać ten przyszłościowy, dynamicznie rozwijający się język. Materiał proponowany w ramach kursu jest także przeznaczony dla akademików wyspecjalizowanych w naukach ścisłych, którzy chcieliby nauczyć się przekładania równań na skuteczny kod. Wreszcie - szkolenie przyda się tym, którzy marzą o karierze na stanowisku Data Scientist (jedna z najpilniej poszukiwanych i jednocześnie najlepiej płatnych ról w IT). Wiedza oferowana w ramach kursu zapewni im odpowiedni punkt startowy - dalsza droga zawodowa będzie wymagała opanowania zaproponowanych zagadnień do perfekcji. Co Cię czeka podczas naszego profesjonalnego szkolenia? W trakcie tego kursu video opanujesz wiedzę, dzięki której: Stworzysz środowisko pracy i upewnisz się, jakie narzędzia będą Ci potrzebne. Poznasz język Python, nie tylko na poziomie składni, ale również pewnych przydatnych dla potrzeb kursu koncepcji. Zrozumiesz, na czym polega praca z danymi numerycznymi, tekstowymi i czasowymi. Dowiesz się, jak wykonuje się obliczenia numeryczne przy użyciu różnych technik. Będziesz w stanie dopasowywać, agregować i zestawiać dane. Co więcej... Opanujesz kolejne etapy procesu analizy danych, od ich pozyskania, przez obróbkę, aż po wyciąganie wniosków. Data science w Pythonie. Kurs video. Przetwarzanie i analiza danych został stworzony z myślą o „rozpędzeniu” Cię z poziomu zero do takiego, w którym będziesz potrafił skutecznie operować na całkiem sporych zasobach danych i wydobywać z nich informacje. Jednocześnie spory nacisk położono na pokazanie praktycznych aspektów pracy osoby na stanowisku analityka danych, ponieważ to teren, po którym często trzeba się poruszać, dysponując jedynie ogólnymi wskazówkami. Kurs bardziej szczegółowo Naszemu szkoleniu na początek będziesz musiał poświęcić co najmniej osiem godzin - tyle bowiem trwa nauka z ekspertem. W jej trakcie zapoznasz się z językiem Python jako narzędziem do zadań związanych z analizą danych. Używając biblioteki numpy, będziesz wykonywać obliczenia numeryczne, a stosując bibliotekę pandas - przekształcać zbiory danych. Zwizualizujesz je przy wykorzystaniu matplotlib, seaborn i pandas. Stworzysz własne środowisko pracy, zawierające konsolę, ipython, jupyter, jupyter lab i pip. Nauczysz się odnajdywania dokumentacji, korzystania z przykładów i ogólnego radzenia sobie z danymi. Zmierzysz się z równaniem matematycznym i jego przełożeniem na kod języka Python. Zaimplementujesz rozwiązania - zarówno z użyciem bibliotek, jak i w czystym Pythonie. Poznasz podstawy optymalizacji i czyszczenia danych, będziesz je przekształcać po to, by potwierdzić lub obalić konkretną hipotezę. Opanujesz metodykę korzystania z popularnych form reprezentacji danych statystycznych. Dokonasz także szeregu usprawnień związanych z wydajnością obliczeń (wektoryzacja, dobór typów danych itd.). W efekcie staniesz się początkującym, ale już samodzielnym analitykiem danych, przygotowanym zarówno na rozmowę kwalifikacyjną na przykład na stanowisko Junior Developera, jak i do usprawnienia swojej pracy - inżynierskiej, naukowej czy menedżerskiej.