Analiza danych
Analiza danych jest ekscytującą dyscypliną, która umożliwia zrozumienie pewnych zjawisk, uzyskanie wglądu i wiedzy na podstawie surowych danych. Pojęcie to oznacza dokładnie przetwarzanie danych za pomocą technik matematycznych i statystycznych w celu uzyskania cennych wniosków, podjęcia ważnych decyzji i opracowania przydatnych produktów. Termin ten wywodzi się od angielskiego data science, często traktowanego jako synonim takich terminów, jak analityka biznesowa, badania operacyjne, business intelligence, wywiad konkurencyjny, analiza i modelowanie danych, a także pozyskiwanie wiedzy. Dzięki takim technologiom, jak języki Python czy R, platformy Hadoop i Spark masz szansę wyciągnąć maksimum wniosków, dostrzec szanse na rozwój swojej organizacji albo przewidzieć i zapobiec zagrożeniom.
MrExcel 2024. Igniting Excel Mastery with the Latest Tips & Tricks
MrExcel's Holy Macro! Books, Bill Jelen
Unlock Excel 2024's potential with this essential guide, featuring 150 advanced techniques designed to elevate your skills. Whether you're automating tasks, creating dynamic dashboards, or utilizing Excel's new AI tools, this guide provides clear, practical instructions. Each chapter is crafted to help you navigate Excel's latest features, from data manipulation to complex formulas and Python integration.This guide offers a hands-on approach, with real-world examples that demonstrate how to apply Excel’s capabilities in practical scenarios. You'll learn to optimize your workflow, enhance data visualization, and make informed decisions based on your analysis. The guide is perfect for intermediate to advanced users looking to stay ahead of the curve and maximize their productivity.By focusing on both the how and the why of each feature, this guide ensures you not only understand the technical steps but also grasp the underlying principles that make these tools powerful. Whether you're a data analyst, financial professional, or business manager, this guide equips you with the skills to transform your Excel experience, making your work more efficient, accurate, and insightful.
MySQL 8 Administrator's Guide. Effective guide to administering high-performance MySQL 8 solutions
Chintan Mehta, Ankit K Bhavsar, Hetal Oza,...
MySQL is one of the most popular and widely used relational databases in the world today. The recently released version 8.0 brings along some major advancements in the way your MySQL solution can be administered. This handbook will be your companion to understand the newly introduced features in MySQL and show you how you can leverage them to design a high-performance MySQL solution for your organization.This book starts with a brief introduction to the new features in MySQL 8, and then quickly jumping onto the crucial administration topics that you will find useful in your day-to-day work. Topics such as migrating to MySQL 8, MySQL benchmarking, achieving high performance by implementing the indexing techniques, and optimizing your queries are covered in this book. You will also learn how to perform replication, scale your MySQL solution and implement effective security techniques. There is also a special section on the common and not so common troubleshooting techniques for effective MySQL administration is also covered in this book. By the end of this highly practical book, you will have all the knowledge you need to tackle any problem you might encounter while administering your MySQL solution.
MySQL 8 Cookbook. Over 150 recipes for high-performance database querying and administration
Karthik Appigatla
MySQL is one of the most popular and widely used relational databases in the World today. The recently released MySQL 8 version promises to be better and more efficient than ever before.This book contains everything you need to know to be the go-to person in your organization when it comes to MySQL. Starting with a quick installation and configuration of your MySQL instance, the book quickly jumps into the querying aspects of MySQL. It shows you the newest improvements in MySQL 8 and gives you hands-on experience in managing high-transaction and real-time datasets. If you've already worked with MySQL before and are looking to migrate your application to MySQL 8, this book will also show you how to do that. The book also contains recipes on efficient MySQL administration, with tips on effective user management, data recovery, security, database monitoring, performance tuning, troubleshooting, and more.With quick solutions to common and not-so-common problems you might encounter while working with MySQL 8, the book contains practical tips and tricks to give you the edge over others in designing, developing, and administering your database effectively.
Gökhan Ozar
Any database designer who wants to accomplish both everyday tasks and more advanced actions with a few clicks or drag-and-drops can now do so using Navicat's advanced tools and this book.Starting with the basics before progressing with advanced features, this book can be read from cover to cover, or simply used as a reference guide for any problems you encounter.The book features 'work along' tutorials, some of which will surprise you by revealing features of Navicat which you may never have known existed ñ features such as designing functions and stored procedures, event triggers, creating batch jobs and scheduling.MySQL Management and Administration with Navicat is an ideal resource to master Navicat and unlock its true potential.
Myślenie statystyczne. Jak analizować dane i wydobywać z nich wiedzę. Wydanie III
Allen B. Downey
Dla większości z nas statystyka jest poddziedziną matematyki związaną z opracowywaniem teoretycznych podstaw prawdopodobieństwa i wnioskowania statystycznego. Analitycy danych podchodzą do tego inaczej: dla nich statystyka jest niezbędnym zestawem narzędzi i praktyk, które służą do pracy z danymi, odpowiadania na pytania i ułatwiają podejmowanie najlepszych decyzji. To trzecie wydanie przewodnika cenionego przez analityków danych, inżynierów oprogramowania i pasjonatów danologii. Dzięki niemu szybko nauczysz się korzystać z bibliotek NumPy, SciPy i Pandas. Poznasz różne metody eksploracji i wizualizacji danych, odkrywania zależności i trendów, a także prezentowania wyników. Struktura książki odpowiada rzeczywistemu procesowi pracy ze zbiorem danych: od importowania i oczyszczenia, przez analizę wieloczynnikową, aż po wizualizację uzyskanych wyników. Wszystkie rozdziały są dostępne w formie notatników Jupytera, dzięki czemu możesz jednocześnie czytać tekst, uruchamiać kod i pracować nad ćwiczeniami. W książce znajdziesz również takie zagadnienia jak: analiza rozkładów danych i wizualizacja wzorców za pomocą bibliotek Pythona korzystanie z modeli regresji analiza szeregów czasowych i analiza przeżycia tworzenie zrozumiałych wizualizacji danych rozwiązywanie typowych problemów związanych z analizą danych Jeśli chcesz się szybko nauczyć statystyki i stosowania jej w praktyce, to ta książka jest dla Ciebie! Zachary del Rosario, adiunkt w Olin College of Engineering
Sohom Ghosh, Dwight Gunning
If NLP hasn't been your forte, Natural Language Processing Fundamentals will make sure you set off to a steady start. This comprehensive guide will show you how to effectively use Python libraries and NLP concepts to solve various problems.You'll be introduced to natural language processing and its applications through examples and exercises. This will be followed by an introduction to the initial stages of solving a problem, which includes problem definition, getting text data, and preparing it for modeling. With exposure to concepts like advanced natural language processing algorithms and visualization techniques, you'll learn how to create applications that can extract information from unstructured data and present it as impactful visuals. Although you will continue to learn NLP-based techniques, the focus will gradually shift to developing useful applications. In these sections, you'll understand how to apply NLP techniques to answer questions as can be used in chatbots. By the end of this book, you'll be able to accomplish a varied range of assignments ranging from identifying the most suitable type of NLP task for solving a problem to using a tool like spacy or gensim for performing sentiment analysis. The book will easily equip you with the knowledge you need to build applications that interpret human language.
Deborah A. Dahl
Natural Language Understanding facilitates the organization and structuring of language allowing computer systems to effectively process textual information for various practical applications. Natural Language Understanding with Python will help you explore practical techniques for harnessing NLU to create diverse applications. with step-by-step explanations of essential concepts and practical examples, you’ll begin by learning about NLU and its applications. You’ll then explore a wide range of current NLU techniques and their most appropriate use-case. In the process, you’ll be introduced to the most useful Python NLU libraries. Not only will you learn the basics of NLU, you’ll also discover practical issues such as acquiring data, evaluating systems, and deploying NLU applications along with their solutions. The book is a comprehensive guide that’ll help you explore techniques and resources that can be used for different applications in the future.By the end of this book, you’ll be well-versed with the concepts of natural language understanding, deep learning, and large language models (LLMs) for building various AI-based applications.
Bo Wang, Cristian Mitroi, Feng Wang, Shubham...
Search is a big and ever-growing part of the tech ecosystem. Traditional search, however, has limitations that are hard to overcome because of the way it is designed. Neural search is a novel approach that uses the power of machine learning to retrieve information using vector embeddings as first-class citizens, opening up new possibilities of improving the results obtained through traditional search.Although neural search is a powerful tool, it is new and finetuning it can be tedious as it requires you to understand the several components on which it relies. Jina fills this gap by providing an infrastructure that reduces the time and complexity involved in creating deep learning–powered search engines. This book will enable you to learn the fundamentals of neural networks for neural search, its strengths and weaknesses, as well as how to use Jina to build a search engine. With the help of step-by-step explanations, practical examples, and self-assessment questions, you'll become well-versed with the basics of neural search and core Jina concepts, and learn to apply this knowledge to build your own search engine.By the end of this deep learning book, you'll be able to make the most of Jina's neural search design patterns to build an end-to-end search solution for any modality.
NoSQL, NewSQL i BigData. Bazy danych następnej generacji
Guy Harrison
Model relacyjnej bazy danych zdecydowanie dominował wśród technologii bazodanowych przez ostatnie 20 lat. Poszczególne rozwiązania były do siebie na tyle podobne, że decyzja o zastosowaniu relacyjnej bazy danych stała się oczywista. Architektura rozwiązań tego typu była zbliżona, a różnice polegały głównie na koszcie wdrożenia, wydajności, niezawodności i łatwości użycia aplikacji. Obecnie sytuacja diametralnie się zmieniła: powstało wiele radykalnie różniących się od siebie technologii bazodanowych, a wybór właściwej bazy danych stał się złożonym zadaniem, wymagającym sporej wiedzy i obarczonym poważnymi konsekwencjami natury ekonomicznej i technologicznej. Ta książka szczególnie przyda się architektom technologii informatycznych, administratorom baz danych i projektantom, którzy do wykonywania swoich obowiązków potrzebują wiedzy o najświeższych rozwiązaniach z dziedziny technologii baz danych. Omówiono tu najnowsze, wykorzystywane obecnie technologie baz danych. Wyjaśniono, w jakim celu zaprojektowano każdą z nich. Zaprezentowano możliwości poszczególnych baz danych oraz ich potencjał w rozwiązywaniu realnych problemów biznesowych i problemów z aplikacjami. Co najważniejsze, ukazano różnice w architekturze między technologiami, które mają kluczowe znaczenie przy wyborze platformy baz danych dla nowych i planowanych projektów. W tej książce między innymi: Co zrewolucjonizowało bazy danych Google, Hadoop i koncepcja BigData Pamięciowe i rozproszone bazy danych NoSQL, CQL i nowe odsłony SQL Hybrydowe bazy danych Oracle NoSQL i BigData: potężne bazy danych przyszłości!
Nowe usługi 2.0. Przewodnik po analizie zbiorów danych
Toby Segaran
Wykorzystaj dane z sieci do własnych potrzeb! Internet to nic innego jak gigantyczny zbiór danych. Każdy, kto znajdzie sposób na ich umiejętne wykorzystanie, ma szansę zbudować aplikację, która odniesie światowy sukces. Serwisy randkowe, portale społecznościowe, porównywarki cen — to tylko drobna część serwisów, które możesz wykorzystać przy tworzeniu nowej usługi. Jak analizować dane i wyciągnąć wnioski? Na wiele podobnych pytań odpowiada ta jedyna w swoim rodzaju książka. W trakcie lektury poznasz najlepsze sposoby filtrowania danych, tworzenia rekomendacji, wykrywania grup oraz wyszukiwania i klasyfikowania. Na kolejnych stronach znajdziesz bogaty zbiór informacji poświęconych algorytmom analizującym dane. Ponadto będziesz mieć możliwość zapoznania się z różnymi sposobami optymalizacji, modelowania przy użyciu drzew decyzyjnych oraz tworzenia modeli cenowych. Książka ta w rękach wprawnego programisty może stanowić niesamowite narzędzie. Otwiera wrota do świata pełnego danych i zależności pomiędzy nimi! Dzięki tej książce: poznasz najlepsze i najskuteczniejsze algorytmy do analizy danych zbudujesz model cen nauczysz się korzystać z drzew decyzyjnych zastosujesz dane z sieci do budowy nowych usług Wyciągnij właściwe wnioski z posiadanych danych! „Brawo! Nic lepszego nie przychodzi mi na myśl w przypadku programisty, który zaczyna dopiero przygodę z opisanymi w książce algorytmami i metodami. Sam (jako stary »wyjadacz« od sztucznej inteligencji) sięgnąłbym po nią w pierwszej kolejności, żeby odświeżyć swoją znajomość szczegółów.” Dan Russell, główny specjalista ds. technologii, firma Google „W książce Toby’ego w znakomity sposób dokonano rozbicia złożonego zagadnienia dotyczącego algorytmów uczenia maszynowego na praktyczne i łatwe do zrozumienia przykłady, które mogą być bezpośrednio używane do analizowania interakcji społecznościowej w obecnym internecie. Jeśli ta książka trafiła w moje ręce dwa lata wcześniej, zaoszczędziłbym mój cenny czas, gdy podążałem bezowocnymi ścieżkami.” Tim Wolters, szef ds. technologii, firma Collective Intellect
Nowoczesna analiza danych w Excelu. Power Query, Power Pivot i inne narzędzia
George Mount
Organizacje stosują zaawansowane narzędzia i techniki, aby umożliwić podejmowanie decyzji na podstawie danych. Jeszcze do niedawna MS Excel nie był w stanie sprostać wymaganiom analityków, obecnie jest wschodzącą gwiazdą w świecie nowoczesnej analizy danych. Kluczem do sukcesu stało się opanowanie takich narzędzi jak Power Pivot czy Power Query. Dzięki tej praktycznej książce przekonasz się, że w Excelu możesz przeprowadzić dogłębną analizę danych i wyciągnąć z nich cenną wiedzę. Wystarczy, że skorzystasz z najnowszych funkcji i narzędzi Excela. W poradniku pokazano, jak za pomocą Power Query budować przepływy pracy porządkujące dane i jak projektować w skoroszycie relacyjne modele danych przy użyciu Power Pivot. Ponadto odkryjesz nowe możliwości przeprowadzania analiz, w tym dynamiczne funkcje tablicowe i pozyskiwanie wartościowych informacji z wykorzystaniem sztucznej inteligencji. Dowiesz się również, jak za sprawą integracji z Pythonem zautomatyzować analizę danych i budować raporty. W książce: tworzenie procesów porządkujących dane w Excelu za pomocą Power Query relacyjne modele danych i wskaźniki analityczne w Power Pivot korzystanie z dynamicznych funkcji tablicowych zastosowanie AI do identyfikacji wzorców i trendów w danych integracja funkcjonalności Pythona z Excelem Książka jest łatwa w odbiorze, praktyczna i pomocna dla analityków, a także zwykłych użytkowników! Meghan Finley, autorka i redaktorka tekstów technicznych
Nowoczesne analizy biznesowe. Zwiększanie wartości danych przy użyciu Pythona i R
Deanne Larson
"Lektura obowiązkowa dla wszystkich analityków biznesowych i danetyków." Balaji Dhamodharan, światowy lider w dziedzinie danetyki, NXP Semiconductors "Ta książka to niezastąpione źródło wiedzy dla każdego, kto pragnie opanować szybko zmieniający się świat analityki." Lipi Deepaakshi Patnaik, starszy inżynier oprogramowania, Zeta Wydobycie wartości biznesowej z ogromu danych to trudny i wymagający proces. Przekształcenie surowych danych w użyteczne informacje wymaga od analityka biegłego posługiwania się wieloma technologiami, takimi jak bazy danych, narzędzia programistyczne czy komercyjne narzędzia analityczne. Ten praktyczny przewodnik pokazuje programistom rozumiejącym koncepcje analizy, jak rozwijać umiejętności niezbędne do uzyskania wartości biznesowej. Autorka, zajmująca się danetyką zarówno od strony praktycznej, jak i naukowej, pomaga połączyć światy biznesu i techniki, aby spełnić te wymagania. Rozwiń umiejętności posługiwania się językami R i Python na z życia wziętych przykładach. Dowiedz się również, jak wykorzystywać właściwe metodologie w celu skutecznego realizowania celów. Metodyka uczenia się połączona z narzędziami open source jest kluczem do dostarczania rzeczywistych wartości biznesowych. Książka ta pokazuje, jak: - Stosować metodologie analityki biznesowej, aby osiągnąć pomyślne wyniki - Czyścić i przekształcać dane przy użyciu R i Pythona - Używać R i Pythona do wykonywania eksploracyjnej analizy danych - Tworzyć modele predykcyjne do rozwiązywania problemów biznesowych w R i Pythonie - Używać Pythona, R i narzędzi analitycznych do obsługi wielkich wolumenów danych - Współpracować z inżynierami danych i danetykami - Mierzyć skuteczność analiz biznesowych Dr. Deanne Larson jest eksperktą w dziedzinie danetyki oraz edukatorką, która pomaga największym firmom odblokować wartości biznesowe dzięki analityce. Dzięki wykładom w zakresie analiz, sztucznej inteligencji i przywództwa prowadzonym na takich uczelniach, jak MIT, Harvard, Stanford i NYU, stała się poszukiwanym wykładowcą i oddanym mentorem swojej dziedziny.
James Serra
Architektury data fabric i data lakehouse, a także siatka danych pojawiły się niedawno jako alternatywy hurtowni danych. Te nowe architektury mają swoje mocne strony, ale podczas projektowania rzeczywistych rozwiązań musisz pamiętać o odróżnianiu faktów od przesadnych pochwał i niejasności. Nie zawsze jest to proste i oczywiste zadanie. Niezwykłość tej książki polega na przekształcaniu złożonych zagadnień technicznych w jasne i zrozumiałe objaśnienia. Annie Xu, starszy inżynier danych, Google Dzięki temu praktycznemu przewodnikowi profesjonaliści zajmujący się danymi dobrze zrozumieją wady i zalety poszczególnych rozwiązań. Omówiono tu typowe zagadnienia dotyczące architektur danych, w tym ich rozwój i możliwości. Żadna architektura nie jest na tyle uniwersalna, by być odpowiednia w każdej sytuacji, dlatego w książce znajdziesz rzetelne porównanie cech poszczególnych architektur. Dowiesz się, jakie kompromisy towarzyszą każdej z nich, niezależnie od popularności. W ten sposób o wiele łatwiej przyjdzie Ci wybór rozwiązania, które najlepiej odpowiada Twoim potrzebom. Najciekawsze zagadnienia: praktyczne działanie architektur danych, ich mocne i słabe strony wybór najlepszej architektury pod kątem konkretnego zastosowania różnice między hurtowniami i "jeziorami" danych wspólne koncepcje architektur danych i ich historyczny rozwój sesje projektowania architektury, organizacja zespołów i najważniejsze uwarunkowania Połóż tę książkę na biurku. Będziesz często po nią sięgać! Sawyer Nyquist, autor, właściciel The Data Shop
Pratap Dangeti, Allen Yu, Claire Chung, Aldrin...
Data mining, or parsing the data to extract useful insights, is a niche skill that can transform your career as a data scientist Python is a flexible programming language that is equipped with a strong suite of libraries and toolkits, and gives you the perfect platform to sift through your data and mine the insights you seek. This Learning Path is designed to familiarize you with the Python libraries and the underlying statistics that you need to get comfortable with data mining.You will learn how to use Pandas, Python's popular library to analyze different kinds of data, and leverage the power of Matplotlib to generate appealing and impressive visualizations for the insights you have derived. You will also explore different machine learning techniques and statistics that enable you to build powerful predictive models.By the end of this Learning Path, you will have the perfect foundation to take your data mining skills to the next level and set yourself on the path to become a sought-after data science professional.This Learning Path includes content from the following Packt products:• Statistics for Machine Learning by Pratap Dangeti• Matplotlib 2.x By Example by Allen Yu, Claire Chung, Aldrin Yim• Pandas Cookbook by Theodore Petrou
Odsłaniamy SQL Server 2019: Klastry Big Data i uczenie maszynowe
Bob Ward
Nabierz prędkości dzięki przełomowym zmianom w SQL Server 2019. Nie jest to już jedynie silnik bazodanowy, ale nowatorskie narzędzie wyposażone we wsparcie dla uczenia maszynowego, analiz Big Data, możliwość działania w systemie Linux, kontenery, Kubernetes, Javę czy wirtualizację danych w Azure. Ta książka nie zajmuje się tradycyjną administracją bazami danych w środowisku SQL Server. Koncentruje się na tym wszystkim, co nowe w jednej z najskuteczniej modernizowanych platform danych w branży. To książka dla profesjonalistów danych, którzy znają już podstawy SQL Server i chcą się rozwijać, rozbudowując umiejętności w najgorętszych obszarach nowych technologii. Zagłębimy się w szczegóły kluczowych nowych możliwości SQL Server 2019 przy użyciu podejścia „nauka przez przykład”. Zajmiemy się zagadnieniami Intelligent Performance, zabezpieczeń, dostępności i funkcjonalności oczekiwanych przez współczesnych programistów. Omówimy usprawnienia w SQL Server 2019 dla systemu Linux oraz wykorzystanie kontenerów i klastrów Kubernetes. Pokażemy, jak zwirtualizować dostęp do danych przy użyciu Polybase dla Oracle, MongoDB, Hadoop i Azure, co pozwala zredukować potrzebę stosowania kosztownych aplikacji ETL. Nauczymy się również, jak budować wszechstronne rozwiązania Big Data Clusters, sztandarowej funkcjonalności wydania 2019, zapewniającej dostęp do środowisk Spark, SQL Server HDFS i dowiemy się, jak wbudować inteligencję w nasze własne dane i wdrażać kompletne aplikacje uczenia maszynowego. Dowiedz się, jak: • Implementować Big Data Clusters przy użyciu SQL Server, Spark i HDFS • Tworzyć węzły danych z połączeniami do Oracle, Azure, Hadoop i innych źródeł • Łączyć SQL i Spark w celu zbudowania platformy uczenia maszynowego dla aplikacji AI • Zwiększyć wydajność bez zmieniania aplikacji przy użyciu Intelligent Performance • Podnieść zabezpieczenia SQL Server dzięki mechanizmom Secure Enclaves i Data Classification • Zmaksymalizować czas działania bazy danych poprzez indeksowanie online i Accelerated Database Recovery • Budować nowoczesne aplikacje przy użyciu narzędzi Graph, ML Services i T-SQL Extensibility dla języka Java • Zwiększyć możliwości wdrażania SQL Server w systemie Linux • Uruchamiać SQL Server w kontenerach i Kubernetes • Korzystać z najnowszych narzędzi i metod migracji bazy danych do SQL Server 2019 • Zastosować wiedzę na temat SQL Server 2019 w środowisku Azure
William Lo, Raymond Chun Hing Lo
OpenGL is a great multi-platform, cross-language, and hardware-accelerated graphics interface for visualizing large 2D and 3D datasets. Data visualization has become increasingly challenging using conventional approaches as datasets become larger and larger, especially with the Big Data evolution. From a mobile device to a sophisticated high-performance computing cluster, OpenGL libraries provide developers with an easy-to-use interface to create stunning visuals in 3D in real time for a wide range of interactive applications.This book provides a series of easy-to-follow, hands-on tutorials to create appealing OpenGL-based visualization tools with minimal development time. We will first illustrate how to quickly set up the development environment in Windows, Mac OS X, and Linux. Next, we will demonstrate how to visualize data for a wide range of applications using OpenGL, starting from simple 2D datasets to increasingly complex 3D datasets with more advanced techniques. Each chapter addresses different visualization problems encountered in real life and introduces the relevant OpenGL features and libraries in a modular fashion.By the end of this book, you will be equipped with the essential skills to develop a wide range of impressive OpenGL-based applications for your unique data visualization needs, on platforms ranging from conventional computers to the latest mobile/wearable devices.
Omar Khedher
The Sahara project is a module that aims to simplify the building of data processing capabilities on OpenStack.The goal of this book is to provide a focused, fast paced guide to installing, configuring, and getting started with integrating Hadoop with OpenStack, using Sahara.The book should explain to users how to deploy their data-intensive Hadoop and Spark clusters on top of OpenStack. It will also cover how to use the Sahara REST API, how to develop applications for Elastic Data Processing on Openstack, and setting up hadoop or spark clusters on Openstack.
Anirudh Kala, Anshul Bhatnagar, Sarthak Sarbahi
Databricks is an industry-leading, cloud-based platform for data analytics, data science, and data engineering supporting thousands of organizations across the world in their data journey. It is a fast, easy, and collaborative Apache Spark-based big data analytics platform for data science and data engineering in the cloud.In Optimizing Databricks Workloads, you will get started with a brief introduction to Azure Databricks and quickly begin to understand the important optimization techniques. The book covers how to select the optimal Spark cluster configuration for running big data processing and workloads in Databricks, some very useful optimization techniques for Spark DataFrames, best practices for optimizing Delta Lake, and techniques to optimize Spark jobs through Spark core. It contains an opportunity to learn about some of the real-world scenarios where optimizing workloads in Databricks has helped organizations increase performance and save costs across various domains.By the end of this book, you will be prepared with the necessary toolkit to speed up your Spark jobs and process your data more efficiently.
Francisco Munoz Alvarez, Aman Sharma
The three main responsibilities of a successful DBA are to ensure the availability, recoverability, and performance of any database. To ensure the recoverability of any database, a DBA needs to have a strong backup and recovery skills set. Every DBA is always looking for a reference book that will help them to solve any possible backup and recovery situation that they can come across in their professional life.Oracle Database 12c Backup and Recovery Survival Guide has the unique advantage to be a reference to all Oracle backup and recovery options available, making it essential for any DBA in the world. If you are new to Oracle Database, this book will introduce you to the fantastic world of backup and recovery that is vital to your success. If you are an experienced DBA, this book will become a reference guide and will also help you to learn some possible new skills, or give you some new ideas you were never aware about. It will also help you to easily find the solution to some of the most well known problems you could find during your career as a DBA. This book contains useful screenshots, scripts, and examples that you will find more than useful.Most of the books currently available in the market concentrate only on the RMAN utility to backup and recovery. This book will be an exception to the rule and will become a must-have reference, allowing you to design a real and complete backup and recovery strategy. It covers the most important topics on Oracle database such as backup strategies, Nologging operations, new features in 12c, user managed backups and recoveries, RMAN (including reporting, catalog management, troubleshooting, and performance tuning), advanced data pump, Oracle Enterprise Manager 12c and SQL Developer.Oracle Database 12c Backup and Recovery Survival Guide contains everything a DBA needs to know to keep data safe and recoverable, using real-life scenarios.
OSINT w praktyce. Jak gromadzić i analizować dane dostępne w sieci
Dale Meredith
Pojęcie OSINT pochodzi od angielskiego wyrażenia open source intelligence i oznacza biały wywiad. Polega na pozyskiwaniu danych z publicznie dostępnych źródeł. Okazuje się, że niezwykle cenne informacje są dostępne na wyciągnięcie ręki, ale trzeba wiedzieć, w jaki sposób do nich dotrzeć. A potrafi to być niezwykle wciągające zajęcie, przy okazji którego można poznać podstawy cyberbezpieczeństwa, zrozumieć czyhające w internecie zagrożenia i nauczyć się zabezpieczać swoją cyfrową obecność. Z tą książką krok po kroku zagłębisz się w metody OSINT, a także powiązane z nim zagadnienia natury prawnej i etycznej. Poznasz sposoby gromadzenia i analizowania informacji z wykorzystaniem wyszukiwarek, portali społecznościowych i innych zasobów internetowych. Zrozumiesz wagę anonimowości i technik gwarantujących bezpieczne poruszanie się po sieci, ułatwiających zarządzanie cyfrowym śladem czy tworzenie fikcyjnych tożsamości internetowych. Zdobędziesz również doświadczenie w korzystaniu z popularnych narzędzi OSINT, takich jak Recon-ng, Maltego, Shodan czy Aircrack-ng. Dowiesz się też, jak ograniczać ryzyko, przewidywać cyberataki, zapobiegać im i na nie reagować - wszystko dzięki technikom opartym na OSINT. W książce: działanie OSINT i najlepsze praktyki automatyzacja zbierania i analizy danych dane z mediów społecznościowych a OSINT zarządzanie swoim cyfrowym śladem, ograniczanie ryzyka i ochrona prywatności skuteczny program analizy ryzyka na bazie OSINT zwiększanie bezpieczeństwa firmy technikami OSINT Dołącz potężne narzędzia OSINT do swojego arsenału!
Pandas Basics. Mastering Data Analysis with Pandas
Mercury Learning and Information, Oswald Campesato
This book is essential for aspiring data scientists and anyone needing to perform data cleaning using Pandas and NumPy. It offers numerous code samples and comprehensive coverage of NumPy and Pandas features, including writing regular expressions. Chapter 3 introduces fundamental statistical concepts, while Chapter 7 delves into data visualization using Matplotlib and Seaborn. Companion files with code are available for download from the publisher.Starting with an introduction to Python, the course progresses through working with data, and then moves into Pandas, covering its functionalities in three detailed chapters. The statistical concepts provided are crucial for analyzing data effectively, while the visualization techniques enhance the ability to present data insights clearly.By the end of this course, users will have a solid foundation in data manipulation and cleaning, statistical analysis, and data visualization, enabling them to tackle real-world data science tasks confidently and efficiently.