Analiza danych
Deborah A. Dahl
Natural Language Understanding facilitates the organization and structuring of language allowing computer systems to effectively process textual information for various practical applications. Natural Language Understanding with Python will help you explore practical techniques for harnessing NLU to create diverse applications. with step-by-step explanations of essential concepts and practical examples, you’ll begin by learning about NLU and its applications. You’ll then explore a wide range of current NLU techniques and their most appropriate use-case. In the process, you’ll be introduced to the most useful Python NLU libraries. Not only will you learn the basics of NLU, you’ll also discover practical issues such as acquiring data, evaluating systems, and deploying NLU applications along with their solutions. The book is a comprehensive guide that’ll help you explore techniques and resources that can be used for different applications in the future.By the end of this book, you’ll be well-versed with the concepts of natural language understanding, deep learning, and large language models (LLMs) for building various AI-based applications.
Bo Wang, Cristian Mitroi, Feng Wang, Shubham...
Search is a big and ever-growing part of the tech ecosystem. Traditional search, however, has limitations that are hard to overcome because of the way it is designed. Neural search is a novel approach that uses the power of machine learning to retrieve information using vector embeddings as first-class citizens, opening up new possibilities of improving the results obtained through traditional search.Although neural search is a powerful tool, it is new and finetuning it can be tedious as it requires you to understand the several components on which it relies. Jina fills this gap by providing an infrastructure that reduces the time and complexity involved in creating deep learning–powered search engines. This book will enable you to learn the fundamentals of neural networks for neural search, its strengths and weaknesses, as well as how to use Jina to build a search engine. With the help of step-by-step explanations, practical examples, and self-assessment questions, you'll become well-versed with the basics of neural search and core Jina concepts, and learn to apply this knowledge to build your own search engine.By the end of this deep learning book, you'll be able to make the most of Jina's neural search design patterns to build an end-to-end search solution for any modality.
NoSQL, NewSQL i BigData. Bazy danych następnej generacji
Guy Harrison
Model relacyjnej bazy danych zdecydowanie dominował wśród technologii bazodanowych przez ostatnie 20 lat. Poszczególne rozwiązania były do siebie na tyle podobne, że decyzja o zastosowaniu relacyjnej bazy danych stała się oczywista. Architektura rozwiązań tego typu była zbliżona, a różnice polegały głównie na koszcie wdrożenia, wydajności, niezawodności i łatwości użycia aplikacji. Obecnie sytuacja diametralnie się zmieniła: powstało wiele radykalnie różniących się od siebie technologii bazodanowych, a wybór właściwej bazy danych stał się złożonym zadaniem, wymagającym sporej wiedzy i obarczonym poważnymi konsekwencjami natury ekonomicznej i technologicznej. Ta książka szczególnie przyda się architektom technologii informatycznych, administratorom baz danych i projektantom, którzy do wykonywania swoich obowiązków potrzebują wiedzy o najświeższych rozwiązaniach z dziedziny technologii baz danych. Omówiono tu najnowsze, wykorzystywane obecnie technologie baz danych. Wyjaśniono, w jakim celu zaprojektowano każdą z nich. Zaprezentowano możliwości poszczególnych baz danych oraz ich potencjał w rozwiązywaniu realnych problemów biznesowych i problemów z aplikacjami. Co najważniejsze, ukazano różnice w architekturze między technologiami, które mają kluczowe znaczenie przy wyborze platformy baz danych dla nowych i planowanych projektów. W tej książce między innymi: Co zrewolucjonizowało bazy danych Google, Hadoop i koncepcja BigData Pamięciowe i rozproszone bazy danych NoSQL, CQL i nowe odsłony SQL Hybrydowe bazy danych Oracle NoSQL i BigData: potężne bazy danych przyszłości!
Nowe usługi 2.0. Przewodnik po analizie zbiorów danych
Toby Segaran
Wykorzystaj dane z sieci do własnych potrzeb! Internet to nic innego jak gigantyczny zbiór danych. Każdy, kto znajdzie sposób na ich umiejętne wykorzystanie, ma szansę zbudować aplikację, która odniesie światowy sukces. Serwisy randkowe, portale społecznościowe, porównywarki cen — to tylko drobna część serwisów, które możesz wykorzystać przy tworzeniu nowej usługi. Jak analizować dane i wyciągnąć wnioski? Na wiele podobnych pytań odpowiada ta jedyna w swoim rodzaju książka. W trakcie lektury poznasz najlepsze sposoby filtrowania danych, tworzenia rekomendacji, wykrywania grup oraz wyszukiwania i klasyfikowania. Na kolejnych stronach znajdziesz bogaty zbiór informacji poświęconych algorytmom analizującym dane. Ponadto będziesz mieć możliwość zapoznania się z różnymi sposobami optymalizacji, modelowania przy użyciu drzew decyzyjnych oraz tworzenia modeli cenowych. Książka ta w rękach wprawnego programisty może stanowić niesamowite narzędzie. Otwiera wrota do świata pełnego danych i zależności pomiędzy nimi! Dzięki tej książce: poznasz najlepsze i najskuteczniejsze algorytmy do analizy danych zbudujesz model cen nauczysz się korzystać z drzew decyzyjnych zastosujesz dane z sieci do budowy nowych usług Wyciągnij właściwe wnioski z posiadanych danych! „Brawo! Nic lepszego nie przychodzi mi na myśl w przypadku programisty, który zaczyna dopiero przygodę z opisanymi w książce algorytmami i metodami. Sam (jako stary »wyjadacz« od sztucznej inteligencji) sięgnąłbym po nią w pierwszej kolejności, żeby odświeżyć swoją znajomość szczegółów.” Dan Russell, główny specjalista ds. technologii, firma Google „W książce Toby’ego w znakomity sposób dokonano rozbicia złożonego zagadnienia dotyczącego algorytmów uczenia maszynowego na praktyczne i łatwe do zrozumienia przykłady, które mogą być bezpośrednio używane do analizowania interakcji społecznościowej w obecnym internecie. Jeśli ta książka trafiła w moje ręce dwa lata wcześniej, zaoszczędziłbym mój cenny czas, gdy podążałem bezowocnymi ścieżkami.” Tim Wolters, szef ds. technologii, firma Collective Intellect
Nowoczesna analiza danych w Excelu. Power Query, Power Pivot i inne narzędzia
George Mount
Organizacje stosują zaawansowane narzędzia i techniki, aby umożliwić podejmowanie decyzji na podstawie danych. Jeszcze do niedawna MS Excel nie był w stanie sprostać wymaganiom analityków, obecnie jest wschodzącą gwiazdą w świecie nowoczesnej analizy danych. Kluczem do sukcesu stało się opanowanie takich narzędzi jak Power Pivot czy Power Query. Dzięki tej praktycznej książce przekonasz się, że w Excelu możesz przeprowadzić dogłębną analizę danych i wyciągnąć z nich cenną wiedzę. Wystarczy, że skorzystasz z najnowszych funkcji i narzędzi Excela. W poradniku pokazano, jak za pomocą Power Query budować przepływy pracy porządkujące dane i jak projektować w skoroszycie relacyjne modele danych przy użyciu Power Pivot. Ponadto odkryjesz nowe możliwości przeprowadzania analiz, w tym dynamiczne funkcje tablicowe i pozyskiwanie wartościowych informacji z wykorzystaniem sztucznej inteligencji. Dowiesz się również, jak za sprawą integracji z Pythonem zautomatyzować analizę danych i budować raporty. W książce: tworzenie procesów porządkujących dane w Excelu za pomocą Power Query relacyjne modele danych i wskaźniki analityczne w Power Pivot korzystanie z dynamicznych funkcji tablicowych zastosowanie AI do identyfikacji wzorców i trendów w danych integracja funkcjonalności Pythona z Excelem Książka jest łatwa w odbiorze, praktyczna i pomocna dla analityków, a także zwykłych użytkowników! Meghan Finley, autorka i redaktorka tekstów technicznych
Nowoczesne analizy biznesowe. Zwiększanie wartości danych przy użyciu Pythona i R
Deanne Larson
"Lektura obowiązkowa dla wszystkich analityków biznesowych i danetyków." Balaji Dhamodharan, światowy lider w dziedzinie danetyki, NXP Semiconductors "Ta książka to niezastąpione źródło wiedzy dla każdego, kto pragnie opanować szybko zmieniający się świat analityki." Lipi Deepaakshi Patnaik, starszy inżynier oprogramowania, Zeta Wydobycie wartości biznesowej z ogromu danych to trudny i wymagający proces. Przekształcenie surowych danych w użyteczne informacje wymaga od analityka biegłego posługiwania się wieloma technologiami, takimi jak bazy danych, narzędzia programistyczne czy komercyjne narzędzia analityczne. Ten praktyczny przewodnik pokazuje programistom rozumiejącym koncepcje analizy, jak rozwijać umiejętności niezbędne do uzyskania wartości biznesowej. Autorka, zajmująca się danetyką zarówno od strony praktycznej, jak i naukowej, pomaga połączyć światy biznesu i techniki, aby spełnić te wymagania. Rozwiń umiejętności posługiwania się językami R i Python na z życia wziętych przykładach. Dowiedz się również, jak wykorzystywać właściwe metodologie w celu skutecznego realizowania celów. Metodyka uczenia się połączona z narzędziami open source jest kluczem do dostarczania rzeczywistych wartości biznesowych. Książka ta pokazuje, jak: - Stosować metodologie analityki biznesowej, aby osiągnąć pomyślne wyniki - Czyścić i przekształcać dane przy użyciu R i Pythona - Używać R i Pythona do wykonywania eksploracyjnej analizy danych - Tworzyć modele predykcyjne do rozwiązywania problemów biznesowych w R i Pythonie - Używać Pythona, R i narzędzi analitycznych do obsługi wielkich wolumenów danych - Współpracować z inżynierami danych i danetykami - Mierzyć skuteczność analiz biznesowych Dr. Deanne Larson jest eksperktą w dziedzinie danetyki oraz edukatorką, która pomaga największym firmom odblokować wartości biznesowe dzięki analityce. Dzięki wykładom w zakresie analiz, sztucznej inteligencji i przywództwa prowadzonym na takich uczelniach, jak MIT, Harvard, Stanford i NYU, stała się poszukiwanym wykładowcą i oddanym mentorem swojej dziedziny.
James Serra
Architektury data fabric i data lakehouse, a także siatka danych pojawiły się niedawno jako alternatywy hurtowni danych. Te nowe architektury mają swoje mocne strony, ale podczas projektowania rzeczywistych rozwiązań musisz pamiętać o odróżnianiu faktów od przesadnych pochwał i niejasności. Nie zawsze jest to proste i oczywiste zadanie. Niezwykłość tej książki polega na przekształcaniu złożonych zagadnień technicznych w jasne i zrozumiałe objaśnienia. Annie Xu, starszy inżynier danych, Google Dzięki temu praktycznemu przewodnikowi profesjonaliści zajmujący się danymi dobrze zrozumieją wady i zalety poszczególnych rozwiązań. Omówiono tu typowe zagadnienia dotyczące architektur danych, w tym ich rozwój i możliwości. Żadna architektura nie jest na tyle uniwersalna, by być odpowiednia w każdej sytuacji, dlatego w książce znajdziesz rzetelne porównanie cech poszczególnych architektur. Dowiesz się, jakie kompromisy towarzyszą każdej z nich, niezależnie od popularności. W ten sposób o wiele łatwiej przyjdzie Ci wybór rozwiązania, które najlepiej odpowiada Twoim potrzebom. Najciekawsze zagadnienia: praktyczne działanie architektur danych, ich mocne i słabe strony wybór najlepszej architektury pod kątem konkretnego zastosowania różnice między hurtowniami i "jeziorami" danych wspólne koncepcje architektur danych i ich historyczny rozwój sesje projektowania architektury, organizacja zespołów i najważniejsze uwarunkowania Połóż tę książkę na biurku. Będziesz często po nią sięgać! Sawyer Nyquist, autor, właściciel The Data Shop
Pratap Dangeti, Allen Yu, Claire Chung, Aldrin...
Data mining, or parsing the data to extract useful insights, is a niche skill that can transform your career as a data scientist Python is a flexible programming language that is equipped with a strong suite of libraries and toolkits, and gives you the perfect platform to sift through your data and mine the insights you seek. This Learning Path is designed to familiarize you with the Python libraries and the underlying statistics that you need to get comfortable with data mining.You will learn how to use Pandas, Python's popular library to analyze different kinds of data, and leverage the power of Matplotlib to generate appealing and impressive visualizations for the insights you have derived. You will also explore different machine learning techniques and statistics that enable you to build powerful predictive models.By the end of this Learning Path, you will have the perfect foundation to take your data mining skills to the next level and set yourself on the path to become a sought-after data science professional.This Learning Path includes content from the following Packt products:• Statistics for Machine Learning by Pratap Dangeti• Matplotlib 2.x By Example by Allen Yu, Claire Chung, Aldrin Yim• Pandas Cookbook by Theodore Petrou