Big data
Bahaaldine Azarmi, Jeff Vestal, Shay Banon
While natural language processing (NLP) is largely used in search use cases, this book aims to inspire you to start using vectors to overcome equally important domain challenges like observability and cybersecurity. The chapters focus mainly on integrating vector search with Elastic to enhance not only their search but also observability and cybersecurity capabilities.The book, which also features a foreword written by the founder of Elastic, begins by teaching you about NLP and the functionality of Elastic in NLP processes. Here you’ll delve into resource requirements and find out how vectors are stored in the dense-vector type along with specific page cache requirements for fast response times. As you advance, you’ll discover various tuning techniques and strategies to improve machine learning model deployment, including node scaling, configuration tuning, and load testing with Rally and Python. You’ll also cover techniques for vector search with images, fine-tuning models for improved performance, and the use of clip models for image similarity search in Elasticsearch. Finally, you’ll explore retrieval-augmented generation (RAG) and learn to integrate ChatGPT with Elasticsearch to leverage vectorized data, ELSER's capabilities, and RRF's refined search mechanism.By the end of this NLP book, you’ll have all the necessary skills needed to implement and optimize vector search in your projects with Elastic.
Dr Ranjana Rajnish; Dr Meenakshi Srivastava
Danologia to najszybciej rozwijająca się dziedzina na świecie. Przewiduje się, że do roku 2026 stworzy 11,5 mln nowych miejsc pracy, tak więc osoby poszukujące pracy i posiadające ten zestaw umiejętności mają tu wiele możliwości. Jednym z najbardziej pożądanych obszarów w dziedzinie danologii jest wydobywanie informacji ze stron internetowych. Jeśli jesteś początkującym danologiem, który chce się nauczyć różnych technik eksplorowania stron sieci Web, ta książka jest właśnie dla Ciebie. Na początku tej książki omawiane są kluczowe koncepcje związane z eksploracją danych w sieci Web i jej taksonomią. Następnie omawiane są podstawy dotyczące procesu ekstrakcji danych ze stron, jego zastosowania i komponenty, a także inne tematy, jak choćby aspekty prawne związane z procesem ekstrakcji, wyodrębnianiem i wstępnym przetwarzaniem danych, ekstrakcją danych z dynamicznych stron internetowych czy zabezpieczeniem CAPTCHA. Przedstawia również koncepcję eksploracji opinii oraz struktury stron internetowych. Ponadto omawia ona eksplorację grafów, wyodrębnianie informacji ze stron internetowych, wyszukiwanie na stronach i hiperłącza, wyszukiwanie algorytmem Hyperlink Induced Topic Search (HITS) oraz algorytmy partycjonowania, które używane są przy eksploracji danych w sieci Web. Na końcu książki prezentowane są różne techniki eksploracji ułatwiające odkrywanie interesujących wzorców użycia z danych na stronach internetowych. Kluczowe elementy Pełny przegląd podstawowych i zaawansowanych koncepcji dotyczących eksploracji danych w sieci Web. Pracuj z łatwymi w użyciu bibliotekami open source języka Python do eksplorowania danych. Zapoznaj się z różnymi korzystnymi obszarami i zastosowaniami dla eksploracji danych w sieci Web. CZEGO SIĘ NAUCZYSZ? Dokonywać ekstrakcji danych z dowolnej witryny internetowej z użyciem języka Python. Zapoznasz się z koncepcjami dotyczącymi eksploracji opinii i analizy nastrojów. Użyjesz eksploracji struktury do odkrywania informacji o strukturze danej strony. Nauczysz się zbierać i analizować dane z mediów społecznościowych z użyciem języka Python. Użyjesz eksploracji korzystania ze strony do przewidywania zachowań internautów podczas przeglądania stron. Dla kogo jest ta książka Ta książka jest przeznaczona dla każdego, kto chce się nauczyć eksplorować dane na stronach sieci Web. Będzie najbardziej pomocna dla początkujących danologów, inżynierów danych i analityków danych, którzy chcą opanować techniki eksplorowania danych na stronach internetowych.
Charbel Nemnom, Patrick Lownds, Leandro Carvalho
Hyper-V 2016 is full of new features and updates. The second of our best-selling Hyper-V books, the Windows Server 2016 Hyper-V Cookbook has it all covered. Brimming with expert solutions and techniques, you?ll have everything you need to master virtualization and Hyper-V Manager. This Hyper-V book is designed to help advanced-level administrators benefit fully from the new Windows Server. With over 80 hands-on recipes, the Hyper-V Cookbook gives you tips, tricks and best practices to deploy, maintain and upgrade your virtual machines.
Wizualizacja danych. Pulpity nawigacyjne i raporty w Excelu
Dick Kusleika
Dziś nawet małe firmy mają niespotykany wcześniej dostęp do dużych ilości danych. Osoby zarządzające przedsiębiorstwem mogą z nich korzystać przy podejmowaniu decyzji biznesowych, w tym celu jednak konieczne jest przetworzenie surowych danych. Tym właśnie zajmuje się analityka biznesowa, a jednym z najpopularniejszych programów stosowanych w tej dziedzinie jest MS Excel. Od jakiegoś czasu oprogramowanie to zawiera wyspecjalizowane funkcje i narzędzia, dzięki którym analizę i wizualizację danych można wykonać bez potrzeby sięgania po inne aplikacje. Lektura tej książki nauczy Cię myśleć o danych inaczej niż dotychczas. Przekonasz się, że to nie tylko wypełnione kolumny i wiersze. Nie poprzestaniesz na prostej pracy z danymi, a nauczysz się je układać w historie obfitujące w cenne wnioski. Dowiesz się, jak sobie radzić z wartościami, które wyraźnie odstają od innych, i nauczysz się odpowiedniego grupowania danych. Zobaczysz, że można je pokazywać ― nawet jeśli są to ogromne ilości ― bez zasypywania i dezorientowania odbiorców. W końcu odkryjesz, jak przejść od arkusza z nieprzetworzonymi danymi i wykresami do pełnych wartościowych informacji raportów i paneli nawigacyjnych. W ten sposób, dzięki wizualizacji danych biznesowych, łatwiej Ci będzie przekonać swoich partnerów do własnych pomysłów. Dzięki książce poznasz sposoby: analizowania bardzo dużych ilości danych prezentowania danych z kilku perspektyw efektywnego rozdzielania danych na różne widoki automatyzowania procesów przygotowywania raportów i przeprowadzania analiz tworzenia atrakcyjnych paneli nawigacyjnych przygotowania analiz typu „co, jeśli” MS Excel: najbardziej przydatne wnioski wyciągniesz ze swoich danych!
Aleksander Molak
W uczeniu maszynowym odkrywanie związków przyczynowych daje możliwości, jakich nie można uzyskać tradycyjnymi technikami statystycznymi. Najnowsze trendy w programowaniu pokazują, że przyczynowość staje się kluczowym zagadnieniem dla generatywnej sztucznej inteligencji. Niezbędna okazuje się więc znajomość grafów przyczynowych i zapytań konfrontacyjnych. Dzięki tej książce łatwo przyswoisz teoretyczne podstawy i zaczniesz je płynnie wdrażać w rzeczywistych scenariuszach. Dowiesz się, w jaki sposób myślenie przyczynowe ułatwia rozwiązywanie problemów, i poznasz pojęcia Pearla, takie jak strukturalny model przyczynowy, interwencje, kontrfakty itp. Każde zagadnienie zostało dokładnie wyjaśnione i opatrzone zbiorem praktycznych ćwiczeń z kodem w Pythonie. Nauczysz się także implementować poszczególne modele i zrozumiesz, czym się kierować przy wyborze technik i algorytmów do rozwiązywania konkretnych scenariuszy przyczynowych. To przewodnik, który docenią szczególnie inżynierowie uczenia maszynowego i analitycy danych. W książce: wnioskowanie związków przyczynowych budowa i działanie strukturalnych modeli przyczynowych czteroetapowy proces wnioskowania związków przyczynowych w Pythonie techniki modelowania efektu interwencji nowoczesne metody odkrywania związków przyczynowych za pomocą Pythona korzystanie z wnioskowania związków przyczynowych Przyczyna i skutek, nic więcej. Pomyłki jako takie nie istnieją... Jose Antonio Cotrina, hiszpański pisarz science fiction
Wnioskowanie przyczynowe w Pythonie. Praktyczne wykorzystanie w branży technologicznej
Matheus Facure
Wnioskowanie przyczynowe przydaje się w sytuacji, gdy trzeba określić wpływ decyzji biznesowej na konkretny wynik, na przykład wielkość sprzedaży. Działania te są dobrze znane nauce, ale dopiero od niedawna świat poznaje korzyści z ich zastosowania w branży technologicznej. Przyczyniły się do tego postępy w uczeniu maszynowym, automatyzacji procesów i danologii. Teraz, aby uzyskać wymierne korzyści, wystarczy kilka wierszy kodu w Pythonie. Poznaj narzędzia najbardziej znanych analityków danych korzystających z Pythona! prof. Nick Huntington-Klein, autor The Effect: An Introduction to Research Design and Causality Tę książkę docenią w szczególności analitycy danych. Wyjaśniono w niej potencjał wnioskowania przyczynowego w zakresie szacowania wpływu i efektów w biznesie. Opisano klasyczne metody wnioskowania przyczynowego, w tym testy A/B, regresja liniowa, wskaźnik skłonności, metoda syntetycznej kontroli i metoda różnicy w różnicach, przy czym skoncentrowano się przede wszystkim na praktycznym aspekcie tych technik. Znalazło się tu również omówienie nowoczesnych rozwiązań, takich jak wykorzystanie uczenia maszynowego do szacowania heterogenicznych efektów. Każda metoda została zilustrowana opisem zastosowania w branży technologicznej. W książce między innymi: podstawy wnioskowania przyczynowego problemy biznesowe jako zagadnienia z obszaru wnioskowania przyczynowego eksperymenty geograficzne i eksperymenty z przełączaniem oddziaływania badanie błędu systematycznego modele graficzne i wizualizacja związków przyczynowych Najlepsza książka poświęcona najnowocześniejszym metodom, działaniu na rzeczywistych danych i rozwiązywaniu praktycznych problemów! Sean J. Taylor, główny badacz w Motif Analytics
Wnioskowanie przyczynowe w Pythonie. Praktyczne wykorzystanie w branży technologicznej
Matheus Facure
Wnioskowanie przyczynowe przydaje się w sytuacji, gdy trzeba określić wpływ decyzji biznesowej na konkretny wynik, na przykład wielkość sprzedaży. Działania te są dobrze znane nauce, ale dopiero od niedawna świat poznaje korzyści z ich zastosowania w branży technologicznej. Przyczyniły się do tego postępy w uczeniu maszynowym, automatyzacji procesów i danologii. Teraz, aby uzyskać wymierne korzyści, wystarczy kilka wierszy kodu w Pythonie. Poznaj narzędzia najbardziej znanych analityków danych korzystających z Pythona! prof. Nick Huntington-Klein, autor The Effect: An Introduction to Research Design and Causality Tę książkę docenią w szczególności analitycy danych. Wyjaśniono w niej potencjał wnioskowania przyczynowego w zakresie szacowania wpływu i efektów w biznesie. Opisano klasyczne metody wnioskowania przyczynowego, w tym testy A/B, regresja liniowa, wskaźnik skłonności, metoda syntetycznej kontroli i metoda różnicy w różnicach, przy czym skoncentrowano się przede wszystkim na praktycznym aspekcie tych technik. Znalazło się tu również omówienie nowoczesnych rozwiązań, takich jak wykorzystanie uczenia maszynowego do szacowania heterogenicznych efektów. Każda metoda została zilustrowana opisem zastosowania w branży technologicznej. W książce między innymi: podstawy wnioskowania przyczynowego problemy biznesowe jako zagadnienia z obszaru wnioskowania przyczynowego eksperymenty geograficzne i eksperymenty z przełączaniem oddziaływania badanie błędu systematycznego modele graficzne i wizualizacja związków przyczynowych Najlepsza książka poświęcona najnowocześniejszym metodom, działaniu na rzeczywistych danych i rozwiązywaniu praktycznych problemów! Sean J. Taylor, główny badacz w Motif Analytics
Wprowadzenie do systemów baz danych. Wydanie VII
Ramez Elmasri, Shamkant B. Navathe
Mijają lata, a bazy danych wciąż stanowią serce większości systemów informatycznych. Rozwój technologii sprawia jednak, że zaprojektowanie systemu baz danych, jego wdrożenie i administrowanie nim wymaga biegłości w wielu dziedzinach. Niezbędne są solidne podstawy modelowania i projektowania baz danych, umiejętność posłużenia się językami i modelami udostępnianymi przez systemy zarządzania bazami danych, a także znajomość technik implementacji samych systemów. Od profesjonalisty wymaga się także wiedzy o najnowszych technologiach, takich jak NoSQL i oczywiście big data. Ważnym uzupełnieniem tego szerokiego wachlarza jest też znajomość technologii powiązanych z systemami bazodanowymi. Ta książka jest siódmym, zaktualizowanym wydaniem klasycznego podręcznika do nauki baz danych. Jest to szczegółowa prezentacja najważniejszych aspektów systemów i aplikacji bazodanowych oraz powiązanych technologii. To znakomity podręcznik dla studentów i świetne kompendium dla praktyków. Sporo miejsca poświęcono w nim systemom rozproszonym oraz technologiom opartym na systemie Hadoop i modelu MapReduce. Nie zabrakło opisu takich zagadnień, jak model IR, wyszukiwanie z użyciem słów kluczowych, porównanie baz danych z modelem IR, modele wyszukiwania, ocena wyszukiwania i algorytmy rankingowe. Wykładowcom przyda się szereg ułatwiających pracę dydaktyczną diagramów, prezentacji i rysunków. W książce między innymi: wprowadzenie do modeli, systemów i języków z obszaru baz danych; model związków encji i programowanie baz danych; bazy relacyjne, obiektowo-relacyjne, obiektowe i XML w bazach danych; algorytmy przetwarzania zapytań i techniki optymalizacji; bezpieczeństwo baz danych. Baza danych? Stosuj tylko najskuteczniejsze rozwiązania!
Wprowadzenie do uczenia maszynowego według Esposito
Dino Esposito, Francesco Esposito
Opanuj koncepcje uczenia maszynowego i rozwiązuj rzeczywiste problemy Uczenie maszynowe stwarza niesamowite możliwości, a książka Wprowadzenie do uczenia maszynowego zawiera praktyczną wiedzę o ich wykorzystaniu. Dino i Francesco Esposito zaczynają od krótkiego omówienia podstawowych zagadnień sztucznej inteligencji oraz zasad każdego projektu uczenia maszynowego. Następ-nie wprowadzają do potężnej biblioteki ML.NET opracowanej przez firmę Microsoft. Omawiają między innymi przetwarzanie danych, uczenie i weryfikację. Prezentują rodziny algorytmów, które można uczyć w celu rozwią-zywania rzeczywistych problemów, a także techniki uczenia głębokiego wykorzystujące sieci neuronowe. Na koniec autorzy omawiają wartościowe usługi czasu wykonywania, dostępne za pośrednictwem chmury obli-czeniowej Azure, a także rozważają długoterminowe perspektywy biznesowe związane z uczeniem maszyno-wym. Dino Esposito, 14-krotnie wyróżniony tytułem Microsoft MVP, oraz Francesco Esposito ułatwią nam: Zgłębianie poznanych zasad uczenia się ludzi oraz budowy inteligentnego oprogramowania Odkrycie problemów, które można rozwiązać z wykorzystaniem uczenia maszynowego Zrozumienie potoku uczenia maszynowego, czyli kroków prowadzących do uzyskania gotowego modelu Użycie AutoML w celu automatycznego wybrania najlepszego potoku dla dowolnego problemu i zbioru danych Opanowanie biblioteki ML.NET, zaimplementowanie jej potoku oraz wykorzystanie zadań i algorytmów Zgłębianie matematycznych podstaw uczenia maszynowego Prognozowanie, ulepszanie sposobów podejmowania decyzji i stosowanie metod probabilistycznych Grupowanie danych poprzez klasyfikację i klasteryzację Poznanie podstaw uczenia głębokiego, włącznie z projektowaniem sieci neuronowych Wykorzystanie usług w chmurze AI w celu szybszego tworzenia lepszych rzeczywistych rozwiązań O książce Dla profesjonalistów zamierzających tworzyć aplikacje wykorzystujące uczenie maszynowe: zarówno dla programistów chcących zdobyć umiejętności z zakresu analizy danych, jak i dla analityków danych, którzy chcą zdobyć odpowiednie umiejętności programistyczne Zawiera przykładowe scenariusze kodu uczenia maszynowego wykorzystujące bibliotekę ML.NET O autorach Dino Esposito, 14-krotnie wyróżniony tytułem Microsoft MVP, jest autorem ponad 20 książek, włącznie z best-sellerem wydawnictwa Microsoft Press, zatytułowanym Microsoft .NET: Architecting Applications for the Enter-prise. Od 22 lat jest autorem kolumny Cutting Edge, a także prowadzi regularne wykłady w firmie Microsoft i na niezależnych wydarzeniach branżowych na całym świecie. Od ponad 25 lat jest programistą, a obecnie kon-centruje się na sztucznej inteligencji w kontekście inteligentnych rozwiązań dla miast i energetyki, pracując na stanowisku stratega do spraw korporacyjnych rozwiązań cyfrowych w BaxEnergy. Francesco Esposito jest 21-letnim programistą zawieszonym między zagadnieniami zaawansowanej matema-tyki i tajnikami nauk o danych. Interesuje się przede wszystkim hydrologią i służbą zdrowia. Francesco założył Youbiquitous, firmę zajmującą się oprogramowaniem i sztuczną inteligencją, a także prowadzi małą firmę in-westycyjną. Cały przykładowy kod, włącznie z kompletnymi aplikacjami, jest dostępny pod adresem MicrosoftPressStore.com/IntroMachineLearning/downloads Obraz na okładce autorstwa Andreya Pronin/aAlamy Stock Vector