Big data
Lior Gazit, Meysam Ghaffari
Uczenie maszynowe i duże modele językowe rewolucjonizują biznes i nasze codzienne życie. Potencjał tych innowacji jest trudny do oszacowania: modele LLM stały się wiodącym trendem w tworzeniu aplikacji i analizie danych. Integrowanie zaawansowanych modeli z systemami produkcyjnymi bywa jednak często wymagającym, a nawet niewdzięcznym zadaniem. Na szczęście dzięki tej książce poradzisz sobie z takimi wyzwaniami! Najpierw zapoznasz się z matematycznymi podstawami algorytmów ML i NLP. Zaznajomisz się również z ogólnymi technikami uczenia maszynowego i dowiesz się, w jakim stopniu dotyczą one dużych modeli językowych. Kolejnym zagadnieniem będzie przetwarzanie danych tekstowych, w tym metody przygotowywania tekstu do analizy, po czym przyswoisz zasady klasyfikowania tekstu. Ponadto poznasz zaawansowane aspekty teorii, projektowania i stosowania LLM, wreszcie ― przyszłe trendy w NLP. Aby zdobyć praktyczne umiejętności, będziesz ćwiczyć na przykładach rzeczywistych zagadnień biznesowych i rozwiązań NLP. W książce: podstawy matematyczne uczenia maszynowego i NLP zaawansowane techniki przetwarzania wstępnego i analizy danych tekstowych projektowanie systemów ML i NLP w Pythonie przetwarzanie tekstu z użyciem metod uczenia głębokiego modele LLM i ich implementacja w różnych aplikacjach AI trendy w NLP i potencjał tej technologii Odkryj przyszłe trendy w NLP widziane oczami ekspertów!
Zaawansowane uczenie maszynowe z językiem Python
John Hearty
Uczenie maszynowe przyczyniło się do powstania wielu innowacyjnych technologii. Pojazdy autonomiczne, mechanizmy rozpoznawania obrazów, badania genetyczne, a także dynamiczne dostosowywanie prezentowanych treści do preferencji odbiorcy to tylko niektóre przykłady. Możliwości związane z rozwojem tych technik sprawiają, że analityka danych i zaawansowane uczenie maszynowe stają się wyjątkowo cenną wiedzą. Dotyczy to szczególnie nowatorskich technik analizy danych, takich jak głębokie uczenie, algorytmy częściowo nadzorowane i metody zespołowe. Niniejsza książka jest przystępnie napisanym podręcznikiem, dzięki któremu poznasz niektóre zaawansowane techniki uczenia maszynowego. Szczególną uwagę poświęcono tu algorytmom uczenia maszynowego: zostały dokładnie wyjaśnione, opisano ich zastosowanie oraz topologię, metody uczenia i miary wydajności. Każdy rozdział uzupełniono o wykaz źródeł, pomocny w dalszym zgłębianiu tematu. Dodatkowo przedstawiono wiele cennych wskazówek dotyczących specyfiki pracy analityka danych. Do prezentacji przykładów wybrano język Python z uwagi na jego wszechstronność, elastyczność, prostotę oraz możliwość stosowania do specjalistycznych zadań. Najważniejsze zagadnienia przedstawione w książce: identyfikacja struktur i wzorców w zbiorach danych stosowanie sieci neuronowych praca z językiem naturalnym modele zespołowe i poprawa ich elastyczności narzędzia uczenia maszynowego w Pythonie Zaawansowane uczenie maszynowe — poznaj algorytmy przyszłości! John Hearty — jest autorytetem w dziedzinie analityki danych i inżynierii infrastruktury. Przez pewien czas zajmował się modelowaniem zachowań gracza i infrastrukturą dużych zbiorów danych w Microsofcie. Ważniejszymi jego projektami były modelowanie umiejętności gracza w grach asymetrycznych i modele segmentacji graczy mające na celu zindywidualizowanie rozgrywki. Obecnie Hearty jest niezależnym ekspertem, szczególnie cenionym przez zespoły zajmujące się eksploracją danych. W wolnym czasie tworzy modele uczenia maszynowego w Pythonie.
Zapytania w języku T-SQL w Microsoft SQL Server 2014 i SQL Server 2012
Itzik Ben-Gan, Adam Machanic, Dejan Sarka, Kevin...
Poznaj tajniki T-SQL, aby poradzić sobie z najtrudniejszymi zapytaniami i problemami dostrajania wydajności. Wyciśnij maksymalną wydajność i efektywność z każdego tworzonego zapytania T-SQL. Czterech wiodących ekspertów prezentuje pogłębiony przegląd wewnętrznej architektury T SQL i zaawansowane, praktyczne techniki optymalizowania reaktywności i zużycia zasobów. Dzięki właściwemu rozumieniu języka i jego podstaw autorzy przedstawiają unikatowe rozwiązania, tworzone i dostrajane przez lata. Cały kod i prezentowane techniki zostały w pełni zaktualizowane, aby odzwierciedlić nowe usprawnienia T-SQL dostępne w Microsoft SQL Server 2014 i SQL Server 2012. Twórz szybszy i wydajniejszy kod T-SQL: - Przejdź od programowania proceduralnego do języka zbiorów i logiki - Doskonal wydajną metodologię dostrajania zapytań - Oceniaj złożoność algorytmiczną, by móc przewidzieć wydajność rozwiązania - Porównaj techniki agregowania danych, łącznie z nową koncepcją grupowania zbiorów - Wydajnie realizuj analizy danych - Wydobądź wszystko z zoptymalizowanych narzędzi masowego importowania danych - Uniknij pułapek prowadzących do wadliwego, wolno wykonywanego kodu - Twórz zoptymalizowane zapytania statystyczne bez dodatkowego oprogramowania - Użyj obiektów programowalnych do przyśpieszenia zapytań - Wykorzystaj ulepszenia wydajności w zapytaniach OLTP - Opanuj użyteczne i eleganckie podejście do manipulowania grafami Przykłady kodu dostępne są do pobrania pod adresem tsql.solidq.com/books/tq3 O tej książce - Dla doświadczonych praktyków T-SQL - Obejmuje zaktualizowaną tematykę książek Microsoft SQL Server 2008 od środka: Zapytania w języku T-SQL oraz Programowanie w języku T-SQL - Wyjaśnia wiele zagadnień egzaminacyjnych dla certyfikacji MCSE 70-464 oraz MCSA/MCSE 70-461 O autorach Itzik Ben-Gan, SQL Server MVP od roku 1999, współtwórca SolidQ oraz cyków szkoleniowych Advanced T-SQL Querying, Programming and Tuning oraz T-SQL Fundamentals courses. Prowadzi wiele szkoleń na temat T-SQL i wykładów na konferencjach TechEd, SQLPASS i SQL Server Connections. Dejan Sarka, MCT, SQL Server MVP, jest konsultantem w dziedzinie baz danych/BI, szkoleniowcem i programistą specjalizującym się w modelowaniu, drążeniu danych i zapewnianiu jakości. Jest autorem lub współautorem 11 książek i założycielem Slovenian SQL Server and .NET Users Group. Adam Machanic, SQL Server MVP, jest programistą, autorem i wykładowcą skupiającym się na wydajności i projektowaniu wielkoskalowych hurtowni danych. Jest twórcą nagrodzonej procedury składowanej sp_WhoIsActive. Kevin Farlee, Storage Engine Program Manager w zespole SQL Server, ma ponad 25 lat doświadczenia w dziedzinie baz danych i magazynowania informacji.
Piethein Strengholt
Datafikacja trwa ― i zmienia nasze życie z zawrotną prędkością. Danych jest coraz więcej i są coraz bardziej złożone, a poza kwestiami technicznymi trzeba rozstrzygać mnóstwo dylematów etycznych lub prawnych związanych z prywatnością i bezpieczeństwem. Bez wątpienia w zarządzaniu danymi potrzeba nowej, wyrazistej wizji. Ta książka zapewnia bardzo szczegółowe i solidne podstawy z zakresu zarządzania danymi obecnie i w przyszłości! Joe Reis, współautor książki Inżynieria danych w praktyce. Kluczowe koncepcje i najlepsze technologie W książce w praktyczny sposób ujęto wiele złożonych zagadnień, różnych technologii, metod biznesowych, struktur i wzorców architektury. Przeanalizowano abstrakcyjny poziom strategii danych, kwestie zarządcze i architekturę danych, a następnie wyjaśniono, czym są domeny danych i strefy docelowe. Zaprezentowano kwestie zarządzania systemami źródłowymi, aplikacji, opisano też praktyczne szczegóły z zakresu zarządzania danymi. Nie zabrakło wartościowych informacji o aspektach istotnych dla konsumentów danych. Autor nie skupia się wyłącznie na teorii. Cennym atutem książki są jasne wskazówki, w jaki sposób zastosować omawianą wiedzę w praktyce. Zagadnienia: trendy w zarządzaniu danymi a aktualne wymagania nowe technologie projektowe, w tym siatka danych i data fabric strefy docelowe danych w chmurze, DDD, projektowanie produktów z danymi bezpieczeństwo danych zarządzanie samoobsługowymi platformami danych rola metadanych Ta książka mówi o skalowaniu i pozostaniu konkurencyjnym. Nie ma na rynku drugiej takiej pozycji! Ole Olesen-Bagneux, autor książki The Enterprise Data Catalog
Zaufanie do systemów sztucznej inteligencji
Marek Jakubiak, Paweł Stacewicz
W prezentowanym wyborze tekstów zagadnienie zaufania podjęto w sposób możliwie aktualny i wszechstronny. Odnosi się to zarówno do kwestii ogólnych, wręcz filozoficznych, związanych z narzuceniem na sposób działania maszyn pewnych norm, które od wieków postulują etycy (np. Arystoteles); jak również do kwestii bardzo szczegółowych, osadzonych w kontekście bieżących zastosowań. W obszarze zastosowań uwypuklono kwestie tak różnorodne, jak zaufanie do systemów SI wspomagających edukację, projektowanie bezpiecznych miast przyszłości (tzw. smart cities) czy zaufanie do programów i systemów usprawniających funkcjonowanie różnego rodzaju organizacji. Spośród wielu czynników wzmacniających zaufanie do sztucznej inteligencji szczególny nacisk położono na dwa - skuteczność systemu połączoną z bezpieczeństwem użytkowników oraz jego poznawczą przejrzystość połączoną z umiejętnością zrozumiałego dla człowieka wyjaśniania podejmowanych przez system decyzji. Konkluzje autorów nie są jednolite. Niektórzy są optymistami, przekonując, że nawet najbardziej rozwinięta sztuczna inteligencja pozostanie czymś na kształt kontrolowanej przez człowieka "mechanicznej lalki". Inni są bardziej sceptyczni, licząc się z możliwością zaistnienia systemów sztucznych, które przypominają bardziej "mroczne widmo" - czyli skrajnie niebezpieczny dla człowieka artefakt, zdolny do przejęcia nad nim fizycznej i psychicznej kontroli.
Zrozumieć BPMN. Modelowanie procesów biznesowych
Szymon Drejewicz
Poznaj BPMN. Zobacz na przykładach, jak modelować w procesach biznesowych: Aktywności Zdarzenia Przepływy Bramki Obiekty Uczestników Podprocesy, transakcje i kompensacje Kolaboracje Choreografie Konwersacje Pełne zrozumienie w biznesie BPMN to standard opracowany przez organizację Object Management Group (OMG). Jego pełna nazwa brzmi "Business Process Model and Notation". Podstawowym celem standardu jest dostarczenie takiej notacji do opisywania procesów biznesowych, która będzie czytelna i zrozumiała tak dla biznesowych "użytkowników", którzy procesy monitorują i zarządzają nimi, jak i dla analityków przeprowadzających biznesową analizę oraz programistów odpowiedzialnych za techniczną implementację procesów. BPMN powstał z bezsilności — z braku języka wspólnego dla analityków biznesowych, "zwykłych" uczestników biznesu i programistów. O ile bowiem informatycy mieli swój standard opisywania procesów biznesowych, o tyle ludzie w firmie, którzy mieli korzystać z ich pracy, często nie byli w stanie użyć przygotowanych dla nich modeli analitycznych. Standard BPMN przyjęto w roku 2004. Od tego momentu przestało być istotne, za pomocą jakiego narzędzia tworzone są modele procesów. W centrum uwagi znalazło się tworzenie opisu zrozumiałego dla wszystkich uczestników. Ułatwia on pracę nad procesami zachodzącymi wewnątrz firmy, otwiera także szerzej możliwości współdziałania między podmiotami obecnymi na rynku. Szymon Drejewicz. Starszy specjalista ds. jakości oprogramowania w polskim centrum Samsung Research & Development oraz asystent na Wydziale Elektrycznym Politechniki Warszawskiej. Wcześniej jako starszy konsultant i trener w firmie Infovide-Matrix SA uczestniczył w projektach BPM dla największych firm w Polsce. Specjalista od projektowania systemów oprogramowania, analizy procesów biznesowych i modelowania. Przeprowadził ponad 70 szkoleń z zakresu zarządzania procesami biznesowymi (BPMN), modelowania systemów oprogramowania w języku UML i inżynierii oprogramowania.
Zrozumieć BPMN. Modelowanie procesów biznesowych. Wydanie 2 rozszerzone
Szymon Drejewicz
Zrozumieć, by zwyciężyć Standard lub notacja BPMN (od ang. Business Process Model and Notation) jest obecnie najpopularniejszym narzędziem do specyfikowania procesów biznesowych. Na podstawie obserwacji trendów w systemach tej klasy można przypuszczać, że wkrótce całkowicie zdominuje on rynek i ostatecznie wyprze inne standardy. Sukces BPMN wynika z tego, że z jednej strony umożliwia on opisanie i rozrysowanie procesów w sposób zrozumiały dla zwykłych śmiertelników, a z drugiej pozwala na bardzo dokładne zgłębienie ich na poziomie technicznym. Te dwie cechy czynią go potężnym narzędziem rozwiązującym problem, przed jakim staje dziś wiele firm i organizacji: jak zmaksymalizować efektywność wykorzystania potencjału systemów informatycznych, zasobów finansowych i ludzi? Powiązanie tych wszystkich elementów w jedną notację lub standard stanowi punkt wyjścia do zyskania trwałej przewagi konkurencyjnej na rynku. BPMN pozwala na ciągłe analizowanie, monitorowanie i optymalizowanie procesów biznesowych. Jest narzędziem bardzo skutecznym, prawdziwym „świętym Graalem” współczesnego biznesu. Jednak nie jest on niestety tak przyjazny, jak mógłby oczekiwać początkujący użytkownik. Jego oryginalną specyfikację opracowało i udostępnia konsorcjum Object Management Group, a wiele osób twierdzi, że ta instrukcja jest mało zrozumiała. Niniejsza książka adresowana jest do wszystkich, którzy chcą lub muszą szybko poznać i zrozumieć standard BPMN bez konieczności zagłębiania się w gąszcz specyfikacji OMG. Przyda się z pewnością także analitykom biznesowym i systemowym, którzy chcą poszerzyć swoją wiedzę. Powinni zapoznać się z nią również studenci kierunków zarządczych i technicznych, ponieważ ich zawodowa przyszłość będzie nierozerwalnie związana z pracą z notacjami typu BPMN lub ich ewentualnymi następcami. Szymon Drejewicz - doświadczony analityk i specjalista w dziedzinach zarządzania projektami i procesami biznesowymi oraz inżynierii oprogramowania. Zdobywał doświadczenie jako trener, konsultant i wdrożeniowiec BPM dla największych firm w Polsce. Obecnie doradza klientom i pomaga rozwiązywać problemy związane z optymalizacją procesów biznesowych, zarządzaniem zasobami ludzkimi oraz analizą danych z wykorzystaniem takich technik jak process mining, czy uczenie maszynowe.
Zwinna analiza danych. Apache Hadoop dla każdego
Russell Jurney
Duże zbiory danych dla każdego! W dobie Big Data klasyczne podejście do analizy danych nie przynosi już pożądanych wyników. Skuteczna analiza gigantycznych zbiorów informacji, wyciąganie interesujących wniosków i prezentowanie ich w przejrzystej formie użytkownikowi wymagają mnóstwa czasu i środków. Zastanawiasz się, jak podejść do tego problemu, by zminimalizować ryzyko niepowodzenia? Na to i wiele innych pytań odpowiada ta fantastyczna książka. Dzięki niej dowiesz się, jak zaprząc platformę Hadoop do własnych celów. Skorzystasz z prostych narzędzi, takich jak język Python, biblioteka D3.js oraz Apache Pig, i zastosujesz zwinne podejście do problemu, by osiągnąć zaskakujące efekty. Ponadto przekonasz się, jak łatwo można publikować dane w MongoDB, stosować wyszukiwarkę ElasticSearch oraz wykorzystać potencjał chmur obliczeniowych. Nauczysz się także wizualizować dane na wykresach, prognozować oraz podejmować właściwe działania. Książka ta jest doskonałą lekturą dla wszystkich osób stojących przed problemem skutecznej pracy z ogromnymi zbiorami danych. Dzięki tej książce: poznasz najlepsze narzędzia do przetwarzania zbiorów danych wykorzystasz możliwości języka Python sprawdzisz możliwości chmur obliczeniowych błyskawicznie wyszukasz dane za pomocą ElasticSearch zwizualizujesz dane z użyciem D3.js Zwinnie rozwiąż problemy z dużymi zbiorami danych! „Przy tak dużej popularności zagadnień Big Data i Data Science, lektura praktycznego instruktażu budowy aplikacji analitycznych jest mocno odświeżająca. Russel Jurney wprowadza nas, małymi porcjami implementacji, w swoją filozofię zwinności w dziedzinie analizy i aplikacyjnego wykorzystywania danych.” Mat Kelcey, matpalm.com
Zwinna analiza danych. Apache Hadoop dla każdego
Russell Jurney
Duże zbiory danych dla każdego! W dobie Big Data klasyczne podejście do analizy danych nie przynosi już pożądanych wyników. Skuteczna analiza gigantycznych zbiorów informacji, wyciąganie interesujących wniosków i prezentowanie ich w przejrzystej formie użytkownikowi wymagają mnóstwa czasu i środków. Zastanawiasz się, jak podejść do tego problemu, by zminimalizować ryzyko niepowodzenia? Na to i wiele innych pytań odpowiada ta fantastyczna książka. Dzięki niej dowiesz się, jak zaprząc platformę Hadoop do własnych celów. Skorzystasz z prostych narzędzi, takich jak język Python, biblioteka D3.js oraz Apache Pig, i zastosujesz zwinne podejście do problemu, by osiągnąć zaskakujące efekty. Ponadto przekonasz się, jak łatwo można publikować dane w MongoDB, stosować wyszukiwarkę ElasticSearch oraz wykorzystać potencjał chmur obliczeniowych. Nauczysz się także wizualizować dane na wykresach, prognozować oraz podejmować właściwe działania. Książka ta jest doskonałą lekturą dla wszystkich osób stojących przed problemem skutecznej pracy z ogromnymi zbiorami danych. Dzięki tej książce: poznasz najlepsze narzędzia do przetwarzania zbiorów danych wykorzystasz możliwości języka Python sprawdzisz możliwości chmur obliczeniowych błyskawicznie wyszukasz dane za pomocą ElasticSearch zwizualizujesz dane z użyciem D3.js Zwinnie rozwiąż problemy z dużymi zbiorami danych! „Przy tak dużej popularności zagadnień Big Data i Data Science, lektura praktycznego instruktażu budowy aplikacji analitycznych jest mocno odświeżająca. Russel Jurney wprowadza nas, małymi porcjami implementacji, w swoją filozofię zwinności w dziedzinie analizy i aplikacyjnego wykorzystywania danych.” Mat Kelcey, matpalm.com