E-book details

Trino Profesjonalny przewodnik. SQL w dowolnej skali, w dowolnym magazynie i w dowolnym środowisku

Trino Profesjonalny przewodnik. SQL w dowolnej skali, w dowolnym magazynie i w dowolnym środowisku

Matt Fuller, Manfred Moser, Martin Traverso

Ebook

Za pomocą Trino, wysoce wydajnego, rozproszonego silnika zapytań SQL, przeprowadzisz szybkie, interaktywne analizy różnorodnych źródeł danych. W drugim wydaniu tego praktycznego przewodnika dowiesz się, jak analizować dane w miejscu, w którym się znajdują, niezależnie czy jest to jezioro danych obsługiwane przez system Hive, nowoczesny lakehouse obsługiwany przez tabele Iceberg lub usługę Delta Lake, inny system, taki jak Cassandra, Kafka lub SingleStore, czy może relacyjna baza danych, taka jak PostgreSQL lub Oracle.

Analitycy, inżynierowie oprogramowania i produkcji dowiedzą się, jak zarządzać Trino, jak go używać i tworzyć za jego pomocą nowe rozwiązania, a także jak uczynić to narzędzie kluczowym elementem swojej platformy danych. Autorzy, Matt Fuller, Manfred Moser i Martin Traverso pokazują, jak w jednym zapytaniu Trino połączyć dane z wielu źródeł, aby dokonać analizy danych z całej organizacji.

- Poznasz przypadki użycia Trino i narzędzia, za pomocą których połączysz się z Trino, aby przeszukiwać i przetwarzać ogromne ilości danych.

- Dowiesz się, jak działa Trino, uwzględniając sposoby łączenia się ze źródłami danych i ich przeszukiwania za pomocą instrukcji SQL, operatorów, funkcji i innych mechanizmów

- Wdrożysz i zadbasz o zabezpieczenie Trino na dużą skalę, będziesz monitorować obciążenie, dostrajać zapytania i dołączać dodatkowe aplikacje

- Dowiesz się, jak inne organizacje z powodzeniem wykorzystują Trino

"Trino odgrywa kluczową rolę w analizie danych w witrynie Pinterest. Ta książka opisuje najważniejsze aspekty Trino, począwszy od przypadków użycia, po wykorzystanie Trino w wielkoskalowych projektach."

-Ashish Kumar Singh

Lider techniczny, Big Data Query
Processing Platform, Pinterest

"Ta książka jest obowiązkową lekturą dla firm, które chcą unowocześnić swój stos technologiczny do analizy danych."

-Jay Kreps

Współtwórca Apache Kafka oraz współzałożyciel firmy Confluent i jej dyrektor ds. technicznych

Matt Fuller jest współzałożycielem firmy Starburst, zajmującej się analizą danych. Manfred Moser jest rzecznikiem społeczności, pisarzem, szkoleniowcem i inżynierem oprogramowania w firmie Starbust.
Martin Traverso jest współzałożycielem fundacji Trino Software Foundation, dyrektorem ds. technicznych w firmie Starburst i współtwórcą Trino.

  • Przedmowa
  • Wprowadzenie
    • Część I
    • Wprowadzenie do Trino
      • Wstęp do Trino
      • Problemy związane z wielkimi zbiorami danych
      • Trino na ratunek
      • Przypadki użycia Trino
      • Zasoby dotyczące Trino
      • Krótka historia Trino
      • Podsumowanie
      • Instalowanie i konfigurowanie Trino
      • Wypróbowanie Trino w kontenerze Dockera
      • Instalowanie za pomocą pliku archiwum
      • Dodawanie źródła danych
      • Uruchamianie Trino
      • Podsumowanie
      • Używanie Trino
      • Interfejs wiersza poleceń Trino
      • Sterownik JDBC dla Trino
      • Trino i ODBC
      • Biblioteki klienckie
      • Interfejs internetowy Trino
      • SQL w Trino
      • Podsumowanie
    • Część II
    • Zagłębiamy się w Trino
      • Architektura Trino
      • Koordynator i węzły robocze w klastrze
      • Architektura oparta na konektorach
      • Katalogi, schematy i tabele
      • Model wykonywania zapytań
      • Planowanie zapytania
      • Reguły optymalizacji
      • Reguły implementacji
      • Optymalizator oparty na kosztach
      • Korzystanie ze statystyk tabeli
      • Podsumowanie
      • Wdrażanie w środowisku produkcyjnym
      • Szczegółowe informacje o konfiguracji
      • Konfiguracja serwera
      • Logowanie
      • Konfiguracja węzła
      • Konfiguracja JVM
      • Skrypt startowy
      • Instalacja klastra
      • Instalacja RPM
      • Instalacja w chmurze
      • Pakiet Helm dla wdrożenia w platformie Kubernetes
      • Rozważania na temat rozmiaru klastra
      • Podsumowanie
      • Konektory
      • Konfiguracja
      • Przykład konektora RDBMS: PostgreSQL
      • Konektory Trino TPC-H i TPC-DS
      • Konektor Hive dla rozproszonych źródeł danych
      • Zarządzanie nowoczesnym systemem magazynowym i jego analiza
      • Nierelacyjne źródła danych
      • Konektor JMX dla Trino
      • Konektor Black Hole
      • Konektor memory
      • Inne konektory
      • Podsumowanie
      • Przykłady zaawansowanych konektorów
      • Łączenie się z HBase za pomocą narzędzia Phoenix
      • Przykład konektora dla magazynu typu klucz-wartość: Accumulo
      • Konektor Apache Cassandra
      • Przykład konektora systemu strumieniowego: Kafka
      • Przykład konektora dla magazynu opartego na dokumentach: Elasticsearch
      • Federacja zapytań w Trino
      • Operacje ekstrakcji, transformacji i ładowania z zapytaniami federacyjnymi
      • Podsumowanie
      • Użycia SQL w Trino
      • Instrukcje Trino
      • Tabele systemowe Trino
      • Katalogi
      • Schematy
      • Schemat informacji
      • Tabele
      • Widoki
      • Informacje o sesji i konfiguracja
      • Typy danych
      • Wprowadzenie do instrukcji SELECT
      • Klauzula WHERE
      • Klauzule GROUP BY i HAVING
      • Klauzule ORDER BY i LIMIT
      • Instrukcje JOIN
      • Klauzule UNION, INTERSECT i EXCEPT
      • Operacje grupowania
      • Klauzula WITH
      • Podzapytania
      • Usuwanie danych z tabeli
      • Podsumowanie
      • Zaawansowany SQL
      • Wprowadzenie do funkcji i operatorów
      • Funkcje skalarne i operatory
      • Operatory logiczne
      • Operatory logiczne
      • Wybór zakresu za pomocą instrukcji BETWEEN
      • Wykrywanie wartości za pomocą instrukcji IS (NOT) NULL
      • Funkcje i operatory matematyczne
      • Funkcje trygonometryczne
      • Funkcje zwracające liczby stałe i losowe
      • Funkcje i operatory dotyczące ciągów tekstowych
      • Ciągi tekstowe i mapy
      • Unicode
      • Wyrażenia regularne
      • Spłaszczanie złożonych typów danych
      • Funkcje JSON
      • Funkcje i operatory dotyczące daty i czasu
      • Histogramy
      • Funkcje agregujące
      • Funkcje okna
      • Wyrażenia lambda
      • Funkcje geoprzestrzenne
      • Przygotowane instrukcje
      • Podsumowanie
    • Część III
    • Rzeczywiste przypadki użycia Trino
      • Bezpieczeństwo
      • Uwierzytelnianie
      • Autoryzacja
      • Szyfrowanie
      • Urząd certyfikacji kontra samopodpisane certyfikaty
      • Uwierzytelnianie za pomocą certyfikatu
      • Kerberos
      • Dostęp do źródła danych i konfiguracja zabezpieczeń
      • Uwierzytelnianie za pomocą protokołu Kerberos w konektorze Hive
      • Separacja klastra
      • Podsumowanie
      • Integrowanie Trino z innymi narzędziami
      • Zapytania, wizualizacje i inne operacje z użyciem Apache Superset
      • Lepsza wydajność dzięki platformie RubiX
      • Cykle pracy z użyciem Apache Airflow
      • Przykład wbudowanego Trino: Amazon Athena
      • Wygodne dystrybucje komercyjne: Starburst Enterprise i Starburst Galaxy
      • Przykłady innych integracji
      • Niestandardowe integracje
      • Podsumowanie
      • Trino w środowisku produkcyjnym
      • Monitorowanie za pomocą interfejsu internetowego Trino
      • Dostrajanie zapytań SQL w Trino
      • Zarządzanie pamięcią
      • Współbieżność zadań
      • Planowanie zadań w węźle roboczym
      • Wymiana danych przez sieć
      • Dostrajanie wirtualnej maszyny Java
      • Grupy zasobów
      • Podsumowanie
      • Rzeczywiste przykłady
      • Platformy wdrożeniowe
      • Dobór rozmiaru klastra
      • Przypadek migracji Hadoop/Hive
      • Inne źródła danych
      • Użytkownicy i ruch
      • Podsumowanie
  • Podsumowanie
  • O autorach
  • Indeks
  • Title: Trino Profesjonalny przewodnik. SQL w dowolnej skali, w dowolnym magazynie i w dowolnym środowisku
  • Author: Matt Fuller, Manfred Moser, Martin Traverso
  • ISBN: 9788375415056, 9788375415056
  • Date of issue: 2023-02-25
  • Format: Ebook
  • Item ID: e_34hv
  • Publisher: Promise