E-book details

Inżynieria AI. Tworzenie aplikacji z wykorzystaniem modeli bazowych

Inżynieria AI. Tworzenie aplikacji z wykorzystaniem modeli bazowych

Chip Huyen

Ebook

Modele bazowe (foundation models) zapoczątkowały prawdziwy rozkwit aplikacji opartych na sztucznej inteligencji. AI stała się potężnym narzędziem rozwojowym, którego dziś może używać niemal każdy. Decyzja o stworzeniu własnej aplikacji AI wymaga jednak zrozumienia procesu budowy i świadomego podejmowania decyzji projektowych.

Ta książka jest kompleksowym przewodnikiem po budowaniu generatywnych aplikacji AI w środowiskach produkcyjnych.

Luke Metz, współtwórca ChatGPT w OpenAI

Ten przystępnie napisany i praktyczny podręcznik pokazuje, czym jest inżynieria AI i w jaki sposób tworzy się aplikacje z wykorzystaniem łatwo dostępnych modeli bazowych. Dowiesz się, jak się poruszać w świecie sztucznej inteligencji, czym dokładnie są modele, zbiory danych, wskaźniki oceny i wzorce aplikacyjne. W książce przedstawiono również, krok po kroku, kompletny proces tworzenia aplikacji AI i ich efektywnego wdrażania. Poszczególne zagadnienia zostały zilustrowane dobrze udokumentowanymi studiami przypadków. Nie zabrakło również komentarzy odnoszących się do zaimplementowania systemu opinii użytkowników w celu zapewnienia przydatnych informacji zwrotnych.

Najważniejsze zagadnienia:

  • istota inżynierii AI
  • proces tworzenia aplikacji AI
  • różne techniki adaptacji modeli, w tym inżynieria promptów, generowanie wspomagane wyszukiwaniem (RAG), dostrajanie modeli, agenty i inżynieria zbiorów danych
  • wąskie gardła modeli podstawowych i ich pokonywanie
  • zasady wyboru modelu, wskaźników, danych oraz wzorców projektowych

Pozycja obowiązkowa dla każdego profesjonalisty, który chce wdrożyć AI w swojej firmie!

Vittorio Cretella, były dyrektor IT w P&G i Mars

Wstęp

Rozdział 1. Wprowadzenie do tworzenia aplikacji AI przy użyciu modeli podstawowych

  • Rozwój inżynierii AI
    • Od modeli językowych do dużych modeli językowych
    • Od dużych modeli językowych do modeli podstawowych
    • Od modeli podstawowych do inżynierii AI
  • Przykłady zastosowań modeli podstawowych
    • Programowanie
    • Tworzenie obrazów i wideo
    • Generowanie tekstów
    • Edukacja
    • Boty konwersacyjne
    • Agregacja informacji
    • Organizowanie danych
    • Automatyzacja przepływu danych
  • Planowanie aplikacji AI
    • Ocena przypadków użycia
    • Ustalenie oczekiwań
    • Zaplanowanie kamieni milowych
    • Konserwacja i utrzymanie
  • Stos technologiczny inżynierii AI
    • Trzy warstwy stosu AI
    • Inżynieria AI a inżynieria ML
    • Inżynieria AI a inżynieria pełnowymiarowa
  • Podsumowanie

Rozdział 2. Zrozumienie modeli podstawowych

  • Dane treningowe
    • Modele wielojęzyczne
    • Modele specyficzne dla danej dziedziny
  • Modelowanie
    • Architektura modelu
    • Rozmiar modelu
  • Post-trening
    • Dostrajanie nadzorowane
    • Dostrajanie preferencji
  • Próbkowanie
    • Podstawy próbkowania
    • Strategie próbkowania
    • Efektywność obliczeniowa czasu testowania
    • Dane ustrukturyzowane
    • Probabilistyczna natura sztucznej inteligencji
  • Podsumowanie

Rozdział 3. Metodyka ewaluacji

  • Wyzwania związane z ewaluacją modeli podstawowych
  • Zrozumienie wskaźników dotyczących modelowania języka
    • Entropia
    • Entropia krzyżowa
    • Wskaźniki bits-per-character i bits-per-byte
    • Nieokreśloność
    • Interpretacja nieokreśloności i jej zastosowania
  • Ewaluacja dokładna
    • Poprawność funkcjonalna
    • Pomiar poziomu podobieństwa względem danych referencyjnych
    • Wprowadzenie do osadzania
  • AI jako sędzia
    • Dlaczego "AI jako sędzia"?
    • Jak używać metody "AI jako sędzia"?
    • Ograniczenia metody "AI jako sędzia"
    • Jakie modele mogą być sędziami?
  • Ranking modeli wynikający z ewaluacji porównawczej
    • Wyzwania ewaluacji porównawczej
    • Przyszłość ewaluacji porównawczej
  • Podsumowanie

Rozdział 4. Ewaluacja modeli AI

  • Kryteria ewaluacji
    • Zdolności specyficzne dla danej dziedziny
    • Zdolności generacyjne
    • Zdolność do podążania za instrukcjami
    • Koszty i opóźnienia
  • Wybór modelu
    • Proces wyboru modelu
    • Budowa czy zakup modelu?
    • Zestawy testów dostępne publicznie
  • Projektowanie procesu ewaluacji
    • Krok 1. Ewaluacja wszystkich komponentów systemu
    • Krok 2. Utworzenie wytycznych do ewaluacji
    • Krok 3. Określenie metod ewaluacji i danych
  • Podsumowanie

Rozdział 5. Inżynieria promptów

  • Wprowadzenie do tworzenia promptów
    • Uczenie w kontekście: zero-shot i few-shot
    • Prompt systemowy a prompt użytkownika
    • Długość i efektywność kontekstu
  • Najlepsze zasady inżynierii promptów
    • Twórz jasno i precyzyjnie sformułowane instrukcje
    • Dostarcz niezbędny kontekst
    • Podziel zadania złożone na prostsze podzadania
    • Daj modelowi czas na myślenie
    • Doskonal prompty w procesie iteracyjnym
    • Oceniaj narzędzia do inżynierii promptów
    • Porządkuj prompty i zarządzaj ich wersjami
  • Strategia zabezpieczania promptów
    • Prompty zastrzeżone i inżynieria odwrotna promptów
    • Omijanie zabezpieczeń i wstrzykiwanie promptów
    • Ekstrakcja informacji
    • Obrona przed atakami na prompty
  • Podsumowanie

Rozdział 6. Generowanie wspomagane wyszukiwaniem i agenty

  • Generowanie wspomagane wyszukiwaniem
    • Architektura generowania wspomaganego wyszukiwaniem
    • Algorytmy wyszukiwania
    • Optymalizacja wyszukiwania
    • Generowanie wspomagane wyszukiwaniem a inne modalności
  • Agenty
    • Przegląd agentów
    • Narzędzia
    • Planowanie
    • Tryby błędów agenta i sposoby ich oceny
  • Pamięć
  • Podsumowanie

Rozdział 7. Dostrajanie

  • Wprowadzenie do dostrajania
  • Kiedy należy dostrajać?
    • Powody, by dostrajać
    • Powody, by nie dostrajać
    • Dostrajanie a generowanie wspomagane wyszukiwaniem (RAG)
  • Ograniczenia pamięciowe
    • Propagacja wsteczna i parametry trenowane
    • Obliczenia dotyczące pamięci
    • Reprezentacje numeryczne
    • Kwantyzacja
  • Techniki dostrajania
    • Dostrajanie efektywne parametrowo
    • Scalanie modeli i dostrajanie wielozadaniowe
    • Taktyki dostrajania
  • Podsumowanie

Rozdział 8. Inżynieria zbiorów danych

  • Przygotowanie danych
    • Jakość danych
    • Pokrycie danych
    • Ilość danych
    • Pozyskiwanie i etykietowanie danych
  • Synteza i generowanie sztucznych danych
    • Po co stosować syntezę danych?
    • Tradycyjne metody syntezy danych
    • Synteza danych wspierana przez AI
    • Destylacja modelu
  • Przetwarzanie danych
    • Inspekcja danych
    • Deduplikacja danych
    • Czyszczenie i filtrowanie danych
    • Formatowanie danych
  • Podsumowanie

Rozdział 9. Optymalizacja wnioskowania

  • Zrozumienie optymalizacji wnioskowania
    • Podstawy wnioskowania
    • Wskaźniki związane z wydajnością wnioskowania
    • Akceleratory AI
  • Optymalizacja wnioskowania
    • Optymalizacja modelu
    • Optymalizacja usługi wnioskowania
  • Podsumowanie

Rozdział 10. Architektura systemów AI i informacje zwrotne od użytkowników

  • Architektura systemów AI
    • Krok 1. Rozszerzenie kontekstu
    • Krok 2. Wprowadzenie zabezpieczeń
    • Krok 3. Wprowadzenie routingu i bramki dostępowej
    • Krok 4. Zmniejszenie opóźnień za pomocą mechanizmów buforowania
    • Krok 5. Dodanie wzorców agentowych
    • Monitorowanie systemu i przejrzystość jego działania
    • Orkiestracja potoku AI
  • Informacja zwrotna od użytkowników
    • Pozyskiwanie informacji zwrotnej z rozmów
    • Projektowanie systemu gromadzenia informacji zwrotnych
    • Ograniczenia systemu gromadzenia informacji zwrotnych
  • Podsumowanie

Epilog

Skorowidz

  • Title: Inżynieria AI. Tworzenie aplikacji z wykorzystaniem modeli bazowych
  • Author: Chip Huyen
  • Original title: AI Engineering: Building Applications with Foundation Models
  • Translation: Jacek Janusz
  • ISBN: 978-83-289-2629-5, 9788328926295
  • Date of issue: 2025-09-02
  • Format: Ebook
  • Item ID: inaitw
  • Publisher: Helion