Kategorien
E-Books
-
Wirtschaft
- Bitcoin
- Geschäftsfrau
- Coaching
- Controlling
- E-Business
- Ökonomie
- Finanzen
- Börse und Investitionen
- Persönliche Kompetenzen
- Computer im Büro
- Kommunikation und Verhandlungen
- Kleines Unternehmen
- Marketing
- Motivation
- Multimedia-Training
- Immobilien
- Überzeugung und NLP
- Steuern
- Sozialpolitik
- Handbȕcher
- Präsentationen
- Führung
- Public Relation
- Berichte, Analysen
- Geheimnis
- Social Media
- Verkauf
- Start-up
- Ihre Karriere
- Management
- Projektmanagement
- Personal (HR)
-
Für Kinder
-
Für Jugendliche
-
Bildung
-
Enzyklopädien, Wörterbücher
-
E-Presse
- Architektura i wnętrza
- Biznes i Ekonomia
- Haus und Garten
- E-Business
- Finanzen
- Persönliche Finanzen
- Unternehmen
- Fotografie
- Informatik
- HR und Gehaltsabrechnung
- Computer, Excel
- Buchhaltung
- Kultur und Literatur
- Wissenschaftlich und akademisch
- Umweltschutz
- meinungsbildend
- Bildung
- Steuern
- Reisen
- Psychologie
- Religion
- Landwirtschaft
- Buch- und Pressemarkt
- Transport und Spedition
- Gesundheit und Schönheit
-
Geschichte
-
Informatik
- Office-Programme
- Datenbank
- Bioinformatik
- IT Branche
- CAD/CAM
- Digital Lifestyle
- DTP
- Elektronik
- Digitale Fotografie
- Computergrafik
- Spiele
- Hacking
- Hardware
- IT w ekonomii
- Wissenschaftliche Pakete
- Schulbücher
- Computergrundlagen
- Programmierung
- Mobile-Programmierung
- Internet-Server
- Computernetzwerke
- Start-up
- Betriebssysteme
- Künstliche Inteligenz
- Technik für Kinder
- Webmaster
-
Andere
-
Fremdsprachen lernen
-
Kultur und Kunst
-
Lektüre
-
Literatur
- Anthologien
- Ballade
- Biografien und Autobiografien
- Für Erwachsene
- Drama
- Tagebücher, Memoiren, Briefe
- Epos
- Essay
- Science Fiction
- Felietonys
- Fiktion
- Humor, Satire
- Andere
- Klassisch
- Krimi
- Sachbücher
- Belletristik
- Mity i legendy
- Nobelpreisträger
- Kurzgeschichten
- Gesellschaftlich
- Okultyzm i magia
- Erzählung
- Erinnerungen
- Reisen
- Gedicht
- Poesie
- Politik
- Populärwissenschaftlich
- Roman
- Historischer Roman
- Prosa
- Abenteuer
- Journalismus
- Reportage
- Romans i literatura obyczajowa
- Sensation
- Thriller, Horror
- Interviews und Erinnerungen
-
Naturwissenschaften
-
Sozialwissenschaften
-
Schulbücher
-
Populärwissenschaft und akademisch
- Archäologie
- Bibliotekoznawstwo
- Filmwissenschaft
- Philologie
- Polnische Philologie
- Philosophie
- Finanse i bankowość
- Erdkunde
- Wirtschaft
- Handel. Weltwirtschaft
- Geschichte und Archäologie
- Kunst- und Architekturgeschichte
- Kulturwissenschaft
- Linguistik
- Literaturwissenschaft
- Logistik
- Mathematik
- Medizin
- Geisteswissenschaften
- Pädagogik
- Lehrmittel
- Populärwissenschaftlich
- Andere
- Psychologie
- Soziologie
- Theatrologie
- Teologie
- Theorien und Wirtschaftswissenschaften
- Transport i spedycja
- Sportunterricht
- Zarządzanie i marketing
-
Handbȕcher
-
Spielanleitungen
-
Professioneller und fachkundige Leitfaden
-
Jura
- Sicherheit und Gesundheit am Arbeitsplatz
- Geschichte
- Verkehrsregeln. Führerschein
- Rechtswissenschaften
- Gesundheitswesen
- Allgemeines. Wissenskompendium
- akademische Bücher
- Andere
- Bau- und Wohnungsrecht
- Zivilrecht
- Finanzrecht
- Wirtschaftsrecht
- Wirtschafts- und Handelsrecht
- Strafrecht
- Strafrecht. Kriminelle Taten. Kriminologie
- Internationales Recht
- Internationales und ausländisches Recht
- Gesundheitsschutzgesetz
- Bildungsrecht
- Steuerrecht
- Arbeits- und Sozialversicherungsrecht
- Öffentliches, Verfassungs- und Verwaltungsrecht
- Familien- und Vormundschaftsrecht
- Agrarrecht
- Sozialrecht, Arbeitsrecht
- EU-Recht
- Industrie
- Agrar- und Umweltschutz
- Wörterbücher und Enzyklopädien
- Öffentliche Auftragsvergabe
- Management
-
Führer und Reisen
- Afrika
- Alben
- Südamerika
- Mittel- und Nordamerika
- Australien, Neuseeland, Ozeanien
- Österreich
- Asien
- Balkan
- Naher Osten
- Bulgarien
- China
- Kroatien
- Tschechische Republik
- Dänemark
- Ägypten
- Estland
- Europa
- Frankreich
- Berge
- Griechenland
- Spanien
- Niederlande
- Island
- Litauen
- Lettland
- Mapy, Plany miast, Atlasy
- Miniführer
- Deutschland
- Norwegen
- Aktive Reisen
- Polen
- Portugal
- Andere
- Russland
- Rumänien
- Slowakei
- Slowenien
- Schweiz
- Schweden
- Welt
- Türkei
- Ukraine
- Ungarn
- Großbritannien
- Italien
-
Psychologie
- Lebensphilosophien
- Kompetencje psychospołeczne
- zwischenmenschliche Kommunikation
- Mindfulness
- Allgemeines
- Überzeugung und NLP
- Akademische Psychologie
- Psychologie von Seele und Geist
- Arbeitspsychologie
- Relacje i związki
- Elternschafts- und Kinderpsychologie
- Problemlösung
- Intellektuelle Entwicklung
- Geheimnis
- Sexualität
- Verführung
- Aussehen ind Image
- Lebensphilosophien
-
Religion
-
Sport, Fitness, Diäten
-
Technik und Mechanik
Hörbücher
-
Wirtschaft
- Bitcoin
- Geschäftsfrau
- Coaching
- Controlling
- E-Business
- Ökonomie
- Finanzen
- Börse und Investitionen
- Persönliche Kompetenzen
- Kommunikation und Verhandlungen
- Kleines Unternehmen
- Marketing
- Motivation
- Immobilien
- Überzeugung und NLP
- Steuern
- Handbȕcher
- Präsentationen
- Führung
- Public Relation
- Geheimnis
- Social Media
- Verkauf
- Start-up
- Ihre Karriere
- Management
- Projektmanagement
- Personal (HR)
-
Für Kinder
-
Für Jugendliche
-
Bildung
-
Enzyklopädien, Wörterbücher
-
Geschichte
-
Informatik
-
Andere
-
Fremdsprachen lernen
-
Kultur und Kunst
-
Lektüre
-
Literatur
- Anthologien
- Ballade
- Biografien und Autobiografien
- Für Erwachsene
- Drama
- Tagebücher, Memoiren, Briefe
- Epos
- Essay
- Science Fiction
- Felietonys
- Fiktion
- Humor, Satire
- Andere
- Klassisch
- Krimi
- Sachbücher
- Belletristik
- Mity i legendy
- Nobelpreisträger
- Kurzgeschichten
- Gesellschaftlich
- Okultyzm i magia
- Erzählung
- Erinnerungen
- Reisen
- Poesie
- Politik
- Populärwissenschaftlich
- Roman
- Historischer Roman
- Prosa
- Abenteuer
- Journalismus
- Reportage
- Romans i literatura obyczajowa
- Sensation
- Thriller, Horror
- Interviews und Erinnerungen
-
Naturwissenschaften
-
Sozialwissenschaften
-
Populärwissenschaft und akademisch
- Archäologie
- Philosophie
- Wirtschaft
- Handel. Weltwirtschaft
- Geschichte und Archäologie
- Kunst- und Architekturgeschichte
- Kulturwissenschaft
- Literaturwissenschaft
- Mathematik
- Medizin
- Geisteswissenschaften
- Pädagogik
- Lehrmittel
- Populärwissenschaftlich
- Andere
- Psychologie
- Soziologie
- Teologie
- Zarządzanie i marketing
-
Handbȕcher
-
Professioneller und fachkundige Leitfaden
-
Jura
-
Führer und Reisen
-
Psychologie
- Lebensphilosophien
- zwischenmenschliche Kommunikation
- Mindfulness
- Allgemeines
- Überzeugung und NLP
- Akademische Psychologie
- Psychologie von Seele und Geist
- Arbeitspsychologie
- Relacje i związki
- Elternschafts- und Kinderpsychologie
- Problemlösung
- Intellektuelle Entwicklung
- Geheimnis
- Sexualität
- Verführung
- Aussehen ind Image
- Lebensphilosophien
-
Religion
-
Sport, Fitness, Diäten
-
Technik und Mechanik
Videokurse
-
Datenbank
-
Big Data
-
Biznes, ekonomia i marketing
-
Cybersicherheit
-
Data Science
-
DevOps
-
Für Kinder
-
Elektronik
-
Grafik / Video / CAX
-
Spiele
-
Microsoft Office
-
Entwicklungstools
-
Programmierung
-
Persönliche Entwicklung
-
Computernetzwerke
-
Betriebssysteme
-
Softwaretest
-
Mobile Geräte
-
UX/UI
-
Web development
-
Management
Podcasts
- E-Books
- Big data
- Datenanalyse
- Pig Design Patterns. Simplify Hadoop programming to create complex end-to-end Enterprise Big Data solutions with Pig
Details zum E-Book
Einloggen, wenn Sie am Inhalt des Artikels interessiert sind.
Pig Design Patterns. Simplify Hadoop programming to create complex end-to-end Enterprise Big Data solutions with Pig
E-book
- Pig Design Patterns
- Table of Contents
- Pig Design Patterns
- Credits
- Foreword
- About the Author
- Acknowledgments
- About the Reviewers
- www.PacktPub.com
- Support files, eBooks, discount offers and more
- Why Subscribe?
- Free Access for Packt account holders
- Support files, eBooks, discount offers and more
- Preface
- What this book covers
- Motivation for this book
- What you need for this book
- Who this book is for
- Conventions
- Reader feedback
- Customer support
- Downloading the example code
- Third-party libraries
- Datasets
- Errata
- Piracy
- Questions
- Downloading the example code
- What this book covers
- 1. Setting the Context for Design Patterns in Pig
- Understanding design patterns
- The scope of design patterns in Pig
- Hadoop demystified a quick reckoner
- The enterprise context
- Common challenges of distributed systems
- The advent of Hadoop
- Hadoop under the covers
- Understanding the Hadoop Distributed File System
- HDFS design goals
- Working of HDFS
- Understanding MapReduce
- Understanding how MapReduce works
- The MapReduce internals
- Pig a quick intro
- Understanding the rationale of Pig
- Understanding the relevance of Pig in the enterprise
- Working of Pig an overview
- Firing up Pig
- The use case
- Code listing
- The dataset
- Understanding Pig through the code
- Pigs extensibility
- Operators used in code
- The EXPLAIN operator
- Understanding Pig's data model
- Primitive types
- Complex types
- The relevance of schemas
- Summary
- 2. Data Ingest and Egress Patterns
- The context of data ingest and egress
- Types of data in the enterprise
- Ingest and egress patterns for multistructured data
- Considerations for log ingestion
- The Apache log ingestion pattern
- Background
- Motivation
- Use cases
- Pattern implementation
- Code snippets
- Code for the CommonLogLoader class
- Code for the CombinedLogLoader class
- Results
- Additional information
- The Custom log ingestion pattern
- Background
- Motivation
- Use cases
- Pattern implementation
- Code snippets
- Results
- Additional information
- The image ingress and egress pattern
- Background
- Motivation
- Use cases
- Pattern implementation
- The image Ingress Implementation
- The image egress implementation
- Code snippets
- The image ingress
- Pig script
- Image to a sequence UDF snippet
- The image egress
- Pig script
- Sequence to an image UDF
- The image ingress
- Results
- Additional information
- Considerations for log ingestion
- The ingress and egress patterns for the NoSQL data
- MongoDB ingress and egress patterns
- Background
- Motivation
- Use cases
- Pattern implementation
- The ingress implementation
- The egress implementation
- Code snippets
- The ingress code
- The egress code
- Results
- Additional information
- The HBase ingress and egress pattern
- Background
- Motivation
- Use cases
- Pattern implementation
- The ingress implementation
- The egress implementation
- Code snippets
- The ingress code
- The egress code
- Results
- Additional information
- MongoDB ingress and egress patterns
- The ingress and egress patterns for structured data
- The Hive ingress and egress patterns
- Background
- Motivation
- Use cases
- Pattern implementation
- The ingress implementation
- The egress implementation
- Code snippets
- The ingress Code
- Importing data using RCFile
- Importing data using HCatalog
- The egress code
- The ingress Code
- Results
- Additional information
- The Hive ingress and egress patterns
- The ingress and egress patterns for semi-structured data
- The mainframe ingestion pattern
- Background
- Motivation
- Use cases
- Pattern implementation
- Code snippets
- Results
- Additional information
- XML ingest and egress patterns
- Background
- Motivation
- Motivation for ingesting raw XML
- Motivation for ingesting binary XML
- Motivation for egression of XML
- Use cases
- Pattern implementation
- The implementation of the XML raw ingestion
- The implementation of the XML binary ingestion
- Code snippets
- The XML raw ingestion code
- The XML binary ingestion code
- The XML egress code
- Pig script
- The XML storage
- Results
- Additional information
- The mainframe ingestion pattern
- JSON ingress and egress patterns
- Background
- Motivation
- Use cases
- Pattern implementation
- The ingress implementation
- The egress implementation
- Code snippets
- The ingress code
- The code for simple JSON
- The code for nested JSON
- The egress code
- The ingress code
- Results
- Additional information
- Background
- Summary
- 3. Data Profiling Patterns
- Data profiling for Big Data
- Big Data profiling dimensions
- Sampling considerations for profiling Big Data
- Sampling support in Pig
- Rationale for using Pig in data profiling
- The data type inference pattern
- Background
- Motivation
- Use cases
- Pattern implementation
- Code snippets
- Pig script
- Java UDF
- Results
- Additional information
- The basic statistical profiling pattern
- Background
- Motivation
- Use cases
- Pattern implementation
- Code snippets
- Pig script
- Macro
- Results
- Additional information
- The pattern-matching pattern
- Background
- Motivation
- Use cases
- Pattern implementation
- Code snippets
- Pig script
- Macro
- Results
- Additional information
- The string profiling pattern
- Background
- Motivation
- Use cases
- Pattern implementation
- Code snippets
- Pig script
- Macro
- Results
- Additional information
- The unstructured text profiling pattern
- Background
- Motivation
- Use cases
- Pattern implementation
- Code snippets
- Pig script
- Java UDF for stemming
- Java UDF for generating TF-IDF
- Results
- Additional information
- Summary
- Data profiling for Big Data
- 4. Data Validation and Cleansing Patterns
- Data validation and cleansing for Big Data
- Choosing Pig for validation and cleansing
- The constraint validation and cleansing design pattern
- Background
- Motivation
- Use cases
- Pattern implementation
- Code snippets
- Results
- Additional information
- The regex validation and cleansing design pattern
- Background
- Motivation
- Use cases
- Pattern implementation
- Code snippets
- Results
- Additional information
- The corrupt data validation and cleansing design pattern
- Background
- Motivation
- Use cases
- Pattern implementation
- Code snippets
- Results
- Additional information
- The unstructured text data validation and cleansing design pattern
- Background
- Motivation
- Use cases
- Pattern implementation
- Code snippets
- Results
- Additional information
- Summary
- 5. Data Transformation Patterns
- Data transformation processes
- The structured-to-hierarchical transformation pattern
- Background
- Motivation
- Use cases
- Pattern implementation
- Code snippets
- Results
- Additional information
- The data normalization pattern
- Background
- Motivation
- Use cases
- Pattern implementation
- Code snippets
- Results
- Additional information
- The data integration pattern
- Background
- Motivation
- Use cases
- Pattern implementation
- Code snippets
- Results
- Additional information
- The aggregation pattern
- Background
- Motivation
- Use cases
- Pattern implementation
- Code snippets
- Results
- Additional information
- The data generalization pattern
- Background
- Motivation
- Use cases
- Pattern implementation
- Code snippets
- Results
- Additional information
- Summary
- 6. Understanding Data Reduction Patterns
- Data reduction a quick introduction
- Data reduction considerations for Big Data
- Dimensionality reduction the Principal Component Analysis design pattern
- Background
- Motivation
- Use cases
- Pattern implementation
- Limitations of PCA implementation
- Code snippets
- Results
- Additional information
- Numerosity reduction the histogram design pattern
- Background
- Motivation
- Use cases
- Pattern implementation
- Code snippets
- Results
- Additional information
- Numerosity reduction sampling design pattern
- Background
- Motivation
- Use cases
- Pattern implementation
- Code snippets
- Results
- Additional information
- Numerosity reduction clustering design pattern
- Background
- Motivation
- Use cases
- Pattern implementation
- Code snippets
- Results
- Additional information
- Summary
- 7. Advanced Patterns and Future Work
- The clustering pattern
- Background
- Motivation
- Use cases
- Pattern implementation
- Code snippets
- Results
- Additional information
- The topic discovery pattern
- Background
- Motivation
- Use cases
- Pattern implementation
- Code snippets
- Results
- Additional information
- The natural language processing pattern
- Background
- Motivation
- Use cases
- Pattern implementation
- Code snippets
- Results
- Additional information
- The classification pattern
- Background
- Motivation
- Use cases
- Pattern implementation
- Code snippets
- Results
- Additional information
- Future trends
- Emergence of data-driven patterns
- The emergence of solution-driven patterns
- Patterns addressing programmability constraints
- Summary
- The clustering pattern
- Index
- Titel: Pig Design Patterns. Simplify Hadoop programming to create complex end-to-end Enterprise Big Data solutions with Pig
- Autor: Pradeep Pasupuleti
- Originaler Titel: Pig Design Patterns. Simplify Hadoop programming to create complex end-to-end Enterprise Big Data solutions with Pig.
- ISBN: 9781783285563, 9781783285563
- Veröffentlichungsdatum: 2014-04-17
- Format: E-book
- Artikelkennung: e_3bdv
- Verleger: Packt Publishing