Kategorie
Ebooki
-
Biznes i ekonomia
- Bitcoin
- Bizneswoman
- Coaching
- Controlling
- E-biznes
- Ekonomia
- Finanse
- Giełda i inwestycje
- Kompetencje osobiste
- Komputer w biurze
- Komunikacja i negocjacje
- Mała firma
- Marketing
- Motywacja
- Multimedialne szkolenia
- Nieruchomości
- Perswazja i NLP
- Podatki
- Polityka społeczna
- Poradniki
- Prezentacje
- Przywództwo
- Public Relation
- Raporty, analizy
- Sekret
- Social Media
- Sprzedaż
- Start-up
- Twoja kariera
- Zarządzanie
- Zarządzanie projektami
- Zasoby ludzkie (HR)
-
Dla dzieci
-
Dla młodzieży
-
Edukacja
-
Encyklopedie, słowniki
-
E-prasa
- Architektura i wnętrza
- Biznes i Ekonomia
- Dom i ogród
- E-Biznes
- Finanse
- Finanse osobiste
- Firma
- Fotografia
- Informatyka
- Kadry i płace
- Komputery, Excel
- Księgowość
- Kultura i literatura
- Naukowe i akademickie
- Ochrona środowiska
- Opiniotwórcze
- Oświata
- Podatki
- Podróże
- Psychologia
- Religia
- Rolnictwo
- Rynek książki i prasy
- Transport i Spedycja
- Zdrowie i uroda
-
Historia
-
Informatyka
- Aplikacje biurowe
- Bazy danych
- Bioinformatyka
- Biznes IT
- CAD/CAM
- Digital Lifestyle
- DTP
- Elektronika
- Fotografia cyfrowa
- Grafika komputerowa
- Gry
- Hacking
- Hardware
- IT w ekonomii
- Pakiety naukowe
- Podręczniki szkolne
- Podstawy komputera
- Programowanie
- Programowanie mobilne
- Serwery internetowe
- Sieci komputerowe
- Start-up
- Systemy operacyjne
- Sztuczna inteligencja
- Technologia dla dzieci
- Webmasterstwo
-
Inne
-
Języki obce
-
Kultura i sztuka
-
Lektury szkolne
-
Literatura
- Antologie
- Ballada
- Biografie i autobiografie
- Dla dorosłych
- Dramat
- Dzienniki, pamiętniki, listy
- Epos, epopeja
- Esej
- Fantastyka i science-fiction
- Felietony
- Fikcja
- Humor, satyra
- Inne
- Klasyczna
- Kryminał
- Literatura faktu
- Literatura piękna
- Mity i legendy
- Nobliści
- Nowele
- Obyczajowa
- Okultyzm i magia
- Opowiadania
- Pamiętniki
- Podróże
- Poemat
- Poezja
- Polityka
- Popularnonaukowa
- Powieść
- Powieść historyczna
- Proza
- Przygodowa
- Publicystyka
- Reportaż
- Romans i literatura obyczajowa
- Sensacja
- Thriller, Horror
- Wywiady i wspomnienia
-
Nauki przyrodnicze
-
Nauki społeczne
-
Podręczniki szkolne
-
Popularnonaukowe i akademickie
- Archeologia
- Bibliotekoznawstwo
- Filmoznawstwo
- Filologia
- Filologia polska
- Filozofia
- Finanse i bankowość
- Geografia
- Gospodarka
- Handel. Gospodarka światowa
- Historia i archeologia
- Historia sztuki i architektury
- Kulturoznawstwo
- Lingwistyka
- Literaturoznawstwo
- Logistyka
- Matematyka
- Medycyna
- Nauki humanistyczne
- Pedagogika
- Pomoce naukowe
- Popularnonaukowa
- Pozostałe
- Psychologia
- Socjologia
- Teatrologia
- Teologia
- Teorie i nauki ekonomiczne
- Transport i spedycja
- Wychowanie fizyczne
- Zarządzanie i marketing
-
Poradniki
-
Poradniki do gier
-
Poradniki zawodowe i specjalistyczne
-
Prawo
- BHP
- Historia
- Kodeks drogowy. Prawo jazdy
- Nauki prawne
- Ochrona zdrowia
- Ogólne, kompendium wiedzy
- Podręczniki akademickie
- Pozostałe
- Prawo budowlane i lokalowe
- Prawo cywilne
- Prawo finansowe
- Prawo gospodarcze
- Prawo gospodarcze i handlowe
- Prawo karne
- Prawo karne. Przestępstwa karne. Kryminologia
- Prawo międzynarodowe
- Prawo międzynarodowe i zagraniczne
- Prawo ochrony zdrowia
- Prawo oświatowe
- Prawo podatkowe
- Prawo pracy i ubezpieczeń społecznych
- Prawo publiczne, konstytucyjne i administracyjne
- Prawo rodzinne i opiekuńcze
- Prawo rolne
- Prawo socjalne, prawo pracy
- Prawo Unii Europejskiej
- Przemysł
- Rolne i ochrona środowiska
- Słowniki i encyklopedie
- Zamówienia publiczne
- Zarządzanie
-
Przewodniki i podróże
- Afryka
- Albumy
- Ameryka Południowa
- Ameryka Środkowa i Północna
- Australia, Nowa Zelandia, Oceania
- Austria
- Azja
- Bałkany
- Bliski Wschód
- Bułgaria
- Chiny
- Chorwacja
- Czechy
- Dania
- Egipt
- Estonia
- Europa
- Francja
- Góry
- Grecja
- Hiszpania
- Holandia
- Islandia
- Litwa
- Łotwa
- Mapy, Plany miast, Atlasy
- Miniprzewodniki
- Niemcy
- Norwegia
- Podróże aktywne
- Polska
- Portugalia
- Pozostałe
- Rosja
- Rumunia
- Słowacja
- Słowenia
- Szwajcaria
- Szwecja
- Świat
- Turcja
- Ukraina
- Węgry
- Wielka Brytania
- Włochy
-
Psychologia
- Filozofie życiowe
- Kompetencje psychospołeczne
- Komunikacja międzyludzka
- Mindfulness
- Ogólne
- Perswazja i NLP
- Psychologia akademicka
- Psychologia duszy i umysłu
- Psychologia pracy
- Relacje i związki
- Rodzicielstwo i psychologia dziecka
- Rozwiązywanie problemów
- Rozwój intelektualny
- Sekret
- Seksualność
- Uwodzenie
- Wygląd i wizerunek
- Życiowe filozofie
-
Religia
-
Sport, fitness, diety
-
Technika i mechanika
Audiobooki
-
Biznes i ekonomia
- Bitcoin
- Bizneswoman
- Coaching
- Controlling
- E-biznes
- Ekonomia
- Finanse
- Giełda i inwestycje
- Kompetencje osobiste
- Komunikacja i negocjacje
- Mała firma
- Marketing
- Motywacja
- Nieruchomości
- Perswazja i NLP
- Podatki
- Poradniki
- Prezentacje
- Przywództwo
- Public Relation
- Sekret
- Social Media
- Sprzedaż
- Start-up
- Twoja kariera
- Zarządzanie
- Zarządzanie projektami
- Zasoby ludzkie (HR)
-
Dla dzieci
-
Dla młodzieży
-
Edukacja
-
Encyklopedie, słowniki
-
Historia
-
Informatyka
-
Inne
-
Języki obce
-
Kultura i sztuka
-
Lektury szkolne
-
Literatura
- Antologie
- Ballada
- Biografie i autobiografie
- Dla dorosłych
- Dramat
- Dzienniki, pamiętniki, listy
- Epos, epopeja
- Esej
- Fantastyka i science-fiction
- Felietony
- Fikcja
- Humor, satyra
- Inne
- Klasyczna
- Kryminał
- Literatura faktu
- Literatura piękna
- Mity i legendy
- Nobliści
- Nowele
- Obyczajowa
- Okultyzm i magia
- Opowiadania
- Pamiętniki
- Podróże
- Poezja
- Polityka
- Popularnonaukowa
- Powieść
- Powieść historyczna
- Proza
- Przygodowa
- Publicystyka
- Reportaż
- Romans i literatura obyczajowa
- Sensacja
- Thriller, Horror
- Wywiady i wspomnienia
-
Nauki przyrodnicze
-
Nauki społeczne
-
Popularnonaukowe i akademickie
-
Poradniki
-
Poradniki zawodowe i specjalistyczne
-
Prawo
-
Przewodniki i podróże
-
Psychologia
- Filozofie życiowe
- Komunikacja międzyludzka
- Mindfulness
- Ogólne
- Perswazja i NLP
- Psychologia akademicka
- Psychologia duszy i umysłu
- Psychologia pracy
- Relacje i związki
- Rodzicielstwo i psychologia dziecka
- Rozwiązywanie problemów
- Rozwój intelektualny
- Sekret
- Seksualność
- Uwodzenie
- Wygląd i wizerunek
- Życiowe filozofie
-
Religia
-
Sport, fitness, diety
-
Technika i mechanika
Kursy video
-
Bazy danych
-
Big Data
-
Biznes, ekonomia i marketing
-
Cyberbezpieczeństwo
-
Data Science
-
DevOps
-
Dla dzieci
-
Elektronika
-
Grafika/Wideo/CAX
-
Gry
-
Microsoft Office
-
Narzędzia programistyczne
-
Programowanie
-
Rozwój osobisty
-
Sieci komputerowe
-
Systemy operacyjne
-
Testowanie oprogramowania
-
Urządzenia mobilne
-
UX/UI
-
Web development
-
Zarządzanie
Podcasty
- Ebooki
- Informatyka
- Aplikacje biznesowe
- Getting Started with Greenplum for Big Data Analytics. A hands-on guide on how to execute an analytics project from conceptualization to operationalization using Greenplum
Szczegóły ebooka
Zaloguj się, jeśli jesteś zainteresowany treścią pozycji.
Getting Started with Greenplum for Big Data Analytics. A hands-on guide on how to execute an analytics project from conceptualization to operationalization using Greenplum
Ebook
Organizations are leveraging the use of data and analytics to gain a competitive advantage over their opposition. Therefore, organizations are quickly becoming more and more data driven. With the advent of Big Data, existing Data Warehousing and Business Intelligence solutions are becoming obsolete, and a requisite for new agile platforms consisting of all the aspects of Big Data has become inevitable. From loading/integrating data to presenting analytical visualizations and reports, the new Big Data platforms like Greenplum do it all. It is now the mindset of the user that requires a tuning to put the solutions to work.
Getting Started with Greenplum for Big Data Analytics is a practical, hands-on guide to learning and implementing Big Data Analytics using the Greenplum Integrated Analytics Platform. From processing structured and unstructured data to presenting the results/insights to key business stakeholders, this book explains it all.
Getting Started with Greenplum for Big Data Analytics discusses the key characteristics of Big Data and its impact on current Data Warehousing platforms. It will take you through the standard Data Science project lifecycle and will lay down the key requirements for an integrated analytics platform. It then explores the various software and appliance components of Greenplum and discusses the relevance of each component at every level in the Data Science lifecycle.
You will also learn Big Data architectural patterns and recap some key advanced analytics techniques in detail. The book will also take a look at programming with R and integration with Greenplum for implementing analytics. Additionally, you will explore MADlib and advanced SQL techniques in Greenplum for analytics. This book also elaborates on the physical architecture aspects of Greenplum with guidance on handling high-availability, back-up, and recovery.
Getting Started with Greenplum for Big Data Analytics is a practical, hands-on guide to learning and implementing Big Data Analytics using the Greenplum Integrated Analytics Platform. From processing structured and unstructured data to presenting the results/insights to key business stakeholders, this book explains it all.
Getting Started with Greenplum for Big Data Analytics discusses the key characteristics of Big Data and its impact on current Data Warehousing platforms. It will take you through the standard Data Science project lifecycle and will lay down the key requirements for an integrated analytics platform. It then explores the various software and appliance components of Greenplum and discusses the relevance of each component at every level in the Data Science lifecycle.
You will also learn Big Data architectural patterns and recap some key advanced analytics techniques in detail. The book will also take a look at programming with R and integration with Greenplum for implementing analytics. Additionally, you will explore MADlib and advanced SQL techniques in Greenplum for analytics. This book also elaborates on the physical architecture aspects of Greenplum with guidance on handling high-availability, back-up, and recovery.
- Getting Started with Greenplum for Big Data Analytics
- Table of Contents
- Getting Started with Greenplum for Big Data Analytics
- Credits
- Foreword
- About the Author
- Acknowledgement
- About the Reviewers
- www.PacktPub.com
- Support files, eBooks, discount offers and more
- Why Subscribe?
- Free Access for Packt account holders
- Instant Updates on New Packt Books
- Support files, eBooks, discount offers and more
- Preface
- What this book covers
- What you need for this book
- Who this book is for
- Conventions
- Reader feedback
- Customer support
- Errata
- Piracy
- Questions
- 1. Big Data, Analytics, and Data Science Life Cycle
- Enterprise data
- Classification
- Features
- Big Data
- So, what is Big Data?
- Multi-structured data
- Data analytics
- Data science
- Data science life cycle
- Phase 1 state business problem
- Phase 2 set up data
- Phase 3 explore/transform data
- Phase 4 model
- Phase 5 publish insights
- Phase 6 measure effectiveness
- Data science life cycle
- References/Further reading
- Summary
- Enterprise data
- 2. Greenplum Unified Analytics Platform (UAP)
- Big Data analytics platform requirements
- Greenplum Unified Analytics Platform (UAP)
- Core components
- Greenplum Database
- Hadoop (HD)
- Chorus
- Command Center
- Modules
- Database modules
- HD modules
- Data Integration Accelerator (DIA) modules
- Core architecture concepts
- Data warehousing
- Column-oriented databases
- Parallel versus distributed computing/processing
- Shared nothing, massive parallel processing (MPP) systems, and elastic scalability
- Shared disk data architecture
- Shared memory data architecture
- Shared nothing data architecture
- Data loading patterns
- Core components
- Greenplum UAP components
- Greenplum Database
- The Greenplum Database physical architecture
- The Greenplum high-availability architecture
- High-speed data loading using external tables
- External table types
- Polymorphic data storage and historic data management
- Data distribution
- Hadoop (HD)
- Hadoop Distributed File System (HDFS)
- Hadoop MapReduce
- Chorus
- Greenplum Database
- Greenplum Data Computing Appliance (DCA)
- Greenplum Data Integration Accelerator (DIA)
- References/Further reading
- Summary
- 3. Advanced Analytics Paradigms, Tools, and Techniques
- Analytic paradigms
- Descriptive analytics
- Predictive analytics
- Prescriptive analytics
- Analytics classified
- Classification
- Forecasting or prediction or regression
- Clustering
- Optimization
- Simulations
- Modeling methods
- Decision trees
- Association rules
- The Apriori algorithm
- Linear regression
- Logistic regression
- The Naive Bayesian classifier
- K-means clustering
- Text analysis
- R programming
- Weka
- In-database analytics using MADlib
- References/Further reading
- Summary
- Analytic paradigms
- 4. Implementing Analytics with Greenplum UAP
- Data loading for Greenplum Database and HD
- Greenplum data loading options
- External tables
- gpfdist
- gpload
- Hadoop (HD) data loading options
- Sqoop 2
- Greenplum BulkLoader for Hadoop
- Using external ETL to load data into Greenplum
- Extraction, Load, and Transformation (ELT) and Extraction, Transformation, Load, and Transformation (ETLT)
- Greenplum target configuration
- Sourcing large volumes of data from Greenplum
- Unsupported Greenplum data types
- Push Down Optimization (PDO)
- Greenplum data loading options
- Greenplum table distribution and partitioning
- Distribution
- Data skew and performance
- Optimizing the broadcast or redistribution motion for data co-location
- Partitioning
- Querying Greenplum Database and HD
- Querying Greenplum Database
- Analyzing and optimizing queries
- The ANALYZE function
- The EXPLAIN function
- Analyzing and optimizing queries
- Dynamic Pipelining in Greenplum
- Querying HDFS
- Hive
- Pig
- Data communication between Greenplum Database and Hadoop (using external tables)
- Distribution
- Data Computing Appliance (DCA)
- Storage design, disk protection, and fault tolerance
- Master server RAID configurations
- Segment server RAID configurations
- Monitoring DCA
- Storage design, disk protection, and fault tolerance
- Greenplum Database management
- In-database analytics options (Greenplum-specific)
- Window functions
- The PARTITION BY clause
- The ORDER BY clause
- The OVER (ORDER BY) clause
- Creating, modifying, and dropping functions
- User-defined aggregates
- Window functions
- Using R with Greenplum
- DBI Connector for R
- PL/R
- Using Weka with Greenplum
- Using MADlib with Greenplum
- Using Greenplum Chorus
- Pivotal
- References/Further reading
- Summary
- Data loading for Greenplum Database and HD
- Index
- Tytuł: Getting Started with Greenplum for Big Data Analytics. A hands-on guide on how to execute an analytics project from conceptualization to operationalization using Greenplum
- Autor: Sunila Gollapudi
- Tytuł oryginału: Getting Started with Greenplum for Big Data Analytics. A hands-on guide on how to execute an analytics project from conceptualization to operationalization using Greenplum
- ISBN: 9781782177050, 9781782177050
- Data wydania: 2013-10-23
- Format: Ebook
- Identyfikator pozycji: e_3d3b
- Wydawca: Packt Publishing