R - Programowanie

1
Ebook

Analiza danych behawioralnych przy użyciu języków R i Python

Florent Buisson

Wykorzystanie danych zorientowanych na użytkownika w celu uzyskania realnych wyników biznesowych Dzięki tej książce Czytelnik będzie mógł wykorzystać w swojej firmie pełną moc danych behawioralnych używając w tym celu wyspecjalizowanych narzędzi. Algorytmy często stosowane w danologii, a także programy służące do analizy predykcyjnej traktują jak zwykłe informacje dane behawioralne wygenerowane przez użytkowników, takie jak kliknięcia na stronie internetowej czy zakupy w supermarkecie. Ten praktyczny przewodnik zawiera opisy skutecznych metod, zaprojektowanych specjalnie w celu przeprowadzania analiz danych behawioralnych. Zaawansowana architektura umożliwiająca wykonywanie eksperymentów pomaga w pełni wykorzystać testy A/B. Diagramy przyczynowe pozwalają poznać przyczyny zachowań nawet w przypadku, gdy nie można przeprowadzać eksperymentów. Ta praktyczna książka, napisana przystępnym stylem i przeznaczona dla osób zajmujących się danymi, analityków biznesowych oraz behawiorystów, zawiera kompletne przykłady, a także ćwiczenia wykorzystujące języki R i Python, pozwalające od razu uzyskać lepszy wgląd w dane. Zagadnienia przeanalizowane w książce: •  Poznanie specyfiki danych behawioralnych. •  Przedstawienie różnic pomiędzy pomiarami a prognozami. •  Wyjaśnienie, jak można oczyścić i przygotować dane behawioralne. •  Zaprojektowanie i przeanalizowanie eksperymentów umożliwiających podejmowanie optymalnych decyzji biznesowych. •  Wykorzystanie danych behawioralnych w celu zrozumienia i określenia przyczyny oraz skutku. •  Zaprezentowanie kompleksowej metody pozwalającej na uzyskanie przejrzystego podziału klientów na grupy. „Ta książka jest wyjątkowa, ponieważ rozpoczyna się od przedstawienia pytań i problemów, a także wykorzystuje w postaci prawdziwych narzędzi odpowiednie techniki i języki programowania. Dzięki temu Czytelnicy poznają, jak można rozwiązywać niezwykle ważne i trudne zagadnienia. Czas poświęcony na jej przeczytanie będzie czystą inwestycją.” —Eric Weber Kierownik Działu Eksperymentów, Yelp Florent Buisson jest ekonomistą behawioralnym z 10-letnim doświadczeniem związanych z biznesem, analityką i naukami behawioralnymi. W firmie ubezpieczeniowej Allstate założył zespół specjalizujący się w naukach behawioralnych i pełnił funkcję jego szefa przez cztery lata. Publikował artykuły naukowe w czasopismach takich jak recenzowany Journal of Real Estate Research. Posiada tytuł magistra ekonometrii oraz doktorat z ekonomii behawioralnej, uzyskany na uniwersytecie Sorbona w Paryżu.

2
Ebook

Badanie danych. Raport z pierwszej linii działań

Rachel Schutt, Cathy O'Neil

Unikalne wprowadzenie do nauki o danych! W dzisiejszych czasach najcenniejszym dobrem jest informacja. Ogromne ilości danych są przechowywane w przepastnych bazach danych, a kluczem do sukcesu jest ich umiejętna analiza i wyciąganie wniosków. To dynamicznie rozwijająca się dziedzina wiedzy, w której do tej pory brakowało solidnych podręczników, pozwalających na dogłębne poznanie tego obszaru. Na szczęście to się zmieniło! To unikalna książka, w której badacze z największych firm branży IT dzielą się skutecznymi technikami analizy danych. Z kolejnych rozdziałów dowiesz się, czym jest nauka o danych, model danych oraz test A/B. Ponadto zdobędziesz wiedzę na temat wnioskowania statystycznego, algorytmów, języka R oraz wizualizacji danych. Sięgnij po tę książkę, jeżeli chcesz się dowiedzieć, jak wykrywać oszustwa, korzystać z MapReduce oraz badać przyczynowość. To obowiązkowa pozycja na półce czytelników zainteresowanych badaniem danych. Wśród tematów poruszonych w książce odnajdziesz: Wnioskowanie statystyczne, eksploracyjną analizę danych i proces (metodologię) nauki o danych Algorytmy Filtry spamu, naiwny algorytm Bayesa i wstępną obróbkę danych Regresję logistyczną Modelowanie finansowe Mechanizmy rekomendacji i przyczynowość Wizualizowanie danych Sieci społecznościowe i dziennikarstwo danych Inżynierię danych, systemy MapReduce, Pregel i Hadoop Wyciągnij wartościowe wnioski z posiadanych informacji!

3
Ebook

Data Analysis with R. A comprehensive guide to manipulating, analyzing, and visualizing data in R - Second Edition

Tony Fischetti

Frequently the tool of choice for academics, R has spread deep into the private sector and can be found in the production pipelines at some of the most advanced and successful enterprises. The power and domain-specificity of R allows the user to express complex analytics easily, quickly, and succinctly. Starting with the basics of R and statistical reasoning, this book dives into advanced predictive analytics, showing how to apply those techniques to real-world data though with real-world examples.Packed with engaging problems and exercises, this book begins with a review of R and its syntax with packages like Rcpp, ggplot2, and dplyr. From there, get to grips with the fundamentals of applied statistics and build on this knowledge to perform sophisticated and powerful analytics. Solve the difficulties relating to performing data analysis in practice and find solutions to working with messy data, large data, communicating results, and facilitating reproducibility.This book is engineered to be an invaluable resource through many stages of anyone’s career as a data analyst.

4
Ebook

Data Science. Programowanie, analiza i wizualizacja danych z wykorzystaniem języka R

Michael Freeman, Joel Ross

Aby surowe dane przekuć w gotową do wykorzystania wiedzę, potrzebna jest umiejętność ich analizy, przekształcania i niekiedy również wizualizacji. Nagrodą za włożony w to wysiłek jest lepsze rozumienie różnych złożonych zagadnień z wielu dziedzin wiedzy. Co więcej, znajomość procesów programowego przetwarzania danych pozwala na szybkie wykrywanie i opisywanie wzorców danych, praktycznie niemożliwych do dostrzeżenia innymi technikami. Dla wielu badaczy jednak barierą na drodze do skorzystania z tych atrakcyjnych możliwości jest konieczność pisania kodu. Oto podręcznik programowania w języku R dla analityków danych, szczególnie przydatny dla osób, które nie mają doświadczenia w tej dziedzinie. Dokładnie opisano tu potrzebne narzędzia i technologie. Zamieszczono wskazówki dotyczące instalacji i konfiguracji oprogramowania do pisania kodu, wykonywania go i zarządzania nim, a także śledzenia wersji projektów i zmian w nich oraz korzystania z innych podstawowych mechanizmów. Poszczególne kroki tworzenia kodu w języku R wyjaśniono dokładnie i przystępnie. Dzięki tej książce można płynnie przejść do konkretnych zadań i budować potrzebne aplikacje. Zrozumienie prezentowanych w niej treści ułatwiają liczne przykłady i ćwiczenia, co pozwala szybko przystąpić do skutecznego analizowania własnych zbiorów danych. W tej książce między innymi: przygotowanie środowiska pracy i rozpoczęcie programowania w R podstawy zarządzania projektami, kontrola wersji i generowanie dokumentacji ramki danych, pakiety dplyr i tidyr kod do wizualizacji danych i pakiet ggplot2 tworzenie aplikacji i techniki współpracy w zespołach specjalistów Po prostu R i dane. Wyciśniesz każdą kroplę wiedzy!

5
Ebook

Deep Learning. Praca z językiem R i biblioteką Keras

Francois Chollet, J. J. Allaire

W ostatnich latach byliśmy świadkami ogromnego postępu technik sztucznej inteligencji, uczenia maszynowego oraz uczenia głębokiego. Konsekwencje tego błyskawicznego rozwoju są odczuwalne w niemal każdej dziedzinie. Wydaje się, że to jedna z tych technologii, które powinny być dostępne dla jak najszerszej grupy ludzi. Dopiero wtedy uczenie głębokie wykorzysta w pełni swój potencjał i stanie się prawdziwym impulsem rozwoju naszej cywilizacji. Co prawda na pierwszy rzut oka ta niesamowita technologia może wydawać się wyjątkowo skomplikowana i trudna do zrozumienia, warto jednak wykorzystać dostępne narzędzia, takie jak biblioteka Keras i język R, aby implementować mechanizmy uczenia głębokiego wszędzie tam, gdzie okażą się przydatne. Ta książka jest znakomitym przewodnikiem po technikach uczenia głębokiego. Poza wyczerpująco przedstawionymi podstawami znajdziesz tu zasady implementacji tych technik z wykorzystaniem języka R i biblioteki Keras. Dzięki przystępnym wyjaśnieniom i praktycznym przykładom szybko zrozumiesz nawet bardziej skomplikowane zagadnienia uczenia głębokiego. Poznasz koncepcje i dobre praktyki związane z tworzeniem mechanizmów analizy obrazu, przetwarzania języka naturalnego i modeli generatywnych. Przeanalizujesz ponad 30 przykładów kodu uzupełnionego dokładnymi komentarzami. W efekcie szybko przygotujesz się do korzystania z uczenia głębokiego w rozwiązywaniu konkretnych problemów. W tej książce między innymi: podstawowe koncepcje sztucznej inteligencji, uczenia maszynowego i uczenia głębokiego wprowadzenie do budowy i trenowania sieci neuronowych uczenie głębokie w przetwarzaniu obrazów modele generatywne tworzące obrazy i tekst perspektywy i ograniczenia uczenia głębokiego Uczenie głębokie: zafascynuj się i zaimplementuj!

6
Ebook

Dodaj mocy Power BI! Jak za pomocą kodu w Pythonie i R pobierać, przekształcać i wizualizować dane

Luca Zavarella, Francesca Lazzeri

Ważnym zadaniem inżynierów danych jest kreowanie modeli uczenia maszynowego. Używa się do tego narzędzi do analizy biznesowej, takich jak Power BI. Możliwości Power BI są imponujące, a można je dodatkowo rozbudować. Jedną z ciekawszych metod wzbogacania modelu danych i wizualizacji Power BI jest zastosowanie złożonych algorytmów zaimplementowanych w językach Python i R. W ten sposób można nie tylko tworzyć interesujące wizualizacje danych, ale także pozyskiwać dzięki nim kluczowe dla biznesu informacje. Dzięki tej książce dowiesz się, jak to zrobić. Zaczniesz od przygotowania środowiska Power BI do używania skryptów w Pythonie i R. Następnie będziesz importować dane z nieobsługiwanych obiektów i przekształcać je za pomocą wyrażeń regularnych i złożonych algorytmów. Nauczysz się wywoływać zewnętrzne interfejsy API i korzystać z zaawansowanych technik w celu przeprowadzenia dogłębnych analiz i wyodrębnienia cennych informacji za pomocą narzędzi statystyki i uczenia maszynowego, a także poprzez zastosowanie optymalizacji liniowej i innych algorytmów. Zapoznasz się również z głównymi cechami statystycznymi zestawów danych i z metodami tworzenia różnych wykresów ułatwiających zrozumienie relacji między zmiennymi. Najciekawsze zagadnienia: złożone przekształcanie danych w Power BI za pomocą skryptów Pythona i R anonimizacja i pseudonimizacja danych praca z dużymi zestawami danych wartości odstające i brakujące dla danych wielowymiarowych i szeregów czasowych tworzenie złożonych wizualizacji danych Wyzwól potężną moc Power BI!

7
Ebook

Instant Heat Maps in R How-to. Learn how to design heat maps in R to enhance your data analysis

Sebastian Raschka

R has grown rapidly over the years to become one of the most versatile and valuable tools for data analysis and graphing. One of its many useful features is the heat map representation of numerical data, which is an invaluable tool to discover patterns in data quickly and efficiently.Instant Heat Maps in R How-to provides you with practical recipes to create heat maps of all difficulty levels by yourself right from the start. At the end of each recipe, you will find an in-depth analysis that will equip you with everything you need to know to frame the code to your own needs.Instant Heat Maps in R will present you with all the different heat map plotting functions that exist in R. You will start by creating simple heat maps before moving on to learn how to add more features to them. While you advance step-by-step through the well-connected recipes, you will find out which tool suits the given situation best. You will learn how to read data from popular file formats and how to format the data to create heat maps as well as the ways to export them for presentation.

8
Ebook

Język R dla każdego: zaawansowane analizy i grafika statystyczna zaawansowane analizy i grafika statystyczna

Jared P. Lander

Obliczenia statystyczne dla programistów, naukowców, analityków, użytkowników Excela i innych Przy użyciu języka R możesz budować skuteczne modele statystyczne i znaleźć odpowiedzi na wiele spośród najtrudniejszych pytań. Tworzony w ramach open source język R tradycyjnie uważany jest za trudny do opanowania dla nie-statystyków, zaś większość dostępnych książek zakłada zbyt dużą już obecną wiedzę na ten temat, aby były prawdziwie pomocne. Rozwiązaniem tego problemu jest ten tytuł: R dla każdego. Opierając się na swoich rozległych doświadczeniach w nauczaniu nowych użytkowników, Jared P. Lander przygotował doskonały tutorial dla każdego, kto dopiero wkracza w świat programowania i modelowania statystycznego. Przewodnik ten, zaplanowany tak, aby nauka była prosta i intuicyjna, skupia się na tych 20 procentach funkcjonalności R, których potrzebujemy, aby móc zrealizować 80 procent nowoczesnych zadań. Wykład rozpoczyna się od absolutnych podstaw, oferując liczne ćwiczenia praktyczne i przykładowy kod. Trzeba pobrać i zainstalować R; poznać środowisko; opanować podstawowe sterowanie programu, importowanie danych, przetwarzanie ich i wizualizację, a także wykonywanie podstawowych testów. Następnie na tym fundamencie można konstruować pełne modele, zarówno liniowe, jak i nieliniowe i używać technik drążenia danych. A na koniec sprawimy, aby nasz kod był reprodukowalny przy użyciu LaTeX, RMarkdown oraz Shiny. Po ukończeniu lektury nie będziesz po prostu wiedział, jak pisać programy w R będziesz gotów rozwiązywać problemy statystyczne, na których ci zależy. JARED P. LANDER zajmuje stanowisko Chief Data Scientist w Lander Analytics, zlokalizowanej w Nowym Jorku firmie specjalizującej się w analizach statystycznych i usługasz szkoleniowych, jednej z organizatorów New York Open Statistical Programming Meetup największego na świecie spotkanie użytkowników i twórców R oraz New York R Conference. Jest wykładowcą statystyki na Uniwersytecie Columbia. Posiadając dyplom M.A. z Uniwersytetu Columbia w dziedzinie statystyki oraz B.S. z matematyki uzyskany w Muhlenberg College, ma doświadczenie zarówno w badaniach naukowych, jak i komercyjnych zastosowaniach. Jared często występuje na różnorodnych konferencjach i spotkaniach na całym świecie. Jego artykuły na temat statystyki można znaleźć na stronie jaredlander.com. Jego prace są cytowane w takich czasopismach, jak Forbes i Wall Street Journal.