Categories
Ebooks
-
Business and economy
- Bitcoin
- Businesswoman
- Coaching
- Controlling
- E-business
- Economy
- Finances
- Stocks and investments
- Personal competence
- Computer in the office
- Communication and negotiation
- Small company
- Marketing
- Motivation
- Multimedia trainings
- Real estate
- Persuasion and NLP
- Taxes
- Social policy
- Guides
- Presentations
- Leadership
- Public Relation
- Reports, analyses
- Secret
- Social Media
- Sales
- Start-up
- Your career
- Management
- Project management
- Human Resources
-
For children
-
For youth
-
Education
-
Encyclopedias, dictionaries
-
E-press
- Architektura i wnętrza
- Biznes i Ekonomia
- Home and garden
- E-business
- Finances
- Personal finance
- Business
- Photography
- Computer science
- HR & Payroll
- Computers, Excel
- Accounts
- Culture and literature
- Scientific and academic
- Environmental protection
- Opinion-forming
- Education
- Taxes
- Travelling
- Psychology
- Religion
- Agriculture
- Book and press market
- Transport and Spedition
- Healthand beauty
-
History
-
Computer science
- Office applications
- Data bases
- Bioinformatics
- IT business
- CAD/CAM
- Digital Lifestyle
- DTP
- Electronics
- Digital photography
- Computer graphics
- Games
- Hacking
- Hardware
- IT w ekonomii
- Scientific software package
- School textbooks
- Computer basics
- Programming
- Mobile programming
- Internet servers
- Computer networks
- Start-up
- Operational systems
- Artificial intelligence
- Technology for children
- Webmastering
-
Other
-
Foreign languages
-
Culture and art
-
School reading books
-
Literature
- Antology
- Ballade
- Biographies and autobiographies
- For adults
- Dramas
- Diaries, memoirs, letters
- Epic, epopee
- Essay
- Fantasy and science fiction
- Feuilletons
- Work of fiction
- Humour and satire
- Other
- Classical
- Crime fiction
- Non-fiction
- Fiction
- Mity i legendy
- Nobelists
- Novellas
- Moral
- Okultyzm i magia
- Short stories
- Memoirs
- Travelling
- Narrative poetry
- Poetry
- Politics
- Popular science
- Novel
- Historical novel
- Prose
- Adventure
- Journalism, publicism
- Reportage novels
- Romans i literatura obyczajowa
- Sensational
- Thriller, Horror
- Interviews and memoirs
-
Natural sciences
-
Social sciences
-
School textbooks
-
Popular science and academic
- Archeology
- Bibliotekoznawstwo
- Cinema studies
- Philology
- Polish philology
- Philosophy
- Finanse i bankowość
- Geography
- Economy
- Trade. World economy
- History and archeology
- History of art and architecture
- Cultural studies
- Linguistics
- Literary studies
- Logistics
- Maths
- Medicine
- Humanities
- Pedagogy
- Educational aids
- Popular science
- Other
- Psychology
- Sociology
- Theatre studies
- Theology
- Economic theories and teachings
- Transport i spedycja
- Physical education
- Zarządzanie i marketing
-
Guides
-
Game guides
-
Professional and specialist guides
-
Law
- Health and Safety
- History
- Road Code. Driving license
- Law studies
- Healthcare
- General. Compendium of knowledge
- Academic textbooks
- Other
- Construction and local law
- Civil law
- Financial law
- Economic law
- Economic and trade law
- Criminal law
- Criminal law. Criminal offenses. Criminology
- International law
- International law
- Health care law
- Educational law
- Tax law
- Labor and social security law
- Public, constitutional and administrative law
- Family and Guardianship Code
- agricultural law
- Social law, labour law
- European Union law
- Industry
- Agricultural and environmental
- Dictionaries and encyclopedia
- Public procurement
- Management
-
Tourist guides and travel
- Africa
- Albums
- Southern America
- North and Central America
- Australia, New Zealand, Oceania
- Austria
- Asia
- Balkans
- Middle East
- Bulgary
- China
- Croatia
- The Czech Republic
- Denmark
- Egipt
- Estonia
- Europe
- France
- Mountains
- Greece
- Spain
- Holand
- Iceland
- Lithuania
- Latvia
- Mapy, Plany miast, Atlasy
- Mini travel guides
- Germany
- Norway
- Active travelling
- Poland
- Portugal
- Other
- Russia
- Romania
- Slovakia
- Slovenia
- Switzerland
- Sweden
- World
- Turkey
- Ukraine
- Hungary
- Great Britain
- Italy
-
Psychology
- Philosophy of life
- Kompetencje psychospołeczne
- Interpersonal communication
- Mindfulness
- General
- Persuasion and NLP
- Academic psychology
- Psychology of soul and mind
- Work psychology
- Relacje i związki
- Parenting and children psychology
- Problem solving
- Intellectual growth
- Secret
- Sexapeal
- Seduction
- Appearance and image
- Philosophy of life
-
Religion
-
Sport, fitness, diets
-
Technology and mechanics
Audiobooks
-
Business and economy
- Bitcoin
- Businesswoman
- Coaching
- Controlling
- E-business
- Economy
- Finances
- Stocks and investments
- Personal competence
- Communication and negotiation
- Small company
- Marketing
- Motivation
- Real estate
- Persuasion and NLP
- Taxes
- Guides
- Presentations
- Leadership
- Public Relation
- Secret
- Social Media
- Sales
- Start-up
- Your career
- Management
- Project management
- Human Resources
-
For children
-
For youth
-
Education
-
Encyclopedias, dictionaries
-
History
-
Computer science
-
Other
-
Foreign languages
-
Culture and art
-
School reading books
-
Literature
- Antology
- Ballade
- Biographies and autobiographies
- For adults
- Dramas
- Diaries, memoirs, letters
- Epic, epopee
- Essay
- Fantasy and science fiction
- Feuilletons
- Work of fiction
- Humour and satire
- Other
- Classical
- Crime fiction
- Non-fiction
- Fiction
- Mity i legendy
- Nobelists
- Novellas
- Moral
- Okultyzm i magia
- Short stories
- Memoirs
- Travelling
- Poetry
- Politics
- Popular science
- Novel
- Historical novel
- Prose
- Adventure
- Journalism, publicism
- Reportage novels
- Romans i literatura obyczajowa
- Sensational
- Thriller, Horror
- Interviews and memoirs
-
Natural sciences
-
Social sciences
-
Popular science and academic
-
Guides
-
Professional and specialist guides
-
Law
-
Tourist guides and travel
-
Psychology
- Philosophy of life
- Interpersonal communication
- Mindfulness
- General
- Persuasion and NLP
- Academic psychology
- Psychology of soul and mind
- Work psychology
- Relacje i związki
- Parenting and children psychology
- Problem solving
- Intellectual growth
- Secret
- Sexapeal
- Seduction
- Appearance and image
- Philosophy of life
-
Religion
-
Sport, fitness, diets
-
Technology and mechanics
Videocourses
-
Data bases
-
Big Data
-
Biznes, ekonomia i marketing
-
Cybersecurity
-
Data Science
-
DevOps
-
For children
-
Electronics
-
Graphics/Video/CAX
-
Games
-
Microsoft Office
-
Development tools
-
Programming
-
Personal growth
-
Computer networks
-
Operational systems
-
Software testing
-
Mobile devices
-
UX/UI
-
Web development
-
Management
Podcasts
- Ebooks
- Business and economy
- Social Media
- Data Mining. Eksploracja danych w sieciach społecznościowych. Wydanie III
E-book details
Data Mining. Eksploracja danych w sieciach społecznościowych. Wydanie III
Matthew A. Russell, Mikhail Klassen
Internetu nie można rozważać wyłącznie jako tworu techniki. Powstanie tej sieci doprowadziło do rozwoju różnych zjawisk społecznych. Z tej perspektywy na szczególną uwagę zasługują media społecznościowe. Są źródłem informacji, które, właściwie spożytkowane, mogą przynieść niezły dochód. Mogą też dać odpowiedzi na wiele pytań zadawanych przez naukowców z różnych branż. Sama eksploracja tych danych przynosi sporo satysfakcji i radości. Zaskakujące przy tym jest to, że przygotowanie zestawu potrzebnych narzędzi i nauka posługiwania się nimi zabiera naprawdę niewiele czasu i nie wymaga specjalnych talentów!
To trzecie, zaktualizowane wydanie popularnego podręcznika dla osób, które chcą zająć się wydobywaniem danych z sieci społecznościowych. Uwzględniono tu zmiany interfejsów API wprowadzone do poszczególnych platform i dodano rozdział o eksploracji Instagrama. Dowiesz się, jak dzięki danym z mediów społecznościowych określić sieć powiązań użytkowników, zorientować się, kto o czym mówi i gdzie się znajduje. Treść bogato zilustrowano przykładami kodu w Pythonie, a także plikami Jupyter Notebook lub kontenerów Dockera. Ciekawym elementem książki jest zbiór receptur dotyczących rozwiązywania konkretnych problemów z Twitterem.
W tej książce między innymi:
- wprowadzenie do świata mediów społecznościowych
- przybliżenie bogactwa danych zawartych w mediach społecznościowych
- eksploracja danych za pomocą narzędzi Pythona 3
- zaawansowane techniki eksploracji danych, w tym współczynniki TFIDF, podobieństwo kosinusów i rozpoznawanie obrazów
- tworzenie wizualizacji pozyskanych danych
Jakie informacje dziś znajdziesz dzięki danym z Facebooka?
Przedmowa 11
CZĘŚĆ I. PRZEWODNIK PO SIECIACH SPOŁECZNOŚCIOWYCH
Wstęp 25
1. Eksploracja Twittera: odkrywanie trendów, dowiadywanie się, o czym się rozmawia, i trochę więcej 27
- 1.1. Przegląd 27
- 1.2. Dlaczego Twitter to jest "to"? 28
- 1.3. Odkrywanie API Twittera 30
- 1.3.1. Podstawowa terminologia związana z Twitterem 30
- 1.3.2. Tworzenie połączenia z API Twittera 33
- 1.3.3. Odkrywanie trendów 36
- 1.3.4. Wyszukiwanie tweetów 40
- 1.4. Analiza 140 (lub więcej) znaków 46
- 1.4.1. Wyodrębnianie podmiotów z tweetów 47
- 1.4.2. Analizowanie tweetów i występujących w nich podmiotów z wykorzystaniem analizy częstości 49
- 1.4.3. Obliczanie różnorodności leksykalnej tweetów 51
- 1.4.4. Badanie wzorców w retweetach 53
- 1.4.5. Wizualizacja danych częstości za pomocą histogramów 55
- 1.5. Uwagi końcowe 59
- 1.6. Zalecane ćwiczenia 60
- 1.7. Zasoby online 61
2. Eksploracja Facebooka: analizowanie fanpage'y, znajomości i więcej 63
- 2.1. Przegląd 64
- 2.2. Interfejs API Graph Facebooka 64
- 2.2.1. Wprowadzenie do API Graph 66
- 2.2.2. Protokół Open Graph 70
- 2.3. Analiza połączeń grafu społecznościowego 75
- 2.3.1. Analizowanie stron Facebooka 78
- 2.3.2. Manipulowanie danymi z wykorzystaniem pakietu pandas 88
- 2.4. Uwagi końcowe 95
- 2.5. Zalecane ćwiczenia 96
- 2.6. Zasoby online 96
3. Eksploracja Instagrama: komputerowy wzrok, sieci neuronowe, rozpoznawanie obiektów i wykrywanie twarzy 99
- 3.1. Przegląd 100
- 3.2. Poznawanie API Instagrama 101
- 3.2.1. Tworzenie żądań do API Instagrama 101
- 3.2.2. Odczytywanie własnego kanału na Instagramie 103
- 3.2.3. Pobieranie medium według hashtagu 105
- 3.3. Anatomia posta na Instagramie 105
- 3.4. Szybki kurs na temat sztucznych sieci neuronowych 108
- 3.4.1. Trening sieci neuronowej pod kątem "oglądania" zdjęć 109
- 3.4.2. Rozpoznawanie cyfr pisanych odręcznie 111
- 3.4.3. Rozpoznawanie obiektów na zdjęciach przy użyciu wstępnie przeszkolonych sieci neuronowych 116
- 3.5. Wykorzystanie sieci neuronowych do postów na Instagramie 119
- 3.5.1. Oznaczanie zawartości obrazu 119
- 3.5.2. Wykrywanie twarzy na zdjęciach 121
- 3.6. Uwagi końcowe 122
- 3.7. Zalecane ćwiczenia 123
- 3.8. Zasoby online 124
4. Eksploracja sieci LinkedIn: stanowiska, współpracownicy i nie tylko 127
- 4.1. Przegląd 128
- 4.2. Poznawanie API LinkedIna 128
- 4.2.1. Tworzenie żądań do API LinkedIn 129
- 4.2.2. Pobieranie połączeń LinkedIn w pliku CSV 132
- 4.3. Krótki kurs grupowania danych 132
- 4.3.1. Normalizacja danych w celu umożliwienia analizy 135
- 4.3.2. Mierzenie podobieństwa 145
- 4.3.3. Algorytmy klasteryzacji 147
- 4.4. Uwagi końcowe 161
- 4.5. Zalecane ćwiczenia 161
- 4.6. Zasoby online 162
5. Eksploracja danych z plików tekstowych: obliczanie podobieństwa dokumentów, wyodrębnianie kolokacji i inne 163
- 5.1. Przegląd 164
- 5.2. Pliki tekstowe 164
- 5.3. Wprowadzenie do TF-IDF 166
- 5.3.1. Częstość terminu 166
- 5.3.2. Odwrotna częstość dokumentu 168
- 5.3.3. TF-IDF 169
- 5.4. Odpytywanie danych w języku naturalnym za pomocą TF-IDF 172
- 5.4.1. Natural Language Toolkit - wprowadzenie 172
- 5.4.2. Zastosowanie współczynnika TF-IDF do języka naturalnego 176
- 5.4.3. Wyszukiwanie podobnych dokumentów 177
- 5.4.4. Analiza bigramów w języku naturalnym 184
- 5.4.5. Refleksje na temat analizy danych języka naturalnego 193
- 5.5. Uwagi końcowe 194
- 5.6. Zalecane ćwiczenia 195
- 5.7. Zasoby online 195
6. Eksploracja stron internetowych: przetwarzanie języka naturalnego w celu zrozumienia języka ludzkiego, tworzenie podsumowań postów na blogu i inne 197
- 6.1. Przegląd 198
- 6.2. Scraping, parsowanie i crawling stron internetowych 199
- 6.2.1. Przeszukiwanie wszerz w crawlingu stron internetowych 202
- 6.3. Odkrywanie semantyki przez dekodowanie składni 205
- 6.3.1. Przetwarzanie języka naturalnego krok po kroku 207
- 6.3.2. Wykrywanie zdań w danych w języku naturalnym 210
- 6.3.3. Tworzenie streszczeń dokumentów 214
- 6.4. Zmiana paradygmatu. Analiza obiektów 222
- 6.4.1. Podsumowania danych w języku naturalnym 226
- 6.5. Jakość analiz do przetwarzania danych w języku naturalnym 230
- 6.6. Uwagi końcowe 234
- 6.7. Zalecane ćwiczenia 234
- 6.8. Zasoby online 235
7. Eksploracja skrzynek pocztowych: analiza, kto rozmawia z kim, o czym, jak często i nie tylko 237
- 7.1. Przegląd 238
- 7.2. Uzyskiwanie i przetwarzanie korpusu danych pocztowych 239
- 7.2.1. Uniksowe skrzynki pocztowe 239
- 7.2.2. Pobieranie danych Enron 243
- 7.2.3. Konwersja korpusu poczty na uniksowy format mbox 245
- 7.2.4. Konwertowanie uniksowych skrzynek pocztowych na obiekty DataFrame biblioteki pandas 247
- 7.3. Analiza korpusu Enron 249
- 7.3.1. Zapytania według zakresu dat (godzin) 250
- 7.3.2. Analiza wzorców w komunikacji nadawca-odbiorca 253
- 7.3.3. Wyszukiwanie wiadomości e-mail według słów kluczowych 257
- 7.4. Analiza własnych danych pocztowych 258
- 7.4.1. Dostęp do Twojej skrzynki Gmail za pomocą OAuth 260
- 7.4.2. Pobieranie i parsowanie wiadomości e-mail 262
- 7.4.3. Wizualizacja wzorców w e-mailu za pomocą frameworka Immersion 264
- 7.5. Uwagi końcowe 265
- 7.6. Zalecane ćwiczenia 265
- 7.7. Zasoby online 266
8. Eksploracja serwisu GitHub: badanie nawyków podczas współtworzenia oprogramowania, tworzenie grafów zainteresowań i nie tylko 269
- 8.1. Przegląd 270
- 8.2. Odkrywanie API GitHuba 270
- 8.2.1. Tworzenie połączenia do API serwisu GitHub 272
- 8.2.2. Tworzenie żądań do API GitHuba 275
- 8.3. Modelowanie danych za pomocą grafów właściwości 277
- 8.4. Analiza grafów zainteresowań serwisu GitHub 280
- 8.4.1. "Wysiewanie" grafu zainteresowań 281
- 8.4.2. Obliczanie miar centralności grafu 284
- 8.4.3. Rozszerzanie grafu zainteresowań z wykorzystaniem krawędzi "śledzi" dla użytkowników 287
- 8.4.4. Używanie węzłów jako punktów przestawnych w celu tworzenia bardziej wydajnych zapytań 296
- 8.4.5. Wizualizacja grafów zainteresowań 301
- 8.5. Uwagi końcowe 303
- 8.6. Zalecane ćwiczenia 304
- 8.7. Zasoby online 305
CZĘŚĆ II. TWITTER. RECEPTURY
9. Twitter. Receptury 309
- 9.1. Dostęp do interfejsu API Twittera dla celów programistycznych 310
- 9.2. Wykorzystanie OAuth w celu uzyskania dostępu do interfejsu API Twittera dla aplikacji produkcyjnych 311
- 9.3. Odkrywanie trendów 315
- 9.4. Wyszukiwanie tweetów 316
- 9.5. Konstruowanie wygodnych wywołań funkcji 318
- 9.6 Zapisywanie i przywracanie danych JSON z wykorzystaniem plików tekstowych 319
- 9.7. Zapisywanie danych JSON i uzyskiwanie dostępu do nich za pomocą MongoDB 320
- 9.8. Pobieranie próbek z mechanizmu firehose Twittera za pomocą API Streaming 323
- 9.9. Pobieranie danych szeregów czasowych 324
- 9.10. Wyodrębnianie podmiotów z tweetów 326
- 9.11. Znajdowanie najpopularniejszych tweetów w kolekcji 327
- 9.12. Znajdowanie najpopularniejszych obiektów w kolekcji tweetów 329
- 9.13. Tabularyzacja analizy częstości 330
- 9.14. Znajdowanie użytkowników, którzy retweetowali status 331
- 9.15. Wyodrębnianie przypisania retweeta 333
- 9.16. Wykonywanie odpornych na błędy żądań do Twittera 334
- 9.17. Pobieranie informacji o profilu użytkownika 337
- 9.18. Wyodrębnianie podmiotów tweeta z dowolnego tekstu 338
- 9.19. Pobieranie wszystkich znajomych lub obserwatorów użytkownika 339
- 9.20. Analiza znajomych i obserwatorów użytkownika 341
- 9.21. Zbieranie tweetów użytkownika 342
- 9.22. Crawling grafu znajomości 344
- 9.23. Analiza treści tweetów 346
- 9.24. Tworzenie streszczeń celów łączy 347
- 9.25. Analizowanie ulubionych tweetów użytkownika 350
- 9.26. Uwagi końcowe 352
- 9.27. Zalecane ćwiczenia 352
- 9.28. Zasoby online 353
CZĘŚĆ III. ZAŁĄCZNIKI
A. Informacje o maszynie wirtualnej przeznaczonej dla tej książki 357
B. Elementarz OAuth 359
C. Porady i wskazówki na temat Pythona i środowiska Jupyter Notebook 363
Skorowidz 365
- Title: Data Mining. Eksploracja danych w sieciach społecznościowych. Wydanie III
- Author: Matthew A. Russell, Mikhail Klassen
- Original title: Mining the Social Web: Data Mining Facebook, Twitter, LinkedIn, Google+, GitHub, and More, 3rd Edition
- Translation: Radosław Meryk
- ISBN: 978-83-283-5555-2, 9788328355552
- Date of issue: 2019-10-15
- Format: Ebook
- Item ID: datam3
- Publisher: Helion