in samenwerking met
Op werkdagen voor 23:00 besteld, morgen in huis Gratis verzending vanaf €20
-
Inloggen
-- Inloggen
  • accountoverzicht
  • bestellingen
  • facturen betalen
  • downloadcentrum
  • gegevens
  • financieel
  • inloggen
  • uitloggen

Uw winkelwagen

Naar winkelwagen Verder winkelen
Titel niet gevonden? Wij gaan voor u op zoek!
Vul onderstaand formulier zo volledig mogelijk in, dan gaan wij voor u op zoek.
Vul onderstaand formulier zo volledig mogelijk in.
Alle rubrieken
Alle boeken
  • Cadeauboeken
  • Computer & Informatica
  • Economie
  • Filosofie
  • Flora en fauna
  • Geneeskunde
  • Geschiedenis
  • Gezondheid
  • Jeugd
  • Koken en eten
  • Kunst en cultuur
  • Literatuur en romans
  • Management
  • Mens en maatschappij
  • Naslagwerken
  • Non-fictie informatief/professioneel
  • Paramedisch
  • Psychologie
  • Reizen
  • Religie
  • Schoolboeken
  • Spiritualiteit
  • Sport, hobby, lifestyle
  • Thrillers en spanning
  • Wetenschap en techniek
  • Woordenboeken en taal
010-4091943
Klantenservice
Mijn account
Mijn bestellingen
010-4091943
Boeken Computer en informatica Big Data
Big Data
Nathan Marz

Nathan Marz is the creator of Apache Storm and the originator of the Lambda Architecture for big data systems.

Meer over de auteurs
Nathan Marz, James Warren

Big Data

Principles and best practices of scalable realtime data systems

Specificaties
Paperback, 308 blz. | Engels
Manning | 1e druk, 2015
ISBN13: 9781617290343
Rubricering
Hoofdrubriek : Computer en informatica
Manning 1e druk, 2015 9781617290343
59,74
In winkelwagen
Verwachte levertijd ongeveer 11 werkdagen
Samenvatting Specificaties Over de auteur Inhoudsopgave

Samenvatting

Web-scale applications like social networks, real-time analytics, or e-commerce sites deal with a lot of data, whose volume and velocity exceed the limits of traditional database systems. These applications require architectures built around clusters of machines to store and process data of any size, or speed. Fortunately, scale and simplicity are not mutually exclusive.

'Big Data' teaches you to build big data systems using an architecture designed specifically to capture and analyze web-scale data. This book presents the Lambda Architecture, a scalable, easy-to-understand approach that can be built and run by a small team. You'll explore the theory of big data systems and how to implement them in practice. In addition to discovering a general framework for processing big data, you'll learn specific technologies like Hadoop, Storm, and NoSQL databases.

WHAT'S INSIDE
-Introduction to big data systems
-Real-time processing of web-scale data
-Tools like Hadoop, Cassandra, and Storm
-Extensions to traditional database skills

This book requires no previous exposure to large-scale data analysis or NoSQL tools. Familiarity with traditional databases is helpful.

Specificaties

ISBN13:9781617290343
Trefwoorden:Data analyse, big data
Taal:Engels
Bindwijze:paperback
Aantal pagina's:308
Uitgever:Manning
Druk:1
Verschijningsdatum:7-5-2015
Hoofdrubriek:Computer en informatica

Over Nathan Marz

Nathan Marz is the creator of Apache Storm and the originator of the Lambda Architecture for big data systems.

Andere boeken door Nathan Marz

Bekijk alle boeken

Over James Warren

James Warren is an analytics architect with a background in machine learning and scientific computing.

Andere boeken door James Warren

Bekijk alle boeken

Inhoudsopgave

U kunt van deze inhoudsopgave een PDF downloaden

Preface
Acknowledgments
About this book

1. A new paradigm for Big Data
1.1 How this book is structured
1.2 1.2Scaling with a traditional database
1.3 NoSQL is not a panacea
1.4 First principles
1.5 Desired properties of a Big Data system
1.6 The problems with fully incremental architectures
1.7 Lambda Architecture
1.8 Recent trends in technology
1.9 Example application: SuperWebAnalytics.com
1.10 Summary

Part 1: Batch layer
2. Data model for Big Data
2.1 The properties of data
2.2 The fact-based model for representing data
2.3 Graph schemas
2.4 A complete data model for SuperWebAnalytics.com
2.5 Summary

3. Data model for Big Data: Illustration
3.1 Why a serialization framework?
3.2 Apache Thrift
3.3 Limitations of serialization frameworks
3.4 Summary

4. Data storage on the batch layer
4.1 Storage requirements for the master dataset
4.2 Choosing a storage solution for the batch layer
4.3 How distributed filesystems work
4.4 Storing a master dataset with a distributed filesystem
4.5 Vertical partitioning
4.6 Low-level nature of distributed filesystems
4.7 Storing the SuperWebAnalytics.com master dataset on a distributed filesystem
4.8 Summary

5. Data storage on the batch layer: Illustration
5.1 Using the Hadoop Distributed File System
5.2 Data storage in the batch layer with Pail
5.3 Storing the master dataset for SuperWebAnalytics.com
5.4 Summary

6. Batch layer
6.1 Motivating examples
6.2 Computing on the batch layer
6.3 Recomputation algorithms vs. incremental algorithms
6.4 Scalability in the batch layer
6.5 MapReduce: a paradigm for Big Data computing
6.6 Low-level nature of MapReduce
6.7 Pipe diagrams: a higher-level way of thinking about batch computation
6.8 Summary

7. Batch layer: Illustration
7.1 An illustrative example
7.2 Common pitfalls of data-processing tools
7.3 An introduction to JCascalog
7.4 Composition
7.5 Summary

8. An example batch layer: Architecture and algorithms
8.1 Design of the SuperWebAnalytics.com batch layer
8.2 Workflow overview
8.3 Ingesting new data
8.4 URL normalization
8.5 User-identifier normalization
8.6 Deduplicate pageviews
8.7 Computing batch views
8.8 Summary

9. An example batch layer: Implementation
9.1 Starting point
9.2 Preparing the workflow
9.3 Ingesting new data
9.4 URL normalization
9.5 User-identifier normalization
9.6 Deduplicate pageviews
9.7 Computing batch views
9.8 Summary

Part 2: Serving layer
10. Serving layer
10.1 Performance metrics for the serving layer
10.2 The serving layer solution to the normalization/denormalization problem
10.3 Requirements for a serving layer database
10.4 Designing a serving layer for SuperWebAnalytics.com
10.5 Contrasting with a fully incremental solution
10.6 Summary

11. Serving layer: Illustration
11.1 Basics of ElephantDB
11.2 Building the serving layer for SuperWebAnalytics.com
11.3 Summary

Part 3: Speed layer
12. Realtime views
12.1 Computing realtime views
12.2 Storing realtime views
12.3 Challenges of incremental computation
12.4 Asynchronous versus synchronous updates
12.5 Expiring realtime views
12.6 Summary

13. Realtime views: Illustration
13.1 Cassandra’s data model
13.2 Using Cassandra
13.3 Summary

14. Queuing and stream processing
14.1 Queuing
14.2 Stream processing
14.3 Higher-level, one-at-a-time stream processing
14.4 SuperWebAnalytics.com speed layer
14.5 Summary

15. Queuing and stream processing: Illustration
15.1 Defining topologies with Apache Storm
15.2 Apache Storm clusters and deployment
15.3 Guaranteeing message processing
15.4 Implementing the SuperWebAnalytics.com uniques-over-time speed layer
15.5 Summary

16. Micro-batch stream processing
16.1 Achieving exactly-once semantics
16.2 Core concepts of micro-batch stream processing
16.3 Extending pipe diagrams for micro-batch processing
16.4 Finishing the speed layer for SuperWebAnalytics.com
16.5 Pageviews over time 262 n Bounce-rate analysis
16.6 Another look at the bounce-rate-analysis example
16.7 Summary

17. Micro-batch stream processing: Illustration
17.1 Using Trident
17.2 Finishing the SuperWebAnalytics.com speed layer
17.3 Fully fault-tolerant, in-memory, micro-batch processing
17.4 Summary

18. Lambda Architecture in depth
18.1 Defining data systems
18.2 Batch and serving layers
18.3 Speed layer
18.4 Query layer
18.5 Summary


Index

Anderen die dit boek kochten, kochten ook

  • Exam Ref SC-300 Microsoft Identity and Access Administrator
    Razi Rais
    Exam Ref SC-300 Microsoft Identity and Access Administrator
    € 50,14
  • Data and Analytics Strategy for Business
    Simon Asplen–taylor
    Data and Analytics Strategy for Business
    € 52,47
  • Theory of Fun for Game Design
    Raph Koster
    Theory of Fun for Game Design
    € 50,42
  • Building Design Systems
    Sarrah Vesselov
    Building Design Systems
    € 54,99
  • A Tale Of Two Halves: The History of Football Video Games (Captain's Edition)
    Bitmap Books
    A Tale Of Two Halves: The History of Football Video Games (Captain's Edition)
    € 63,80
  • Agile Scrum Handbook
    Nader Rad
    Agile Scrum Handbook
    € 34,83

Rubrieken

Uw cookie-instellingen
Deze website maakt gebruik van verschillende soorten cookies. Sommige cookies worden geplaatst door diensten van derden die op onze pagina's worden weergegeven. Om deze externe content te kunnen tonen is nodig dat u toestemming geeft voor het zetten van persoonlijke en marketingcookies. U kunt uw toestemming op elk moment wijzigen of intrekken. In onze cookieverklaring vindt u meer informatie.

Functionele cookies
Deze zijn noodzakelijk voor de werking van de website, zonder deze cookies kan de website niet naar behoren werken.

Persoonlijke en marketingcookies
Wij gebruiken cookies voor statistieken om bij te houden en rapportages te krijgen over hoe bezoekers de website gebruiken. Zo kunnen wij onze website verbeteren. Marketingcookies worden gebruikt om bezoekers te volgen wanneer ze verschillende websites bezoeken. Hun doel is advertenties weergeven die zijn toegesneden op en relevant zijn voor de individuele gebruiker.
Gratis verzending – 5% korting bij 2 of meer Nederlandse boeken – 10% korting op buitenlandse boeken

Klantenservice

Contact Voorwaarden

Bestellen en retourneren
DE STUDIEBOEKHANDEL VOOR HANZEHOGESCHOOL
Algemene voorwaarden Privacy Cookies Service & Contact
© 2025 Wristers Boekverkopers BV

    Personen

      Trefwoorden

        Big Data

        Big Data
        Nathan Marz , James Warren
        /
        loader
        Recensiebeleid
        Noordhoff terugkoopgarantie

        Noordhoff koopt jouw boek terug, zonder zorgen!

        Heb je jouw boeken niet meer nodig?

        Als je jouw studieboeken gekocht hebt bij hanzestudybook.nl, kun je geselecteerde titels moeiteloos terugverkopen aan Noordhoff. Geen vragen, geen gedoe en lekker duurzaam.

        Volledige informatie op Noordhoff.nl

        AI-book

        Wat is een AI-book?

        Een AI-book is niet een boek dat geschreven is door AI maar een boek dat verrijkt is met AI. Het maakt de inhoud van een boek interactief via WhatsApp, zodat je ermee kunt chatten. Zie het als een razend slimme assistent die het boek perfect begrijpt en er alles uit onthouden heeft. Jij kunt deze assistent alles vragen. Vraag bijvoorbeeld hoe je iets kunt toepassen op jouw persoonlijke situatie, om een korte samenvatting, of wat de belangrijkste inzichten zijn. AI-books zijn alleen te gebruiken via WhatsApp, je hoeft er geen aparte app voor te installeren.
        Meer informatie over AI-books

        ?

        Geef uw beoordeling

        Big Data

        Verwijder uw beoordeling