Data Pipelines with Apache Airflow, Second Edition (eBook)

Data Pipelines with Apache Airflow, Second Edition (eBook)

Prezzo:
€ 49,61
Compra EPUB
Prezzo:
€ 49,61
Compra EPUB

Formato

:
EPUB
Cloud: Scopri di più
Lingua: Inglese
Editore: Manning
Codice EAN: 9781638357698
Anno pubblicazione: 2026
Scopri QUI come leggere i tuoi eBook

Note legali

NOTE LEGALI

a) Garanzia legale, Pagamenti, Consegne, Diritto di recesso
b) Informazioni sul prezzo
Il prezzo barrato corrisponde al prezzo di vendita al pubblico al lordo di IVA e al netto delle spese di spedizione
Il prezzo barrato dei libri italiani corrisponde al prezzo di copertina.
I libri in inglese di Libraccio sono di provenienza americana o inglese.
Libraccio riceve quotidianamente i prodotti dagli USA e dalla Gran Bretagna, pagandone i costi di importazione, spedizione in Italia ecc.
Il prezzo in EURO è fissato da Libraccio e, in alcuni casi, può discostarsi leggermente dal cambio dollaro/euro o sterlina/euro del giorno. Il prezzo che pagherai sarà quello in EURO al momento della conferma dell'ordine.
In ogni caso potrai verificare la convenienza dei nostri prezzi rispetto ad altri siti italiani e, in moltissimi casi, anche rispetto all'acquisto su siti americani o inglesi.
c) Disponibilità
I termini relativi alla disponibilità dei prodotti sono indicati nelle Condizioni generali di vendita.

Disponibilità immediata
L'articolo è immediatamente disponibile presso Libraccio e saremo in grado di procedere con la spedizione entro un giorno lavorativo.
Nota: La disponibilità prevista fa riferimento a singole disponibilità.

Disponibile in giorni o settimane (ad es. "3-5-10 giorni", "4-5 settimane" )
L'articolo sarà disponibile entro le tempistiche indicate, necessarie per ricevere l'articolo dai nostri fornitori e preparare la spedizione.
Nota: La disponibilità prevista fa riferimento a singole disponibilità.

Prenotazione libri scolastici
Il servizio ti permette di prenotare libri scolastici nuovi che risultano non disponibili al momento dell'acquisto.

Attualmente non disponibile
L'articolo sarà disponibile ma non sappiamo ancora quando. Inserisci la tua mail dalla scheda prodotto attivando il servizio Libraccio “avvisami” e sarai contattato quando sarà ordinabile.

Difficile reperibilità
Abbiamo dei problemi nel reperire il prodotto. Il fornitore non ci dà informazioni sulla sua reperibilità, ma se desideri comunque effettuare l'ordine, cercheremo di averlo nei tempi indicati. Se non sarà possibile, ti avvertiremo via e-mail e l'ordine verrà cancellato.
Chiudi

Descrizione

Data Pipelines with Apache Airflow has empowered thousands of data engineers to build more successful data platforms. This new second edition has been fully revised for Airflow 3 with coverage of all the latest features of Apache Airflow, including the Taskflow API, deferrable operators, and Large Language Model integration. Filled with real-world scenarios and examples, you'll be carefully guided from Airflow novice to expert. Using real-world scenarios and examples, this book teaches you how to simplify and automate data pipelines, reduce operational overhead, and smoothly integrate all the technologies in your stack. Part reference and part tutorial, each technique is illustrated with engaging hands-on examples, from training machine learning models for generative AI to optimizing delivery routes. In Data Pipelines with Apache Airflow, Second Edition you'll learn how to: • Master the core concepts of Airflow architecture and workflow design • Schedule data pipelines using the Dataset API and time tables, including complex irregular schedules • Develop custom Airflow components for your specific needs • Implement comprehensive testing strategies for your pipelines • Apply industry best practices for building and maintaining Airflow workflows • Deploy and operate Airflow in production environments • Orchestrate workflows in container-native environments • Build and deploy Machine Learning and Generative AI models using Airflow About the Technology Apache Airflow provides a unified platform for collecting, consolidating, cleaning, and analyzing data. With its easy-to-use UI, powerful scheduling and monitoring features, plug-and-play options, and flexible Python scripting, Airflow makes it easy to implement secure, consistent pipelines for any data or AI task. About the book Data Pipelines with Apache Airflow, Second Edition teaches you how to build, monitor, and maintain effective data workflows. This new edition adds comprehensive coverage of Airflow 3 features, such as event-driven scheduling, dynamic task mapping, DAG versioning, and Airflow’s entirely new UI. The numerous examples address common use cases like data ingestion and transformation and connecting to multiple data sources, along with AI-aware techniques such as building RAG systems. What's inside • Deploying data pipelines as Airflow DAGs • Time and event-based scheduling strategies • Integrating with databases, LLMs, and AI models • Deploying Airflow using Kubernetes About the reader For data engineers, machine learning engineers, DevOps, and sysadmins with intermediate Python skills. About the author Julian de Ruiter, Ismael Cabral, Kris Geusebroek, Daniel van der Ende, and Bas Harenslak are seasoned data engineers and Airflow experts. Table of Contents Part 1 1 Meet Apache Airflow 2 Anatomy of an Airflow DAG 3 Time-based scheduling 4 Asset-aware scheduling 5 Templating tasks using the Airflow context 6 Defining dependencies between tasks Part 2 7 Triggering workflows with external input 8 Communicating with external systems 9 Extending Airflow with custom operators and sensors 10 Testing 11 Running tasks in containers Part 3 12 Best practices 13 Project: Finding the fastest way to get around NYC 14 Project: Keeping family traditions alive with Airflow and generative AI Part 4 15 Operating Airflow in production 16 Securing Airflow 17 Airflow deployment options A Running code samples B Prometheus metric mapping