Modern Large Language Models: A First-Principles Guide to Building and Understanding Transformer-Based Language Models (eBook)

Modern Large Language Models: A First-Principles Guide to Building and Understanding Transformer-Based Language Models (eBook)

Daniel R. Holt
Daniel R. Holt
Prezzo:
€ 8,99
Compra EPUB
Prezzo:
€ 8,99
Compra EPUB

Formato

:
EPUB
Cloud: Scopri di più
Compatibilità: Tutti i dispositivi
Lingua: Inglese
Editore: Richa Publishing Minds
Codice EAN: 9798231865895
Anno pubblicazione: 2025
Scopri QUI come leggere i tuoi eBook
Abbonati a Kobo Plus per avere accesso illimitato a migliaia di eBook

Note legali

NOTE LEGALI

a) Garanzia legale, Pagamenti, Consegne, Diritto di recesso
b) Informazioni sul prezzo
Il prezzo barrato corrisponde al prezzo di vendita al pubblico al lordo di IVA e al netto delle spese di spedizione
Il prezzo barrato dei libri italiani corrisponde al prezzo di copertina.
I libri in inglese di Libraccio sono di provenienza americana o inglese.
Libraccio riceve quotidianamente i prodotti dagli USA e dalla Gran Bretagna, pagandone i costi di importazione, spedizione in Italia ecc.
Il prezzo in EURO è fissato da Libraccio e, in alcuni casi, può discostarsi leggermente dal cambio dollaro/euro o sterlina/euro del giorno. Il prezzo che pagherai sarà quello in EURO al momento della conferma dell'ordine.
In ogni caso potrai verificare la convenienza dei nostri prezzi rispetto ad altri siti italiani e, in moltissimi casi, anche rispetto all'acquisto su siti americani o inglesi.
c) Disponibilità
I termini relativi alla disponibilità dei prodotti sono indicati nelle Condizioni generali di vendita.

Disponibilità immediata
L'articolo è immediatamente disponibile presso Libraccio e saremo in grado di procedere con la spedizione entro un giorno lavorativo.
Nota: La disponibilità prevista fa riferimento a singole disponibilità.

Disponibile in giorni o settimane (ad es. "3-5-10 giorni", "4-5 settimane" )
L'articolo sarà disponibile entro le tempistiche indicate, necessarie per ricevere l'articolo dai nostri fornitori e preparare la spedizione.
Nota: La disponibilità prevista fa riferimento a singole disponibilità.

Prenotazione libri scolastici
Il servizio ti permette di prenotare libri scolastici nuovi che risultano non disponibili al momento dell'acquisto.

Attualmente non disponibile
L'articolo sarà disponibile ma non sappiamo ancora quando. Inserisci la tua mail dalla scheda prodotto attivando il servizio Libraccio “avvisami” e sarai contattato quando sarà ordinabile.

Difficile reperibilità
Abbiamo dei problemi nel reperire il prodotto. Il fornitore non ci dà informazioni sulla sua reperibilità, ma se desideri comunque effettuare l'ordine, cercheremo di averlo nei tempi indicati. Se non sarà possibile, ti avvertiremo via e-mail e l'ordine verrà cancellato.
Chiudi

Descrizione

Large language models now sit at the core of modern software systems. They power search, recommendation engines, coding assistants, conversational interfaces, and autonomous agents. Yet for many engineers and practitioners, these models remain opaque—understood through fragments of code, borrowed recipes, or surface-level explanations. This book was written to change that. Modern Large Language Models is a clear, systems-level guide to understanding how transformer-based language models actually work—starting from first principles and building upward toward complete, modern LLM systems. Rather than treating large language models as black boxes, this book explains the fundamental ideas that make them possible: probabilistic language modeling, vector representations, attention mechanisms, optimization, and architectural composition. Concepts are introduced gradually, with visual intuition and concrete reasoning before full implementations, allowing readers to develop understanding that transfers beyond any single framework or model version. The book takes you from the foundations of language modeling to the realities of training, fine-tuning, evaluation, and deployment. Along the way, it connects theory to practice, showing how design decisions shape model behavior, performance, and limitations. This is not a collection of shortcuts or prompt recipes. It is a guide for readers who want to reason about large language models as engineered systems—systems that can be analyzed, debugged, improved, and deployed with confidence. What You'll Learn • How language modeling works at a probabilistic level—and why it matters • How tokens, embeddings, and vector spaces encode meaning • How self-attention and transformer architectures operate internally • How complete GPT-style models are built from first principles • How training pipelines work, including optimization and scaling considerations • How fine-tuning, instruction tuning, and preference optimization fit together • How embeddings, retrieval, and RAG systems extend model capabilities • How modern LLM systems are evaluated, deployed, and monitored responsibly What Makes This Book Different Most books on large language models focus either on high-level descriptions or narrow implementation details. This book takes a first-principles, systems-oriented approach, emphasizing understanding over memorization and architecture over tools. The examples use PyTorch for clarity, but the ideas are framework-agnostic and designed to remain relevant as tooling and architectures evolve. Clean diagrams, structured explanations, and carefully reasoned trade-offs replace hype and jargon. Who This Book Is For This book is written for software engineers, data scientists, machine learning practitioners, researchers, and technically curious readers who want to move beyond surface familiarity with LLMs. You do not need to be an expert in machine learning to begin, but you should be comfortable with programming and willing to engage with ideas thoughtfully. Readers looking for quick tutorials or platform-specific recipes may want supplementary resources; readers seeking durable understanding will find this book invaluable. What This Book Is Not This book does not promise instant mastery, viral tricks, or platform-specific shortcuts. It does not focus on prompt engineering in isolation, nor does it attempt to catalog every model variant or benchmark. Instead, it focuses on what lasts: the principles that explain why large language models work—and how to think cle