Build a Text-to-Image Generator (from Scratch) (eBook)

Build a Text-to-Image Generator (from Scratch) (eBook)

Mark Liu
Mark Liu
Prezzo:
€ 49,61
Compra EPUB
Prezzo:
€ 49,61
Compra EPUB

Formato

:
EPUB
Cloud: Scopri di più
Lingua: Inglese
Editore: Manning
Codice EAN: 9781638357803
Anno pubblicazione: 2026
Scopri QUI come leggere i tuoi eBook

Note legali

NOTE LEGALI

a) Garanzia legale, Pagamenti, Consegne, Diritto di recesso
b) Informazioni sul prezzo
Il prezzo barrato corrisponde al prezzo di vendita al pubblico al lordo di IVA e al netto delle spese di spedizione
Il prezzo barrato dei libri italiani corrisponde al prezzo di copertina.
I libri in inglese di Libraccio sono di provenienza americana o inglese.
Libraccio riceve quotidianamente i prodotti dagli USA e dalla Gran Bretagna, pagandone i costi di importazione, spedizione in Italia ecc.
Il prezzo in EURO è fissato da Libraccio e, in alcuni casi, può discostarsi leggermente dal cambio dollaro/euro o sterlina/euro del giorno. Il prezzo che pagherai sarà quello in EURO al momento della conferma dell'ordine.
In ogni caso potrai verificare la convenienza dei nostri prezzi rispetto ad altri siti italiani e, in moltissimi casi, anche rispetto all'acquisto su siti americani o inglesi.
c) Disponibilità
I termini relativi alla disponibilità dei prodotti sono indicati nelle Condizioni generali di vendita.

Disponibilità immediata
L'articolo è immediatamente disponibile presso Libraccio e saremo in grado di procedere con la spedizione entro un giorno lavorativo.
Nota: La disponibilità prevista fa riferimento a singole disponibilità.

Disponibile in giorni o settimane (ad es. "3-5-10 giorni", "4-5 settimane" )
L'articolo sarà disponibile entro le tempistiche indicate, necessarie per ricevere l'articolo dai nostri fornitori e preparare la spedizione.
Nota: La disponibilità prevista fa riferimento a singole disponibilità.

Prenotazione libri scolastici
Il servizio ti permette di prenotare libri scolastici nuovi che risultano non disponibili al momento dell'acquisto.

Attualmente non disponibile
L'articolo sarà disponibile ma non sappiamo ancora quando. Inserisci la tua mail dalla scheda prodotto attivando il servizio Libraccio “avvisami” e sarai contattato quando sarà ordinabile.

Difficile reperibilità
Abbiamo dei problemi nel reperire il prodotto. Il fornitore non ci dà informazioni sulla sua reperibilità, ma se desideri comunque effettuare l'ordine, cercheremo di averlo nei tempi indicati. Se non sarà possibile, ti avvertiremo via e-mail e l'ordine verrà cancellato.
Chiudi

Descrizione

This book takes you step-by-step through creating your own AI models that can generate images from text. You’ll explore two methods of image generation—vision transformers and diffusion models—and learn vital AI development techniques as you go. Dive into the powerful models behind AI image generators. The best way to learn is to build something from scratch, and in this book you’ll build your very own diffusion model and vision transformer. As you work through each stage of development, you’ll develop an understanding of how these models can be customized, applied, and integrated for impressive multimodal AI. Build a Text-to-Image Generator (from Scratch) teaches you how to: • Build and train models to generate high resolution images based on text descriptions • Edit an existing image based on text prompts • Build and train a model to add captions to images • Build and train a vision transformer to classify images • Fine-tune LLMs for downstream tasks such as classification, text or image generation • Better differentiate real images from deepfakes About the technology AI-generated images appear everywhere from high-end advertising to casual social media feeds. Text-to-image tools like Dall-e, Midjourney, and Flux make it easy to create AI art, but how do they work? In this book, you’ll find out by building your own text-to-image generator! About the book Build a Text-to-Image Generator (from Scratch) explores both transformer-based image generation and diffusion models. You’ll work hands-on to build a pair of simple generation models that can classify images, automatically add captions, reconstruct images, and enhance existing graphics. Author Mark Liu guides you every step of the way with clear explanations, informative diagrams, and eye-opening examples you can build on your own laptop. What's inside • Build a vision transformer to classify images • Edit images using text prompts • Fine-tune image models About the reader Requires basic knowledge of generative AI models and intermediate Python skills. About the author Mark Liu is the founding director of the Master of Science in Finance program at the University of Kentucky. He is also the author of Learn Generative AI with PyTorch. Table of Contents Part 1 1 A tale of two models: Transformers and diffusions 2 Build a transformer 3 Classify images with a vision transformer 4 Add captions to images Part 2 5 Generate images with diffusion models 6 Control what images to generate in diffusion models 7 Generate high-resolution images with diffusion models Part 3 8 CLIP: A model to measure the similarity between image and text 9 Text-to-image generation with latent diffusion 10 A deep dive into Stable Diffusion Part 4 11 VQGAN: Convert images into sequences of integers 12 A minimal implementation of DALL-E Part 5 13 New developments and challenges in text-to-image generation A Installing PyTorch and enabling GPU training locally and in Colab