ComfyUI για VFX: Εισαγωγή, Εγκατάσταση και Ροή Εργασίας

  • Έννοια ροής εργασίας στο ComfyUI: πώς να αποθηκεύσετε, να εισαγάγετε και να εξαγάγετε χωρίς να χάσετε μεταδεδομένα.
  • FLUX: Εκδόσεις Pro, Dev και Schnell, απαιτήσεις και πώς να τις εγκαταστήσετε στο ComfyUI.
  • Οδηγοί χρήσης για Txt2Img, Img2Img, LoRA, ControlNet, Inpainting, NF4, IPAdapter και Upscale.

ComfyUI

Αν εργάζεστε σε VFX και είστε περίεργοι να αναβαθμίσετε τις ροές εργασίας σας για δημιουργικές εικόνες, το ComfyUI είναι απαραίτητο. Η προσέγγισή της που βασίζεται σε κόμβους, η αρθρωτή δομή της και η ισχύς που προσθέτει το FLUX Αυτό το καθιστά ιδανικό περιβάλλον για την εξερεύνηση των πάντων, από υψηλής πιστότητας text2img έως σύνθετα pipelines με εκπαίδευση ControlNet, IP-Adapter ή LoRA. ComfyUI για VFX: Επεξήγηση εγκατάστασης και ροών εργασίας FLUX.

Σε αυτόν τον οδηγό θα βρείτε, με οργανωμένο τρόπο, όλα όσα χρειάζεστε: τι είναι μια ροή εργασίας στο ComfyUI, πώς να την αποθηκεύσετε και να την μοιραστείτε, πώς να εγκαταστήσετε το FLUX βήμα προς βήμα, τι υλικό χρειάζεστε και μια σαφή εξήγηση των πιο χρησιμοποιούμενων ροών (Txt2Img, Img2Img, Inpainting, LoRA, ControlNet, NF4, IPAdapter και latent scaling). Θα δείτε επίσης εναλλακτικές λύσεις όπως FP8, NF4 ή GGUF για τη μείωση της VRAM.Πόροι για τη χρήση του Flux στο cloud και μια εγκατάσταση ComfyUI βελτιστοποιημένη για Windows με πρακτικές συμβουλές.

Τι είναι μια ροή εργασίας στο ComfyUI;

Μια ροή εργασίας είναι η οπτική αναπαράσταση της διαδικασίας δημιουργίας που δημιουργείτε ενώνοντας κόμβους. Μπορείτε να το φανταστείτε σαν μια σανίδα από κομμάτια τύπου LegoΚάθε κόμβος εκτελεί μια λειτουργία (φόρτωση μοντέλων, κωδικοποίηση κειμένου, δειγματοληψία, αποκωδικοποίηση, κ.λπ.) και οι συνδέσεις περιγράφουν τη διαδρομή που ακολουθούν οι πληροφορίες μέχρι να ληφθεί η τελική εικόνα.

Το οικοσύστημα είναι τεράστιο: στατική εικόνα, βίντεο, ήχος, ακόμη και 3D Συνυπάρχουν χάρη στην κοινότητα ανοιχτού κώδικα. Το μειονέκτημα είναι ότι υπάρχει μια καμπύλη μάθησης, επειδή είναι σημαντικό να κατανοήσουμε τι κάνει κάθε στοιχείο και πώς να τα συνδυάσουμε αποτελεσματικά για να αποφύγουμε σημεία συμφόρησης ή ασυνεπή αποτελέσματα.

Για να ξεκινήσετε γρήγορα, είναι καλύτερο να εξετάσετε τις επίσημες και βασικές ροές (text2img και img2img) και στη συνέχεια να προχωρήσετε σε πιο σύνθετους κόμβους. Τεκμηρίωση κοινότητας και επίσημα παραδείγματα ComfyUI Ενημερώνονται συχνά, επομένως είναι εύκολο να συνεχίσετε ή να ελέγξετε τις ροές εργασίας που αλλάζουν με τις νέες εκδόσεις.

Μια σημαντική λεπτομέρεια: Το ComfyUI μπορεί να ενσωματώσει τη ροή εργασίας στην ίδια την τελική εικόνα (PNG) ως μεταδεδομένα. Αυτό σας επιτρέπει να κοινοποιήσετε μόνο την εικόνα και να ανακτήσετε ολόκληρο το γράφημα. σύροντάς το πίσω στη διεπαφή.

Πώς να μαθαίνετε και να προοδεύετε με τις ροές εργασίας

Η συμβουλή μου είναι να ξεκινήσετε με απλά παραδείγματα που έχουν δημοσιευτεί σε πόρους τύπου wiki και σε συλλογές κοινότητας. Μια λογική εξέλιξη είναι: Txt2Img, Img2Img και στη συνέχεια ControlNet ή LoRAΚαθώς κατανοείτε τις εισόδους, τις εξόδους και τον τρόπο με τον οποίο οι σχεδιαστές επηρεάζουν τη δειγματοληψία, θα γίνει φυσικό να ενσωματώνετε κόμβους οδηγούς, μάσκες και πρόσθετες συνθήκες.

Αν θέλετε να δείτε διάφορες τοπολογίες, υπάρχουν αποθετήρια δημόσιων ροών και σελίδες με αναπαραγώγιμα παραδείγματα όπου μπορείτε να κατεβάσετε εικόνες με μεταδεδομένα ή αρχεία .json. Είναι καλή πρακτική να εισάγετε, να εκτελείτε ως έχει και στη συνέχεια να επαναλαμβάνετε τις παραμέτρους να κατανοήσουν την επίδραση κάθε μπλοκ χωρίς να διασπάσουν το σύνολο.

Σε πλατφόρμες cloud θα βρείτε επίσης προρυθμισμένα περιβάλλοντα για την εκτέλεση αγωγών χωρίς να αντιμετωπίζετε τοπικές εξαρτήσεις. Το πλεονέκτημα είναι ότι προφορτώνουν βαριούς κόμβους και μοντέλαΩστόσο, συνιστάται να ελέγξετε τις διαθέσιμες εκδόσεις και τη μνήμη VRAM για να βεβαιωθείτε ότι τα αποτελέσματα ανταποκρίνονται στις προσδοκίες.

Αποθήκευση, εισαγωγή και εξαγωγή ροών εργασίας στο ComfyUI

Το ComfyUI υποστηρίζει δύο κύριες μεθόδους αποθήκευσης: εικόνα με μεταδεδομένα (PNG) ή αρχείο JSON του γραφήματος. Το πρώτο είναι το πιο βολικό για κοινή χρήση σε φόρουμ. Το δεύτερο σας δίνει σαφή έλεγχο του αρχείου, χρήσιμο για τη διαχείριση εκδόσεων.

Για εισαγωγή, απλώς σύρετε το αρχείο PNG ή Json στη διεπαφή ή χρησιμοποιήστε τη συντόμευση Ctrl (Command) + O. Για εξαγωγή, μπορείτε να αποθηκεύσετε την εικόνα που δημιουργήθηκε ή να χρησιμοποιήσετε το μενού Εξαγωγή για το JSON.Να είστε προσεκτικοί εάν συμπιέζετε ή μεταφέρετε εικόνες: ορισμένες μέθοδοι συμπίεσης και ορισμένα κανάλια καταργούν τα μεταδεδομένα, γεγονός που θα μπορούσε να σας προκαλέσει απώλεια της ενσωματωμένης ροής εργασίας.

Ροή εργασίας στο ComfyUI

Λόγω της συνεχούς εξέλιξης του ComfyUI, Δεν λειτουργούν όλα τα παλαιότερα αρχεία JSON σε νεότερες εκδόσεις.Εάν κάτι πάει στραβά, ανοίξτε τη ροή, αντικαταστήστε τους παρωχημένους κόμβους ή επανεγκαταστήστε τις εξαρτήσεις με την συμβατή τους έκδοση. Η χρήση του ComfyUI-Manager κάνει πολύ πιο γρήγορη την ανίχνευση και την επίλυση ελλειπόντων στοιχείων.

FLUX στο ComfyUI: τι είναι και γιατί έχει σημασία

Το FLUX.1 είναι μια οικογένεια μοντέλων από την Black Forest Labs που επικεντρώνεται στη μετατροπή κειμένου σε εικόνα υψηλής πιστότητας. Η υβριδική αρχιτεκτονική του με περίπου 12 δισεκατομμύρια παραμέτρους Είναι βελτιστοποιημένο για άμεση προσκόλληση, χειρισμό σύνθετων σκηνών και δημιουργία ευανάγνωστου κειμένου μέσα στην εικόνα, μια εργασία στην οποία άλλα μοντέλα συχνά αποτυγχάνουν.

Ένα άλλο πλεονέκτημα: η ευελιξία του. Από τον φωτορεαλισμό στα καλλιτεχνικά στυλΤο FLUX.1 ξεχωρίζει για την οπτική του συνέπεια και λεπτομέρεια, συμπεριλαμβανομένης της απόδοσης των χεριών, ένα κλασικό αδύναμο σημείο στα δημιουργικά γραφικά. Δεν αποτελεί έκπληξη το γεγονός ότι συγκρίνεται με λύσεις όπως το Stable Diffusion ή το Midjourney, και κατακτά την κορυφή όσον αφορά την ευκολία χρήσης και την ποιότητα.

Η Black Forest Labs ιδρύθηκε από τον Robin Rombach, μια βασική προσωπικότητα που εργάστηκε στον πυρήνα της Stability AI. Αν θέλετε να ρίξετε μια ματιά από πρώτο χέρι, η επίσημη ιστοσελίδα του βρίσκεται στη διεύθυνση blackforestlabs.ai.

Το FLUX.1 διανέμεται σε τρεις παραλλαγές: Pro, Dev και SchnellΤο Pro προσφέρει την υψηλότερη ποιότητα για επαγγελματικά περιβάλλοντα. Το Dev έχει σχεδιαστεί για μη εμπορική χρήση με εξαιρετική ισορροπία. Το Schnell εστιάζει στην ταχύτητα και την ελαφρότητα και είναι ανοιχτού κώδικα με άδεια Apache 2.0.

Απαιτήσεις υλικού ανά έκδοση FLUX

Για το FLUX.1 Pro, συνιστάται GPU τύπου NVIDIA RTX 4090 με 24 GB VRAM32 GB RAM και γρήγορος SSD. Χρησιμοποιεί FP16 για να αποφύγει την εμφάνιση εκτός συσκευασίας και είναι καλύτερο να χρησιμοποιήσετε τον κωδικοποιητή κειμένου στο FP16 για μέγιστη ποιότητα.

Στο FLUX.1 Dev, ένα RTX 3080/3090 με 16 GB VRAM Λειτουργεί καλά με 16 GB RAM και περίπου 25 GB χώρου στο δίσκο. Υποστηρίζει FP16 και ακόμη και FP8 σε ορισμένες περιπτώσεις, ανάλογα με την GPU σας.

Για το FLUX.1 Schnell, RTX 3060/4060 με 12 GB VRAM Τα 8GB μνήμης RAM και τα 15GB αποθηκευτικού χώρου είναι αρκετά. Έχει σχεδιαστεί για ταχύτητα, θυσιάζοντας μέρος του χώρου απόδοσης σε σύγκριση με τις εκδόσεις Pro/Dev.

Αν έχετε περιορισμένη μνήμη, η κοινότητα προσφέρει εναλλακτικές λύσεις όπως το FP8, το NF4 ή το GGUF που Μειώνουν σημαντικά την απαραίτητη VRAM, με διαμορφώσεις που ξεκινούν από 6 έως 12 GB ανάλογα με τη ροή.

Εγκατάσταση FLUX στο ComfyUI: βασικά βήματα

FLUX στο ComfyUI

Πρώτα απ 'όλα, βεβαιωθείτε ότι χρησιμοποιείτε την τελευταία έκδοση του ComfyUIΟι ενσωματώσεις FLUX απαιτούν κόμβους και λειτουργίες που ενημερώνονται συχνά.

Κατεβάστε τους κωδικοποιητές κειμένου και CLIP: clip_l.safetensors και ένα από τα αρχεία T5 XXL, είτε t5xxl_fp16.safetensors (αν έχετε άφθονη VRAM/RAM) είτε t5xxl_fp8_e4m3fn.safetensors (αν έχετε περιορισμένο προϋπολογισμό). Τοποθετήστε τα στον φάκελο ComfyUI/models/clip/. Αν χρησιμοποιήσατε SD3 Medium, ενδέχεται να έχετε ήδη αυτά τα αρχεία..

VAE: λήψη αε.προστατευτικά και μετακινήστε το στο ComfyUI/models/vae/. Μετονομάστε το σε flux_ae.safetensors αν θέλετε να το βρείτε πιο εύκολα. Αυτό το VAE βελτιώνει την τελική αποκωδικοποίηση και είναι το κλειδί για την ποιότητα.

UNET: επιλέξτε ανάμεσα flux1-dev.safetensors ή flux1-schnell.safetensors σύμφωνα με τη μνήμη σας και τοποθετήστε το στο ComfyUI/models/unet/. Με αυτό, έχετε τη βάση για την εκτέλεση ροών FLUX. τοπικά.

Ένας πρακτικός οδηγός για τις ροές εργασίας FLUX στο ComfyUI

Txt2Img με FLUX

Ξεκινήστε φορτώνοντας τα στοιχεία: UNETLoader, DualCLIPLoader και VAELoaderΟ κόμβος CLIPTextEncode κωδικοποιεί την προτροπή σας. Το EmptyLatentImage δημιουργεί την αρχική λανθάνουσα εικόνα. Το BasicGuider καθοδηγεί τη διαδικασία συνδυάζοντας τη λογική υπό όρους με το UNET του FLUX.

Επιλέξτε δειγματολήπτη με KSamplerSelectΠαράγει θόρυβο με το RandomNoise και ορίζει την ράμπα sigma με το BasicScheduler. Το SamplerCustomAdvanced ενοποιεί τα πάντα: θόρυβο, οδηγό, δειγματολήπτη, sigmas και latent. Τέλος, το VAEDecode μετατρέπει το λανθάνον σήμα σε εικόνα. και με το SaveImage αποθηκεύετε το αποτέλεσμα.

Img2Img με FLUX

Ο αγωγός προσθέτει μια αρχική εικόνα: Φόρτωση εικόνας + κλίμακα εικόνας Το μέγεθος προσαρμόζεται και το VAEEncode το ορίζει σε λανθάνουσα τιμή. Η προτροπή κωδικοποιείται με CLIPTextEncode και η έντασή της προσαρμόζεται με FluxGuidance. Το ModelSamplingFlux ελέγχει την αναδιάταξη και τις διαστάσειςΤα KSamplerSelect, RandomNoise και BasicScheduler χειρίζονται τη δειγματοληψία. Το SamplerCustomAdvanced συγχωνεύει την υπό συνθήκη με την είσοδο latent και το VAEDecode παράγει την έξοδο.

LoRA με FLUX

Για να βελτιώσετε το στυλ ή τα χαρακτηριστικά, προσθέστε Μόνο μοντέλο LoraLoader μαζί με τα UNETLoader, DualCLIPLoader και VAELoader. Αφού κωδικοποιήσετε το κείμενο και εφαρμόσετε το FluxGuidance, δημιουργείτε την λανθάνουσα εικόνα με το EmptyLatentImage, ορίζετε τη δειγματοληψία με το ModelSamplingFlux και εκτελείτε το SamplerCustomAdvanced. Με το VAEDecode έχετε την εικόνα που έχει ήδη επηρεαστεί από το LoRA.Τυπικό παράδειγμα: realism_lora.safetensors στο flux1-dev.

LoRA

ControlNet με FLUX

Δύο πολύ χρήσιμες περιπτώσεις για τα οπτικά εφέ: βάθος και έξυπνες άκρες. Για βάθος, προεπεξεργαστείτε με Προεπεξεργαστής MiDaS-DepthMapΦορτώστε το depth ControlNet και εφαρμόστε το με το ApplyFluxControlNet. Χρησιμοποιήστε το XlabsSampler για να δημιουργήσετε την υπό όρους λανθάνουσα κυματομορφή και, στη συνέχεια, Το VAEDecode παράγει την εικόνα.

Για το Canny, χρησιμοποιήστε Προεπεξεργαστής CannyEdge, φορτώστε το Canny ControlNet και επαναλάβετε το σχήμα: ApplyFluxControlNet → XlabsSampler → VAEDecode. Αυτός ο πρόσθετος έλεγχος παρέχει ακρίβεια στο σχήμα και τη σύνθεση..

Ενσωματωμένη βαφή με FLUX

Φορτώστε τα UNET, VAE και CLIP και προετοιμάστε θετικές και αρνητικές προτροπές. Η εντολή LoadAndResizeImage εμφανίζει την εικόνα και τη μάσκαΗ μετάβαση εξομαλύνεται με το ImpactGaussianBlurMask. Το InpaintModelConditioning συνδυάζει την επεξεργασία, την εικόνα και τη μάσκα. Μετά τη διαμόρφωση του δειγματολήπτη, του θορύβου και των σίγμα, το SamplerCustomAdvanced ανακατασκευάζει την περιοχή με μάσκα. Το VAEDecode ενσωματώνει την ενημέρωση κώδικα με συνέπεια με τους υπόλοιπους.

ΡΟΗ NF4

Με την κβαντοποίηση NF4, η μνήμη μειώνεται. Φόρτωση στοιχείων με CheckpointLoaderNF4 και ορίζει ύψος/πλάτος με πρωτόγονους κόμβους. Το ModelSamplingFlux ορίζει παραμέτρους. Το EmptySD3LatentImage δημιουργεί την λανθάνουσα εικόνα. Το BasicScheduler και το RandomNoise οργανώνουν την αποθόρυβη λειτουργία. Το SamplerCustomAdvanced παράγει το λανθάνον σήμα και το VAEDecode το μεταφράζει σε μια εικόνα.Για την κλιμάκωση, το UltimateSDUpscale, μαζί με το UpscaleModelLoader και μια επιπλέον θετική προτροπή, κάνουν τη διαφορά.

Προσαρμογέας IP με FLUX

Όταν θέλετε να κάνετε συνθήκη χρησιμοποιώντας μια εικόνα αναφοράς, χρησιμοποιήστε LoadFluxIPAdapter και ApplyFluxIPAdapter μαζί με το clip_vision_l.safetensors. Κλιμακώστε την εικόνα αναφοράς με το ImageScale, προετοιμάστε προτροπές και εκτελέστε το XlabsSampler. Με το VAEDecode θα δείτε την έξοδο να επηρεάζεται από την αισθητική ή τα χαρακτηριστικά από την εικόνα οδηγού.

Εκπαιδευτής LoRA για FLUX

Για την εκπαίδευση ενός LoRA απευθείας στο ComfyUI, η ροή εργασίας περιλαμβάνει: FluxTrainModelSelect, OptimizerConfig και TrainDatasetGeneralConfigΤο InitFluxLoRATraining αρχικοποιεί, το FluxTrainLoop εκτελεί βήματα και το FluxTrainValidate δημιουργεί περιοδικές επικυρώσεις.

ComfyUI για VFX: Εισαγωγή, Εγκατάσταση και Ροή Εργασίας

Με το VisualizeLoss παρακολουθείτε την απώλεια. ImageBatchMulti και ImageConcatFromBatch Ομαδοποιούν τις επικυρώσεις. Το FluxTrainSave αποθηκεύει τα σημεία ελέγχου και το FluxTrainEnd κλείνει τη διαδικασία. Αν θέλετε, ανεβάστε το αποτέλεσμα στο Hugging Face με το UploadToHuggingFace και κοινοποιήστε το.

Flux Latent Upscaler

Για λεπτομερή κλιμάκωση, ορίστε το μέγεθος με SDXLEmptyLatentSizePicker+ και αλυσίδες LatentUpscale και LatentCrop. Με μάσκες που δημιουργούνται από τα SolidMask και FeatherMask, το LatentCompositeMasked συνδυάζει το κλιμακωτό λανθάνον με το πρωτότυπο. Το InjectLatentNoise+ βελτιώνει τη λεπτομέρεια πριν από το VAEDecodeΚαι μια διόρθωση με το ImageSmartSharpen+ ολοκληρώνει τη διαδικασία. Κόμβοι υπολογισμού όπως το SimpleMath+ βοηθούν στην ευθυγράμμιση των αναλογιών.

Εναλλακτικές εκδόσεις: FP8, NF4 και GGUF για μείωση της VRAM

Αν έχετε περιορισμένους πόρους, έχετε επιλογές. Τα σημεία ελέγχου του FP8 από το Comfy.org και συγγραφείς όπως ο Kijai. σας επιτρέπει να χρησιμοποιείτε το FLUX με ένα μόνο αρχείο στο ComfyUI/models/checkpoints/. Συνιστάται η μετονομασία ή ο διαχωρισμός σε φακέλους για να διακρίνετε μεταξύ των παραλλαγών dev και schnell.

Με NF4 (bitsandbytes), εγκαταστήστε το πρόσθετο ComfyUI_bitsandbytes_NF4 και χρησιμοποιήστε flux1-dev-bnb-nf4-v2 σε μοντέλα/σημεία ελέγχου. Αυτή η έκδοση βελτιώνει τις λεπτομέρειες σε σύγκριση με την πρώτη επανάληψη.

Η κβάντωση GGUF του City96, μαζί με το πρόσθετο ComfyUI-GGUFχαμηλώνει τον πήχη ακόμη περισσότερο: Κατεβάστε το μοντέλο FLUX GGUF, τον κωδικοποιητή t5-v1_1-xxl-encoder-ggufΤα αρχεία `clip_l.safetensors` και `ae.safetensors` θα πρέπει να τοποθετούνται στους αντίστοιχους φακέλους τους. Υπάρχουν βολικές περιπτώσεις χρήσης με 6 GB VRAM.

Χρήση του FLUX.1 στο cloud και σε άλλους πόρους

Αν προτιμάτε να μην εγκαταστήσετε τίποτα, μπορείτε να δοκιμάσετε το FLUX στο Αγκαλιασμένοι χώροι προσώπου: FLUX.1-dev y FLUX.1-schnell. Επίσης στο Αντιγραφή, Mystic.ai o φαλ.αι. Αυτές είναι χρήσιμες επιλογές για την επικύρωση προτροπών και διαμορφώσεων πριν από τη λήψη τοπικών μοντέλων.

Για έμπνευση και έτοιμες ροές εργασίας, δείτε επίσημα παραδείγματα του ComfyUI και συλλογές ροών εργασίας όπως OpenArt. Να θυμάστε ότι πολλές εικόνες περιέχουν μεταδεδομέναώστε να μπορείτε να τα σύρετε στο ComfyUI για να ανακτήσετε το γράφημα.

Αναβαθμισμένο pixel

Περισσότερο υλικό: συλλογές από LoRA για FLUX ως ΡεαλισμόςLora ή συλλογές σε XLabs-AIControlNet για FLUX ως συλλογές y Ένωση; IP-Adapter en XLabs-AIΓια να εκπαιδεύσετε το LoRA με χαμηλή VRAM, δοκιμάστε το. fluxgym ή ο εκπαιδευτής αντιγράφων από την Ostris; Υπάρχει ένας οδηγός DreamBooth για την ανάπτυξη του FLUX.1 στο αποθετήριο των διαχυτών.

Εγκαταστήστε το ComfyUI στα Windows 11 με σταθερή απόδοση

Αν θέλετε μια καθαρή εγκατάσταση, αυτός είναι ένας αποδεδειγμένος τρόπος. Λειτουργεί άψογα με κάρτες γραφικών NVIDIA σειράς 40/50. και σας βοηθά να αποφύγετε τα συνηθισμένα λάθη.

1) Εγκαταστήστε την εφαρμογή NVIDIA και το πρόγραμμα οδήγησης Studio από nvidia.com. Επανεκκίνηση. 2) Κιτ εργαλείων CUDA από developer.nvidia.com (προαιρετικό αλλά χρήσιμο για την αποφυγή ειδοποιήσεων με το Triton εάν δεν χρησιμοποιείτε venv). 3) ffmpeg Από το αποθετήριο BtbN, προσθέστε το C:\ffmpeg\bin στη διαδρομή. 4) Git για Windows από git-scm.com5) Python 3.12 x64 από python.org, με εκκινητή py για όλους τους χρήστες και προσθήκη σε μεταβλητές περιβάλλοντος.

5.5) Αν επιλέξετε venv, δημιουργήστε το με python -m venv CUVenv και ενεργοποιήστε το με την εντολή CUVenv\Scripts\activate.bat. Από εκεί, εκτελέστε οποιεσδήποτε σχετικές εντολές pip ή git μέσα στο venv. Το σενάριο εκκίνησης μπορεί να ενεργοποιήσει το περιβάλλον και να εκτελέσει το ComfyUI με μία κίνηση.

6) Κλωνοποίηση ComfyUI με κλώνος git https://github.com/comfyanonymous/ComfyUI.git D:\CU7) Μεταβείτε στο D:\CU και εκτελέστε την εντολή pip install -r requirements.txt. 8) Εάν το pip προειδοποιήσει για scripts εκτός της διαδρομής, προσθέστε τη διαδρομή Python Scripts στις μεταβλητές συστήματος και επανεκκινήστε. 9) Εγκαταστήστε το PyTorch CUDA 12.8 Εγκαταστήστε το torch χρησιμοποιώντας την εντολή `pip install torchvision torchaudio --index-url https://download.pytorch.org/whl/cu128`. Εάν κάτι δεν πάει καλά, απεγκαταστήστε το torch και εγκαταστήστε το ξανά χρησιμοποιώντας την ίδια εντολή.

9 bis) Εκκινήστε το ComfyUI με python main.py και ανοίξτε το 127.0.0.1:8188. 10) Εγκαταστήστε το Triton για Windows με το pip install -U triton-windows. 11) Επιταχύνετε την προσοχή με το Sage Attention 2.2: Κατεβάστε τον συμβατό τροχό CU128/Torch2.8 για CP312, εγκαταστήστε το με το pip και ξεκινήστε το ComfyUI με τη σημαία –use-sage-attention.

12) Εγκαταστήστε το ComfyUI-Manager: στην εκτέλεση του ComfyUI/custom_nodes κλώνος git https://github.com/ltdrdata/ComfyUI-Manager comfyui-manager13) Δημιουργήστε ένα αρχείο εκκίνησης .bat με τις γραμμές: cd D:\CU και python main.py –use-sage-attention. Κατά την εκκίνηση, το Manager θα χρειαστεί λίγο χρόνο την πρώτη φορά.; ελέγξτε ότι εμφανίζεται η καρτέλα Διαχειριστής στη διεπαφή.

14) Τοποθετήστε τα πρότυπα στους σωστούς φακέλους (σημεία ελέγχου, clip, unet, vae) και ανοίξτε τις ροές σας. Εάν μια ροή εργασίας φέρνει τον δικό της κόμβο Sage, μπορείτε να την παραλείψετε εάν ξεκινάτε ήδη με τη σημαίαΣυμβουλές: Αποφύγετε να έχετε ανοιχτά προγράμματα που απαιτούν πολλούς πόρους, ρυθμίστε τις παραμέτρους της εικονικής μνήμης των Windows εάν η μνήμη είναι χαμηλή και ελέγξτε τις συζητήσεις για την απόδοση στο αποθετήριο ComfyUI. Εάν λαμβάνετε προειδοποιήσεις μνήμης, σκεφτείτε να χρησιμοποιήσετε την παραλλαγή FP8 ενός αρχείου.

Σταθερή διάχυση βίντεο

Αν προτιμάτε ένα εγχειρίδιο που μπορείτε να κατεβάσετε, υπάρχει ένα χρήσιμο PDF στη διεύθυνση αυτή η σύνδεση. Ορισμένοι οδηγοί έχουν αναθεωρηθεί για να απλοποιήσουν την εγκατάσταση και να προτείνουν venvΌταν χρησιμοποιείτε το venv, θυμηθείτε να εκτελείτε πάντα τις λειτουργίες pip και git εντός του περιβάλλοντος.

Συμβουλές χρήσης, συμβατότητα και βέλτιστες πρακτικές

Εισαγάγετε ροές σύροντας PNG με μεταδεδομένα ή JSON και ελέγξτε τις εκδόσεις κόμβων με το Manager. Όταν κοινοποιείτε εικόνες, αποφύγετε τη συμπίεση που διαγράφει τα μεταδεδομένα.Εάν ένα JSON παρουσιάσει σφάλμα σε μια νέα έκδοση, αντικαταστήστε τους παρωχημένους κόμβους ή εγκαταστήστε συμβατές εκδόσεις.

Για να λειτουργήσει με πολλαπλά FLUX LoRA, υπάρχουν αναφορές για υψηλή κατανάλωση ενέργειας σε πρόσφατες εκδόσεις ComfyUI. Δοκιμή GGUF ή συγκεκριμένων φορτωτών Για την ελαχιστοποίηση της VRAM. Στο ControlNet, ξεκινήστε με depth ή Canny για να δημιουργήσετε ένα σταθερό σύστημα σύνθεσης.

Κατά την ανάπτυξη στο cloud, ελέγξτε την VRAM και τις ουρές εκτέλεσης. Σε τοπικό επίπεδο, ένας γρήγορος SSD και τα ενημερωμένα προγράμματα οδήγησης κάνουν όλη τη διαφορά.Καταγράψτε τον αγωγό σας ανά ενότητες: φόρτωση μοντέλου, προετοιμασία, δειγματοληψία, αποκωδικοποίηση και μετεπεξεργασία. Αυτό θα διευκολύνει την αποσφαλμάτωση σε περίπτωση που κάτι παρουσιάσει σφάλμα.

Με όλα τα παραπάνω, μπορείτε τώρα να δημιουργήσετε έναν πραγματικά ισχυρό αγωγό οπτικών εφέ με το ComfyUI: Καταλαβαίνετε τι είναι μια ροή εργασίας και πώς να την αποθηκεύσετε χωρίς να χάσετε μεταδεδομένα;Μπορείτε να εγκαταστήσετε το FLUX και τις παραλλαγές του (επιλογές Dev, Schnell και FP8, NF4, GGUF), ξέρετε πώς να εκτελείτε τις βασικές ροές εργασίας της καθημερινής πρακτικής (Txt2Img, Img2Img, Inpainting, ControlNet, LoRA, IPAdapter και Upscale) και έχετε μια βελτιστοποιημένη εγκατάσταση των Windows με Triton, Sage Attention και ComfyUI-Manager για να διατηρείτε το σύστημα άψογο, σταθερό και γρήγορο.