Metal 기반 로컬 이미지 생성, 생각보다 된다
최근 MacBook Air M5 16GB 환경에서 ComfyUI Desktop을 설치해서 몇 가지 이미지 생성 워크플로우를 테스트해봤다.
“MacBook Air M5 16GB에서도 로컬 이미지 생성 워크플로우를 실사용할 수 있을까?”
결론부터 말하면, 가능은 하다.
다만 “고성능 NVIDIA GPU처럼 마음 놓고 대형 모델을 돌리는 경험”은 아니고, FP8, GGUF, Turbo 계열, 낮은 스텝, 적절한 해상도를 잘 조합해야 꽤 쾌적해진다.
테스트 환경
- 기기 MacBook Air M5
- 메모리 16GB
- 실행 방식 ComfyUI Desktop
- 가속 Apple Silicon / Metal 기반
- 주요 모델 CoffeeMix Anima Romano FP8, ILXL GGUF, Z-Image-Turbo GGUF, waiIllustriousSDXL
MacBook Air는 팬이 없는 구조라 장시간 고부하 작업에는 한계가 있다.
그래도 Apple Silicon의 통합 메모리 구조와 Metal 기반 실행 환경 덕분에, 적절히 경량화된 모델을 쓰면 로컬 생성 자체는 충분히 가능했다.
사용한 워크플로우
📎 Workflow.zip (17.4KB)
CoffeeMix_Anima_Romano_v1_FP8

이 워크플로우는 CheckpointLoaderSimple로 모델을 한 번에 불러오는 방식이다. 즉 MODEL, CLIP, VAE가 체크포인트에서 같이 나오는 구조라 설정이 단순하다. 여기에 Power Lora Loader (rgthree)를 외부에 두고, 필요할 때 LoRA를 켜고 끄는 형태로 구성했다. 워크플로우 내부에는 Positive Prompt, Negative Prompt, Empty Latent, KSampler, VAE Decode, Upscale 노드가 들어가 있다.
주요 설정은 다음과 같다.
- 모델 CoffeeMix_Anima_Romano_v1_FP8.safetensors
- 로더 CheckpointLoaderSimple
- Sampler euler
- Scheduler simple
이 모델은 FP8 체크포인트라 MacBook Air 16GB에서 비교적 부담이 적은 편이었다.
특히 Steps 12, CFG 2 정도로 낮게 잡은 구성이 인상적이었다.
고스텝으로 밀어붙이는 방식이 아니라, Turbo 느낌으로 빠르게 결과를 확인하고 업스케일로 마무리하는 구성이다.
ILXL GGU

이 워크플로우에서는 UnetLoaderGGUF로 illustrious-q4_k_s.gguf를 불러오고, DualCLIPLoaderGGUF로 illustrious_clip_l_fp8_e4m3fn.safetensors, illustrious_clip_g_fp8_e4m3fn.safetensors를 함께 사용한다. VAE는 illustrious_vae.safetensors를 별도로 불러온다.
- 모델 illustrious-q4_k_s.gguf
- 모델 로더 UnetLoaderGGUF
- CLIP DualCLIPLoaderGGUF
- CLIP 파일 illustrious_clip_l_fp8_e4m3fn.safetensors
- illustrious_clip_g_fp8_e4m3fn.safetensors
- VAE illustrious_vae.safetensors
- Sampler euler
- Scheduler normal
여기서 중요한 포인트는 GGUF다.
GGUF는 양자화된 모델을 다룰 때 자주 보게 되는 포맷이다. ComfyUI에서도 GGUF 로더를 통해 경량화된 diffusion 모델을 불러오는 데 활용된다. MacBook Air처럼 별도 GPU VRAM이 없는 통합 메모리 환경에서는 Q4 계열 GGUF 모델이 꽤 현실적인 선택지가 된다.
illustrious-q4_k_s.gguf는 이름 그대로 Q4 계열 양자화 모델이다. 대략적으로 보면 용량과 메모리 사용량을 줄이는 대신, 원본 고정밀 모델 대비 품질이나 디테일에서 어느 정도 타협하는 방식이다. 하지만 애니메이션풍 이미지 생성에서는 체감 품질이 충분히 괜찮은 경우가 많다.
ILXL 워크플로우는 CoffeeMix보다 설정이 조금 더 무겁다. Steps도 24로 올라가고 CFG도 5.5라서 생성 시간은 더 걸린다. 대신 프롬프트 반응성과 스타일 안정성은 더 정석적인 SDXL/Illustrious 계열 느낌에 가깝다.
Z-Image-Turbo GGUF

이 워크플로우는 UnetLoaderGGUF로 z_image_turbo-Q4_K_M.gguf를 불러오고, 텍스트 인코더는 qwen_3_4b.safetensors를 CLIPLoader에서 사용한다. VAE는 ae.safetensors를 사용하며, 내부에는 ModelSamplingAuraFlow 노드가 들어가 있다.
- 모델 z_image_turbo-Q4_K_M.gguf
- 모델 로더 UnetLoaderGGUF
- 텍스트 인코더 qwen_3_4b.safetensors
- CLIP 타입 lumina2
- VAE ae.safetensors
- Sampler res_multistep
- Scheduler simple
Steps가 10이고 CFG도 1로 낮다. 일반적인 SDXL 워크플로우의 감각으로 보면 굉장히 낮은 수치인데, Turbo 계열은 애초에 낮은 스텝에서 빠르게 결과를 내는 쪽에 맞춰져 있다.
MacBook Air 16GB에서는 이런 Turbo 계열이 꽤 매력적이다. 고품질 한 장을 오래 기다리는 방식보다, 여러 장을 빠르게 뽑아보고 괜찮은 결과를 고르는 방식이 더 잘 맞는다.
다만 Z-Image-Turbo 워크플로우는 qwen_3_4b.safetensors, lumina2, ModelSamplingAuraFlow, ae.safetensors 같은 구성이 들어가기 때문에, 모델 파일 경로가 하나라도 어긋나면 처음 세팅에서 막히기 쉽다.
Text to Image

waiIllustriousSDXL_v170.safetensors 기반의 애니메이션 스타일 워크플로우도 사용했다.
이 구성은 CheckpointLoaderSimple로 모델을 불러오고, Power Lora Loader (rgthree)를 통해 외부 LoRA를 적용하는 방식이다. 이 워크플로우에서는 748cmSDXL.safetensors, Smooth_Booster_v5.safetensors, Eva_02.safetensors가 활성화되어 있으며, 각각 strength는 0.75, 0.65, 1로 설정되어 있다.
- 모델 waiIllustriousSDXL_v170.safetensors
- LoRA 748cmSDXL / Smooth_Booster_v5 / Eva_02
- CLIP Last Layer -2
- Sampler dpmpp_2m
- Scheduler karras
이 워크플로우는 앞의 Turbo 계열보다 훨씬 정석적인 애니메이션 이미지 생성 구성에 가깝다. Steps 28, CFG 5, dpmpp_2m + karras 조합은 품질을 조금 더 챙기는 쪽이다.
대신 MacBook Air에서는 그만큼 부담이 커진다. LoRA를 여러 개 켜고, 해상도를 세로 1200으로 잡고, 4x 업스케일까지 붙이면 메모리와 발열 모두 신경 써야 한다.
FP8, GGUF, Q4가 왜 중요한가
MacBook Air 16GB에서 ComfyUI를 쓸 때 가장 중요한 건 “모델을 얼마나 가볍게 가져가느냐”였다.
- FP16 일반적인 고품질 체크포인트 품질 좋지만 무거움
- FP8 8비트 부동소수점 계열 품질과 메모리 사이 타협
- GGUF 양자화 모델 포맷 Mac 로컬 구동에 유리
- Q4 4비트 양자화 계열 가볍고 빠르지만 품질 타협 있음
- Q4_K_M / Q4_K_S Q4 계열 변형 크기와 품질 사이 밸런스 차이
MacBook Air 16GB에서는 FP16 대형 모델을 무리하게 쓰는 것보다, FP8이나 Q4 GGUF 모델을 쓰는 쪽이 훨씬 현실적이다. 특히 여러 워크플로우를 오가며 테스트할 때는 모델 로딩, 메모리 압박, 앱 안정성이 중요해진다.
워크플로우 장점 단점 추천 용도
CoffeeMix FP8 세팅 단순, 빠름, 부담 적음 스타일 폭은 모델 성향에 좌우 첫 세팅, 빠른 애니풍 생성
ILXL GGUF Q4라 메모리 부담 감소, 품질 안정 구성 파일이 많음 Illustrious 계열 테스트
Z-Image-Turbo GGUF 낮은 Steps, 빠른 생성 전용 구성 요소가 낯설 수 있음 빠른 시안 뽑기
waiIllustriousSDXL 품질 지향, LoRA 활용 좋음 Air에서는 다소 무거움 완성도 높은 애니 스타일
결론
MacBook Air M5 16GB에서 ComfyUI Desktop은 “가능하냐?”고 묻는다면, 답은 가능하다다.
다만 중요한 건 기대치를 잘 잡는 것이다.
고성능 데스크톱 GPU처럼 모든 모델을 원본 품질로 빠르게 돌리는 환경은 아니다. 대신 FP8, GGUF, Q4, Turbo 계열을 잘 활용하면 MacBook Air에서도 충분히 재미있고 실용적인 로컬 이미지 생성 환경을 만들 수 있다.