meeting-103 R4 ✅3/❌2: 단순화 검증 — Pony 단일 모델 = 가장 안정 / Flux Dev 복합 실패
✅ 4-1 Schnell A 640×1024 (검정 13.92% 한계, 파스텔 24%)
✅ 4-2 Schnell B 한옥 640×1024 (검정 0.9%, 파스텔 36.4%)
✅ 4-3 Pony A 별이 640×1024 (검정 0.01% ⭐, 파스텔 21.5%)
✅ 4-4 Pony B 한옥 640×1024 (검정 0.01% ⭐, 파스텔 13.1%)
❌ 4-5 Flux Dev A 640×1024 (no output, cast_to_device 추정)
핵심 발견:
- Pony 단일 모델 = R1·R2·R4 모두 성공 (3라운드 검증)
- 작은 해상도(640×1024) = 검정 0.01% 더 완벽
- 768×1344 = 파스텔 더 높음 (42%) but 검정 비율도 약간 (0.61%)
- Flux Dev Q5 GGUF = 복합/단순 모두 실패 빈번
자산 갱신:
- models-performance: Pony R4 누적 (검정 0.01% 일관성)
- proven-patterns: pony single_model_stable (3 rounds confirmed)
5 라운드 누적 시점 — 사용자 시각 검수 권장 단계