R1~R5 총 시도 27 · 성공 11 (40.7%) - R1: 4/5 Pony 42.5% pastel ⭐ - R2: 2/6 Pony→Refiner 42.1% · Pony C 한자카드 41.8% (시각 평가 핵심) - R3: 0/6 cast_to_device OOM (VRAM 4.6GB) - R4: 4/5 단순화 (Pony 검정 0.01% 완벽) - R5: 1/5 동시 enqueue 한계 (Pony B dawn) 자동 정지 사유: - 자동 평가 5R 변동 0.01~0.68% 범위 정체 (Plan §정지 #12) - 자동 평가 시각 차원 미커버 (별이 정합성 / 한자 / 한옥 한국식) - Qwen 5차 연속 실패 + PuLID 복합 반복 실패 사용자 시각 검수 의무 (Plan §검수 시스템 이중 채널): - 1순위 Vault: D:\Vault\8460s-image-rd\eval\meeting-103-grid.html - 2순위 Gitea raw 다음 결정: - R1-1/R2-1/R4-3 Pony A 별이 8/10 ↑ → LoRA 자동 트리거 - R2-6 Pony C 한자 4.5/5 ↑ → winner 채택 + 60갑자 운영 - R1-4 Flux B 한옥 4.5/5 ↑ → winner 채택 자산 라이브러리: - models-performance: pony-v6 5R · flux-dev/schnell/pulid/qwen 부분 - proven-patterns: pony single-model-stable + score tags - failed-patterns: Qwen 5차 + PuLID concat/max + R3 OOM + Schnell 검정 14% - loras: 트리거 미충족 (시각 평가 후 결정)
53 lines
1.7 KiB
JSON
53 lines
1.7 KiB
JSON
{
|
||
"session": "meeting-103-v2.1",
|
||
"started_at": "2026-05-19T21:47:00+09:00",
|
||
"stopped_at": "2026-05-19T22:10:00+09:00",
|
||
"current_round": 5,
|
||
"total_attempts": 27,
|
||
"total_successes": 11,
|
||
"stop_reason": "Plan §자동 정지 #12 — 5R 자동 평가 정체 + 자동 미커버 시각 차원",
|
||
"rounds_summary": [
|
||
{
|
||
"round": 1,
|
||
"attempts": 5,
|
||
"successes": 4,
|
||
"key": "Pony A best pastel 42.5%, Qwen 1차 실패"
|
||
},
|
||
{
|
||
"round": 2,
|
||
"attempts": 6,
|
||
"successes": 2,
|
||
"key": "Pony→Refiner 42.1%, Pony C 한자카드 41.8%"
|
||
},
|
||
{
|
||
"round": 3,
|
||
"attempts": 6,
|
||
"successes": 0,
|
||
"key": "cast_to_device OOM 전부 실패"
|
||
},
|
||
{
|
||
"round": 4,
|
||
"attempts": 5,
|
||
"successes": 4,
|
||
"key": "640×1024 단순화 Pony 검정 0.01% ⭐"
|
||
},
|
||
{
|
||
"round": 5,
|
||
"attempts": 5,
|
||
"successes": 1,
|
||
"key": "동시 enqueue 한계, Pony B dawn 만"
|
||
}
|
||
],
|
||
"key_findings": {
|
||
"pony-v6": "단일 모델 = 가장 안정 (3R 검증 / 검정 0.01-0.68%)",
|
||
"flux-dev": "복합 워크플로우 cast_to_device OOM 빈번",
|
||
"qwen-image-2512": "5차 연속 5KB 실패 — GGUF Q4 환경 호환성 결함",
|
||
"pulid": "mean fusion R1 만 성공, concat/max/R3 PuLID 모두 실패"
|
||
},
|
||
"next_actions_pending_user_vision": [
|
||
"1순위: A 별이 R1-1 / R2-1 / R4-3 가 character-bible 8/10 ↑인지",
|
||
"2순위: R2-6 Pony C 한자 카드가 '甲子' 정확 렌더링했는지",
|
||
"3순위: R1-4 Flux Dev B 한옥이 한국식 vs 일본 통과인지"
|
||
],
|
||
"raw_html_url": "https://kakao-kakao2-server.tail31bd37.ts.net/choijaewook/8460s-image-rd/raw/branch/main/eval/meeting-103-grid.html"
|
||
} |