Files
8460s-image-rd/eval/meeting-103-meta.json
choijaewook 7be1192c73 meeting-103 R5+종합: 5라운드 통합 (Plan §자동 정지 #12 발동)
R1~R5 총 시도 27 · 성공 11 (40.7%)
- R1: 4/5 Pony 42.5% pastel 
- R2: 2/6 Pony→Refiner 42.1% · Pony C 한자카드 41.8% (시각 평가 핵심)
- R3: 0/6 cast_to_device OOM (VRAM 4.6GB)
- R4: 4/5 단순화 (Pony 검정 0.01% 완벽)
- R5: 1/5 동시 enqueue 한계 (Pony B dawn)

자동 정지 사유:
- 자동 평가 5R 변동 0.01~0.68% 범위 정체 (Plan §정지 #12)
- 자동 평가 시각 차원 미커버 (별이 정합성 / 한자 / 한옥 한국식)
- Qwen 5차 연속 실패 + PuLID 복합 반복 실패

사용자 시각 검수 의무 (Plan §검수 시스템 이중 채널):
- 1순위 Vault: D:\Vault\8460s-image-rd\eval\meeting-103-grid.html
- 2순위 Gitea raw

다음 결정:
- R1-1/R2-1/R4-3 Pony A 별이 8/10 ↑ → LoRA 자동 트리거
- R2-6 Pony C 한자 4.5/5 ↑ → winner 채택 + 60갑자 운영
- R1-4 Flux B 한옥 4.5/5 ↑ → winner 채택

자산 라이브러리:
- models-performance: pony-v6 5R · flux-dev/schnell/pulid/qwen 부분
- proven-patterns: pony single-model-stable + score tags
- failed-patterns: Qwen 5차 + PuLID concat/max + R3 OOM + Schnell 검정 14%
- loras: 트리거 미충족 (시각 평가 후 결정)
2026-05-19 22:12:34 +09:00

53 lines
1.7 KiB
JSON
Raw Permalink Blame History

This file contains ambiguous Unicode characters
This file contains Unicode characters that might be confused with other characters. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.
{
"session": "meeting-103-v2.1",
"started_at": "2026-05-19T21:47:00+09:00",
"stopped_at": "2026-05-19T22:10:00+09:00",
"current_round": 5,
"total_attempts": 27,
"total_successes": 11,
"stop_reason": "Plan §자동 정지 #12 — 5R 자동 평가 정체 + 자동 미커버 시각 차원",
"rounds_summary": [
{
"round": 1,
"attempts": 5,
"successes": 4,
"key": "Pony A best pastel 42.5%, Qwen 1차 실패"
},
{
"round": 2,
"attempts": 6,
"successes": 2,
"key": "Pony→Refiner 42.1%, Pony C 한자카드 41.8%"
},
{
"round": 3,
"attempts": 6,
"successes": 0,
"key": "cast_to_device OOM 전부 실패"
},
{
"round": 4,
"attempts": 5,
"successes": 4,
"key": "640×1024 단순화 Pony 검정 0.01% ⭐"
},
{
"round": 5,
"attempts": 5,
"successes": 1,
"key": "동시 enqueue 한계, Pony B dawn 만"
}
],
"key_findings": {
"pony-v6": "단일 모델 = 가장 안정 (3R 검증 / 검정 0.01-0.68%)",
"flux-dev": "복합 워크플로우 cast_to_device OOM 빈번",
"qwen-image-2512": "5차 연속 5KB 실패 — GGUF Q4 환경 호환성 결함",
"pulid": "mean fusion R1 만 성공, concat/max/R3 PuLID 모두 실패"
},
"next_actions_pending_user_vision": [
"1순위: A 별이 R1-1 / R2-1 / R4-3 가 character-bible 8/10 ↑인지",
"2순위: R2-6 Pony C 한자 카드가 '甲子' 정확 렌더링했는지",
"3순위: R1-4 Flux Dev B 한옥이 한국식 vs 일본 통과인지"
],
"raw_html_url": "https://kakao-kakao2-server.tail31bd37.ts.net/choijaewook/8460s-image-rd/raw/branch/main/eval/meeting-103-grid.html"
}