Files
8460s-image-rd/eval/meeting-103-meta.json

53 lines
1.7 KiB
JSON
Raw Permalink Normal View History

{
"session": "meeting-103-v2.1",
"started_at": "2026-05-19T21:47:00+09:00",
"stopped_at": "2026-05-19T22:10:00+09:00",
"current_round": 5,
"total_attempts": 27,
"total_successes": 11,
"stop_reason": "Plan §자동 정지 #12 — 5R 자동 평가 정체 + 자동 미커버 시각 차원",
"rounds_summary": [
{
"round": 1,
"attempts": 5,
"successes": 4,
"key": "Pony A best pastel 42.5%, Qwen 1차 실패"
},
{
"round": 2,
"attempts": 6,
"successes": 2,
"key": "Pony→Refiner 42.1%, Pony C 한자카드 41.8%"
},
{
"round": 3,
"attempts": 6,
"successes": 0,
"key": "cast_to_device OOM 전부 실패"
},
{
"round": 4,
"attempts": 5,
"successes": 4,
"key": "640×1024 단순화 Pony 검정 0.01% ⭐"
},
{
"round": 5,
"attempts": 5,
"successes": 1,
"key": "동시 enqueue 한계, Pony B dawn 만"
}
],
"key_findings": {
"pony-v6": "단일 모델 = 가장 안정 (3R 검증 / 검정 0.01-0.68%)",
"flux-dev": "복합 워크플로우 cast_to_device OOM 빈번",
"qwen-image-2512": "5차 연속 5KB 실패 — GGUF Q4 환경 호환성 결함",
"pulid": "mean fusion R1 만 성공, concat/max/R3 PuLID 모두 실패"
},
"next_actions_pending_user_vision": [
"1순위: A 별이 R1-1 / R2-1 / R4-3 가 character-bible 8/10 ↑인지",
"2순위: R2-6 Pony C 한자 카드가 '甲子' 정확 렌더링했는지",
"3순위: R1-4 Flux Dev B 한옥이 한국식 vs 일본 통과인지"
],
"raw_html_url": "https://kakao-kakao2-server.tail31bd37.ts.net/choijaewook/8460s-image-rd/raw/branch/main/eval/meeting-103-grid.html"
}