Engineering
Fundamental
Java
Blog
검색
검색
🏠
Home
Blog
(55)
Book Review
(34)
Think
(21)
Engineering
(24)
AI
(2)
Cloud Infrastructure
(7)
Co-work
(3)
Linux
(8)
Web application
(3)
Fundamental
(72)
Algorithm
(6)
C
(6)
Data structure
(3)
Database
(9)
Design pattern
(9)
Network
(1)
OOP
(26)
Operating System
(9)
Problem solving
(2)
Java Eco
(58)
Concurrency
(0)
Java programming
(23)
JPA
(1)
Mapper
(1)
Spring Framework
(33)
TIL
(103)
미분류
(1)
목차
개발 단계 (정리본)
Stage 1. 도메인 재설계 ✅
Stage 2. 데이터 샘플링 ✅
Stage 3. LLM 에이전트 수동 분류 ✅
Stage 4. LLM 모델 벤치마크 ✅
Stage 5. 전체 데이터 분류 (예정)
Stage 6. 서비스에 녹이기 (예정)
Stage 7. 시세추론 (미래)
Stage 3/4 기술 상세 — 데이터 샘플링 & 벤치마크 코드
1. 데이터 샘플링 (Stage 2)
1.1 원본 데이터
1.2 1차 분류 — 규칙기반 rough classification (v3)
1.3 v3 분류 결과
1.4 샘플링 전략 — Stratified Random Sampling
1.5 샘플 품질 검증
2. Stage 3 — LLM 에이전트 수동 분류
2.1 방법
2.2 카테고리별 배치 처리
2.3 발견된 규칙 (분류 과정에서 확립)
2.4 rough 분류 오분류율
3. Stage 4 — LLM 자동 분류 벤치마크
3.1 프롬프트 엔지니어링 과정
3.2 최종 프롬프트 구조
3.3 벤치마크 실행 코드
3.4 응답 파싱 & 검증 로직
4. 데이터 샘플링에 대한 기술적 고찰
4.1 왜 층화 추출(Stratified Sampling)인가?
4.2 왜 rough 분류가 필요한가?
4.3 왜 Stage 3은 600건, Stage 4는 3,000건인가?
4.4 seed=42의 의미
4.5 B+W 보정
4.6 0원 매물 처리
Stage 4 — LLM 분류 모델 벤치마크 보고서
테스트 조건
테스트 모델
정확도 비교
Listing Type 분포 (Stage 3 수동 분류 대비)
태그 품질
비용/속도 비교
핵심 인사이트
추천 전략
추후 검증 필요
Engineering
>
AI
>
보호된 글: Benchmark Comparing Data-Driven Inference Performance Among LLM Models – Classification Tasks
보호된 글: Benchmark Comparing Data-Driven Inference Performance Among LLM Models – Classification Tasks
🗓️
AI
,
Engineering
이 콘텐츠는 비밀번호로 보호되어 있습니다. 이 콘텐츠를 보려면 아래에 비밀번호를 입력해주세요.
비밀번호:
🏷️