yeji-8b-rslora-v7

한국어 운세 해석 전문 언어 모델 (프로덕션 풀 정밀도 버전)

Model Description

yeji-8b-rslora-v7은 Qwen3-8B-Base를 rsLoRA로 미세조정한 한국어 운세 해석 전문 모델입니다. 사주팔자, 타로, 서양 점성술(호로스코프) 등 다양한 운세 도메인에서 고품질 한국어 해석을 제공합니다.

이 모델은 프로덕션 환경에서 최고 품질을 제공하는 풀 정밀도(FP16) 버전이며, 빠른 추론이 필요한 경우 양자화 버전인 yeji-8b-rslora-v7-AWQ를 사용하세요.

주요 특징

도메인 전문성: 33,528건의 고품질 한국어 운세 데이터로 학습
rsLoRA 아키텍처: 효율적인 파라미터 업데이트 (3.41% trainable params)
멀티 도메인 지원: 사주팔자, 타로, 호로스코프 통합 학습
vLLM 최적화: 프로덕션 배포를 위한 vLLM 완전 호환
JSON 구조화 출력: Qwen3의 강력한 JSON 생성 능력 활용

Training Details

항목	값
Base Model	Qwen/Qwen3-8B-Base
Fine-tuning Method	rsLoRA (Rank-Stabilized LoRA)
LoRA Rank (r)	64
LoRA Alpha	128
Dataset	tellang/yeji-fortune-telling-ko-v3
Dataset Size	33,528 samples
Epochs	5
Trainable Parameters	174,653,440 (3.41%)
Total Parameters	5,123,014,656
Training Time	~18 hours
GPU	NVIDIA A100 40GB
Precision	FP16
Model Size	~16GB

학습 데이터 구성

사주팔자 (Saju): 음양오행, 천간지지, 십성 기반 한국 전통 명리학
타로 (Tarot): 메이저/마이너 아르카나, 정/역방향 카드 해석
호로스코프 (Horoscope): 서양 점성술 12궁위 및 행성 영향 분석

Usage

vLLM 서버 실행 (권장)

# vLLM 서버 시작
vllm serve tellang/yeji-8b-rslora-v7 \
    --host 0.0.0.0 \
    --port 8001 \
    --dtype float16 \
    --gpu-memory-utilization 0.95 \
    --max-model-len 4096 \
    --enable-prefix-caching

# API 호출 예시 (curl)
curl http://localhost:8001/v1/completions \
    -H "Content-Type: application/json" \
    -d '{
        "model": "tellang/yeji-8b-rslora-v7",
        "prompt": "<|im_start|>system\n당신은 한국어 운세 해석 전문가입니다.<|im_end|>\n<|im_start|>user\n오늘의 연애운을 알려주세요.<|im_end|>\n<|im_start|>assistant\n",
        "max_tokens": 512,
        "temperature": 0.7,
        "top_p": 0.9
    }'

Python (transformers)

from transformers import AutoModelForCausalLM, AutoTokenizer

model_name = "tellang/yeji-8b-rslora-v7"
tokenizer = AutoTokenizer.from_pretrained(model_name)
model = AutoModelForCausalLM.from_pretrained(
    model_name,
    device_map="auto",
    torch_dtype="auto"
)

messages = [
    {"role": "system", "content": "당신은 한국어 운세 해석 전문가입니다."},
    {"role": "user", "content": "오늘의 연애운을 알려주세요."}
]

text = tokenizer.apply_chat_template(
    messages,
    tokenize=False,
    add_generation_prompt=True
)

inputs = tokenizer([text], return_tensors="pt").to(model.device)
outputs = model.generate(
    **inputs,
    max_new_tokens=512,
    temperature=0.7,
    top_p=0.9
)

print(tokenizer.decode(outputs[0], skip_special_tokens=True))

Python (OpenAI SDK with vLLM)

from openai import OpenAI

client = OpenAI(
    base_url="http://localhost:8001/v1",
    api_key="not-needed"
)

response = client.chat.completions.create(
    model="tellang/yeji-8b-rslora-v7",
    messages=[
        {"role": "system", "content": "당신은 한국어 운세 해석 전문가입니다."},
        {"role": "user", "content": "오늘의 연애운을 알려주세요."}
    ],
    temperature=0.7,
    max_tokens=512
)

print(response.choices[0].message.content)

Intended Use

이 모델은 다음 용도로 설계되었습니다:

한국어 운세 해석 서비스: 사주, 타로, 호로스코프 자동 해석
대화형 점술 챗봇: 사용자와 상호작용하는 운세 상담 시스템
운세 콘텐츠 생성: 일일/주간/월간 운세 자동 작성
도메인 지식 기반 추천: 운세 기반 조언 및 가이던스 제공

사용 사례

✅ 권장 사용:

엔터테인먼트 목적의 운세 서비스
점술 전문가의 보조 도구
운세 콘텐츠 초안 생성
한국어 운세 데이터 분석

❌ 부적절한 사용:

의료, 법률, 금융 조언 대체
중대한 인생 결정의 유일한 근거
타인에 대한 부정적 판단 도구

Limitations

언어: 한국어 전용 (다른 언어 지원 제한적)
도메인: 운세/점술 특화 (일반 대화 성능 베이스 모델 대비 하락 가능)
문화적 맥락: 한국 및 동아시아 문화권 운세 체계 중심
정확성: 운세 해석의 객관적 정확성 보장 불가 (엔터테인먼트 용도)
VRAM 요구사항: 풀 정밀도 모델로 약 16GB VRAM 필요 (양자화 버전 권장: yeji-8b-rslora-v7-AWQ)

Model Variants

모델	정밀도	크기	VRAM	용도
yeji-8b-rslora-v7	FP16	~16GB	~18GB	최고 품질 추론
yeji-8b-rslora-v7-AWQ	W4A16	~4GB	~6-8GB	빠른 프로덕션 배포

Performance

rsLoRA v7 버전은 이전 버전(v5) 대비 다음 개선사항을 제공합니다:

✅ 데이터 품질 향상: v2 → v3 데이터셋 업그레이드 (33,528건)
✅ 안정성 개선: rsLoRA rank 증가 (r=32 → r=64)
✅ JSON 구조화 출력: Qwen3 베이스의 JSON 생성 능력 활용
✅ 멀티 도메인 통합: 사주/타로/호로스코프 단일 모델 처리

Ethical Considerations

이 모델은 엔터테인먼트 목적으로 설계되었습니다
운세 해석은 과학적 근거가 없으며, 중대한 결정에 사용하지 마세요
모델 출력에 대한 비판적 사고를 권장합니다
사용자의 심리적 안녕을 최우선으로 고려하세요

License

Apache 2.0 License (베이스 모델 Qwen3-8B-Base와 동일)

Citation

@misc{yeji-8b-rslora-v7,
  author = {SSAFY YEJI Team},
  title = {yeji-8b-rslora-v7: Korean Fortune-Telling Language Model},
  year = {2025},
  publisher = {HuggingFace},
  howpublished = {\url{https://huggingface.co/tellang/yeji-8b-rslora-v7}}
}

@article{qwen3,
  title={Qwen3 Technical Report},
  author={Qwen Team},
  year={2024}
}

Acknowledgments

베이스 모델: Qwen/Qwen3-8B-Base
학습 데이터: tellang/yeji-fortune-telling-ko-v3
추론 엔진: vLLM
양자화: llm-compressor

Contact

Team: SSAFY YEJI Team
Project: YEJI Fortune-Telling Service
Issues: GitHub Issues

Downloads last month: 110

Safetensors

Model size

8B params

Tensor type

BF16

Model tree for tellang/yeji-8b-rslora-v7

Base model

Qwen/Qwen3-8B-Base

Finetuned

(338)

this model

Quantizations

1 model

tellang
/

yeji-8b-rslora-v7