llm-semantic-router
/

mmbert-feedback-detector

Text Classification

feedback-detection

user-satisfaction

Eval Results (legacy)

Model card Files Files and versions

HuaminChen commited on Jan 21

Commit

b0d00e1

·

verified ·

1 Parent(s): 42d2102

Add AMD MI300X GPU reference

Files changed (1) hide show

README.md +12 -3

README.md CHANGED Viewed

@@ -12,6 +12,7 @@ tags:
 - text-classification
 - modernbert
 - multilingual
 base_model: jhu-clsp/mmBERT-base
 datasets:
 - llm-semantic-router/feedback-detector-dataset
@@ -39,7 +40,7 @@ model-index:
 # mmBERT Feedback Detector
-A high-performance multilingual 4-class feedback classification model fine-tuned on [mmBERT-base](https://huggingface.co/jhu-clsp/mmBERT-base).
 ## Model Description
@@ -65,7 +66,7 @@ This model classifies user feedback into 4 categories:
 - **Dataset**: [llm-semantic-router/feedback-detector-dataset](https://huggingface.co/datasets/llm-semantic-router/feedback-detector-dataset)
 - **Size**: 51,694 examples (46,524 train / 5,170 validation)
 - **Languages**: English, Japanese, Turkish
-- **Labeling**: GPT-OSS-120B via vLLM
 - **Sources**: MultiWOZ, SGD, INSCIT, MIMICS, Hazumi, Consumer Complaints
 ## Training Configuration
@@ -78,7 +79,15 @@ This model classifies user feedback into 4 categories:
 | Learning Rate | 2e-5 |
 | Max Length | 512 |
 | Optimizer | AdamW |
-| Hardware | AMD MI300X (ROCm) |
 ## Usage

 - text-classification
 - modernbert
 - multilingual
+- amd-mi300x
 base_model: jhu-clsp/mmBERT-base
 datasets:
 - llm-semantic-router/feedback-detector-dataset
 # mmBERT Feedback Detector
+A high-performance multilingual 4-class feedback classification model fine-tuned on [mmBERT-base](https://huggingface.co/jhu-clsp/mmBERT-base) using **AMD MI300X GPU**.
 ## Model Description
 - **Dataset**: [llm-semantic-router/feedback-detector-dataset](https://huggingface.co/datasets/llm-semantic-router/feedback-detector-dataset)
 - **Size**: 51,694 examples (46,524 train / 5,170 validation)
 - **Languages**: English, Japanese, Turkish
+- **Labeling**: GPT-OSS-120B via vLLM on AMD MI300X
 - **Sources**: MultiWOZ, SGD, INSCIT, MIMICS, Hazumi, Consumer Complaints
 ## Training Configuration
 | Learning Rate | 2e-5 |
 | Max Length | 512 |
 | Optimizer | AdamW |
+### Hardware
+| Component | Specification |
+|-----------|---------------|
+| **GPU** | AMD Instinct MI300X |
+| **VRAM** | 192 GB HBM3 |
+| **Framework** | PyTorch with ROCm |
+| **Training Time** | ~2 minutes |
 ## Usage