g4me
/

QwenRolina3-Base-LR1e5-b64g8-order-domain-uff

Text Generation

Generated from Trainer

text-generation-inference

Model card Files Files and versions

QwenRolina3-Base-LR1e5-b64g8-order-domain-uff

6.89 GB

Ctrl+K

Ctrl+K

1 contributor

History: 9 commits

g-assismoraes's picture

Training in progress, step 4119

a600e8e verified 26 days ago

.gitattributes

1.57 kB
Training in progress, step 515 29 days ago
README.md

1.77 kB
Training in progress, step 515 29 days ago
chat_template.jinja

4.12 kB
Training in progress, step 515 29 days ago
config.json

1.42 kB
Training in progress, step 515 29 days ago
generation_config.json

148 Bytes
Training in progress, step 515 29 days ago
model.safetensors

6.88 GB
xet

Training in progress, step 4119 26 days ago
tokenizer.json

11.4 MB
xet

Training in progress, step 515 29 days ago
tokenizer_config.json

668 Bytes
Training in progress, step 515 29 days ago
training_args.bin
Detected Pickle imports (11)
- "transformers.trainer_utils.SaveStrategy",
- "transformers.training_args.OptimizerNames",
- "accelerate.state.PartialState",
- "transformers.trainer_utils.HubStrategy",
- "transformers.trainer_utils.IntervalStrategy",
- "trl.trainer.sft_config.SFTConfig",
- "transformers.trainer_utils.SchedulerType",
- "torch.bfloat16",
- "torch.device",
- "transformers.trainer_pt_utils.AcceleratorConfig",
- "accelerate.utils.dataclasses.DistributedType"
How to fix it?
5.84 kB
xet

Training in progress, step 515 29 days ago