deqing
/

llama-300M-v2-original

Text Generation

Generated from Trainer

text-generation-inference

Model card Files Files and versions

llama-300M-v2-original

2.6 GB

Ctrl+K

Ctrl+K

1 contributor

History: 80 commits

deqing's picture

Model save

224dbfb verified 22 days ago

final_model
Model save 22 days ago
.gitattributes

1.63 kB
Model save 22 days ago
README.md

1.46 kB
Model save 22 days ago
config.json

736 Bytes
Sync main at tokens-200M tokens 24 days ago
generation_config.json

214 Bytes
Sync main at tokens-200M tokens 24 days ago
model.safetensors

1.28 GB
xet

Model save 22 days ago
tokenizer.json

17.2 MB
xet

Sync tokenizer on main at tokens-200M tokens 24 days ago
tokenizer_config.json

301 Bytes
Sync tokenizer on main at tokens-200M tokens 24 days ago
training_args.bin
Detected Pickle imports (10)
- "transformers.trainer_pt_utils.AcceleratorConfig",
- "transformers.trainer_utils.IntervalStrategy",
- "transformers.trainer_utils.HubStrategy",
- "accelerate.state.PartialState",
- "torch.device",
- "transformers.training_args.TrainingArguments",
- "transformers.training_args.OptimizerNames",
- "transformers.trainer_utils.SchedulerType",
- "transformers.trainer_utils.SaveStrategy",
- "accelerate.utils.dataclasses.DistributedType"
How to fix it?
5.33 kB
xet

Model save 22 days ago