generate.py · ZeppelinCorp/Charm

Charm_15 / generate.py

Rename model to generate.py

eb813a3 verified about 1 year ago

5.17 kB

	import torch
	from transformers import AutoModelForCausalLM, AutoTokenizer
	import argparse
	import logging
	from typing import List, Optional

	# Configure logging
	logging.basicConfig(level=logging.INFO, format="%(asctime)s - %(levelname)s - %(message)s")
	logger = logging.getLogger(__name__)

	# Load model and tokenizer
	def load_model_and_tokenizer(model_name: str) -> tuple:
	"""
	Load the pre-trained model and tokenizer.

	Args:
	model_name (str): Name or path of the pre-trained model.

	Returns:
	tuple: (model, tokenizer)
	"""
	logger.info(f"Loading model: {model_name}...")
	try:
	tokenizer = AutoTokenizer.from_pretrained(model_name)
	model = AutoModelForCausalLM.from_pretrained(
	model_name,
	torch_dtype=torch.float16 if torch.cuda.is_available() else torch.float32,
	)
	logger.info("Model and tokenizer loaded successfully.")
	return model, tokenizer
	except Exception as e:
	logger.error(f"Error loading model: {e}")
	raise

	# Generate text
	def generate_text(
	model,
	tokenizer,
	prompt: str,
	max_length: int = 100,
	temperature: float = 1.0,
	top_k: int = 50,
	top_p: float = 0.95,
	) -> str:
	"""
	Generate text based on the given prompt.

	Args:
	model: Pre-trained language model.
	tokenizer: Tokenizer for the model.
	prompt (str): Input prompt for text generation.
	max_length (int): Maximum length of the generated text.
	temperature (float): Sampling temperature (higher = more random).
	top_k (int): Top-k sampling (0 = no sampling).
	top_p (float): Top-p (nucleus) sampling (1.0 = no sampling).

	Returns:
	str: Generated text.
	"""
	try:
	inputs = tokenizer(prompt, return_tensors="pt")
	if torch.cuda.is_available():
	inputs = {key: value.to("cuda") for key, value in inputs.items()}
	model.to("cuda")

	with torch.no_grad():
	outputs = model.generate(
	inputs.input_ids,
	max_length=max_length,
	temperature=temperature,
	top_k=top_k,
	top_p=top_p,
	do_sample=True,
	)

	generated_text = tokenizer.decode(outputs[0], skip_special_tokens=True)
	logger.info("Text generation completed successfully.")
	return generated_text
	except Exception as e:
	logger.error(f"Error generating text: {e}")
	raise

	# Save generated text to a file
	def save_to_file(text: str, filename: str) -> None:
	"""
	Save the generated text to a file.

	Args:
	text (str): Generated text.
	filename (str): Name of the output file.
	"""
	try:
	with open(filename, "w") as file:
	file.write(text)
	logger.info(f"Generated text saved to {filename}.")
	except Exception as e:
	logger.error(f"Error saving to file: {e}")
	raise

	# Main function
	def main():
	# Parse command-line arguments
	parser = argparse.ArgumentParser(
	description="Generate text using a pre-trained language model.",
	formatter_class=argparse.ArgumentDefaultsHelpFormatter,
	)
	parser.add_argument(
	"--model",
	type=str,
	default="mistralai/Mistral-8x7B",
	help="Name or path of the pre-trained model.",
	)
	parser.add_argument(
	"--prompt",
	type=str,
	required=True,
	help="Input prompt for text generation.",
	)
	parser.add_argument(
	"--max_length",
	type=int,
	default=100,
	help="Maximum length of the generated text.",
	)
	parser.add_argument(
	"--temperature",
	type=float,
	default=1.0,
	help="Sampling temperature (higher = more random).",
	)
	parser.add_argument(
	"--top_k",
	type=int,
	default=50,
	help="Top-k sampling (0 = no sampling).",
	)
	parser.add_argument(
	"--top_p",
	type=float,
	default=0.95,
	help="Top-p (nucleus) sampling (1.0 = no sampling).",
	)
	parser.add_argument(
	"--output_file",
	type=str,
	help="File to save the generated text.",
	)
	args = parser.parse_args()

	# Load model and tokenizer
	try:
	model, tokenizer = load_model_and_tokenizer(args.model)
	except Exception as e:
	logger.error(f"Failed to load model: {e}")
	return

	# Generate text
	try:
	logger.info("Generating text...")
	generated_text = generate_text(
	model,
	tokenizer,
	args.prompt,
	max_length=args.max_length,
	temperature=args.temperature,
	top_k=args.top_k,
	top_p=args.top_p,
	)

	# Print the generated text
	print("\nGenerated Text:")
	print(generated_text)

	# Save to file if specified
	if args.output_file:
	save_to_file(generated_text, args.output_file)
	except Exception as e:
	logger.error(f"Failed to generate text: {e}")

	if __name__ == "__main__":
	main()