Extrator de Texto para Embeddings

Limpe e normalize texto para uso em embeddings e RAG. Remove HTML, normaliza espaços, acentos e caracteres especiais.