* Tener un archivo con las trasncripciones de los clips
* Usar vocabulary_generator.ipynb para crear 3 archivos: train.csv,dev.csv,test.csv
* Los 3 archivos deben tener por columnas : wav_filename,wav_filesize,transcript
* De ejemplo usar spanish-single-speaker-speech-dataset
* De ejemplo usar _spanish-single-speaker-speech-dataset_ , descargar omitir los pasos para generar el lm.binary y el trie, solo verificar que el path este correcto con los clips de audio.