Подготовить модуль предобработки РПД, позволяющий извлекать из документов текстовые фрагменты, пригодные для дальнейшего анализа. На выходе должна формироваться единая база очищенных текстов в согласованном формате для последующего выделения понятий и построения датасета.
Подготовить модуль предобработки РПД, позволяющий извлекать из документов текстовые фрагменты, пригодные для дальнейшего анализа. На выходе должна формироваться единая база очищенных текстов в согласованном формате для последующего выделения понятий и построения датасета.