Conversion d'un document Word au format XML tout en préservant les informations de police

J'ai besoin de convertir un document Word dans un format facilement analysable, j'ai donc choisi XML. J'ai trouvé un outil qui fonctionne, mais il ne me dit pas de quelle police est le texte, ce qui est ma principale méthode d'analyse. Existe-t-il un outil qui préserve ces informations ou un lien vers un tutoriel qui fournit du code?

demandé sur