Comment convertir fichier HTML en word? [fermé]
j'ai une exigence où j'ai besoin de sauvegarder des documents HTML en mémoire comme Word .DOC files.
Quelqu'un peut-il me donner des liens vers des bibliothèques ouvertes et fermées que je peux utiliser pour faire cela?
aussi, je devrais modifier cette question pour ajouter le langage que j'utilise afin de restreindre les choix.
Merci!
5 réponses
Essayez d'utiliser pandoc
pandoc -f html -t docx -o output.docx input.html
si le format d'entrée ou de sortie n'est pas spécifié explicitement, pandoc tentera de le deviner à partir des extensions des noms de fichiers d'entrée et de sortie.
- manuel pandoc
donc vous pouvez même utiliser
pandoc -o output.docx input.html
juste au-delà de cette sur la tête de votre page php. avant tout code sur ceci devrait être le code supérieur.
<?php
header("Content-Type: application/vnd.ms-word");
header("Expires: 0");
header("Cache-Control: must-revalidate, post-check=0, pre-check=0");
header("content-disposition: attachment;filename=Hawala.doc");
?>
cela convertira tout html en MSWORD, maintenant vous pouvez le personnaliser en fonction des exigences de votre client.
Quand vous faites cela, je l'ai trouvé plus simple:
- Visiter la page dans un navigateur web
- Enregistrer la page en utilisant le navigateur web .extension htm (et peut-être un dossier avec des fichiers de support)
- Démarrer Word et ouvrez le sauvé htmfile (Word ouvrir correctement)
- faire des modifications si nécessaire
- Sélectionnez Enregistrer sous, puis choisissez l'extension que vous souhaitez doc, docx, etc.
Une bonne option est d'utiliser une API comme Docverter. Docverter vous permettra de convertir HTML en PDF ou DOCX en utilisant une API.
autres Alternatives de simplement renommer le fichier .doc.....
http://msdn.microsoft.com/en-us/library/microsoft.office.interop.word(office.11).aspx
voici un bon point de départ. Vous pouvez également essayer D'utiliser ce XML Office Open.
http://www.ecma-international.org/publications/standards/Ecma-376.htm