PDF (adobe.com)

Nettoyage de fichiers HTML créés avec Microsoft Word

Vous pouvez ouvrir des documents enregistrés par Microsoft Word en tant que fichiers HTML, puis utiliser la commande Nettoyer HTML Word pour supprimer le code HTML superflu généré par Word. La commande Nettoyer HTML Word est utilisable pour les documents enregistrés sous forme de fichiers HTML par Word 97 ou une version ultérieure.

Le code que Dreamweaver supprime est principalement utilisé par Word pour mettre en forme et afficher les documents dans Word même, et n'est pas nécessaire dans un véritable fichier HTML. Conservez une copie de votre fichier Word original (.doc) comme sécurité, car il se peut que vous ne puissiez plus ouvrir ce document HTML dans Word après avoir appliqué la fonction Nettoyer HTML Word.

Pour nettoyer un fichier HTML ou XHTML non généré par Microsoft Word, utilisez la commande Nettoyage du HTML.

  1. Enregistrez votre document Microsoft Word au format HTML.
    Remarque : Sous Windows, fermez le fichier dans Word pour éviter une violation de partage.
  2. Ouvrez le fichier HTML dans Dreamweaver.

    Pour afficher le code HTML généré par Word, activez le mode Code (Affichage > Code).

  3. Sélectionnez Commandes > Nettoyer HTML Word.
    Remarque : Si Dreamweaver ne parvient pas à déterminer la version de Word qui a été utilisée pour enregistrer ce fichier, choisissez la version correcte dans le menu déroulant.
  4. Activez (ou désactivez) les options de nettoyage. Les préférences que vous entrez sont sauvegardées comme paramètres de nettoyage par défaut.

    Dreamweaver applique les paramètres de nettoyage au document HTML et un journal contenant une liste des modifications apportées s'affiche (sauf si cette option a été désélectionnée dans la boîte de dialogue).

    Supprimer les marqueurs spécifiques à Word
    Supprime tout le code HTML spécifique à Word, y compris le code XML des balisesHTML, les métadonnées personnalisées Word et les balises de liens figurant dans l'en-tête du document, les balises XML Word, les balises conditionnelles et leur contenu, ainsi que les paragraphes vides et les marges des styles. Vous pouvez sélectionner chacune de ces options individuellement à partir de l'onglet Détaillé.

    Nettoyer CSS
    Supprime de l'en-tête toutes les feuilles de style spécifiques à Word, y compris les styles CSS incorporés si possible (lorsque le style parent possède les mêmes propriétés), les attributs de style commençant par « mso », les déclarations de styles non CSS, les attributs de style CSS des tableaux et toutes les définitions de style non utilisées. Vous pouvez personnaliser cette option encore davantage à partir de l'onglet Détaillé.

    Nettoyer les balises <font>
    Supprime les balises HTML, en convertissant le corps du texte par défaut en HTML de taille 2.

    Corriger les imbrications de balises non valides
    Supprime les balises de définition des polices de caractères insérées par Word en dehors des balises de paragraphe et d'en-tête (au niveau du bloc).

    Appliquer le format source
    Permet d'appliquer au document les options de formatage que vous avez indiquées dans les préférences de format HTML et dans le fichier SourceFormat.txt.

    Afficher le journal à la fin
    Affiche un message d'avertissement détaillant les modifications apportées au document dès que le nettoyage est terminé.

  5. Cliquez sur OK ou sur l'onglet Détaillé pour personnaliser davantage les options Supprimer les marqueurs spécifiques à Word et Nettoyer CSS, puis cliquez sur OK.