Formater ses documents
Tel que mentionné dans à la rubrique Limites du logiciel, la prise en charge du texte formaté est minimale. D'un côté, cette frugalité contribue à la relative simplicité du logiciel, la vitesse d'exécution des commandes ainsi qu'à l'absence de quotas d'espace (si vous n'aviez pas remarqué). D'un autre côté, elle peut rendre la consultation des documents fastidieuse.
Cette rubrique donne certains conseils sur la façon de formater ses documents.
Vos fichiers sont nettoyés
Si vous vous demandez comment vos fichiers sont nettoyés, consulter la documentation des deux outils sur lesquels se base LibreQDA:
- Bleach cyber-sécurise les fichiers que vous téléversez
- Calibre permet d'accepter plusieurs formats et de les convertir en texte brute
Notre procédure de nettoyage pourrait faire disparaître les tableaux, l'italique, les hyperliens, les polices de caractères, les marges personnalisées ou d'autres éléments de formatage pris en charge dans d'autres logiciels.
Il peut en résulter un corpus qui soit difficile à consulter et à coder.
Par exemple, cet extrait du rapport annuel 2023 d'Hydro-Québec contient des images et contient parfois deux colonnes de texte:
Une fois chargé dans LibreQDA, ce document est presque impossible à consulter parce que ses différentes colonnes se confondent. Son formatage complexe pourrait aussi ralentir votre interface.
Trucs pour augmenter la lisibilité de vos fichiers
Si vous avez la flexibilité d'éditer vos fichiers, quelques règles du pouce sont à suivre:
Tenez-vous-en aux balises de caractères **gras**
L'italique ou le soulignement de texte pourraient ne pas être détectés. Mettre en gras des passages peut vous aider à identifier, par exemple, la personne locutrice et l'horodatage.
Au besoin, utilisez des symboles spéciaux pour simuler des délimitations de sections
Par exemple =====. L'utilisation d'astérisques ( * ), de tiret bas ( _ ) ou d'autres caractères spéciaux pourrait ne pas fonctionner.
Finalement, convertissez vos PDF en d'autres formats texte s'ils s'affichent mal
Certains de vos fichiers PDF pourraient être plus lisibles si vous utilisez un outil permettant de les convertir en d'autres formats, par exemple .docx
. Les enjeux associés aux deux colonnes de texte pourraient persister quand même.
Cette capture d'écran montre le résultat de l'application de ces trucs de formatage:
À noter, plus d'éléments stylistiques pourraient être reconnus en utilisant le langage de formattage Markdown qui est partiellement supporté.