Eenvoudig converteren tussen documentindelingen in Linux

Eenvoudig converteren tussen documentindelingen in Linux / Linux

Een van de vaak genoemde problemen bij het overschakelen naar Linux is bestandscompatibiliteit. U verzendt altijd gebruikers van andere besturingssysteembestanden en ze zien er niet hetzelfde uit wanneer ze worden geopend in toepassingen zoals Word. Hoewel u lettertypen kunt installeren of VM's of emulators kunt proberen 4 manieren om Linux compatibel te maken met nog meer software 4 manieren om Linux compatibel te maken met nog meer software lees meer om ervoor te zorgen dat alles consistent uitkomt, is een andere manier om uw werk te doen in een gewone tekstindeling, converteer het dan nadat je klaar bent.

Een tool die u kunt gebruiken om tussen indelingen te converteren, is pandoc, een essentiële tool in de toolbox van elke Linux-gebruiker.

Basic Pandoc installatie en gebruik

Het installeren van pandoc op de meeste Linux-distributies is een kwestie van een eenvoudige trip naar de repositories. Op Ubuntu-gebaseerde systemen installeert de volgende opdracht het voor u:

sudo apt-get install pandoc

Na de installatie kunt u het opdrachtregelprogramma gebruiken om bestanden te converteren. Uitstekend in het omgaan met Markdown en andere lichtgewicht markup-talen, als je een hebt .MD bestand rondslingeren, kunt u dit naar HTML converteren met het volgende:

pandoc -o myfile.html mijnbestand.md

De -O vlag vertelt de naam van de uitvoerbestand jij wil. In dit geval leidt het ook het uitvoerformaat (HTML) af op de bestandsnaamextensie. U kunt de -r (voor lezen) en -w (voor schrijven) vlaggen om pandoc het gewenste type conversie te laten zien. Stel dat je gewend bent te schrijven in Markdown, maar iets moet posten op een op Mediawiki gebaseerde pagina:

pandoc -r markdown -w mediawiki -o markdown.wiki markdown.md 

In eerdere versies was pandoc gericht op “upgrading” bestanden, in de zin dat het eenvoudiger indelingen (zoals Markdown) naar complexere (zoals ODT of Microsoft's DOCX) kon converteren. Maar het zal nu gebeuren lezen deze meer gecompliceerde formaten ook. Dit betekent dat u gewend bent aan een tekstverwerker, maar in de verleiding komt om alle redenen om een ​​kleiner en meer draagbaar indelingstekst-formaat te gebruiken. Wat is markdown? 4 redenen waarom je het nu moet leren Wat is een daling? 4 redenen waarom u het nu zou moeten leren Moe van HTML en WYSIWYG-editors? Dan is Markdown het antwoord voor jou, ongeacht wie je bent. Meer lezen, het is een stuk eenvoudiger geworden.

Gegeven een map vol met Word-bestanden, converteert de volgende opdracht elk naar Markdown:

voor bestand in * do pandoc -r docx -w markdown -o "$ file" .md "$ file" done

Houd er rekening mee dat dit u de bestanden met de naam laat filename.docx.md, dus je moet een snelle hernoemingscommando uitvoeren (of beter nog, voeg het toe aan het bovenstaande als een shellscript 5 Beginner Linux installatie-ideeën voor Cron-banen en shell-scripts 5 Beginner Linux-installatie-ideeën voor Cron-taken en shell-scripts met bash-scripting , je kunt in een handomdraai een complexe reeks taken uitvoeren, dus het is geweldig voor uitgebreide en repetitieve behoeften.Het is ook een geweldige manier om de terminal te leren kennen..

Pandoc Command Line-opties

Nu je wat basiskennis hebt, zullen we een aantal van de meer geavanceerde opties van de opdrachtregelopties van pandoc bekijken.

ODT / DOCX referentiebestanden

Stel dat u al uw oude, omvangrijke tekstverwerkerbestanden hebt geconverteerd naar Markdown. Terwijl je geniet van de vreugde van het schrijven in platte tekst, moet je dit op een bepaald moment met iemand delen. En dat iemand misschien niet zo verlicht is als jij. Je kunt eenvoudig de lezen en schrijven vlaggen om uw bestand terug te zetten naar Word-indeling:

pandoc -r markdown -w docx -o wordfile.docx wordfile.md

Maar sommige mensen houden van hun Word-bestanden met bepaalde lettertypen, genummerde koppen, etc. Pandoc's DOCX back-end ondersteunt sjabloonbestanden, genaamd referentiebestanden, voor zo'n gelegenheid. Dit zijn ODT of DOCX bestanden die je hebt ingesteld met alle styling die je nodig hebt. Vervolgens past pandoc deze stijlen toe wanneer het wordt geconverteerd als u het doorgeeft aan het referentiebestand op de opdrachtregel:

pandoc -r markdown -w odt --reference-odt = / home / user / pad / naar / ref-file.odt -o lowriter.odt lowriter.md

Let op hoe de lettertypen die zijn geconfigureerd in het bovenstaande referentiebestand (Arial Black voor Kop 1, etc.) worden weergegeven in het geconverteerde bestand hieronder. U kunt zoveel referentie-bestanden maken als u nodig hebt (bijvoorbeeld één per client). Negeer vervolgens het formatteren helemaal terwijl u aan het schrijven bent, en pas de styling in één stap toe terwijl u converteert.

PDF-weergave Back-ends

Het maken van PDF's is ook een eenvoudige oefening, eens u enkele noodzakelijke pakketten hebt geïnstalleerd. Een lichtgewicht manier om PDF-schrijfmogelijkheden te krijgen, is het installeren van wkhtmltopdf pakket, een opdrachtregelhulpprogramma om HTML naar PDF te converteren. pandoc ondersteunt dit native, dus als je de schrijven vlag naar HTML, maar de uitvoerbestand als PDF interpreteert het dit als uw intentie om te gebruiken wkhtmltopdf helemaal alleen!

pandoc -r markdown -w html -o nicepub.pdf nicepub.md

Als alternatief kunt u kiezen voor de volledige optie met behulp van het TeTex-zetwerksysteem. Profiteer van het feit dat deze pakketten zijn Voorgestelde installaties voor het pandoc-pakket door het opnieuw installeren met de volgende opdracht:

sudo apt-get install --install-suggereert pandoc

Leun dan achterover terwijl veel (echt, veel) pakketten worden geïnstalleerd. Zodra deze zijn voltooid, kunt u uw bestand rechtstreeks converteren naar PDF door het op te geven als schrijven vlag:

pandoc -r markdown -w pdf -o nicepub-tetex.pdf nicepub.md

Terwijl de wkhtmltopdf optie vereist de installatie van slechts één pakket, u kunt wat meer printvriendelijke resultaten krijgen met TeTex. Serif-lettertypen worden namelijk standaard gebruikt en de pagina's worden automatisch genummerd.

Ebook Generator

Ten slotte kan pandoc uw bestanden converteren naar e-boeken die geschikt zijn om op een telefoon of e-reader te lezen. Hoe u uw e-boekcollectie voor de Amazon Kindle met Calibre beheert Hoe u uw e-boekcollectie voor de Amazon Kindle met Calibre Het grootste probleem met een eReader zoals de Kindle van Amazon is dat het onredelijk veel moeite kost om boeken tussen verschillende apparaten te verplaatsen. Voor Kindle werd ik verliefd op Calibre. Een beetje op de zware ... Lees meer. De epub en EPUB3- back-ends geven je een goed opgemaakt ebook:

pandoc -r markdown -w epub -o mybook.epub mybook.md 

Geavanceerde tips

De voordelen van pandoc gaan verder dan zijn kracht als een opdrachtregelprogramma ... het bevat bijvoorbeeld ondersteuning voor een verbeterde versie van Markdown en kan eenvoudig worden geïntegreerd met grafische toepassingen.

Markut-smaak van Pandoc

Naast een conversietool, ondersteunt pandoc een iets verbeterde smaak van Markdown. Door pandoc te gebruiken in plaats van de standaard markdown opdracht, hebt u enkele extra functies beschikbaar, waaronder de volgende:

  • metadata - Met de smaak van Pandoc van Markdown kunt u informatie opnemen in de kop van uw document, zoals auteur, datum, e-mailadres, enz.
  • Tekst decoraties - U kunt tekstversieringen zoals doorhalingen of super / subscript toepassen die niet worden ondersteund in standaard Markdown via pandoc.
  • tabellen - Dit alleen al maakt pandoc de moeite waard vergeleken met “vanille” Markdown. Met behulp van het pipe-teken om tabelcellen van elkaar te scheiden, kunt u een tabel maken die varieert van echt lelijk tot voor mensen leesbaar in zowel platte tekst als in gerenderde indeling..
  • Fancy Lists - Met Pandoc kunt u lijsten opmaken met een overzicht van stijlniveaus, bijvoorbeeld. “1.,” dan “EEN.,” dan “ik.,” enz. U kunt ook een startnummer voor lijsten opgeven, waar lijsten vanaf gewoon Markdown beginnen “1.”
  • Code Syntax Markering - U kunt de markering op uw codeblokken laten toepassen door pandoc te vertellen wat de taal is.

Het bovenstaande zijn slechts een greep uit de functies van Pandoc Markdown. Bezoek de handleiding op pandoc.org voor een volledige lijst van de extra's die deze smaak van Markdown biedt.

Gebruik een GUI met pandoc

Hoewel pandoc effectief is als een opdrachtregelprogramma, bevat het wel veel opties. Als je Linux nog niet kent, gebruik je misschien liever pandoc met een GUI-interface. Hoewel het standaard geen grafische interface bevat, kunt u het installeren PanDocElectrion om uw documenten om te zetten met aanwijzen en klikken. Download het installatiescript van de website van de app en voer het uit om alle benodigde pakketten en het programma zelf te installeren.

Eenmaal geïnstalleerd, de npm start commando in de PanDocElectron directory start de applicatie. Met vervolgkeuzelijsten voor indelingen en de mogelijkheid om het invoerbestand te kiezen met een dialoogvenster, zal dit u helpen wennen aan de “in en uit” van pandoc, als het ware.

Als je vertrouwd bent met de talloze opties en vlaggen van pandoc, maar gewoon een manier wilt om gemakkelijk te zijn telefoontje het, je kunt het integreren met je GUI-teksteditor. De Atom-editor bevat bijvoorbeeld een aantal pakketten die de mogelijkheid bieden om het huidige bestand met behulp van pandoc op te slaan in verschillende indelingen (pakket pandoc-convert):

Een andere optie is om pandoc-opdrachten uit te voeren met behulp van de ingebouwde functies van een editor, zoals de opdracht build. atoom build-gereedschappen pakket geeft je de mogelijkheid om aangepaste commando's te specificeren:

Dan kunt u de build-opdracht op uw pandoc-compatibele bestanden bellen, net zoals u dat zou doen met de broncode:

Pandoc neemt een deel van de stress weg van schakelen

Met pandoc in uw toolkit kunt u rustiger aan doen, wetende dat u uw documenten altijd in het gewenste formaat aan andere mensen kunt aanbieden. Tegelijkertijd kunt u profiteren van enkele van de geweldige functies van Linux (overweeg om een ​​van de terminal-gebaseerde teksteditors te gebruiken zoals vim een poging).

Zie je vaak dat je bestanden tussen indelingen heen en weer converteert? Als u compatibiliteitsproblemen tegenkomt, kunt u ons dit laten weten in de opmerkingen en we zullen zien of we pandoc kunnen gebruiken om u te helpen!

Beeldcredits: Nirat.pix via Shutterstock.com

Meer informatie over: bestandsconversie, markdown.