Alles wat u moet weten over bestandsindelingen en hun eigenschappen

Alles wat u moet weten over bestandsindelingen en hun eigenschappen / Technologie uitgelegd

De het dossier is een van de fundamentele onderdelen van de computerervaring. Maar wat is a “het dossier” hoe dan ook? Het is een pictogram op uw bureaublad, een vermelding in een lijst die uw budget opent als een spreadsheet en een naam die u aan uw nieuwste selfie kunt geven. Aan het einde van de dag, een “het dossier” is een verzameling bits (nullen en enen) gerangschikt in een patroon dat door een toepassing wordt begrepen.

Ontwikkelaars kunnen deze patronen geheim houden, waardoor gebruikers een bepaald programma kunnen behouden ondanks alternatieven. De volledige Microsoft Office-gids Bestandsconvertor De complete Microsoft Office-gids Bestandsconversie Als u ooit een tekstbestand hebt geconverteerd, zoals PDF naar Word, bent u bekend met de uitdaging. Soms is het net zo gemakkelijk als afdrukken, soms hebt u speciaal gereedschap nodig. Voer deze omzetterhandleiding in. Lees verder . Andere ontwikkelaars kunnen zelfs de acceptatie van hun indelingen aanmoedigen. In sommige gevallen kunt u het formaat gemakkelijk openen en interpreteren of is het mogelijk onmogelijk om de indeling buiten de oorspronkelijke toepassing te gebruiken. We zullen voorbeelden van al het bovenstaande in dit artikel bekijken.

Op tekst gebaseerde versus binaire bestandsindelingen

Het eerste belangrijke aspect van verschillende bestandstypen is of het binair of tekstgericht is. Laten we elk daarvan een voor een bekijken.

Tekstgebaseerde formaten

Het tekstbestand is het meest standaard bestandsformaat. Het kan worden gelezen door vrijwel elk systeem dat er is met een processor. Dit formaat is een reeks bits (enen en nullen) die voldoet aan de ASCII-standaard (we zullen Unicode voorlopig over het hoofd zien), wat betekent dat een computer elke byte (8 bits) als een karakter kan interpreteren uit de volgende:

  • A-Z (inclusief hoofdletters en kleine letters
  • 0-9
  • Ruimteteken
  • Een selectie van symbolen (bijvoorbeeld interpunctie)
  • Besturingstekens (bijv. “DEL”)

Aangezien de gegevens als tekst worden opgeslagen, kunt u de inhoud van een bestand bekijken door het in a te openen teksteditor, zelfs eenvoudige zoals Windows Notepad 2 Minimalistische tekstverwerkers waar je waarschijnlijk nog nooit van gehoord hebt [2] Minimalistische tekstverwerkers waar je waarschijnlijk nog nooit van gehoord hebt [Windows] Afgezien van het feit dat het bij voorkeur gebaseerd is op vlotte laadtijden, hoeven sommige toepassingen dat ook niet te doen veel resource-intensieve functies. Minimalistische applicaties zijn klein en schoon, en zo lang ze de klus hebben geklaard, dan ... Lees meer (of equivalenten voor Mac De beste Mac-teksteditors te gebruiken in 2018 De beste Mac-teksteditors te gebruiken in 2018 Een nieuwe teksteditor nodig voor jouw Mac? Hier zijn de beste gratis en betaalde macOS-teksteditors voor platte tekst, codering en alles daartussenin. Meer lezen, Linux Geavanceerde Linux-teksteditors vergeleken: kate vs gedit Geavanceerde Linux-teksteditors vergeleken: kate vs gedit Elke Linux-gebruiker zal u vertellen dat een goede teksteditor een vitaal onderdeel is van een computersysteem, ongeacht of u een nieuwe gebruiker of een doorgewinterde professional bent ... Lees meer, iOS Write-app: een mooie iOS-teksteditor met markdown Ondersteuning en tientallen acties Schrijf-app: een mooie iOS-teksteditor met ondersteuning voor Markdown en tientallen acties Het schrijven van apps voor de iPad en iPhone is er in overvloed. We hebben het geluk dat we leven in een tijd waarin ontwikkelaars nieuwe manieren bedenken om te bewerken tekst gebruiken unieke functies in nieuwe apps. Deze ... Lees meer, en Android 7 afleiding-vrije teksteditors voor Android vergeleken: wat is het beste? 7 afleidingsvrije teksteditors voor Android vergeleken: wat is het beste? Krijg wat echt werk gedaan op je Android-apparaat met behulp van een van deze geweldige tekst-editors. Lees verder ). Aangezien bijna alle computerplatforms worden geleverd met een eenvoudige teksteditor, kunt u wat (tekst) informatie in een van deze bestanden plaatsen en erop vertrouwen dat u er altijd toegang toe hebt. Andere applicaties hoeven verder niets te weten om de gegevens op zijn minst goed te kunnen lezen.

Het wordt echter ingewikkelder wanneer u iets als het lettertype of een automatisch ingevulde datum op de omslagpagina moet weergeven. In deze gevallen dragen ASCII-tekens bij aan een op tekst gebaseerde indeling zoals Markdown What Is Markdown? 4 redenen waarom je het nu moet leren Wat is een daling? 4 redenen waarom u het nu zou moeten leren Moe van HTML en WYSIWYG-editors? Dan is Markdown het antwoord voor jou, ongeacht wie je bent. Meer lezen of XML. Hoewel dit de voordelen van gewone tekst zoals transparantie oplevert, vereisen deze bestanden vaak meer ruimte voor elementen zoals tags. Beschouw het volgende éénzin-bestand in platte tekst en vervolgens in de Open Document-indelingen “Platte ODT” (FODT) -indeling, die XML gebruikt. De onderstaande afbeelding laat zien dat de tekstversie 53 bytes is, terwijl de ODT-versie dat wel is 25.000 bytes.

Binaire indelingen

In tegenstelling tot binaire formaten Wat is binair? [Technology Explained] What Is Binary? [Technology Explained] Aangezien binary zo absoluut fundamenteel is voor het bestaan ​​van computers, lijkt het vreemd dat we het onderwerp nooit eerder hebben aangepakt - dus vandaag had ik gedacht dat ik een kort overzicht zou geven van wat binary ... Read More are bestanden die een toepassing beetje bij beetje zal maken. U kunt proberen deze bestanden te openen met een teksteditor, maar waarschijnlijk weet u niet hoe u ze moet interpreteren. Hieronder ziet u het resultaat van een poging een Microsoft Excel-bestand te openen met een teksteditor.

De applicatie moet de gegevens in een binair bestand op een specifieke manier verwerken. Bij het openen van een XLS-bestand moet een applicatie de eerste zestien bytes van het bestand behandelen als de “begin van het bestand” (BOF) markering. Binnen die markering is het vijfde item een ​​enkele bit die aangeeft of het bestand voor het laatst is bewerkt op het Windows-platform (“fWin”). Het komt na vier andere items, elke twee bytes, wat betekent dat “fWin” item is het 65ste bit in het Excel-bestand.

Image Credit: Microsoft

Zoals we hebben gezien, als je het probeert te openen met een applicatie die het 65e bit niet als de “fWin” vlag, die applicatie zal het niet correct openen. Het kan veel verminkte karakters op het scherm vertonen (zie hierboven), het sierlijk behandelen met een foutmelding (ook hierboven getoond, omdat Linux), of crashen. In ieder geval zal het niet weten hoe de gegevens correct moeten worden gelezen en dus zal het niet correct worden weergegeven. Maar applicaties kunnen, eenmaal geprogrammeerd, zoveel bestandsformaten als gewenst verwerken.

Open versus eigen indelingen

De volgende overweging is of een bestandsindeling open is (dat wil zeggen beschikbaar is voor eenvoudig gebruik door anderen) of eigen is. Let daar op “gepatenteerd” is niet hetzelfde als gesloten, althans niet in alle gevallen. Terwijl de “tekst versus binair” debat hierboven was een technische, “open versus eigen” heeft meer te maken met de licentievoorwaarden van een bestandsformaat. Meer hierover in de volgende secties.

Open formaten

Open formaten zijn die waarbij de licentie gebruikers toestaat ze voor hun eigen toepassingen aan te nemen. Een standaardlichaam van een bepaald soort moet ook toezicht houden op hun voortdurende ontwikkeling door een gemeenschap van medewerkers om de formats echt te laten zijn “Open.” Open formaten zijn ook vrij van licentiekosten en beperkingen - ze kunnen door iedereen worden gebruikt, voor welk doel dan ook. Misschien wel de meest bekende open indeling is de Open Document Format (ODF) 9 Zeldzame Office-bestandsindelingen die u moet kennen 9 Zeldzame Office-bestandsindelingen die u moet weten Heeft u ooit vreemde bestandsindelingen tegengekomen in uw kantoorsuite? We zullen u een snelle inleiding geven over zeldzame, maar nuttige office-bestandstypen en waarvoor u ze kunt gebruiken. Read More, voor het eerst uitgebracht in 2005 door OASIS. Het doel was om een ​​alternatief te bieden voor het slot dat Microsoft op de productiviteitsmarkt had.

Met open formaten hoeft u nooit bang te zijn dat uw informatie in een bepaald bestand is vergrendeld. Beschouw het volgende, dat ons bestand met platte ODT-indeling laat zien. Hoewel er veel externe informatie omheen zit, kunt u de feitelijke gegevens daar zien, die u dag in dag uit vrijgeeft.

Een ander voordeel van open formaten is hun grondige documentatie. Het is één ding dat een bestand gemakkelijk leesbaar is. Een programmeur zal nog steeds (met vallen en opstaan) moeten uitzoeken wat zijn functie precies is. Maar in het geval van ODF geeft de versie 1.2-specificatie een programmeur alles wat hij moet weten om de ondersteuning ervan efficiënt te implementeren.

Eigen formaten

Ten slotte worden eigen indelingen beschermd door hun ontwikkelaars. Het kan zijn omdat ze handelsgeheimen bevatten, ten behoeve van (waargenomen) veiligheid, of simpelweg omdat de ontwikkelaar zijn werk niet wil delen. Wat de reden ook is, deze formaten zijn eigendom van Licentieovereenkomsten voor eindgebruikers (EULA's) of andere voorwaarden die de gebruiker verbieden om reverse engineer of anderszins te proberen “barst” het bestandsformaat.

Eens slechts “verboden,” de Digital Millennium Copyright Act Wat is de Digital Media Copyright Act? Wat is de Digital Media Copyright Act? Lees meer (DCMA) heeft dingen veranderd. Ontwikkelaars hebben nu de juridische ondersteuning om achter diegenen aan te gaan die hun werk reverse-engineeren. U moet nadenken over de toekomst voordat u investeert in een toepassing die een eigen indeling gebruikt. Moet u die informatie in de toekomst ergens anders naartoe migreren? Zo ja, hoe pijnlijk zal het zijn? Zal het bedrijf zelfs rond zijn in een jaar, of vijf? Je moet overwegen of de functies van een app het waard zijn als het ook betekent dat je vanwege eigen indelingen in die ontwikkelaar wordt geblokkeerd.

Voorbeelden van bestandsindelingen

Als je naar het bovenstaande kijkt, springen een paar combinaties eruit. Het is waar dat op tekst gebaseerde bestandsindelingen lenen zich om open te zijn. Evenzo, als het doel van een formaat eigendom is, is het gemakkelijker om het op die manier te houden door het binair te maken. Maar dit is niet altijd het geval.

Het XCF-afbeeldingsformaat van de GIMP is een open indeling die ook binair is. Het project bevat een gedetailleerde beschrijving van hoe het formaat de afbeeldingen, tekst en lagen bevat waaruit een GIMP-bestand bestaat als onbewerkte bits en bytes (hieronder weergegeven). Ontwikkelaars kunnen dit gebruiken om hun eigen implementatie te coderen, zodat externe toepassingen zoals ImageMagick afbeeldingen gemakkelijk kunnen bijsnijden en vergroten / verkleinen in Linux. Afbeeldingen eenvoudig in Crop vergroten en verkleinen als je wat basisbijsnijden en vergroten / verkleinen op Linux wilt - misschien om te helpen met een project of maak een afbeelding gemakkelijker om te uploaden naar uw favoriete sociale netwerken - probeer dan deze ... Lees meer toolkit kan ze importeren.

Omgekeerd is de nieuwste Microsoft Visio-indeling (VSDX) een op XML gebaseerd (en dus op tekst gebaseerd) formaat. Het publiceert een gedetailleerde referentie van de samenstelling van deze bestanden. In het referentiedocument wordt echter opgemerkt dat Microsoft “heeft patenten die uw implementatie kunnen dekken” van .VSDX-ondersteuning. Daarnaast stelt de Library of Congress gebruik van de VSDX-specificatie “garandeert geen royaltyvrije licentie voor alle relevante patenten” als je het gebruikt. Dit is een andere manier om te zeggen dat je de dobbelsteen kunt gooien en deze ondersteuning kunt gebruiken. Maar Microsoft kan wel of niet willen dat u later betaalt, afhankelijk van hoe dicht het concurreert met Visio.

Als je denkt dat die ingewikkeld zijn, wat dacht je van het niet-platte ODT-formaat? Het is een bestand in ZIP-indeling (binair en open, tenzij u ook de codering ervan gebruikt) die de tekst van een document bevat (content.xml, open op tekst gebaseerde indeling) en afbeeldingen (bijvoorbeeld PNG, binair maar open).

Hoe belangrijk zijn bestandsformaten, echt waar?

Dit is een moeilijke vraag. Aan de ene kant hebben sommige besturingssystemen, zoals iOS, geprobeerd om te isoleren dat gebruikers überhaupt met bestanden te maken hebben. Heb je de app die het bestand heeft gemaakt om het te openen, wie geeft om zijn structuur of wat de extensie is? Toch hebben veel organisaties (met name regeringen) aangedrongen om ervoor te zorgen dat openbare gegevens in een open formaat zijn.

Als je een software-idealist bent (niet dat daar iets mis mee is), zorg er dan bij het evalueren van nieuwe apps voor dat ze in een open (bij voorkeur) op tekst gebaseerde indeling staan. Als u gewoon aan de slag wilt gaan, is het mogelijk dat eigen indelingen geen probleem voor u zijn.

Wat denk je? Vraagt ​​u dat uw informatie zich bevindt in open, op tekst gebaseerde indelingen die u kunt converteren en verifiëren? Of zijn de formaten die de ontwikkelaars gebruiken, gepatenteerd of niet, genoeg voor jou? Laat het ons hieronder weten in de reacties!

Afbeeldingscredits: Edilus / Shutterstock