Home : file Formats : Definitie van documentmaling

Slijpen van documenten

Documentslijpen is het analyseproces documenten om zinvolle gegevens te extraheren. De term wordt sindsdien vaak geassocieerd met computerhacken Hackers kunnen documenten "malen" om vertrouwelijke gegevens te onthullen. Documentslijpen wordt echter ook gebruikt voor niet-schadelijke doeleinden. Voorbeelden hiervan zijn het identificeren van onbekend bestand types en bestand bekijken metadata.

Het is mogelijk om op beide documenten te slijpen platte tekst en binair bestanden.

Tekstbestanden

Tekstbestanden slijpen is een eenvoudig proces, omdat ze gegevens opslaan als platte tekst. U kunt zoeken naar tekens en strings binnen een tekstdocument met behulp van een tool zoals grep of een ander zoekprogramma. Omdat tekstverwerking een relatief snelle computerbewerking is, is het misschien mogelijk om meerdere grote documenten in minder dan een seconde te malen.

Veelvoorkomende tekstbestandstypen die zijn bedoeld voor het slijpen van documenten zijn logbestanden (.LOG, .TXT) en configuratiebestanden (.conf, .cnf). Als een hacker toegang krijgt tot een webserverhij kan bijvoorbeeld in deze bestanden zoeken gebruikersnamen, wachtwoordenen andere vertrouwelijke gegevens.

Binaire bestanden

Binaire bestanden kunnen wat platte tekst bevatten, maar ze slaan ook binaire bestanden op datum - 1s en 0s. Het is moeilijker om binaire gegevens te malen, omdat deze niet kunnen worden doorzocht met een tekstzoekprogramma. Bovendien worden veel binaire bestanden in een proprietary opgeslagen bestandsformaat, wat moeilijk is ontleden zonder het overeenkomstige toepassing. Daarom is binair documentmalen meestal gericht op de hoofd en footer van een document, dat mogelijk platte tekst bevat. Het kan ook zijn gericht op het extraheren van bestandsmetagegevens.

Veel binaire bestanden bevatten informatie over het bestandstype in de kop van de filet. In de voorbeeldafbeelding geven de letters "PNG" in de koptekst bijvoorbeeld aan dat het bestand een is PNG beeld. Deze informatie is handig voor het identificeren van het bestandstype omdat het geen bestandsextensie. Evenzo bevatten digitale foto's vaak verborgen EXIF gegevens opgeslagen toen de foto werd genomen. Een programma voor het bekijken van afbeeldingen of het malen van documenten script kan deze informatie mogelijk detecteren en extraheren.

TechLib - Het Tech Lib computerwoordenboek

Deze pagina bevat een technische definitie van Document Grinding. Het legt in computerterminologie uit wat Document Grinding betekent en een van de vele bestandsformaten in het TechLib-woordenboek is.

Alle definities op de TechLib-website zijn geschreven om technisch nauwkeurig te zijn, maar ook gemakkelijk te begrijpen. Als u deze definitie van Document Slijpen nuttig vindt, kunt u ernaar verwijzen met behulp van de citatielinks hierboven.