Digitalisierung
Scannen
OCR (= Optical Code Recognition)
Umwandlung des gescannten Bildes in Text
Grafikbearbeitung
Kontrast, Helligkeit, ...
Komprimierung
Inhaltserschließung
Layout