Hvorfor er PDF-filer generert av Microsoft Word så stort?
Når dokumentene dine hovedsakelig er tekst bare i naturen, ser det ut til at filstørrelsene for .docx og .pdf-versjoner skal være ganske liknende når de lagres, men det er ikke alltid tilfelle. Dagens SuperUser Q & A-post har svaret på en nysgjerrig leser spørsmål om den store forskjellen i filstørrelser.
Dagens Spørsmål & Svar-sesjon kommer til oss med høflighet av SuperUser-en underavdeling av Stack Exchange, en fellesskapsdrevet gruppering av Q & A-nettsteder.
Boksehansker klippekunst på grunn av Clker.com.
Spørsmålet
SuperUser leser Borek vil vite hvorfor PDF-filer generert av Microsoft Word er så store:
Jeg opprettet et enkelt Microsoft Word-dokument som inneholder bare denne setningen, ingenting annet:
- Dette er et lite dokument.
Da lagret jeg dokumentet som .docx og .pdf-filer. Her er filstørrelsene:
- .docx: 12 kB
- .pdf: 89 kB
Forskjellen mellom de to filene er enorm (teknisk), og det gjør meg veldig plagsomt når dokumenter som hovedsakelig er tekstmessige, er bare titalls kB i .docx-format, men er hundrevis av kB i størrelse når de konverteres til PDF-filer. Hva er så ineffektivt om PDF-formatet? Er det bare Microsoft Word som bruker en forferdelig utdataalgoritme?
Forresten er innstillingene for PDF-utdataene i Microsoft Office-installasjonen min for å opprette de minste filene:
Hvorfor er PDF-filer generert av Microsoft Word så stor?
Svaret
SuperUser bidragsyter rene har svaret for oss:
Hvis du åpner PDF-filen i Notepad ++, finner du:
Og det objektet er referert her på slutten i / FontFile2 instruksjonen:
Skriftene som brukes av et Microsoft Word-dokument, er innebygd i PDF-filer slik at de er selvstendig. Jeg brukte denne lysbildekselet fra Adobe for å dechiffrere PDF-instruksjonene.
Hvis du vil forhindre at skrifter legges inn i en PDF-fil, må du kontrollere at Microsoft Word-dokumentene bruker en av de 14 standard skriftene som er tilgjengelige i PDF-seere (Kilde: Wikipedia).
- Times New Roman> Times (v3) (i vanlig, kursiv, fet og fet kursiv)
- Courier New> Courier (i vanlig, skrå, fet og dristig skrå)
- Arial> Helvetica (v3) (i vanlig, skrå, fet og dristig skrå)
- Symbol> Symbol
- Wingdings> Zapf Dingbats
Har du noe å legge til forklaringen? Lyder av i kommentarene. Vil du lese flere svar fra andre tech-savvy Stack Exchange-brukere? Sjekk ut hele diskusjonstråden her.