Hjemmeside » hvordan » Hvorfor er PDF-filer generert av Microsoft Word så stort?

    Hvorfor er PDF-filer generert av Microsoft Word så stort?

    Når dokumentene dine hovedsakelig er tekst bare i naturen, ser det ut til at filstørrelsene for .docx og .pdf-versjoner skal være ganske liknende når de lagres, men det er ikke alltid tilfelle. Dagens SuperUser Q & A-post har svaret på en nysgjerrig leser spørsmål om den store forskjellen i filstørrelser.

    Dagens Spørsmål & Svar-sesjon kommer til oss med høflighet av SuperUser-en underavdeling av Stack Exchange, en fellesskapsdrevet gruppering av Q & A-nettsteder.

    Boksehansker klippekunst på grunn av Clker.com.

    Spørsmålet

    SuperUser leser Borek vil vite hvorfor PDF-filer generert av Microsoft Word er så store:

    Jeg opprettet et enkelt Microsoft Word-dokument som inneholder bare denne setningen, ingenting annet:

    • Dette er et lite dokument.

    Da lagret jeg dokumentet som .docx og .pdf-filer. Her er filstørrelsene:

    • .docx: 12 kB
    • .pdf: 89 kB

    Forskjellen mellom de to filene er enorm (teknisk), og det gjør meg veldig plagsomt når dokumenter som hovedsakelig er tekstmessige, er bare titalls kB i .docx-format, men er hundrevis av kB i størrelse når de konverteres til PDF-filer. Hva er så ineffektivt om PDF-formatet? Er det bare Microsoft Word som bruker en forferdelig utdataalgoritme?

    Forresten er innstillingene for PDF-utdataene i Microsoft Office-installasjonen min for å opprette de minste filene:

    Hvorfor er PDF-filer generert av Microsoft Word så stor?

    Svaret

    SuperUser bidragsyter rene har svaret for oss:

    Hvis du åpner PDF-filen i Notepad ++, finner du:

    Og det objektet er referert her på slutten i / FontFile2 instruksjonen:

    Skriftene som brukes av et Microsoft Word-dokument, er innebygd i PDF-filer slik at de er selvstendig. Jeg brukte denne lysbildekselet fra Adobe for å dechiffrere PDF-instruksjonene.

    Hvis du vil forhindre at skrifter legges inn i en PDF-fil, må du kontrollere at Microsoft Word-dokumentene bruker en av de 14 standard skriftene som er tilgjengelige i PDF-seere (Kilde: Wikipedia).

    • Times New Roman> Times (v3) (i vanlig, kursiv, fet og fet kursiv)
    • Courier New> Courier (i vanlig, skrå, fet og dristig skrå)
    • Arial> Helvetica (v3) (i vanlig, skrå, fet og dristig skrå)
    • Symbol> Symbol
    • Wingdings> Zapf Dingbats

    Har du noe å legge til forklaringen? Lyder av i kommentarene. Vil du lese flere svar fra andre tech-savvy Stack Exchange-brukere? Sjekk ut hele diskusjonstråden her.