为什么 PDF 文件由 Microsoft 生成 Word 这么大?

当您的文档本质上主要是纯文本时,看起来 .docx 和 .pdf 版本的文件大小在保存时应该相当相似,但情况并非总是如此。 今天的 SuperUser Q&A 帖子回答了好奇的读者关于文件大小差异很大的问题。

今天的问答环节由 SuperUser 提供——Stack Exchange 的一个分支,一个社区驱动的问答网站分组。

拳击手套剪贴画礼貌 文员网.

问题

超级用户 Borek 想知道为什么 Microsoft 会生成 PDF 文件 Word 这么大:

我创建了一个简单的 Microsoft Word 只包含这句话的文档,没有别的:

  • 这是一个小文件。

然后我将文档保存为 .docx 和 .pdf 文件。 以下是文件大小:

  • .docx:12 KB
  • .pdf:89 KB

这两个文件之间的差异是巨大的(技术上),当本质上大部分是文本的文档在 .docx 格式中只有几十 kB,但在转换为 PDF 文件时却有数百 kB 时,这真的让我感到困扰。 PDF 格式效率低下的原因是什么? 是不是只有微软 Word 使用一些可怕的输出算法?

顺便说一下,我的 Microsoft 上的 PDF 输出设置 Office 安装设置为创建尽可能小的文件:

为什么 PDF 文件是由 Microsoft 生成的 Word 这么大?

答案

超级用户贡献者 rene 为我们提供了答案:

如果在 Notepad++ 中打开 PDF 文件,您会发现:

为什么 PDF 文件由 Microsoft 生成 Word 这么大? 1

该对象在 /FontFile2 指令的末尾被引用:

为什么 PDF 文件由 Microsoft 生成 Word 这么大? 2

Microsoft 使用的字体 Word 文档被嵌入到 PDF 文件中,因此它们是独立的。 我用了 这个来自 Adob​​e 的幻灯片 破译PDF说明。

如果您想防止字体嵌入 PDF 文件中,请确保您的 Microsoft Word 文档使用 PDF 查看器中可用的 14 种标准字体之一(来源: 维基百科)。

  • Times New Roman > Times (v3)(常规、斜体、粗体和粗斜体)
  • Courier New > Courier(常规、斜线、粗体和粗斜线)
  • Arial > Helvetica (v3)(常规、斜体、粗体和粗体斜体)
  • 符号 > 符号
  • Wingdings > Zapf Dingbats

有什么要补充的解释吗? 在评测中发出声音。 想从其他精通技术的 Stack Exchange 用户那里阅读更多答案吗? 在此处查看完整的讨论主题.