PDF的故事

2020-11-01 10:22:22

这篇文章的一个版本最初出现在Destdium上,这是一份每周两次的时事通讯,旨在寻找长尾的尽头。

便携式文档格式(PDF)无处不在。但它仍然是一种让普通人头疼的格式。

以特朗普前竞选经理保罗·马纳福特(Paul Manafort)为例,他可能不是普通人,但他和我们中最优秀的人一样,遇到了PDF的问题。

司法部特别顾问罗伯特·穆勒(Robert Mueller)最近对马纳福特的起诉书指出,这位游说者和他的同事理查德·盖茨(Richard Gates)是如何合作修改PDF文档的,方法是将文档转换为Word格式,更改文档中的金额,然后将其改回PDF。

当然,PDF并不经常受到如此程度的关注。PDF的原创故事比MP3和ZIP文件要无聊得多,MP3是根据苏珊娜·维加(Suzanne Vega)在“汤姆的餐厅”(Tom‘s Diner)中无伴奏的声音轮廓建立的,ZIP文件在一场残酷的法律战中变得生动起来,这场官司是由BBS用户的突发奇想煽动起来的。

但PDF仍然有一个故事,这个故事是一种有望在未来几十年变得更有价值的格式。这就是为什么。

各行各业迫切需要的是通过各种机器配置、操作系统和通信网络进行文档通信的通用方式。这些文档应该可以在任何显示器上查看,并且应该可以在任何现代打印机上打印。如果这个问题能够解决,那么人们的根本工作方式就会改变。“。

-Adobe的联合创始人约翰·E·沃诺克(John E.Warnock)在一篇揭示卡梅洛特项目(Camelot Project)存在的文章中,讨论了他围绕需要一种简单的文档格式的思考过程(当然,这是PDF格式)。沃诺克还负责帮助开发Adobe的基础PostScript文档脚本语言,他指出PostScript及其姊妹语言Display PostScript对于他在1990年左右写文章时正在制造的大多数计算机来说太重了。他解释说:“Display PostScript和PostScript解决方案是正确的长期解决方案,因为机器的功率会随着时间的推移而增加,但这种解决方案对当今机器的绝大多数用户没有什么帮助。”

为什么PDF的“杀手级应用”可能是税务表格。

大约在沃诺克和他在Adobe的同事们试图解决创建一种简单的文件格式以在普通人的计算机上阅读文档的难题时,美国国税局(Internal Revenue Service)正在处理与美国邮政服务(US Postal Service)合作时每年都面临的令人头疼的问题。

基本上,每年就在纳税季节之前,美国国税局会向全美数亿人邮寄纳税表格。根据1991年纽约时报的一篇文章,在非人口普查的年份,这一年度邮寄是邮政服务必须处理的最大的年度邮寄-每年约有1.1亿封个人邮件。而美国国税局,处理复杂的税法,不得不管理和处理各种各样的例外情况和不同的形式,无论是企业还是个人纳税人。

这不仅是令人难以置信的浪费--当你是美国国税局(Internal Revenue Service)的时候,这从来都不是一件好事--而且它代表着某种程度上的后勤噩梦,因为它还暗示了整个联邦政府的工作都是纸上谈兵。

在这种情况下,PDF将具有巨大的价值。当然,当时市场上已经存在软件解决方案-其中包括PC上的TurboTax和Mac上的MacInTax-但普通美国用户不一定会信任他们的计算机来纳税。但他们打印表格可能会很酷。

幸运的是,Adobe已经准备好了。1992年底,该公司在COMDEX贸易展上首次展示了其PDF技术,并命名为Acrobat。当时的行业媒体对Acrobat非常兴奋,因为它代表了将文档显示在打印页面上的能力-如果它甚至需要打印的话。那一年,它甚至被评为“最佳节目”。

但沃诺克承认,早些时候,他解决攻击性纸张问题的方法并没有立即流行起来。

“当Acrobat宣布时,全世界都没有领会。沃诺克在2010年接受Knowledge@Wharton采访时说:“他们不知道以电子方式发送文件会有多重要。”

但事实是,Adobe已经以美国国税局(IRS)的形式提供了完美的用例,更不用说美国其他公司了。

Adobe有一个潜在的解决方案,可以减少世界各地办公室生产的堆积如山的纸张。由于Adobe在PostScript中已经有了事实上的市场标准,所以它也有内部通道。你可以看到这是怎么回事。

根据NetworkWorld的说法,美国国税局在1994年初就已经开始分发PDF格式的税单,此举帮助建立了这种格式背后的广泛势头。

但有一个元素缺失了,那就是网络,这使得访问税务文件的概念变得相对容易。到了1996年的纳税季节,随着美国国税局(Internal Revenue Service)启动了网络服务器-根据科技大师金·科曼多(Kim Komando)1996年的一篇专栏文章,已经有600多份文件准备好以PDF格式下载,这一元素已经准备就绪。

Adobe网站上的一个案例研究指出,大约在这个时候,美国国税局(IRS)全力以赴地购买了PDF,截至2001年,美国国税局向10万多名员工提供了其软件的副本,并在此过程中节省了数百万美元的打印成本。

除了省去了大部分表格的邮寄外,它还使材料更容易在审计中找到,从而帮助公司省去了许多令人头疼的问题。税务审查员和审计师可以通过电子方式访问它,而不是把东西放在模糊的文件柜里。

美国国税局的一位官员告诉Adobe:“仅就员工满意度而言,Acrobat就为自己买单。”再加上更容易的文件管理和更少的纸张存储的好处,很明显,Acrobat和Adobe PDF为该机构和我们服务的人提供了真正的回报。“。

显然,这句话有些不着边际,但美国国税局在很大程度上是整个商业世界的缩影。PDF在很短的时间内成为企业用户共享文档的最重要方式之一。(当然,学术界也很快就接受了。)

PDF简化了转到Kinko‘s的艰苦工作,因为这种文件格式能够轻松地嵌入字体和图像等资源,简化了打印文件最困难的部分之一。(当然,您通常不能在PDF表单中进行更改。)。最终,PDF变得可搜索,甚至可编辑。

最重要的是,在美国国税局(IRS)的情况下,是“可填补的”。美国国税局(IRS)很快创建了不同版本的税单,允许最终用户输入自己的号码,最终甚至可以输入自己的签名。

虽然这一切都不像文本文件那样轻量级,也没有HTML那么灵活,但对于普通人来说,它确实胜过PostScript。

自从Adobe在1993年发布完整的PDF规范以来,PDF已经成为更安全和可靠的信息交换的事实上的全球标准。政府和私营企业都开始依赖PDF来处理大量的电子记录,这些记录需要更安全、更可靠地共享、管理,在某些情况下还需要世代保存。“。

-国际标准化组织32000-1标准前言的一部分,这是2008年第一个标准化版本的完整pdf规范。虽然Adobe在1993年首次创建了PDF,但它保留了该格式的开放性,以便其他公司可以使用它,从而使其成为事实上的标准。(Adobe主要对创意工具收费。)。但在2007年,Adobe与国际标准组织(International Standards Organization)合作,为该技术创建了一个开放标准。这一举动突显了这一标准已经变得多么普遍。

这是一个枯燥的话题,但它在档案界是非常重要的。当然,原因很明显:例如,如果你随意改变制作和存储缩微胶片的方式,缩微胶片就会变得难以重复使用。

但这也是双向的。有些东西你不一定想要脱离标准。假设您不关心交互性,因为您正在尝试数字化数百年前的文档。

不过,可能还有一些您想要的细微之处,比如使文本可搜索的功能。也许您想要确保最大程度的兼容性,使用工具的所有变体。

所有这些原因,以及更多原因,都是PDF/A格式在2005年创建的原因。与标准PDF不同,标准PDF旨在利用它是为计算机制作的这一事实,而PDF/A被设计为可最大限度地重现,以至于如果原始纸张丢失,它可以替换打印的文档。

Appligent Document Solutions的营销专家肖娜·麦卡莱尼(Shawna McAlearney)在PDF协会网站上的常见问题解答中解释说:“每次以完全相同的方式呈现文档所需的一切内容都包含在PDF/A文件中:字体、颜色配置文件、图像等。PDF/A也是ISO标准,这保证了未来几代软件将知道如何打开和呈现PDF/A文件。”

这对互联网档案馆和国会图书馆这样的组织来说是好事,这些组织正在长期保存信息,并需要从现在开始30年后使其可读。但它有时也会在档案领域引发一些争议,比如2012年将该格式扩展到允许嵌入电子表格和HTML文档等文件时。

但是,一些批评PDF/A快速普及的人仍然存在。在一篇关于这个主题的论文中,柏林Zuse研究所的Marco Klindt从档案的角度列出了这种格式的各种问题,包括(除其他外)使用起来可能很麻烦。

(值得注意的是,可用性专家雅各布·尼尔森(Jakob Nielsen)也出于同样的原因强烈反对使用PDF,他在咨询公司的网站上表示:“PDF适合打印,但仅此而已。请勿将其用于在线演示。“)。

克林特还提出了这种格式的法律和完整性问题,他认为,对合适的保存格式的渴望限制了对这种格式从长远来看是否真正有意义的讨论。

他写道:“对PDF的熟悉导致了PDF/A作为数字存档领域的一种解决方案被迅速而广泛地采用。”“这一事实可能已经压制了要求为研究工作(文本和数据)寻求和开发更合适的内容容器的先见之明,同时考虑到重复使用。”

即使是这样-当然,多年来我已经加载了我那份300兆字节的PDF,而且网上有很多文档没有资格成为PDF-这种格式在数字化和保护我们的集体知识方面所做的工作当然值得钦佩。

50年后,这些PDF,即使有它们的弱点,也将帮助我们记录历史,而不是网络的短暂本质。与纸质文档不同的是,这些PDF文档不会受到页面磨损的影响。

“(Adobe的)董事会想要扼杀它。我说,‘根本不可能。这是解决一个重要问题,我们将坚持下去,直到它奏效。‘“。

-Warnock,向Knowledge@Wharton讲述Acrobat的早年。如今,我们理所当然地认为,PDF在几乎所有的网络上都很常见,但曾经有一段时间,PDF格式如此糟糕,以至于Adobe不得不停止对Acrobat Reader收费,沃诺克称此举是一个“非常有风险的选择”。(他们对Acrobat收费很高。)。但最终证明,坚持与客户在一起并使其免费的决定是Adobe作为一家公司取得成功的关键。尽管当人们想到Adobe时,可能会更快地想到Photoshop,但这位Adobe联合创始人的母校犹他大学(University Of Utah)在2013年发布的一篇关于Adobe联合创始人的简介中,最终将公司的成功归功于沃诺克创建的文档格式。作者杰森·马修·史密斯(Jason Matthew Smith)写道:“PDF让Adobe声名鹊起。”

回到马纳福特,在他的情况下,有没有什么他可以做的不同的事情,以防止它变成一个彻头彻尾的尴尬?

除了从Word到Back的转换会在格式上产生可以跟踪的细微变化之外,还可以使用Adobe Acrobat等软件直接编辑文件中的文本!

马纳福特自己也可以很容易地修改PDF。如果他这样做了,他就可以避免可能会让他入狱的文件线索的一个关键部分。他甚至可能已经在电脑上安装了PDF编辑器。

毕竟,在洗钱业务中,似乎经常需要从多个PDF文件组合页面;为此您需要一个PDF编辑器。在他洗钱职业生涯的大部分时间里,几乎可以肯定的是,马纳福特距离编辑模式只有一两个点击的距离。

其结果是,PDF编辑很可能在一场重大的政治丑闻中扮演重要角色。

PDF发明的故事可能没有法律战的中心,也没有苏珊娜·维加(Suzanne Vega)歌曲这样的钩子来推动故事向前发展,但它确实有这一丑闻。不管你喜不喜欢,马纳福特笨拙地使用了一个基本上每个人都在使用的工具,这真的突显了PDF的普及程度。