引
各位读者朋友大家好!
正如上期预告所说,今天我要更新的是一期技术内容。准确地讲,这是一个系列,因为关于pdf的技术知识确实很多,我也只能简略的介绍一下。今天是系列的第一期,后续还会继续更新希望对大家有帮助!本文共5568字,篇幅较长,每一部分我都标有一级标题、二级标题,大家可以根据自己的兴趣选择性地阅读。文章当中大多数偏向技术的知识,文末附有参考资料。
PDF简介
PDF是Portable Document Format的简称,意为“可携带文档格式”,是由Adobe Systems用于与应用程序、操作系统、硬件无关的方式进行文件交换所发展出的文件格式。PDF文件以PostScript语言图象模型为基础,无论在哪种打印机上都可保证精确的颜色和准确的打印效果,即PDF会忠实地再现原稿的每一个字符、颜色以及图象。
可移植文档格式是一种电子文件格式。这种文件格式与操作系统平台无关,也就是说,PDF文件不管是在Windows,Unix还是在苹果公司的Mac OS操作系统中都是通用的。这一特点使它成为在Internet上进行电子文档发行和数字化信息传播的理想文档格式。越来越多的电子图书、产品说明、公司文告、网络资料、电子邮件在开始使用PDF格式文件。
便携式文档格式(英语:Portable Document Format,缩写:PDF)是一种用独立于应用程序、硬件、操作系统的方式呈现文档的文件格式。每个PDF文件包含固定布局的平面文档的完整描述,包括文本、字形、图形及其他需要显示的信息。1991年,Adobe Systems共同创始人约翰·沃诺克提出的名为“Camelot”的系统演变成PDF。如今,PDF文件除平面的文本和图形外,还可能包括逻辑结构元素,注释、表单、图层、富媒体(包括视频内容)之类的交互元素,使用U3D或PRC的三维对象,以及多种其他数据内容。PDF规范还提供了启用这些功能时所需的加密功能、数字签名、文档附件和元数据等。
各种百科网站的定义看上去都挺复杂的。对于一般人,pdf就可以理解为一种无论在何种系统、何种网络、何种pdf阅读器下,打开都呈现出的样子都一模一样。这么定义可能有些不太精确。但一般来讲我们碰到的情况就是这样。
以上这些情况相信不少人都遇到过。
我们不妨再来看ppt。别的不说,光微软自家的PowerPoint不同的版本做出的ppt,有些动画在较老的版本上都播放不出。比如PowerPoint 2019 和 2021 中的平滑切换。更不必说用Keynote和WPS 中的效果了。
这些文件传输问题,相信在日常的工作生活中,也给大家带来了不少烦恼。而遇到这种情况,pdf就成了不二之选。
说到pdf的历史,那可谓是源远流长。PDF的英文是Portable Document Format,本质上是一种格式的名称,所以我们平时讲pdf格式实际上有点语义重复了。不过这只是开个玩笑的事情。PDF这种文件格式,本来是Adobe公司研发出的一种格式,当时也只有Adobe开发出的软件 Adobe Acrobat Reader才能打开。pdf这种格式对于出版业有很大的影响,当时很多文件资料和书籍,都通过pdf得以保存。pdf,渐渐地,逐渐走向大众市场。在2008年,国际标准化组织(ISO)才正式将pdf从一个由Adobe公司单独持有的专有格式,变为大众可用的开放版本。我还亲自搜了一下ISO官网上当年的截图:
当然,pdf当中有一些较为高级和专业的功能,Adobe公司并没有将这些技术交给国际标准化组织。因而这些功能只有在Adobe自家的付费软件Acrobat中使用。这些功能一般我们普通大众是用不到的,但对于信息业、出版业还是颇为重要的。可以说,即便今天,pdf, 这项Adobe公司的伟大发明,还在为Adobe公司赚钱。现在市面上很多的软件都有关于pdf的大部分功能。在介绍关于pdf的具体操作之前,我会用一个段落介绍一下pdf的工作机理以及一些技术内容。如果你不想读,那么可以直接跳过。这段内容的开头和结尾处标有分割线。
pdf的工作机理原理
pdf\image2.png
维基百科上是这样解释其技术的。三行文字,讲得非常清楚。首先,pdf要有描述页面的代码,这样阅读器看到这些代码,就可以转换成图像。其次,pdf会将字体嵌入。最后,pdf存储上也有较为合理和先进的安排,压缩了部分内容。因此我们会发现,转换后的pdf和原始文件大小差异并不大,主要就归功于其压缩技术。
PDF背后有着诸多复杂的技术,这关系到通过代码实现字符、图形的转换,也有很多专业内容。我这里只做几点简单的介绍,也让大家能够了解到关于pdf的一些基本技术知识。
将一个word转为pdf时,软件会先将字符转为代码,字体单独存储。字符转为代码实际上并不容易。比如,字符的颜色、是否加粗、是否是斜体、字号多大。同时,pdf是如何确定每个字符的位置呢?这个问题的答案并不复杂。字符的代码和字体文件会协同作战。可以这样大概地理解:「一」这个字假设它的代码为abc;那么如果有斜体,它的代码就会和def组合,这个字符的代码就变成「abcdef」了。如果还有有加粗,那就是「abcdefghi」,如果没有斜体,但是有加粗,那就是「abcghi」。字体的大小也会有代码相对应地记录。同时,pdf的字体的位置实际上是由坐标轴确定了。比如一个字符,它的字号大小是100*100,那么在坐标轴中这个字就被放进了一个大小为100*100的方格中。这个方格左下角的顶点就在坐标原点。紧接着,pdf会确定坐标轴在页面中的位置,说白了就是坐标轴的原点恰好处于原来字符在页面中的位置。这样一来,整个字符的样式和位置就确定了。
另外,我们在转换pdf时,会发现一般段落间距有时会比较奇怪。主要原因就是pdf实际上没有「段」这个概念,只有「行」的概念。任何字符文本都是被当做一个长方形,摆到坐标轴上的,你可以把一行当作一个长方形。那样的话,一页文字实际上就是若干个长方形;而这些长方形之间的相对位置关系,软件是不管的。
代码之中还有很多内容。有关的内容我就不深入讲了,大家可以在文末的参考链接当中继续深入了解。
下面的内容,我将着重介绍各种有关pdf的软件操作。
浏览器
Edge,Safari,Google Chrome,Firefox,yandex,qq浏览器,都可以查看pdf。
这里就不得不说一下不同设备上的区别了。如果在PC上使用Edge,除了查看、打印、复制内容之外,还可以做标记,如加高亮、涂鸦等等。但在iPad上,Edge是能从外部导入df,而且只能查看,不能涂鸦。
iPad上
拿我iPad上的Edge举例吧。
首先,我在文件App中有这样一个文件。轻点右上角的分享按钮,就会出现分享界面,向右滑,找到「Edge」浏览器。
轻点Edge,会弹出窗口。
轻点「在Microsoft Edge」中打开,随后就会跳转至Edge浏览器中。
当然,如果你是在Edge浏览器中下载的pdf,那么肯定是可以导出的。
比如我们浏览一下苹果官网。其中苹果宣传自己的环境保护理念的界面如下:
我们可以看到右上角有一个「2021进展报告(PDF)」。轻点打开,我们就可以在Edge浏览器中查看苹果制作的这份pdf。界面如下:
这就是在iPad上的Edge浏览器的演示。基本上所有的外部第三方浏览器的功能都颇为类似。但是苹果自带的Safari功能就比较强大了。
理论上来讲,Safari可以将任何网页转换成pdf。比如ISO官网的那份内容,我就在这里演示一下如何转换吧。
还是刚才ISO的那个网页。
一个叫「pdf」,还有一个叫「阅读器视图版pdf」
这两个选项是不同的。我们不妨点开试试。
不难发现,如果选择「pdf」,那么导出的文件当中就会包含一定的图像元素,当然不可能与原网页一模一样。如果选择「阅读器视图版pdf」,那么导出的pdf中只会保留文字,同时pdf的字体和字号可能会改变。这两种方式选择的pdf都是一页一页的。
当然,Safari也有另外两种导出pdf的方法。
PC上
类似的,各大浏览器基本上都可以查看pdf。我这里以微软自带的Edge浏览器举例。
导出后的pdf长这个样子:
将网页导出成pdf并不难。而且用PC导出的pdf,可以包含超链接。而用iPad则不能。同时,虽然Safari也可以安装插件,但不可否认的是,PC端的浏览器更容易安装且可供选择范围更广。比如PC端有很多网页标注插件,那么在网页上做的记号用PC端的浏览器导出也可以把插件所做的内容一起导出,非常的方便。
下面我们来看怎样用浏览器标注pdf。
同样是Edge浏览器,这是我们刚才导出的那份pdf。
如果我们想缩放页面,那么可以点工具栏的加减号,也可以在按住Ctrl键的同时滚动鼠标滚轮。
在pdf中的内容都是可标记的纯文字内容时(这个我后文会有解释),我们可以对文本使用高亮,也就是「突出显示」。这样我们就可以为文本添加透明色块高亮显示,也可以更改高亮颜色、粗细。一般默认的是浅黄色。当然,我们也可以突出显示非文字内容,这就类似于涂鸦。
涂鸦,也就是工具栏的绘制,可以让我们直接在pdf上画,界面如下:
按下保存键,我们所画的内容就可以永久保存下来。下次再用Edge打开,就能继续绘制或擦除、更改之前所绘制的内容。但如果是用别的软件、别的设备打开,就不能够更改所绘制的内容,显示可能也会有差别。如果想更改这些内容,也可以购买AdobeAcrobat Reader DC专业版进行恢复。或者,我们前文所说,pdf本质上是一行行代码,那么如果我们了解其中代码的工作原理,那也可以用软件删除有关于涂鸦的代码,当然这就比较专业了。
WPS
如题。
wps相信大家不陌生,其功能之全面,我觉得不用多说了。我就提纲挈领地讲几处吧!
注1:本教程演示的WPS Office是本人于2021年12月从WPS官网下载并安装,没有经过更新,也没有会员功能。
注2:下面将用来演示的pdf文档是由张哲涵同学制作的《Penguins of Madagascar》。
用WPS打开,界面如下:
Wps的标注确实轻松许多,也更加自由。下面的图算是一些功能的概览:
Wps的功能也有很多,我之后还会继续介绍,相信大家自己也非常熟悉。
下面我就个人推荐一款功能与wps功能相近的PC端的软件吧。
1.AdobeAcrobat Reader
(功能最全,最强大,没有之一,是Adobe公司推出的。分为免费版和专 业版。)
2.FoxitReader
3.SumatraPDF
4.DrawBoardPDF
5.Updf
6.LightPDF
关于PDF的制作
Word转为PDF
我这里演示一下Microsoft Office的转换方法。
注:演示的软件版本为Microsoft Office 2021。Office2010,2013, 2016 ,2019 转换方法都类似。
首先,打开「文件」选项卡。
Office1
进入选项卡,选择「另存为」。
Office2
Office3
Office4
最后,在「保存类型」处选择「PDF(.pdf)」。单击「保存」即可。
参考资料:
1.https://baike.baidu.com/item/pdf/317608?fr=aladdin(总)2.https://zh.wikipedia.ahmu.cf/wiki/可移植文档格式(总)
3.https://www.iso.org/standard/63534.html(国际标准化组织页面截图)
4.https://b23.tv/tioYIJD (pdf原理)
5.https://b23.tv/ZpNKINQ (pdf 原理)
6.https://zhuanlan.zhihu.com/p/150986423(pdf 原理)
7.https://www.zhihu.com/question/377951375/answer/1661211521(pdf原理)
8.https://www.apple.com.cn/safari/ (Safari 的使用)
9.https://mp.weixin.qq.com/s/F2kcdAe2y3KyPMSSwWizAA(pdf 软件)
10.https://mp.weixin.qq.com/s/SzEPgLz3vcykYZUfklRbdA(pdf软件)
11.https://www.adobe.com/acrobat/pdf-reader.html(pdf 软件)
12.https://mp.weixin.qq.com/s/dUbs6fAPOJ3ZcLS6dRiEWA(Chrome 浏览器中查看pdf)
13.https://support.microsoft.com/search/results?query=pdf Microsoft Edge&isEnrichedQuery=true(Edge浏览器 中查看pdf)
14.https://mp.weixin.qq.com/s/ZY_o-sve8rVg3VzA8HbOew(pdf 软件)
15.https://mp.weixin.qq.com/s/pXmlVgZYBa72FBn1wWPdYg(pdf 软件)