Redian新闻
>
如何在 Linux 中使用 Pandoc 转换文件格式 | Linux 中国

如何在 Linux 中使用 Pandoc 转换文件格式 | Linux 中国

科技
 
导读:它被称为文档转换的“瑞士军刀” —— 这是有充分理由的。很少有它做不到的事情。               
本文字数:2900,阅读时长大约:4分钟

在之前的一篇文章中,我介绍了使用 pandoc 将少量 Markdown 文件 批量转换🔗 itsfoss.com 为 HTML 的过程。在那篇文章中,我创建了多个 HTML 文件,但 Pandoc 可以做的更多。它被称为文档转换的“瑞士军刀” —— 这是有充分理由的。很少有它做不到的事情。

Pandoc🔗 pandoc.org 可以将 .docx、.odt、.html、.epub、LaTeX、DocBook 等格式互相转换,或者转换为其他格式,例如 JATS、TEI Simple、AsciiDoc 等。

是的,这意味着 Pandoc 可以将 .docx 文件转换为 .pdf 和 .html 文件,但你可能会想:“Word 也可以将文件导出为 .pdf 和 .html。为什么我需要 Pandoc 呢?”

嗯,本来呢,你这个说法也没错,但考虑到 Pandoc 可以转换这么多格式,它很可能成为你所有转换任务的首选工具。例如,我们中的许多人都知道 Markdown 编辑器🔗 itsfoss.com 可以将其 Markdown 文件导出为 .html。而使用 Pandoc 文件也可以转换为许多其他格式。

我很少将 Markdown 导出为 HTML。我通常让 Pandoc 来做这件事。

使用 Pandoc 转换文件格式

本文中,我会将 Markdown 文件转换成几种不同的格式。我几乎所有的写作都使用 Markdown 语法,但我经常需要转换为另一种格式:学校作业通常需要的 .docx 格式;我创建的网页通常需要的 .html 格式;工作需要的 .epub 格式;传单和讲义需要的 .pdf 格式;甚至包括一个大学数字人文项目偶尔需要的 TEI Simple 格式。Pandoc 可以轻松处理所有这些格式,甚至更多。

首先,你需要 安装 pandoc🔗 pandoc.org。此外,要创建 .pdf 文件,还需要 LaTeX。我最喜欢的套件是 TeX Live🔗 www.tug.org

注意:如果你想在安装前试用 pandoc,这里有一个在线试用页面:http://pandoc.org/try/

安装 pandoc 和 texlive

Ubuntu 和其他 Debian 发行版的用户可以在终端中输入以下命令:

  1. sudo apt-get update
  2. sudo apt-get install pandoc texlive

请注意第二行,你将一次性安装 pandoc 和 texliveapt-get 命令🔗 itsfoss.com 支持你这样做。不过,我建议你先去喝杯咖啡,因为这可能需要几分钟的时间。

开始转换

安装完成 pandoc 和 texlive 后,你就可以尝试用它们来完成一些工作了!

该项目的示例文档将是一篇文章,该文章于 1894 年 12 月首次发表在《北美评论》上,标题为“如何击退火车劫匪”。我将使用的 Markdown 文件是前一段时间创建的,该文章的一个恢复项目的一部分(LCTT 译注:这是篇一百多年前发表的文章,这是一个数字化“恢复”项目)。

我把这篇文章保存为 how_to_repel_train_robbers.md,它位于我的 Documents 目录下,名为 samples 的子目录中。它在 Ghostwriter 中看起来是这样的:

在 Ghostwriter 中查看原始的 Markdown 文件

我想创建此文件的 .docx、.pdf 和 .html 版本。

第一次转换

首先,我将制作一个 .pdf 副本,因为我在安装 LaTeX 包时遇到了些麻烦。

在 ~/Documents/samples/ 目录中,我输入以下,以创建一个 .pdf 文件:

  1. pandoc -o htrtr.pdf how_to_repel_train_robbers.md

上述命令将基于 how_to_repel_train_robbers.md 文件,创建一个名为 htrtr.pdf 的文件。我使用 htrtr 作为名称的原因是:嗯,它比 how_to_repel_train_robbers 短。htrtr 其实是长标题中的单词首字母排列。

这是 .pdf 文件制作完成后的一个截图:

在 Ocular 中查看的转换后的 PDF 文件

第二次转换

接下来,我想创建一个 .docx 文件。该命令与我用来创建 .pdf 的命令几乎相同,它是:

  1. pandoc -o htrtr.docx how_to_repel_train_robbers.md

很快,一个 .docx 文件就创建好了。这是它在 Libre Writer 中的样子:

在 Libre Writer 中查看转换后的 DOCX 文件

第三次转换

我可能会想在网上发布这个,所以再多一个支持网页的格式也不错。我将使用以下命令创建一个 .html 文件:

  1. pandoc -o htrtr.html how_to_repel_train_robbers.md

同样,创建它的命令与前两次转换非常相似。这是该 .html 文件在浏览器中的样子:

在 Firefox 中查看的转换后的 HTML 文件

注意到什么了吗?

让我们再看看之前的命令。它们是:

  1. pandoc -o htrtr.pdf how_to_repel_train_robbers.md
  2. pandoc -o htrtr.docx how_to_repel_train_robbers.md
  3. pandoc -o htrtr.html how_to_repel_train_robbers.md

这三个命令唯一不同的是 htrtr 后的扩展名。这提示你 pandoc 会依赖于你提供的输出文件扩展名(来决定目标转换格式)。

总结

Pandoc 可以做的远不止这里完成的三个小转换。如果你选择使用一个首选格式编写文件,但时不时又需要将文件转换为另一种格式,pandoc 很大概率都能为你完成。

现在,既然你已经学会了,你会用它做什么呢?你会把它自动化吗?如果你有一个网站,想供读者下载文章怎么办?你可以修改这些小命令,把它们编写成一个脚本,你的读者可以决定他们想要哪种格式。你可以提供 .docx、.pdf、.odt、.epub 或更多格式。你的读者只需要选择一种格式,然后对应的转换脚本就会执行,最后,你的读者下载他们想要的文件。这是完全可以做到的。


via: https://itsfoss.com/pandoc-convert-file/

作者:Bill Dyer 选题:lujun9972 译者:lkxed 校对:wxy

本文由 LCTT 原创编译,Linux中国 荣誉推出


LCTT 译者 :六开箱
🌟🌟🌟🌟🌟
翻译: 97.0 篇
|
贡献: 108 天
2022-03-16
2022-07-02
https://linux.cn/lctt/lkxed
欢迎遵照 CC-BY-SA 协议规定转载,
如需转载,请在文章下留言 “转载:公众号名称”,
我们将为您添加白名单,授权“转载文章时可以修改”。

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
在 Linux 上使用 Bash 创建一个临时文件 | Linux 中国如何在 Ubuntu 22.04 LTS 中安装 Docker 和 Docker Compose | Linux 中国如何在 Linux 中实时监控日志文件(桌面和服务器) | Linux 中国一個英雄 剖析人性用 ranger 在 Linux 终端管理你的文件 | Linux 中国如何在基于 Ubuntu 的 Linux 发行版上安装最新的 Vim 9.0 | Linux 中国如何在 Fedora Linux 中安装多媒体编码器 | Linux 中国HandBrake:用于转换任何格式视频的免费工具 | Linux 中国马克谈天下(282) 巴铁俾路支解放军的前世今生如何在 Linux 桌面中启用 “激活 Linux” 水印通知 | Linux 中国如何从 Windows 上用 SSH 连接到 Linux | Linux 中国Linux 下的 Docker 入门教程 | Linux 中国清零注定要失败?好消息!Docker Desktop 现已支持 Linux | Linux 中国分裂使 Linux 超越 Windows 的梦想破灭了 | Linux 中国如何将你的文件系统转换为 Btrfs | Linux 中国如何在 Linux 和 Windows 电脑之间共享文件 | Linux 中国如何在 Arch Linux 中安装深度桌面(DDE) | Linux 中国聊聊子女教育如何在 Ubuntu/Linux 和 Windows 之间共享文件夹 | Linux 中国在 Linux 中隐藏文件和文件夹的那些事 | Linux 中国用这些开源工具在 Linux 上编辑 PDF 文件 | Linux 中国修复 Ubuntu Linux 中 “Command ‘python’ not found” 的错误 | Linux 中国如何在 Linux 上动态链接模块库 | Linux 中国在 Linux 中使用组合键输入隐藏的字形 | Linux 中国如何使用 Linux sed 命令自动进行文件编辑 | Linux 中国在 Linux 上使用 sudo 命令的 5 个理由 | Linux 中国如何在 Manjaro 和其他 Arch Linux 衍生品上安装 Discord 客户端 | Linux 中国如何使用 Dockerfile 创建自定义 Docker 镜像 | Linux 中国初级:如何在 Arch Linux 中安装 Yay AUR 助手 | Linux 中国开源朗读者:我是如何帮助妈妈从 Windows 切换至 Linux 的 | Linux 中国这群上海人真牛叉!如何在 Linux 中更改 GRUB 主题 | Linux 中国我是如何使用 Linux fmt 命令来格式化文本 | Linux 中国Collision:用于验证 ISO 和其他文件的 Linux 应用 | Linux 中国
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。