Tika 简明教程

TIKA - GUI

Graphical User Interface (GUI)

  1. Tika 提供一个 jar 文件以及其源代码(在以下链接中): https://tika.apache.org/download.html.

  2. 下载这两个文件,设置 jar 文件的类路径。

  3. 提取源代码 zip 文件夹,打开 tika-app 文件夹。

  4. 在“tika-1.6\tika-app\src\main\java\org\apache\Tika\gui”的提取文件夹中,您将看到两个类文件: ParsingTransferHandler.javaTikaGUI.java

  5. 将这两个类文件编译后,执行 TikaGUI.java 类文件,它将打开以下窗口。

open window

现在,让我们来看看如何使用 Tika GUI。

在 GUI 上,单击 open(打开),浏览并选择要提取的文件,或将其拖动到窗口的空白处。

Tika 提取文件内容,并以五种不同格式显示,即:元数据、格式化文本、纯文本、主要内容和结构化文本。你可以选择你想要的任何一种格式。

同样,你也可以在“tika-1.6\tikaapp\src\main\java\org\apache\tika\cli”文件夹中找到 CLI 类。

以下插图显示了 Tika 的功能。当我们将图像拖放到 GUI 上时,Tika 会提取并显示其元数据。

gui