diff --git a/pom.xml b/pom.xml index 138cc1d..52adb1c 100644 --- a/pom.xml +++ b/pom.xml @@ -8,6 +8,14 @@ PR2WordCloud 1.0-SNAPSHOT + + + org.apache.pdfbox + pdfbox + 2.0.29 + + + 23 23 diff --git a/src/main/java/domain/FileManager.java b/src/main/java/domain/FileManager.java index 031497a..8609475 100644 --- a/src/main/java/domain/FileManager.java +++ b/src/main/java/domain/FileManager.java @@ -1,5 +1,7 @@ package domain; +import org.apache.pdfbox.pdmodel.PDDocument; +import org.apache.pdfbox.text.PDFTextStripper; import javax.swing.*; import javax.swing.filechooser.FileNameExtensionFilter; import java.io.File; @@ -7,17 +9,29 @@ import java.io.File; public class FileManager { public void loadFile() { - JFileChooser fileChooser = new JFileChooser(); - fileChooser.setFileFilter(new FileNameExtensionFilter("PDF Files", "pdf")); + try{ + JFileChooser fileChooser = new JFileChooser(); + fileChooser.setFileFilter(new FileNameExtensionFilter("PDF Files", "pdf")); - int result = fileChooser.showOpenDialog(null); + int result = fileChooser.showOpenDialog(null); - if (result == JFileChooser.APPROVE_OPTION) { - File selectedFile = fileChooser.getSelectedFile(); - System.out.println("Ausgewählte Datei: " + selectedFile.getAbsolutePath()); - // Hier kannst du die Datei weiterverarbeiten - } else { - System.out.println("Dateiauswahl abgebrochen."); + if (result == JFileChooser.APPROVE_OPTION) { + File selectedFile = fileChooser.getSelectedFile(); + System.out.println("Ausgewählte Datei: " + selectedFile.getAbsolutePath()); + // Hier kannst du die Datei weiterverarbeiten + + try (PDDocument document = PDDocument.load(selectedFile)) { + PDFTextStripper pdfStripper = new PDFTextStripper(); + String text = pdfStripper.getText(document); + System.out.println(text); + } + } + else { + System.out.println("Dateiauswahl abgebrochen."); + } + + } catch (Exception e) { + e.printStackTrace(); } }