PDF Power Query

In der Vergangenheit war es äusserst mühsam Daten von einem PDF in Excel einzufügen. Entweder konnte mit Copy/Paste die Daten kopiert werden oder es gab Addins von Drittanbietern. Neu kann Power Query für den Import von PDFs verwendet werden. PowerQuery ist ab MS Office 2016 in Excel integriert. Nachfolgend erkläre ich Ihnen wie dies funktioniert.

PDF auswählen

Als erstes benötigen wir ein PDF, welches bspw. so aussieht:

Beispiel-PDF-Datei zum Importieren

Sinnvollerweise enthält das PDF eine Tabelle, welche importiert werden kann. Excel versucht die Daten zu erkennen und bereitet sie nach Möglichkeiten auf. Für unser Beispiel habe ich ein PDF vom Bundesamt für Statistik verwendet.

Daten abrufen mit Power Query

Um das PDF zu importieren öffnen Sie bitte Excel und gehen Sie dann zum Tab „Daten“ -> „Daten abrufen“ -> „Aus Datei“ -> „Aus PDF“.

Um das PDF zu importieren öffnen Sie bitte Excel und gehen Sie dann zum Tab "Daten" -> "Daten abrufen" -> "Aus Datei" -> "Aus PDF".
Wählen Sie danach das zu importierende PDF aus. Excel bereitet danach eine Vorschau pro Seite auf. Da unsere Tabelle auf der Seite 49 ist, finde ich die Tabelle unter „…(Page 49)“. Wenn die Tabelle in der Vorschau bereits korrekt aussieht, dann drücken Sie auf „Laden“. In der Regel müssen die Daten aber vorerst via PowerQuery optimiert werden, daher wähle ich stattdessen „Transformieren“.
Wählen Sie danach das zu importierende PDF aus

Daten in Power Query transformieren

Wenn Sie auf Transformieren gedrückt haben, erscheinen die Daten in PowerQuery. In meinem Beispiel steht nun die Titelzeile in der ersten Zeile und nicht im Titel, daher drücke ich links oben in der Ecke auf die Tabelle und wähle „Erste Zeile als Überschriften verwenden“. Danach sind in meinem Beispiel die Monate als Titel definiert.

Wenn Sie auf Transformieren gedrückt haben, erscheinen die Daten in PowerQuery.

Weiter lösche ich die ersten beiden Zeilen, welche mich stören. Ich könnte noch weitere Optimierungen vornehmen. Dies ist aber von PDF zu PDF resp. von Tabelle zu Tabelle unterschiedlich. Wenn ich mit den Optimierungen zufrieden bin, dann klicke ich auf Schliessen und Laden. So sieht dann die Tabelle in Excel aus:

Weiter lösche ich die ersten beiden Zeilen, welche mich stören. Ich könnte noch weitere Optimierungen vornehmen.

Fazit

So einfach haben Sie eine PDF-Tabelle ins Excel eingelesen.

Benötigen Sie Excel-Hilfe?

Erfahren Sie mehr über Power Query, indem Sie andere Artikel zu Power Query auf dieser Website durchsuchen. Insbesondere wie Sie Fehler in Power Query behandeln können oder lesen Sie eine Einführung in die M-Sprache von Power Query.

Wenn Ihnen die Zeit fehlt, um sich selber mit Power Query zu befassen, dann rufen Sie uns an, wir erledigen dies sehr gerne für Sie. Unsere Kontaktdaten finden Sie auf unserer Webseite.

Kommentar verfassen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert

Nach oben scrollen