Увезите податке из ПДФ-а у Екцел преко Повер Куери-а

Задатак преноса података из табеле у ПДФ датотеци у Мицрософт Екцел лист је увек „забаван“. Нарочито ако немате скуп софтвер за препознавање попут ФинеРеадер-а или нешто слично. Директно копирање обично не води ничему добром, јер. након лепљења копираних података на лист, они ће се највероватније „залепити“ у једну колону. Дакле, они ће тада морати да буду пажљиво раздвојени помоћу алата Текст по колонама са картице Датум (Подаци — текст у колоне).

И наравно, копирање је могуће само за оне ПДФ фајлове где постоји текстуални слој, односно са документом који је управо скениран са папира у ПДФ, то у принципу неће функционисати.

Али није тако тужно, заиста 🙂

Ако имате Оффице 2013 или 2016, онда је за неколико минута, без додатних програма, сасвим могуће пренети податке из ПДФ-а у Мицрософт Екцел. А Ворд и Повер Куери ће нам помоћи у томе.

На пример, узмимо овај ПДФ извештај са гомилом текста, формула и табела са сајта Економске комисије за Европу:

Увезите податке из ПДФ-а у Екцел преко Повер Куери-а

… и покушајте да га извучете у Екцел-у, реците прву табелу:

Увезите податке из ПДФ-а у Екцел преко Повер Куери-а

Идемо!

Корак 1. Отворите ПДФ у Ворд-у

Из неког разлога, мало људи зна, али од 2013. године Мицрософт Ворд је научио да отвара и препознаје ПДФ датотеке (чак и оне скениране, односно без текстуалног слоја!). Ово се ради на потпуно стандардан начин: отворите Ворд, кликните Датотека – Отвори (Датотека — Отвори) и наведите ПДФ формат у падајућој листи у доњем десном углу прозора.

Затим изаберите ПДФ датотеку која нам је потребна и кликните отворен (Отворено). Ворд нам говори да ће покренути ОЦР на овом документу у текст:

Увезите податке из ПДФ-а у Екцел преко Повер Куери-а

Слажемо се и за неколико секунди видећемо наш ПДФ отворен за уређивање већ у Ворд-у:

Увезите податке из ПДФ-а у Екцел преко Повер Куери-а

Наравно, дизајн, стилови, фонтови, заглавља и подножја итд. ће делимично одлетети са документа, али то за нас није важно – потребни су нам само подаци из табела. У принципу, у овој фази већ је примамљиво једноставно копирати табелу из препознатог документа у Ворд и једноставно је налепити у Екцел. Понекад то функционише, али чешће доводи до разних врста изобличења података – на пример, бројеви се могу претворити у датуме или остати текст, као у нашем случају, јер. ПДФ користи не-сепараторе:

Увезите податке из ПДФ-а у Екцел преко Повер Куери-а

Дакле, хајде да не сечемо углове, већ да све буде мало компликованије, али исправно.

Корак 2: Сачувајте документ као веб страницу

Да бисмо затим учитали примљене податке у Екцел (преко Повер Куерија), наш документ у Ворд-у треба да буде сачуван у формату веб странице – овај формат је, у овом случају, нека врста заједничког имениоца између Ворд-а и Екцел-а.

Да бисте то урадили, идите на мени Датотека – Сачувај као (Датотека — Сачувај као) или притисните тастер ФКСНУМКС на тастатури иу прозору који се отвори изаберите тип датотеке Веб страница у једној датотеци (Веб-страница — једна датотека):

Увезите податке из ПДФ-а у Екцел преко Повер Куери-а

Након чувања, требало би да добијете датотеку са екстензијом мхтмл (ако видите екстензије датотека у Екплореру).

Фаза 3. Отпремање датотеке у Екцел преко Повер Куери-а

Креирану МХТМЛ датотеку можете отворити директно у Екцел-у, али тада ћемо добити, прво, сав садржај ПДФ-а одједном, заједно са текстом и гомилом непотребних табела, а друго, опет ћемо изгубити податке због нетачних сепаратори. Због тога ћемо извршити увоз у Екцел преко Повер Куери додатка. Ово је потпуно бесплатан додатак са којим можете да отпремите податке у Екцел из готово било ког извора (датотеке, фасцикле, базе података, ЕРП системи) и затим трансформишете примљене податке на сваки могући начин, дајући им жељени облик.

Ако имате Екцел 2010-2013, онда можете да преузмете Повер Куери са званичне Мицрософт веб локације – након инсталације видећете картицу Повер Куери. Ако имате Екцел 2016 или новији, онда не морате ништа да преузимате – сва функционалност је већ подразумевано уграђена у Екцел и налази се на картици Датум (Датум) у групи Преузмите и претворите (Набавите и трансформишите).

Дакле, идемо или на картицу Датум, или на картици Повер Куери и изаберите тим Да бисте добили податке or Креирајте упит – из датотеке – из КСМЛ-а. Да бисте учинили видљивим не само КСМЛ датотеке, промените филтере у падајућој листи у доњем десном углу прозора у Све датотеке (Све датотеке) и наведите нашу МХТМЛ датотеку:

Увезите податке из ПДФ-а у Екцел преко Повер Куери-а

Имајте на уму да се увоз неће успешно завршити, јер. Повер Куери од нас очекује КСМЛ, али ми заправо имамо ХТМЛ формат. Стога, у следећем прозору који се појави, мораћете да кликнете десним тастером миша на датотеку која је неразумљива за Повер Куери и наведете њен формат:

Увезите податке из ПДФ-а у Екцел преко Повер Куери-а

Након тога, датотека ће бити исправно препозната и видећемо листу свих табела које садржи:

Увезите податке из ПДФ-а у Екцел преко Повер Куери-а

Можете погледати садржај табела кликом на леви тастер миша на белој позадини (не у речи Табела!) ћелија у колони Подаци.

Када је жељена табела дефинисана, кликните на зелену реч Табела – и „пропадате“ у њен садржај:

Увезите податке из ПДФ-а у Екцел преко Повер Куери-а

Остаје да урадите неколико једноставних корака да "чешљате" његов садржај, и то:

  1. избришите непотребне колоне (десни клик на заглавље колоне – уклонити)
  2. замените тачке зарезима (изаберите колоне, кликните десним тастером миша - Замена вредности)
  3. уклоните знаке једнакости у заглављу (изаберите колоне, кликните десним тастером миша - Замена вредности)
  4. уклоните горњу линију (Početna – Избриши линије – Избриши горње линије)
  5. уклоните празне редове (Почетна – Избриши редове – Избриши празне редове)
  6. подигните први ред до заглавља табеле (Почетна – Користите први ред као наслове)
  7. филтрирајте непотребне податке помоћу филтера

Када се табела доведе у нормалан облик, може се истоварити на лист помоћу команде затворите и преузмите (Затвори и учитај) on Главни таб. И добићемо такву лепоту са којом већ можемо да радимо:

Увезите податке из ПДФ-а у Екцел преко Повер Куери-а

  • Трансформисање колоне у табелу помоћу Повер Куери-а
  • Подела лепљивог текста у колоне

Ostavite komentar