Садржај
Задатак преноса података из табеле у ПДФ датотеци у Мицрософт Екцел лист је увек „забаван“. Нарочито ако немате скуп софтвер за препознавање попут ФинеРеадер-а или нешто слично. Директно копирање обично не води ничему добром, јер. након лепљења копираних података на лист, они ће се највероватније „залепити“ у једну колону. Дакле, они ће тада морати да буду пажљиво раздвојени помоћу алата Текст по колонама са картице Датум (Подаци — текст у колоне).
И наравно, копирање је могуће само за оне ПДФ фајлове где постоји текстуални слој, односно са документом који је управо скениран са папира у ПДФ, то у принципу неће функционисати.
Али није тако тужно, заиста 🙂
Ако имате Оффице 2013 или 2016, онда је за неколико минута, без додатних програма, сасвим могуће пренети податке из ПДФ-а у Мицрософт Екцел. А Ворд и Повер Куери ће нам помоћи у томе.
На пример, узмимо овај ПДФ извештај са гомилом текста, формула и табела са сајта Економске комисије за Европу:
… и покушајте да га извучете у Екцел-у, реците прву табелу:
Идемо!
Корак 1. Отворите ПДФ у Ворд-у
Из неког разлога, мало људи зна, али од 2013. године Мицрософт Ворд је научио да отвара и препознаје ПДФ датотеке (чак и оне скениране, односно без текстуалног слоја!). Ово се ради на потпуно стандардан начин: отворите Ворд, кликните Датотека – Отвори (Датотека — Отвори) и наведите ПДФ формат у падајућој листи у доњем десном углу прозора.
Затим изаберите ПДФ датотеку која нам је потребна и кликните отворен (Отворено). Ворд нам говори да ће покренути ОЦР на овом документу у текст:
Слажемо се и за неколико секунди видећемо наш ПДФ отворен за уређивање већ у Ворд-у:
Наравно, дизајн, стилови, фонтови, заглавља и подножја итд. ће делимично одлетети са документа, али то за нас није важно – потребни су нам само подаци из табела. У принципу, у овој фази већ је примамљиво једноставно копирати табелу из препознатог документа у Ворд и једноставно је налепити у Екцел. Понекад то функционише, али чешће доводи до разних врста изобличења података – на пример, бројеви се могу претворити у датуме или остати текст, као у нашем случају, јер. ПДФ користи не-сепараторе:
Дакле, хајде да не сечемо углове, већ да све буде мало компликованије, али исправно.
Корак 2: Сачувајте документ као веб страницу
Да бисмо затим учитали примљене податке у Екцел (преко Повер Куерија), наш документ у Ворд-у треба да буде сачуван у формату веб странице – овај формат је, у овом случају, нека врста заједничког имениоца између Ворд-а и Екцел-а.
Да бисте то урадили, идите на мени Датотека – Сачувај као (Датотека — Сачувај као) или притисните тастер ФКСНУМКС на тастатури иу прозору који се отвори изаберите тип датотеке Веб страница у једној датотеци (Веб-страница — једна датотека):
Након чувања, требало би да добијете датотеку са екстензијом мхтмл (ако видите екстензије датотека у Екплореру).
Фаза 3. Отпремање датотеке у Екцел преко Повер Куери-а
Креирану МХТМЛ датотеку можете отворити директно у Екцел-у, али тада ћемо добити, прво, сав садржај ПДФ-а одједном, заједно са текстом и гомилом непотребних табела, а друго, опет ћемо изгубити податке због нетачних сепаратори. Због тога ћемо извршити увоз у Екцел преко Повер Куери додатка. Ово је потпуно бесплатан додатак са којим можете да отпремите податке у Екцел из готово било ког извора (датотеке, фасцикле, базе података, ЕРП системи) и затим трансформишете примљене податке на сваки могући начин, дајући им жељени облик.
Ако имате Екцел 2010-2013, онда можете да преузмете Повер Куери са званичне Мицрософт веб локације – након инсталације видећете картицу Повер Куери. Ако имате Екцел 2016 или новији, онда не морате ништа да преузимате – сва функционалност је већ подразумевано уграђена у Екцел и налази се на картици Датум (Датум) у групи Преузмите и претворите (Набавите и трансформишите).
Дакле, идемо или на картицу Датум, или на картици Повер Куери и изаберите тим Да бисте добили податке or Креирајте упит – из датотеке – из КСМЛ-а. Да бисте учинили видљивим не само КСМЛ датотеке, промените филтере у падајућој листи у доњем десном углу прозора у Све датотеке (Све датотеке) и наведите нашу МХТМЛ датотеку:
Имајте на уму да се увоз неће успешно завршити, јер. Повер Куери од нас очекује КСМЛ, али ми заправо имамо ХТМЛ формат. Стога, у следећем прозору који се појави, мораћете да кликнете десним тастером миша на датотеку која је неразумљива за Повер Куери и наведете њен формат:
Након тога, датотека ће бити исправно препозната и видећемо листу свих табела које садржи:
Можете погледати садржај табела кликом на леви тастер миша на белој позадини (не у речи Табела!) ћелија у колони Подаци.
Када је жељена табела дефинисана, кликните на зелену реч Табела – и „пропадате“ у њен садржај:
Остаје да урадите неколико једноставних корака да "чешљате" његов садржај, и то:
- избришите непотребне колоне (десни клик на заглавље колоне – уклонити)
- замените тачке зарезима (изаберите колоне, кликните десним тастером миша - Замена вредности)
- уклоните знаке једнакости у заглављу (изаберите колоне, кликните десним тастером миша - Замена вредности)
- уклоните горњу линију (Početna – Избриши линије – Избриши горње линије)
- уклоните празне редове (Почетна – Избриши редове – Избриши празне редове)
- подигните први ред до заглавља табеле (Почетна – Користите први ред као наслове)
- филтрирајте непотребне податке помоћу филтера
Када се табела доведе у нормалан облик, може се истоварити на лист помоћу команде затворите и преузмите (Затвори и учитај) on Главни таб. И добићемо такву лепоту са којом већ можемо да радимо:
- Трансформисање колоне у табелу помоћу Повер Куери-а
- Подела лепљивог текста у колоне