You signed in with another tab or window. Reload to refresh your session.You signed out in another tab or window. Reload to refresh your session.You switched accounts on another tab or window. Reload to refresh your session.Dismiss alert
Hi! I am trying to read a cyrillic file with pdfparser, but text is quite different than what you see, when you copy from Adobe Acrobat.
Why is that? What can I do to get better result with pdfparser?
Thanks in advance!
The text was updated successfully, but these errors were encountered:
PR #634 should rectify this issue. The output of getText() from the current v2.7.0 performed on F1.pdf is:
ФактураФактуН омер: 0 0 0 0 0 0 1 2 7 2
Д а та : 3 0 . 1 1 . 2 0 1 8ФактурНоме:0127ДД3е .88ФФФК динвсвс73сДв2/лгтМ двсвс73сДвячу/КаЦоС0/члкъ5М е9лкучу4оСе д%зп8щТелефонРадослав ПетковПолучателТЕХНОМАШПРОГРЕС - ООДФФК дBG0400314272/лгтМ д040031427ячу/СОФИЯ0/члкул. Тодорини кукли №4п8щТелефондКодНаименование на стоката/услугатаМяркаКоличествоЦенаСума7344ум5уру4чМз1.6668.33в32крем карамел4чМ7с1.41614.16330мляко с ориз4чМ7с7Мссс7сМсс336мини карамел4чМзсМ%Д73.96зчийзкейк4чМз7Мс3взМв767%геврек4чМзсМ%зс3.75%7моЦ5оНмо4чМ7в1.16773МссДанъчна основа: 59.41ДДС 20%: 11.88Сума за плащане: 71.29Словом: Седемдесет и един лв. и 29 ст.Дата на данъчно събитие: 30.11.2018Основание на сделката:Описание на сделката:Място на сделката: СофияПлащане: По сметкаIBAN: BG21FINV91501017032817Банка: FiBankБанков код:Доставсчик"РАВвсч ИА1о"сАВ Д9Р4оВДЕоОЕАС9№ BЕо1т4Р G20де2н.Грф ян.е20Г удел Р9сБб775МЛТТЛбТл П фф Х 5 5НННБШ20де2н.ГрфБнГф1
... while the output of getText() from the updated PR code is:
Фактура
Копие Н омер: 0 0 0 0 0 0 1 2 7 2
Д а та : 3 0 . 1 1 . 2 0 1 8
Доставчик"РАВИ1994" ЕООД
ДДС № BG202014092
Идент. №202014092
Град София
Адрес ул. "Бесарабия" №75
МОЛ
Телефон
Радослав Петков
ПолучателТЕХНОМАШПРОГРЕС - ООД
ДДС № BG040031427
Идент. №040031427
Град СОФИЯ
Адрес ул. Тодорини кукли №4
МОЛ
Телефон
№ Код Наименование на стоката/услугатаМярка Количество Цена Сума
134 баклава бр. 5 1.666 8.33
232 крем карамел бр. 1 0 1.416 14.16
330 мляко с ориз бр. 1 0 1.000 10.00
4 3 6 мини карамел бр . 5 0.791 3.96
5 чийзкейк бр. 5 1.042 5.21
6 1 7 геврек бр. 5 0.750 3.75
7 1 кифлички бр. 1 2 1.167 14.00
Данъчна основа: 59.41
ДДС 20%: 11.88
Сума за плащане: 71.29
Словом: Седемдесет и един лв. и 29 ст.
Дата на данъчно събитие: 30.11.2018
Основание на сделката:
Описание на сделката:
Място на сделката: София
Плащане: По сметка
IBAN: BG21FINV91501017032817
Банка: FiBank
Банков код:
Получил: Съставил: Радослав Петков
Програмен продукт Microinvest Invoice Pro, тел.088/1344304, h tt p / /www.microinvest.net 1
F1.pdf
Hi! I am trying to read a cyrillic file with pdfparser, but text is quite different than what you see, when you copy from Adobe Acrobat.
Why is that? What can I do to get better result with pdfparser?
Thanks in advance!
The text was updated successfully, but these errors were encountered: