पारंपारिक प्रतिलिपी वापरून पीडीएफ फाइलमधून मजकूर काढणे नेहमीच शक्य नसते. अशा प्रकारच्या कागदपत्रांची पृष्ठे त्यांच्या कागद आवृत्त्यांचे स्कॅन केलेली सामग्री असतात. अशा फायली पूर्णपणे संपादनयोग्य मजकूर डेटामध्ये रुपांतरीत करण्यासाठी, ऑप्टिकल कॅरेक्टर रिकग्निशन (ओसीआर) फंक्शनसह विशेष प्रोग्राम वापरल्या जातात.
अशा उपाययोजना अंमलबजावणी करणे खूप कठीण आहेत आणि म्हणूनच खूप पैसे खर्च करतात. आपल्याला नियमितपणे PDF सह मजकूर ओळखण्याची आवश्यकता असल्यास, उचित प्रोग्राम खरेदी करणे उचित आहे. दुर्मिळ प्रकरणांसाठी, समान कार्यांसह उपलब्ध ऑनलाइन सेवांपैकी एक वापरण्यासाठी अधिक तार्किक असेल.
ऑनलाइन पीडीएफ वरून मजकूर कसे ओळखायचे
निश्चितच, ओसीआर ऑनलाइन सेवा वैशिष्ट्य संच संपूर्ण डेस्कटॉप सोल्यूशन्सच्या तुलनेत अधिक मर्यादित आहे. परंतु आपण अशा प्रकारच्या संसाधनांसह एकतर विनामूल्य किंवा सामान्य फीसाठी कार्य करू शकता. मुख्य गोष्ट अशी आहे की संबंधित वेब अनुप्रयोग त्यांच्या मुख्य कार्यासह अर्थात् मजकूर ओळख देखील हाताळतात.
पद्धत 1: एबीबीवाय फाइनरायडर ऑनलाइन
ऑप्टिकल कागदजत्र ओळख क्षेत्रातील नेत्यांपैकी एक सेवा विकास कंपनी आहे. विंडोज आणि मॅकसाठी ऍबीबीवाय फाइनराइडर हे पीडीएफमध्ये टेक्स्ट बदलण्यासाठी आणि त्यावर कार्य करण्यासाठी एक प्रभावी उपाय आहे.
प्रोग्रामचा वेब समतुल्य, अर्थात कार्यक्षमतेमध्ये कमी आहे. तरीही, 1 9 0 पेक्षा अधिक भाषांमध्ये स्कॅन आणि फोटोंमधील मजकूर ओळखू शकेल. दस्तऐवज, शब्द, एक्सेल इ. मध्ये पीडीएफ फाइल्सचे रूपांतर करण्यास समर्थन देते.
एबीबीवाय फाइनरायडर ऑनलाइन ऑनलाइन सेवा
- आपण साधनासह कार्य करणे प्रारंभ करण्यापूर्वी साइटवर खाते तयार करा किंवा आपले Facebook, Google किंवा Microsoft खाते वापरून लॉग इन करा.
लॉग इन विंडोवर जाण्यासाठी, बटणावर क्लिक करा. "लॉग इन" शीर्ष मेनू बारमध्ये. - एकदा लॉग इन केल्यावर, इच्छित पीडीएफ दस्तऐवज बटण वापरून FineReader मध्ये आयात करा "फायली अपलोड करा".
मग क्लिक करा "पृष्ठ क्रमांक निवडा" आणि मजकूर ओळखीसाठी इच्छित कालावधी निर्दिष्ट करा. - पुढे, दस्तऐवजात उपस्थित असलेल्या भाषा निवडा, परिणामी फाइलचे स्वरूप आणि बटणावर क्लिक करा "ओळखा".
- प्रक्रिया केल्यानंतर, कालावधी कालावधी पूर्णपणे दस्तऐवजाच्या आकारावर अवलंबून असते, आपण केवळ समाप्त केलेल्या फाईलसह त्याच्या नावावर क्लिक करुन फाइल डाउनलोड करू शकता.
किंवा उपलब्ध क्लाउड सेवांपैकी एकाला ते निर्यात करा.
या सेवेमध्ये प्रतिमा आणि पीडीएफ फाइल्समधील सर्वात अचूक मजकूर ओळख अल्गोरिदमद्वारे वेगळे केले गेले आहे. परंतु, दुर्दैवाने, विनामूल्य वापराचा दर प्रति महिना प्रक्रिया केलेल्या पाच पृष्ठांवर मर्यादित आहे. अधिक मोठ्या प्रमाणात दस्तऐवजांसह काम करण्यासाठी आपल्याला एक वर्षाची सदस्यता खरेदी करावी लागेल.
तथापि, जर ओसीआर कार्य फारच क्वचितच आवश्यक असेल तर, लहान पीडीएफ फाइल्समधून मजकूर काढण्यासाठी एबीबीवाय फाइनरायडर ऑनलाइन हा एक चांगला पर्याय आहे.
पद्धत 2: विनामूल्य ऑनलाइन ओसीआर
मजकूर डिजिटलीकरण करण्यासाठी सोपी आणि सोयीस्कर सेवा. नोंदणीची आवश्यकता न घेता, संसाधन आपल्याला प्रति तास 15 पूर्ण पीडीएफ पृष्ठे ओळखण्यास परवानगी देतो. विनामूल्य ऑनलाइन ओसीआर 46 भाषांमध्ये दस्तऐवजांसह पूर्णतः कार्य करते आणि प्राधिकृततेशिवाय तीन टेक्स्ट निर्यात स्वरूपनांचे समर्थन करते - DOCX, XLSX आणि TXT.
नोंदणी करताना वापरकर्ता बहु-पृष्ठ दस्तऐवजांवर प्रक्रिया करण्यास सक्षम असतो परंतु या पृष्ठांची विनामूल्य संख्या 50 युनिट्सपर्यंत मर्यादित आहे.
विनामूल्य ऑनलाइन ओसीआर ऑनलाइन सेवा
- "अतिथी" म्हणून पीडीएफमधील मजकूरास संसाधनाच्या अधिकृततेशिवाय मजकूर ओळखण्यासाठी साइटच्या मुख्य पृष्ठावर योग्य फॉर्म वापरा.
बटण वापरून इच्छित कागदजत्र निवडा "फाइल", मुख्य मजकूर भाषा, आउटपुट स्वरूप निर्दिष्ट करा, नंतर फाइल लोड होण्याची प्रतीक्षा करा आणि क्लिक करा "रूपांतरित करा". - डिजिटलीकरण प्रक्रियेच्या शेवटी, क्लिक करा "आउटपुट फाइल डाउनलोड करा" संगणकावरील मजकूर असलेला पूर्ण दस्तऐवज जतन करण्यासाठी.
अधिकृत वापरकर्त्यांसाठी क्रियांची क्रमवारी थोडी वेगळी आहे.
- बटण वापरा "नोंदणी" किंवा "लॉग इन" शीर्ष मेन्यू बारमध्ये अनुक्रमे एक खाते विनामूल्य ओसीआर तयार करा किंवा त्यात जा.
- ओळख पॅनेलमधील अधिकृततेनंतर, की दाबून ठेवा "सीटीआरएल", प्रदान केलेल्या यादीमधून स्त्रोत दस्तऐवजाच्या दोन भाषांपर्यंत निवडा.
- पीडीएफतून मजकूर काढण्यासाठी पुढील पर्याय निर्दिष्ट करा आणि बटणावर क्लिक करा. "फाइल निवडा" दस्तऐवजात कागदजत्र लोड करणे.
मग, ओळख सुरू करण्यासाठी, क्लिक करा "रूपांतरित करा". - दस्तऐवजावर प्रक्रिया केल्यानंतर, संबंधित स्तंभात आउटपुट फाइलच्या नावाच्या दुव्यावर क्लिक करा.
ओळख परिणाम ताबडतोब आपल्या कॉम्प्यूटरच्या मेमरीमध्ये संचयित केला जाईल.
आपल्याला एका लहान PDF दस्तऐवजामधून मजकूर काढण्याची आवश्यकता असल्यास आपण वर वर्णन केलेल्या साधनाचा वापर करुन सुरक्षितपणे निवडू शकता. मोठ्या फायलींसह कार्य करण्यासाठी, आपल्याला विनामूल्य ऑनलाइन ओसीआरमध्ये अतिरिक्त चिन्हे विकत घ्याव्या लागतील किंवा दुसर्या निराकरणाचा लाभ घ्यावा लागेल.
पद्धत 3: न्यूओसीआर
पूर्णपणे विनामूल्य ओसीआर-सेवा जी आपल्याला डीव्हीव्ही आणि पीडीएफसारख्या कोणत्याही ग्राफिक आणि इलेक्ट्रॉनिक दस्तऐवजांमधून मजकूर काढू देते. संसाधन आकार आणि ओळखण्यायोग्य फायलींची संख्या यावर प्रतिबंध लादत नाही, नोंदणीसाठी आवश्यक नसते आणि संबंधित कार्ये विस्तृत श्रेणी ऑफर करते.
न्यूओसीआर 106 भाषेस समर्थन देते आणि कमी गुणवत्तेचे दस्तऐवज स्कॅन देखील योग्यरित्या हाताळण्यास सक्षम आहे. फाइल पृष्ठावरील मजकूर ओळखण्यासाठी क्षेत्र स्वयं मॅन्युअली करणे शक्य आहे.
ऑनलाइन सेवा न्यूओसीआर
- म्हणून, आपण अनावश्यक कृती न करता त्वरित सोर्ससह कार्य करणे प्रारंभ करू शकता.
थेट मुख्य पृष्ठावर साइटवर दस्तऐवज आयात करण्यासाठी एक फॉर्म आहे. नवीन ओओसीआर फाइल अपलोड करण्यासाठी, बटण वापरा "फाइल निवडा" विभागात "आपली फाइल निवडा". मग शेतात "ओळखीची भाषा" स्त्रोत दस्तऐवजाची एक किंवा अधिक भाषा निवडा, त्यानंतर क्लिक करा "अपलोड + ओसीआर". - आपली प्राधान्य ओळख सेटिंग सेट करा, मजकूर काढण्यासाठी इच्छित पृष्ठ निवडा आणि बटण क्लिक करा. "ओसीआर".
- थोडा खाली स्क्रोल करा आणि बटण शोधा. डाउनलोड करा.
त्यावर क्लिक करा आणि ड्रॉप-डाउन सूचीमध्ये डाउनलोड करण्यासाठी आवश्यक कागदजत्र स्वरूप निवडा. त्यानंतर, काढलेल्या मजकूरासह तयार केलेली फाईल आपल्या संगणकावर डाउनलोड केली जाईल.
साधन सोयीस्कर आहे आणि पुरेसे उच्च गुणवत्तेत सर्व वर्ण ओळखते. तथापि, आयात केलेल्या PDF दस्तऐवजाच्या प्रत्येक पृष्ठाचे प्रक्रिया स्वतंत्रपणे लॉन्च करणे आवश्यक आहे आणि वेगळ्या फाइलमध्ये प्रदर्शित केले पाहिजे. आपण निश्चितपणे, ओळख परिणाम क्लिपबोर्डवर कॉपी करू आणि इतरांसह विलीन करू शकता.
तथापि, उपरोक्त नमूद केल्यानुसार, न्यूओसीआर वापरुन मोठ्या प्रमाणात मजकूर काढणे फार कठीण आहे. त्याच लहान फाइल्ससह "ताकद सह" सेवा copes.
पद्धत 4: ओसीआर. स्पेस
मजकूरास डिजिटलीकरण करण्याकरिता एक सोपा आणि समजण्यायोग्य स्त्रोत आपल्याला PDF दस्तऐवज ओळखण्यास आणि TXT फाइलमध्ये परिणाम आउटपुट करण्यास अनुमती देतो. पृष्ठांच्या संख्येवर मर्यादा नाहीत. केवळ मर्यादा ही आहे की इनपुट दस्तऐवज आकार 5 मेगाबाइट्सपेक्षा जास्त नसावे.
ओसीआर. स्पेस ऑनलाइन सेवा
- साधनासह कार्य करण्यासाठी नोंदणी करणे आवश्यक नाही.
फक्त उपरोक्त दुव्यावर क्लिक करा आणि बटण वापरून आपल्या संगणकावरील वेबसाइटवर PDF दस्तऐवज अपलोड करा "फाइल निवडा" किंवा नेटवर्कमधून - संदर्भानुसार. - ड्रॉपडाउन यादीमध्ये "ओसीआर भाषा निवडा" आयात केलेल्या दस्तऐवजाची भाषा निवडा.
नंतर बटण क्लिक करून मजकूर ओळख प्रक्रिया सुरू करा. "ओसीआर सुरू करा!". - फाइल प्रोसेसिंगच्या शेवटी परिणाम पहा "ओसीआर परिणाम" आणि क्लिक करा डाउनलोड करासमाप्त TXT दस्तऐवज डाउनलोड करण्यासाठी.
जर आपल्याला फक्त पीडीएफमधून मजकूर काढायचा असेल आणि अंतिम स्वरूपन महत्वाचे नाही तर, ओसीआर. स्पेस ही चांगली निवड आहे. केवळ एकाच डॉक्युमेंटमध्ये "मोनोलिंग्युअल" असणे आवश्यक आहे, कारण सेवेमध्ये एकाच वेळी दोन किंवा अधिक भाषांचे ओळख प्रदान केले जात नाही.
हे सुद्धा पहाः फ्री अॅनालॉग्स फाइनरायडर
लेखात सादर केलेल्या ऑनलाइन साधनांचे मूल्यांकन करणे, हे लक्षात घेतले पाहिजे की ABBYY कडून FineReader ऑनलाइन ओसीआर फंक्शनला अचूक आणि अचूकपणे हाताळते. आपल्यासाठी मजकूर ओळखण्याची जास्तीत जास्त अचूकता महत्त्वपूर्ण असल्यास, हा पर्याय विशेषतः विचार करणे सर्वोत्तम आहे. पण त्यासाठी पैसे द्यावे लागतात, बहुतेकदा देखील.
जर आपल्याला लहान दस्तऐवज अंकेक्षण करण्याची आवश्यकता असेल आणि आपण सेवेमध्ये त्रुटी सुधारण्यासाठी तयार असाल तर, न्यूओसीआर, ओसीआर स्पेस किंवा विनामूल्य ऑनलाइन ओसीआर वापरण्याची शिफारस केली जाते.