नियम म्हणून, स्कॅन केलेले मजकूर (ओसीआर, ऑप्टिकल कॅरेक्टर रिकॉग्नाइजेशन) ओळखण्यासाठी प्रोग्राम्ससाठी जेव्हा बहुतेक वापरकर्त्यांना फक्त एबीबीवाय फाइनरायडर लक्षात येते, जे निःसंशयपणे रशियामधील अशा सॉफ्टवेअर आणि जगातील नेत्यांपैकी एक आहे.
तरीही, FineReader हा या प्रकारचा एकमात्र उपाय नाहीः मजकूर ओळखण्यासाठी विनामूल्य प्रोग्राम आहेत, समान उद्देशांसाठी ऑनलाइन सेवा आणि याशिवाय, काही कार्ये अशा परिचित प्रोग्राममध्ये देखील आहेत जे कदाचित आपल्या संगणकावर स्थापित केले जाऊ शकतात . मी या लेखात याबद्दल लिहिण्याचा प्रयत्न करू. सर्व मानले जाणारे प्रोग्राम विंडोज 7, 8 व एक्सपीमध्ये काम करतात.
टेक्स्ट रिकग्निशन लीडर - एबीबीवाय फाइनरेडर
FineReader (फन रीडर म्हणून उच्चारलेले) बद्दल, कदाचित आपल्यापैकी बहुतेक. हा प्रोग्राम रशियन भाषेत उच्च-गुणवत्तेचा मजकूर ओळखण्यासाठी सर्वोत्तम आहे किंवा सर्वोत्तम आहे. कार्यक्रम भरला आहे आणि घरगुती वापरासाठी परवाना किंमत 2000 रूबलांपेक्षा किंचित कमी आहे. FineReader ची चाचणी आवृत्ती डाउनलोड करणे किंवा एबीबीवाय फाइन रीडर ऑनलाइनमध्ये ऑनलाइन मजकूर ओळखणे वापरणे देखील शक्य आहे (आपण अनेक पृष्ठे विनामूल्य, नंतर - फीसाठी ओळखू शकता). हे सर्व अधिकृत विकसक साइट //www.abbyy.ru वर उपलब्ध आहे.
FineReader ची चाचणी आवृत्ती स्थापित केल्यामुळे कोणतीही समस्या उद्भवली नाही. ओळख पटवणे सोपे व्हावे यासाठी सॉफ्टवेअर मायक्रोसॉफ्ट ऑफिस आणि विंडोज एक्सप्लोररसह समाकलित करू शकते. विनामूल्य चाचणी आवृत्तीच्या मर्यादांपैकी - 15 दिवसांचा वापर आणि 50 पृष्ठांपेक्षा अधिक ओळखण्याची क्षमता.
ओळख सॉफ्टवेअर चाचणीसाठी स्क्रीनशॉट
माझ्याकडे स्कॅनर नसल्यामुळे, मी फोनच्या निम्न-गुणवत्तेच्या कॅमेरावरून स्नॅपशॉट वापरला, ज्यात मी तपासण्यासाठी थोडासा कॉन्ट्रास्ट संपादित केला. गुणवत्ता चांगली नाही, चला कोण पाहू शकते ते पाहू या.
मेनू फाइनरायडर
फाइनराइडरला ग्राफिक फायली किंवा कॅमेर्यामधून, स्कॅनरवरून थेट मजकूराची ग्राफिक प्रतिमा मिळू शकेल. माझ्या बाबतीत, प्रतिमा फाइल उघडण्यासाठी पुरेसे होते. परिणामांमुळे मला खूप आनंद झाला - फक्त काही चुका. मी हे सांगेन की या नमुनासह कार्य करताना सर्व चाचणी केलेल्या प्रोग्रामचा हा सर्वोत्तम परिणाम आहे - समान ओळख गुणवत्ता केवळ विनामूल्य ऑनलाइन सेवा विनामूल्य ऑनलाइन ओसीआरवर होती (परंतु या पुनरावलोकनात आम्ही केवळ सॉफ्टवेअरविषयी बोलत आहोत, ऑनलाइन ओळख नाही).
FineReader मधील मजकूर ओळख परिणाम
खरंच, फिनीरायडरला कदाचित सिरीलिक ग्रंथांकरिता कोणतेही प्रतिस्पर्धी नाहीत. प्रोग्रामचे फायदे केवळ मजकूर ओळखण्याची गुणवत्ताच नाही तर विस्तृत कार्यक्षमता, स्वरूपन समर्थन, अनेक स्वरूपनांमध्ये सक्षम निर्यात, डॉकक्स, पीडीएफ आणि इतर वैशिष्ट्यांसह सक्षम आहेत. अशा प्रकारे, जर ओसीआर कार्य आपणास सतत आढळत असेल तर थोड्या प्रमाणात पैशांची अफसोस करु नका आणि ते पैसे भरतील: आपण मोठ्या प्रमाणावर वेळ वाचवू शकता आणि फाइनरायडरमध्ये गुणवत्ता लवकर मिळवू शकता. तसे, मी काहीही जाहिरात देत नाही - मला खरंच वाटतं की ज्यांनी एका डझनपेक्षा जास्त पानाची ओळख पटवायची आहे अशा सॉफ्टवेअर विकत घेण्याचा विचार करावा.
CuneiForm एक विनामूल्य मजकूर ओळख प्रोग्राम आहे.
माझ्या अंदाजानुसार, रशियामधील दुसरा सर्वात लोकप्रिय ओसीआर प्रोग्राम विनामूल्य क्यूनिफॉर्म आहे, जो अधिकृत साइट //cognitiveforms.ru/products/cuneiform/ वरून डाउनलोड केला जाऊ शकतो.
प्रोग्राम स्थापित करणे अगदी सोपे आहे, ते कोणत्याही तृतीय-पक्ष सॉफ्टवेअर (बरेच विनामूल्य सॉफ्टवेअरसारखे) स्थापित करण्याचा प्रयत्न करीत नाही. इंटरफेस संक्षिप्त आणि स्पष्ट आहे. काही प्रकरणांमध्ये, विझार्ड वापरण्याचा सर्वात सोपा मार्ग, जो मेनूमधील प्रथम चिन्ह आहे.
मी FineReader मध्ये वापरलेल्या नमुनासह, प्रोग्रामने सामना केला नाही किंवा अधिक अचूकपणे, काहीतरी चुकीचे वाचनीय आणि शब्दाचे तुकडे दिले. दुसरा प्रोग्राम या प्रोग्रामच्या साइटवरून मजकूरचा स्क्रीनशॉट तयार करण्यात आला होता, परंतु, त्याला वाढवायचे होते (यास 200 डीपीआय आणि उच्चतम रिझोल्यूशनसह स्कॅनची आवश्यकता होती, तो 1-2 पिक्सेलच्या फॉन्ट लाइन रूंदीसह स्क्रीनशॉट वाचत नाही). येथे तिने चांगली कामगिरी केली (काही मजकूर ओळखले गेले नाही कारण फक्त रशियन निवडले गेले होते).
CuneiForm मजकूर ओळख
अशा प्रकारे, आम्ही असे मानू शकतो की कुनेइफॉर्म हे आपण प्रयत्न केले पाहिजे, विशेषतः आपल्याकडे उच्च-गुणवत्तेचे स्कॅन केलेले पृष्ठ आहेत आणि आपण त्यांना विनामूल्य ओळखू इच्छित आहात.
मायक्रोसॉफ्ट वनोट - आपल्याकडे आधीपासूनच असा प्रोग्राम आहे
मायक्रोसॉफ्ट ऑफिसमध्ये, आवृत्ती 2007 पासून सुरू होऊन वर्तमान 2013 पर्यंत संपत आहे, नोट्स घेण्याकरिता एक कार्यक्रम आहे - वन नोट. यात मजकूर ओळख वैशिष्ट्ये देखील आहेत. ते वापरण्यासाठी स्कॅन किंवा इतर कोणत्याही मजकूर प्रतिमेला नोटमध्ये पेस्ट करा, त्यावर उजवे-क्लिक करा आणि संदर्भ मेनू वापरा. मी लक्षात ठेवतो की ओळखण्यासाठी डिफॉल्ट डीफॉल्टवर सेट केले आहे.
मायक्रोसॉफ्ट वन नोट मध्ये ओळख
मी असे म्हणू शकत नाही की मजकूर पूर्णपणे ओळखला गेला आहे, परंतु, जोपर्यंत मी सांगू शकतो, तो कुनेईफॉर्मपेक्षा किंचितच चांगला आहे. प्लस प्रोग्राम, आधीपासूनच नमूद केलेला आहे की, बर्याच संभाव्यतेसह ते आपल्या संगणकावर आधीपासूनच स्थापित केलेले आहे. मोठ्या संख्येने स्कॅन केलेल्या दस्तऐवजांसह कार्य करण्याची आवश्यकता असल्यास त्याचा वापर सोयीस्कर असू शकत नाही परंतु, व्यवसाय कार्ड्स त्वरित ओळखण्यासाठी योग्य आहे.
ओमनीपेज अल्टीमेट, ओमनीपेज 18 - काहीतरी मस्त असले पाहिजे
OmniPage मजकूर ओळख सॉफ्टवेअर किती चांगले आहे हे मला माहिती नाही: तेथे कोणतेही चाचणी आवृत्त्या नाहीत, मला ती कुठेतरी डाउनलोड करायची नाही. परंतु, जर किंमत निश्चित केली गेली असेल तर याच्या वापरासाठी 5,000 हून अधिक रबल्सचा खर्च वैयक्तिक वापरासाठी केला जाईल आणि अल्टीमेट नसेल तर हा काहीतरी प्रभावी असावा. कार्यक्रम पृष्ठ: //www.nuance.com/for-individuals/by-product/omnipage/index.htm
OmniPage सॉफ्टवेअर किंमत
आपण रशियन-भाषेच्या प्रकाशनांसह वैशिष्ट्ये आणि पुनरावलोकने वाचल्यास, ते लक्षात ठेवतात की रशियन भाषेत ओमनीपेज खरोखर उच्च-गुणवत्तेचे आणि अचूक ओळख प्रदान करते, उच्च-गुणवत्तेच्या स्कॅनस न जोडणे तुलनेने सोपे आहे आणि अतिरिक्त साधनांचा संच प्रदान करते. कमतरतांपैकी, हे सर्वात सोयीस्कर नाही, खासकरुन नवख्या वापरकर्त्यासाठी, इंटरफेससाठी. असं असले तरी, पाश्चात्य बाजारपेठ ओमनीपेज हे FineReader चे थेट प्रतिस्पर्धी आहे आणि इंग्रजी-भाषेच्या रेटिंगमध्ये ते स्वत: बरोबर लढत आहेत, आणि म्हणूनच मला वाटतं, कार्यक्रम योग्य असेल.
हे सर्व प्रकारचे कार्यक्रम नाहीत, लहान विनामूल्य प्रोग्रामसाठी अनेक पर्याय आहेत, परंतु त्यांच्यासह प्रयोग करताना मला त्यांच्यातील मूळ मुख्य हानी आढळली: सिरीलिक सपोर्टचा अभाव, किंवा वेगळा, स्थापना किटमध्ये खूप उपयुक्त सॉफ्टवेअर नाही आणि म्हणूनच त्यांचा उल्लेख न करण्याचे ठरविले येथे