मजकूर ओळख. विनामूल्य कार्यक्रम - अॅनालॉग फाइनरायडर

लवकरच किंवा नंतर, सर्वसाधारणपणे ऑफिस प्रोग्राम्ससह कार्य करणार्या सर्वसाधारण कामास तोंड द्यावे लागते - पुस्तक, मासिक, वृत्तपत्र, सरळ पत्रके यांचे मजकूर स्कॅन करा आणि नंतर या चित्रांना मजकूर स्वरूपनात अनुवादित करा, उदाहरणार्थ, शब्द दस्तऐवजात.

हे करण्यासाठी आपल्याला मजकूर ओळखण्यासाठी स्कॅनर आणि एक विशेष प्रोग्राम आवश्यक आहे. हा लेख FineReader च्या विनामूल्य अॅनालॉगवर चर्चा करेल -क्यूनिफॉर्म (FineReader मध्ये मान्यता बद्दल - हा लेख पहा).

चला प्रारंभ करूया ...

सामग्री

  • 1. कुनेईफॉर्म प्रोग्रामची वैशिष्टये
  • 2. मजकूर ओळखण्याची एक उदाहरण
  • 3. बॅच मजकूर ओळख
  • 4. निष्कर्ष

1. कुनेईफॉर्म प्रोग्रामची वैशिष्टये

क्यूनिफॉर्म

आपण विकसकांच्या साइटवरुन डाउनलोड करू शकता: //cognitiveforms.com/

मुक्त स्त्रोत मजकूर ओळख सॉफ्टवेअर. याव्यतिरिक्त, हे विंडोजच्या सर्व आवृत्त्यांमध्ये कार्य करते: एक्सपी, व्हिस्टा, 7, 8, जो आनंदित करतो. तसेच, कार्यक्रमाचे संपूर्ण रशियन भाषांतर जोडा!

गुणः

- जगातील 20 सर्वात लोकप्रिय भाषांमध्ये मजकूर ओळखणे (इंग्रजी आणि रशियन या नंबरमध्ये समाविष्ट आहे);

- विविध प्रिंट फॉन्टसाठी प्रचंड समर्थन;

- शब्दकोष मान्यताप्राप्त मजकूर तपासा;

- कामाच्या परिणाम अनेक मार्गांनी जतन करण्याची क्षमता;

- कागदपत्रांची रचना राखणे;

उत्कृष्ट समर्थन आणि ओळखपत्रे.

बनावट

- खूप मोठ्या दस्तऐवज आणि फाइल्स (400 डीपीआय पेक्षा अधिक) यांना समर्थन देत नाही;

- काही प्रकारच्या स्कॅनर्सला थेट समर्थन देत नाही (तसेच, हे डरावना नाही, स्कॅनर ड्राइव्हर्ससह एक विशेष स्कॅनर समाविष्ट आहे);

- डिझाइन चमकत नाही (परंतु प्रोग्रामला पूर्णपणे समस्या सोडल्यास त्यास कोण आवश्यक आहे).

2. मजकूर ओळखण्याची एक उदाहरण

आम्ही मानतो की आपल्याला ओळखीसाठी आवश्यक चित्रे आधीच मिळाली आहेत (तेथे स्कॅन केले आहे किंवा इंटरनेटवर पीडीएफ / डीजेव्हीओ स्वरूपात पुस्तक डाउनलोड केले आहे आणि त्यांच्याकडून आवश्यक चित्रे मिळविली आहेत. हे कसे करावे - हा लेख पहा).

1) आवश्यक प्रतिमा CuineForm प्रोग्राममध्ये उघडा (फाइल / उघडा किंवा "Cntrl + O").

2) मान्यता ओळखण्यासाठी - आपण प्रथम विविध क्षेत्रे निवडणे आवश्यक आहेः मजकूर, चित्रे, सारण्या इत्यादि. क्यूनिफॉर्म प्रोग्राममध्ये, हे केवळ व्यक्तिचलितपणे केले जाऊ शकत नाही तर स्वयंचलितपणे! हे करण्यासाठी, विंडोच्या शीर्ष पटाच्या "मार्कअप" बटणावर क्लिक करा.

3) 10-15 सेकंदांनंतर. प्रोग्राम विविध रंगांसह सर्व क्षेत्रे स्वयंचलितपणे हायलाइट करेल. उदाहरणार्थ, निळ्या रंगात एक मजकूर क्षेत्र हायलाइट केला जातो. तसे, तिने सर्व क्षेत्रे योग्यरित्या आणि त्वरीत त्वरित ठळक केले. प्रामाणिकपणे, मी तिच्याकडून त्वरित आणि अचूक प्रतिसाद अपेक्षित नव्हतो ...

4) स्वयंचलित मार्कअपवर विश्वास ठेवणाऱ्यांसाठी आपण मॅन्युअल वापरू शकता. यासाठी एक टूलबार आहे (खाली चित्र पहा), धन्यवाद ज्याचा आपण निवड करू शकता: मजकूर, सारणी, चित्र. प्रारंभ करा, प्रारंभिक प्रतिमा वाढवा / कमी करा, किनारी ट्रिम करा. सर्वसाधारणपणे, एक चांगला संच.

5) सर्व क्षेत्रे चिन्हांकित केल्यानंतर, आपण पुढे जाऊ शकता ओळख. हे करण्यासाठी, खाली दिलेल्या प्रतिमेप्रमाणेच, समान नावाच्या बटणावर क्लिक करा.

6) अक्षरशः 10-20 सेकंदात. आपल्याला ज्ञात मजकुरासह मायक्रोसॉफ्ट वर्डमध्ये एक दस्तऐवज दिसेल. या उदाहरणासाठीच्या मजकुरात, मनोरंजक काय आहे, अर्थातच चुका होत्या, परंतु त्यापैकी बरेच कमी आहेत! विशेषत :, मूळ सामग्री किती साधी होती - चित्र.

वेगवान आणि वेगवान फिइनरायडरशी तुलना करता येते!

3. बॅच मजकूर ओळख

जेव्हा आपल्याला एक चित्र ओळखण्याची गरज नसते तेव्हा प्रोग्रामचा हा कार्य सुलभ होऊ शकतो, परंतु बर्याच वेळा. बॅच ओळखणे लॉन्च करण्यासाठी शॉर्टकट सहसा प्रारंभ मेनूमध्ये लपविला जातो.

1) प्रोग्राम उघडल्यानंतर, आपल्याला नवीन पॅकेज तयार करणे आवश्यक आहे किंवा पूर्वी जतन केलेले एखादे उघडे करणे आवश्यक आहे. आमच्या उदाहरणामध्ये - एक नवीन तयार करा.

2) पुढच्या पायरीमध्ये आम्ही ते नाव देऊ, प्राधान्यकरुन असे की सहा महिने नंतर आपण त्यात काय साठवले आहे ते लक्षात ठेवू.

3) पुढे, कागदजत्र भाषा (रशियन-इंग्रजी) निवडा, आपल्या स्कॅन केलेल्या सामग्रीमध्ये चित्रे आणि सारण्या आहेत का हे सूचित करा.

4) आता आपल्याला फोल्डर निर्दिष्ट करणे आवश्यक आहे ज्यामध्ये ओळखण्यासाठी फायली स्थित आहेत. तसे, मनोरंजक काय आहे की प्रोग्रामला सर्व चित्रे आणि इतर ग्राफिक फाइल्स सापडतील जी ओळखतील आणि त्यांना प्रकल्पात जोडतील. आपण अतिरिक्त काढण्याची गरज आहे.

5) पुढील चरण महत्वाचे नाही - ओळखल्यानंतर स्त्रोत फायलींसह काय करावे ते निवडा. मी "काहीही करू नका" चेकबॉक्स निवडण्याची शिफारस करतो.

6) हाच फॉर्म निवडला जातो ज्यामध्ये मान्यताप्राप्त दस्तऐवज जतन केला जाईल. अनेक पर्याय आहेत:

- आरटीएफ - शब्द दस्तऐवजातील फाइल सर्व लोकप्रिय कार्यालयांद्वारे उघडली जाते (विनामूल्यसह, प्रोग्राम्सचा दुवा);

- txt - मजकूर स्वरूप, आपण त्यात केवळ मजकूर, चित्रे आणि सारण्या जतन करू शकता;

- एचटीएम - हायपरटेक्स्ट पृष्ठ, साइटसाठी फायली स्कॅन आणि ओळखल्यास सोयीस्कर. त्याचा आणि आमच्या उदाहरणामध्ये निवडा.

7) "समाप्त" बटण क्लिक केल्यानंतर आपल्या प्रोजेक्टची प्रक्रिया सुरू होईल.

8) कार्यक्रम खूप लवकर कार्य करते. ओळख केल्यानंतर, आपल्याला एचटीएम फायलींसह एक टॅब दिसेल. जर आपण अशा फाईलवर क्लिक केले तर, ब्राउझर उघडेल जिथे आपण परिणाम पाहू शकता. तसे, पॅकेज पुढील कामासाठी जतन केले जाऊ शकते.

9) आपण पाहू शकता परिणाम काम अतिशय प्रभावी आहे. प्रोग्रामने चित्र सहज ओळखले आणि त्याखाली असलेले मजकूर सहज ओळखले. कार्यक्रम विनामूल्य आहे, तो सामान्यपणे सुपर आहे!

4. निष्कर्ष

आपण बर्याचदा स्कॅन करू शकत नाही आणि कागदजत्र ओळखत नसल्यास, FineReader खरेदी करणे कदाचित समजत नाही. CuneiForm बहुतांश कार्ये सहज हाताळते.

दुसरीकडे, तिला देखील तोटे आहेत.

प्रथम, परिणामी परिणामाचे संपादन आणि तपासणीसाठी बरेच काही साधने आहेत. दुसरी गोष्ट म्हणजे, जेव्हा आपल्याला बर्याच चित्रांची ओळख पटवावी लागते, तेव्हा फाइनराइडरमध्ये उजवीकडे उजवीकडे कॉलममध्ये प्रोजेक्टमध्ये जोडलेली प्रत्येक गोष्ट त्वरित पहाणे सुलभ होते: त्वरित अनावश्यक काढा, संपादने करा इत्यादि. आणि तिसरे, अगदी खराब गुणवत्तेच्या कागदजत्रांवर, कुनेईफॉर्मने ओळख कमी केली: आपल्याला कागदजत्र मनात आणणे आवश्यक आहे - अचूक चुका, विरामचिन्हे, कोट्स वगैरे.

हे सर्व आहे. आपल्याला इतर कोणत्याही सभ्य मुक्त मजकूर ओळख सॉफ्टवेअर माहित आहे?

व्हिडिओ पहा: बदनमकरक मजकर टकणऱय वनद थरतल भजप मतरयच अभय, अनल गटच आरप (एप्रिल 2024).