ब्लॉगच्या सर्व वाचकांना शुभेच्छा!
मला वाटते की जे लोक संगणकावर काम करतात (खेळत नाहीत, परंतु ते कार्य करतात), त्यांना मजकूर ओळखणे आवश्यक होते. ठीक आहे, उदाहरणार्थ, आपण पुस्तकातून एक उतारा स्कॅन केला आणि आता आपल्याला हा भाग आपल्या दस्तऐवजामध्ये पेस्ट करणे आवश्यक आहे. परंतु स्कॅन केलेले कागदपत्र एक चित्र आहे आणि आम्हाला मजकूर पाहिजे आहे - यासाठी आम्हाला चित्रांकडील मजकूर ओळखण्यासाठी विशेष प्रोग्राम आणि ऑनलाइन सेवा आवश्यक आहेत.
मान्यताप्राप्त प्रोग्रामबद्दल मी आधीपासूनच मागील पोस्टमध्ये लिहिले आहे:
- FineReader (सशुल्क प्रोग्राम) मधील मजकूर आणि ओळख स्कॅन करा;
- अॅनालॉग फिनरायडरमध्ये कार्य - कुनेफॉर्म (विनामूल्य प्रोग्राम).
त्याच लेखात मी मजकूर ओळखण्यासाठी ऑनलाइन सेवांवर लक्ष केंद्रित करू इच्छितो. शेवटी, आपल्याला 1-2 चित्रांसह मजकूर त्वरीत मिळवण्याची आवश्यकता असल्यास - विविध प्रोग्राम स्थापित करण्यास त्रास होत नाही ...
हे महत्वाचे आहे! ओळखण्याची गुणवत्ता (त्रुटींची संख्या, वाचनीयता, इ.) मूळ प्रतिमा गुणवत्तेवर अवलंबून असते. म्हणून, स्कॅनिंग (छायाचित्रण इ.) स्कॅन करताना, शक्य तितक्या उच्च गुणवत्तेची निवड करा. बहुतेक बाबतीत, 300-400 डीपीआयची गुणवत्ता पुरेशी असेल (डीपीआय हे चित्र गुणवत्तेचे वैशिष्ट्य असलेले घटक आहे. जवळजवळ सर्व स्कॅनर्सच्या सेटिंग्जमध्ये, हे पॅरामीटर्स सामान्यत: सूचित केले जाते).
ऑनलाइन सेवा
सेवांचे काम दर्शविण्यासाठी, मी माझ्या लेखातील एक स्क्रीनशॉट बनविला. हा स्क्रीनशॉट सर्व सेवांवर अपलोड केला जाईल, ज्याचे वर्णन खाली दिले आहे.
1) //www.ocrconvert.com/
मला साधेपणामुळे खरोखर ही सेवा आवडते. जरी साइट इंग्रजी आहे, तरीही ते रशियन भाषेसह देखील चांगले कार्य करते. आपल्याला नोंदणी करण्याची आवश्यकता नाही. ओळख सुरू करण्यासाठी आपल्याला 3 चरणांची आवश्यकता आहे:
- तुमची प्रतिमा अपलोड करा;
- मजकूर मध्ये असलेल्या मजकूराची भाषा निवडा;
- प्रारंभ ओळख बटण दाबा.
स्वरूप समर्थनः पीडीएफ, जीआयएफ, बीएमपी, जेपीईजी.
परिणाम चित्रात खाली दर्शविले आहे. मला असे म्हणायचे आहे की मजकूर योग्यरित्या ओळखला जातो. याव्यतिरिक्त, खूप त्वरीत - मी अक्षरशः 5-10 सेकंद प्रतीक्षा केली.
2) //www.i2ocr.com/
ही सेवा उपरोक्त प्रमाणेच कार्य करते. येथे आपल्याला फाइल डाउनलोड करण्याची, ओळख भाषा निवडण्याची आणि उतारा मजकूर बटण क्लिक करण्याची देखील आवश्यकता आहे. ही सेवा खूप त्वरीत कार्य करते: 5-6 सेकंद. एक पृष्ठ
समर्थित स्वरूपः टीआयएफ, जेपीईजी, पीएनजी, बीएमपी, जीआयएफ, पीबीएम, पीजीएम, पीपीएम.
या ऑनलाइन सेवेचा परिणाम अधिक सोयीस्कर आहे: आपण दोन विंडो ताबडतोब पाहू शकता - पहिल्यांदा ओळखल्या जाणार्या परिणामात, दुसर्यात - मूळ प्रतिमा. म्हणून, संपादनाच्या संपादनास संपादन करणे सोपे आहे. सेवेद्वारे नोंदणी करा, देखील आवश्यक नाही.
3) //www.newocr.com/
ही सेवा अनेक प्रकारे अद्वितीय आहे. प्रथम, ते "नवीन-शैलीचे" स्वरूप डीजेव्हीयू (वस्तुनिष्ठ स्वरूपांची संपूर्ण यादी: जेपीईजी, पीएनजी, जीआयएफ, बीएमपी, टीआयएफएफ, पीडीएफ, डीजेव्ही) चे समर्थन करते. दुसरे म्हणजे, ते चित्रातील मजकूर क्षेत्रांच्या निवडीस समर्थन देते. जेव्हा आपल्याकडे चित्रात केवळ मजकूर क्षेत्र नसतात तेव्हा आपल्याला हे उपयुक्त आहे, परंतु आपल्याला ग्राफिक नसलेले देखील ओळखणे आवश्यक आहे.
ओळख गुणवत्ता सरासरीपेक्षा जास्त आहे, नोंदणी करण्याची आवश्यकता नाही.
4) //www.free-ocr.com/
ओळखीसाठी एक अत्यंत सोपी सेवा: एक प्रतिमा अपलोड करा, भाषा निर्दिष्ट करा, कॅप्चा प्रविष्ट करा (वस्तुतः, या लेखातील केवळ एक सेवा जेथे आपल्याला ते करणे आवश्यक आहे), आणि प्रतिमेमध्ये टेक्स्टचे भाषांतर करण्यासाठी बटण दाबा. प्रत्यक्षात सर्वकाही!
समर्थित स्वरूपः पीडीएफ, जेपीजी, जीआयएफ, टीआयएफएफ, बीएमपी.
ओळख परिणाम मध्यम आहे. चुका आहेत, परंतु अनेक नाहीत. तथापि, मूळ स्क्रीनशॉटची गुणवत्ता अधिक असेल तर, कमी प्रमाणात त्रुटी कमी होईल.
पीएस
आज सर्व आहे. मजकूर ओळखीसाठी आपल्याला अधिक रूचीपूर्ण सेवा माहित असल्यास - टिप्पण्यांमध्ये सहभागी व्हा, मी आभारी आहे. एक अट: नोंदणी करणे आवश्यक नाही आणि सेवा विनामूल्य होती हे वांछनीय आहे.
शुभेच्छा!