Internet

OCR की फुल फॉर्म क्या है? पूरी जानकारी हिंदी में…

OCR in Hindi

OCR क्या है? OCR एक ऐसी technology है जिसका इस्तमाल एक digital image में text recognize (पहचानने) के लिए किया जाता है

Advertisement

क्या आप कभी किसी दोस्त की लिखावट को पढ़ने के लिए संघर्ष करते हैं? अपने आप को भाग्यशाली समझें, कि आप India डाक सेवा के लिए काम नहीं कर रहे हैं, जिसे हर दिन 30 मिलियन हस्तलिखित लिफाफे को डिकोड करना और वितरित करना है! हमारे जीवन के बहुत से कम्प्यूटरीकृत होने के साथ, यह महत्वपूर्ण रूप से महत्वपूर्ण है कि मशीनें और मनुष्य एक दूसरे को समझ सकते हैं और जानकारी को आगे-पीछे कर सकते हैं।

Advertisement

अधिकतर कंप्यूटरों में चीजें होती हैं- हमें अपेक्षाकृत कच्चे उपकरणों जैसे कीबोर्ड और माउस के माध्यम से उनसे “बात” करनी होती है ताकि वे यह पता लगा सकें कि हम उन्हें क्या करना चाहते हैं। लेकिन जब अधिक मानवीय प्रकार की सूचनाओं को संसाधित करने की बात आती है, जैसे एक पुराने जमाने की मुद्रित पुस्तक या एक फाउंटेन पेन के साथ लिखा हुआ पत्र, तो कंप्यूटर को बहुत कठिन काम करना पड़ता है। जहां ऑप्टिकल कैरेक्टर रिकग्निशन (ओसीआर) आता है। यह एक प्रकार का सॉफ्टवेयर (प्रोग्राम) है जो स्वचालित रूप से मुद्रित पाठ का विश्लेषण कर सकता है और इसे एक ऐसे रूप में बदल देता है जिससे कंप्यूटर अधिक आसानी से प्रक्रिया कर सकता है। OCR सेलफ़ोन पर लिखावट विश्लेषण कार्यक्रमों से लेकर विशाल मेल-सॉर्टिंग मशीनों तक सब कुछ के दिल में है जो यह सुनिश्चित करता है कि उन सभी लाखों पत्र अपने गंतव्यों तक पहुँचें। वह कितना सटीक काम करता है? आओ हम इसे नज़दीक से देखें!

OCR क्या है?

OCR की फुल फॉर्म “Optical Character Recognition” होती है। जैसे ही आप अपने कंप्यूटर स्क्रीन पर इन शब्दों को पढ़ते हैं, आपकी आंखें और मस्तिष्क बिना किसी सूचना के ऑप्टिकल कैरेक्टर रिकॉग्निशन करते हैं! आपकी आंखें प्रकाश और अंधेरे के पैटर्न को पहचान रही हैं जो स्क्रीन पर छपे अक्षरों (अक्षरों, संख्याओं, और विराम चिह्नों जैसी चीजों) को बनाते हैं और आपका मस्तिष्क उन लोगों का उपयोग कर रहा है जो यह जानने की कोशिश कर रहे हैं कि मैं क्या कह रहा हूं (कभी-कभी पढ़कर अलग-अलग वर्ण लेकिन अधिकतर संपूर्ण शब्दों और शब्दों के संपूर्ण समूहों को एक साथ स्कैन करके)।

OCR in Hindi

कंप्यूटर भी ऐसा कर सकते हैं, लेकिन यह वास्तव में उनके लिए कड़ी मेहनत है। पहली समस्या यह है कि कंप्यूटर पर कोई नज़र नहीं है, इसलिए यदि आप चाहते हैं कि यह किसी पुरानी पुस्तक के पृष्ठ जैसा कुछ पढ़े, तो आपको इसे उस पृष्ठ की छवि के साथ प्रस्तुत करना होगा जो किसी ऑप्टिकल स्कैनर या डिजिटल कैमरे से उत्पन्न होता है। आपके द्वारा इस तरह बनाया जाने वाला पृष्ठ एक ग्राफिक फ़ाइल है (अक्सर JPG के रूप में) और, जहाँ तक एक कंप्यूटर का संबंध है, इसके और ताजमहल की तस्वीर या किसी अन्य ग्राफ़िक के बीच कोई अंतर नहीं है: यह पूरी तरह से अर्थहीन पैटर्न है पिक्सल (रंगीन डॉट्स या वर्ग जो किसी भी कंप्यूटर ग्राफिक छवि को बनाते हैं)। दूसरे शब्दों में, कंप्यूटर में पाठ के बजाय पृष्ठ की एक तस्वीर होती है – यह पृष्ठ पर दिए गए शब्दों को नहीं पढ़ सकता है जैसे हम कर सकते हैं, ठीक उसी तरह। OCR पाठ की एक तस्वीर को स्वयं पाठ में बदलने की प्रक्रिया है – दूसरे शब्दों में, एक मुद्रित या हस्तलिखित पृष्ठ के स्कैन किए गए JPG से TXT या DOC फ़ाइल की तरह कुछ का उत्पादन करना।

OCR का आविष्कार किसने किया?

1928/9: वियना के गुस्ताव तौसेक, ऑस्ट्रिया ने एक बुनियादी ओसीआर “रीडिंग मशीन” का पेटेंट कराया। जनरल इलेक्ट्रिक के पॉल हैंडेल अप्रैल 1931 में संयुक्त राज्य अमेरिका में एक समान प्रणाली के लिए एक पेटेंट फाइल करते हैं। दोनों कागज या कार्ड पर पैटर्न को पहचानने के लिए प्रकाश का पता लगाने वाले फोटोकल्स का उपयोग करने के विचार पर आधारित हैं।

1949: एल.ई. फ्लोरी और डब्ल्यू.एस. आरसीए प्रयोगशालाओं के पाईक एक फोटोकेल-आधारित मशीन विकसित करते हैं जो नेत्रहीन लोगों को 60 शब्द प्रति मिनट की दर से पाठ पढ़ा सकते हैं। (लोकप्रिय विज्ञान के फरवरी 1949 के अंक में इसके बारे में सभी पढ़ें।)

1950: डेविड एच। शेपर्ड ने ऐसी मशीनों का विकास किया जो अमेरिकी सेना के लिए मुद्रित जानकारी को मशीन-पठनीय रूप में बदल सकती है और बाद में एक अग्रणी OCR कंपनी को इंटेलिजेंट मशीन रिसर्च (IMR) कहा जाता है। शेफर्ड ने एक मशीन-पठनीय फ़ॉन्ट भी विकसित किया है जिसे Farrington B (OCR-7B और 7B-OCR भी कहा जाता है), अब व्यापक रूप से क्रेडिट कार्डों पर उभरा संख्याओं को प्रिंट करने के लिए उपयोग किया जाता है।

1960: लॉरेंस (लैरी) रॉबर्ट्स, MIT में काम करने वाले एक कंप्यूटर ग्राफिक्स शोधकर्ता, OCR-A जैसे विशेष सरलीकृत फोंट का उपयोग करके प्रारंभिक पाठ मान्यता विकसित करते हैं। वह बाद में इंटरनेट के संस्थापक पिताओं में से एक बन जाता है।

1950/1960 के दशक: रीडर्स डाइजेस्ट और आरसीए एक साथ काम करते हैं जो पहले वाणिज्यिक ओसीआर सिस्टम में से कुछ को विकसित करने के लिए थे।

1960: दुनिया भर की डाक सेवाएं मेल-छँटाई के लिए ओसीआर तकनीक का उपयोग करना शुरू करती हैं। इनमें यूएस पोस्टल सर्विस, ब्रिटेन का जनरल पोस्ट ऑफिस (GPO, जिसे अब रॉयल मेल कहा जाता है), कनाडा पोस्ट और जर्मन ड्यूश पोस्ट शामिल हैं। लॉकहीड मार्टिन जैसी कंपनियों की मदद से डाक सेवाएं आज तक ओसीआर शोध में सबसे आगे हैं।

1974: रेमंड कुर्ज़वील ने कुर्ज़वील रीडिंग मशीन (केआरएम) विकसित की है जो एक फ्लैटबेड स्कैनर और स्पीच सिंथेसाइज़र को एक मशीन में जोड़ती है जो नेत्रहीन लोगों को मुद्रित पृष्ठ पढ़ सकती है। कुर्ज़वील के ओसीआर सॉफ़्टवेयर को ज़ेरॉक्स द्वारा अधिग्रहित किया गया है और इसे स्कैनसॉफ्ट और (बाद में) नुआंस कम्युनिकेशंस के नाम से बेचा जाता है।

1993: Apple न्यूटन मैसेजपैड (पीडीए) एक टच-सेंसिटिव स्क्रीन पर हैंडराइटिंग रिकग्निशन की सुविधा देने वाले पहले हैंडहेल्ड कंप्यूटरों में से एक है। 1990 के दशक के दौरान, सेलफ़ोन, पीडीए (विशेष रूप से अग्रणी पाम और पामपिलॉट) और अन्य हैंडहेल्ड्स पर लिखावट की पहचान एक तेजी से लोकप्रिय विशेषता बन गई।

2000: कार्नेगी मेलन विश्वविद्यालय के शोधकर्ताओं ने अपने सिर पर एक अच्छा ओसीआर सिस्टम विकसित करने की समस्या को फ्लिप किया- और कैप्चा नामक एक स्पैम-बस्टिंग सिस्टम विकसित किया (नीचे कैप्शन देखें)।

2007: iPhone के आगमन से आसान, पॉइंट-एंड-क्लिक स्मार्टफोन ऐप्स के विकास का संकेत मिलता है जो फोन कैमरा का उपयोग करके टेक्स्ट को स्कैन और परिवर्तित कर सकते हैं।

OCR कैसे काम करता है?

मान लीजिए कि जीवन वास्तव में सरल था और वर्णमाला में केवल एक अक्षर था: ए तब भी, आप शायद देख सकते हैं कि ओसीआर काफी मुश्किल समस्या होगी – क्योंकि हर एक व्यक्ति पत्र को थोड़ा अलग तरीके से लिखता है। मुद्रित पाठ के साथ भी, एक मुद्दा है, क्योंकि किताबें और अन्य दस्तावेज़ कई अलग-अलग टाइपफेस (फोंट) में मुद्रित होते हैं और पत्र ए को कई अलग-अलग रूपों में मुद्रित किया जा सकता है।

मोटे तौर पर, इस समस्या को हल करने के दो अलग-अलग तरीके हैं, या तो उनकी संपूर्णता (पैटर्न मान्यता) में वर्णों को पहचानकर या व्यक्तिगत रेखाओं और स्ट्रोक वर्णों का पता लगाकर (फीचर डिटेक्शन) से और उन्हें उस तरीके से पहचान कर बनाया जाता है। आइए इन्हें बारी-बारी से देखें।

ओसीआर मुख्य विशेषताएं:

  • चरित्र पहचान सटीकता
  • पृष्ठ लेआउट पुनर्निर्माण सटीकता
  • भाषाओं के लिए समर्थन
  • यूजर इंटरफेस डिजाइन
  • आउटपुट फ़ाइल प्रारूप (वर्ड, एक्सेल, पीडीएफ, ईबुक, आदि)
  • मल्टी कोर सीपीयू के लिए ओसीआर की गति और समर्थन
  • बैच प्रसंस्करण मोड
  • उन्नत पीडीएफ एन्क्रिप्शन या संपीड़न
  • आला परियोजनाओं के लिए विशेष सुविधाएँ
अंतिम शब्द:

मुझे उम्मीद है कि आपको मेरा यह लेख OCR Kya Hai Hindi? पसंद आया होगा| मुझे हमेशा यह पसंद आया है कि मेरा हमेशा यह प्रयास रहा है कि “OCR kaise use kare”, इसके बारे में पूरी जानकारी प्रदान की जाए, ताकि उन्हें उस लेख के संदर्भ में अन्य साइटों या इंटरनेट पर खोज न करनी पड़े।

इससे उनका समय भी बचेगा और उन्हें एक ही जगह पर सारी जानकारी भी मिल जाएगी। यदि आपको इस लेख के बारे में कोई संदेह है या आप चाहते हैं कि इसमें कुछ सुधार होना चाहिए, तो इसके लिए आप नीचे Comment लिख सकते हैं।

अगर आपको यह पोस्ट पसंद आया कि OCR क्या है या कुछ सीखा है, तो कृपया इस पोस्ट को सोशल नेटवर्क जैसे कि Facebook , Twitter और अन्य सोशल मीडिया साइटों पर share करें।

About the author

Vishu Patel

I am Vishu Patel founder of DroidAcid.com. My main purpose to help those people who want to do online business, make money from the Internet, Android Tips and Tricks or learn something new on the Internet.

Add Comment

Click here to post a comment