OCR क्या है? एक सरल भाषा में गाइड
OCR एक वाक्य में
OCR, जिसका पूरा नाम ऑप्टिकल कैरेक्टर रिकॉग्निशन है, वह तकनीक है जो तस्वीर में टेक्स्ट को पढ़ती है और उसे ऐसे टेक्स्ट में बदलती है जिसे आप संपादित, कॉपी और खोज सकते हैं। यही वह चीज़ है जो ocrX जैसे इमेज टू टेक्स्ट कन्वर्टर को एक पेज की फोटो लेने और आपको वास्तविक शब्द वापस देने में सक्षम बनाती है।
यह किस समस्या का समाधान करता है?
टेक्स्ट की फोटो या स्कैन कंप्यूटर के लिए सिर्फ रंगीन बिंदु हैं। यह B को 8 से नहीं बता सकता। OCR उन बिंदुओं को देखता है, आकृतियों को अक्षरों और संख्याओं के रूप में पहचानता है, और उन्हें वास्तविक टेक्स्ट के रूप में लिखता है। यही एक पेज की तस्वीर और एक दस्तावेज़ के बीच का अंतर है जिसके साथ आप काम कर सकते हैं।
यह मोटे तौर पर कैसे काम करता है
आपको इसका उपयोग करने के लिए विवरण जानने की आवश्यकता नहीं है, लेकिन सार सरल है। सॉफ्टवेयर उन क्षेत्रों को ढूँढता है जिनमें टेक्स्ट है, पंक्तियों और अक्षरों को अलग करता है, और प्रत्येक आकृति को किसी दी गई भाषा के अक्षरों के बारे में अपने ज्ञान से मिलाता है। आधुनिक OCR मशीन लर्निंग का उपयोग करता है, यही कारण है कि यह विभिन्न फ़ॉन्ट, हस्तलेखन और कई भाषाओं को पुराने उपकरणों की तुलना में कहीं बेहतर संभालता है।
जहाँ आपने इसे पहले ही देखा है
- आपका फोन फोटो से फोन नंबर ले रहा है।
- एक स्कैनर एक PDF बना रहा है जिसे आप खोज सकते हैं।
- बैंकिंग एप चेक पढ़ रहा है।
- अनुवाद एप कैमरे के माध्यम से विदेशी मेनू पढ़ रहा है।
OCR किसमें अच्छा है और किसमें नहीं
यह स्पष्ट मुद्रित टेक्स्ट के साथ उत्कृष्ट है और साफ हस्तलेखन के साथ अच्छा है। यह धुंधलापन, कम रोशनी, व्यस्त पृष्ठभूमि और गंदी या घसीट लेखन के साथ संघर्ष करता है। इमेज जितनी साफ होगी, परिणाम उतना ही बेहतर होगा, हर बार।
इसे स्वयं आज़माएँ
OCR को समझने का सबसे आसान तरीका इसका उपयोग करना है। किसी भी टेक्स्ट की फोटो ocrX पर अपलोड करें, भाषा चुनें, और एक स्थिर इमेज को ऐसे शब्दों में बदलते हुए देखें जिन्हें आप कॉपी कर सकते हैं।
