गूगल ने रिकैप्चा को खरीदा [आइये समझें रिकैप्चा को]
गूगल ने अभी हाल ही में रिकैप्चा को खरीद लिया है. रिकैप्चा वेबसाइटों को आनलाइन कैप्चा लगाने की सुविधा प्रदान करने वाली सेवा है.
आपने इसे कई साइटों में कुछ ऐसे देखा होगा:
पहले रिकैप्चा को समझते हैं. रिकैप्चा असल में पुरानी पुस्तकों को डिजिटल रूप में परिवर्तित करने की सेवा है. पर ये काम कैसे करती है?
सामान्यत: किसी किसी किताब के किसी पृष्ठ को डिजिटल रूप देने के लिये उसे स्कैन करना पड़ेगा. लेकिन ये स्कैन की हुई कापी स्टोर करने में आकार में बड़ी हो जाती है तथा इसमें से शब्दों को खोजा नही जा सकता है. अत: इसमें से जानकारियां भी नही खोजी जा सकती हैं.
अत: इस समस्या का हल निकालने के लिये ओसीआर की मदत ली जाती है. ओसीआर यानि कि आप्टिकल कैरेक्टर रीडर. लेकिन ये भी पूरी तरह से शब्दों को पढ़ने में सक्षम नही है. और जब किताबें पुरानी हों और उनका प्रिंट खराब हो तब तो ओसीआर कुछ पढ़ ही नही पायेगा.
इसे समझने के लिये इस चित्र पर गौर फ़रमाइये:
केवल इंसान ही ऐसे शब्दों को पढ़ सकते हैं. अत: ओसीआर का काम कैप्चा के जरिये मनुष्यों से करवाया जाता है. क्योंकि मनुष्य ही खराब प्रिंट वाले अक्षरों को पढ़ सकते हैं. लेकिन लेकिन जब मशीन को शब्द का अर्थ ही नही पता है तो वह यह कैसे जानेगी कि आपने जो टाइप किया है वह सही है?
यही रिकैप्चा का आइडिया है. आपको कैप्चा के रूप में दो शब्द दिये जाते हैं एक वो जिसका मतलब मशीन को पता नही है और दूसरा वो जिसका मतलब मशीन को पता है.
जब आप कैप्चा को हल करते हैं तो एक शब्द से मशीन ये निश्चित करती है कि आप मनुष्य हैं ना कि कोई रोबोट/प्रोग्राम और दूसरे शब्द के से मशीन उसका मतलब सीखती है.
दुनियाभर में प्रतिदिन करीब २०० मिलियन कैप्चा हल की जाती हैं. और किसी सामान्य व्यक्ति को इसे हल करने में करीब १० सेकेंड लगते हैं. जो कि मामूली है. पर इससे एक लाख पचास हजार घंटों का काम प्रतिदिन हो जाता है. और इस प्रकार पुरानी हो चुकी पुस्तकों के ज्ञान को डिजिटल रूप में परिवर्तित किया जाता है.
गूगल रिकैप्चा को खरीदकर गूगल बुक्स के लिये किताबों का डिजिटलीकरण करेगा.
तो है ना रिकैप्चा कमाल की चीज!
Comments
Post a Comment
Ask me anything here...