ഒപ്റ്റിക്കൽ കാരക്റ്റർ റെക്കഗ്നിഷൻ

വിക്കിപീഡിയ, ഒരു സ്വതന്ത്ര വിജ്ഞാനകോശം.
ഒരു പോർട്ടബിൾ സ്കാനർ ഉപയോഗിച്ച് സ്കാനിംഗിന്റെയും തത്സമയ ഒപ്റ്റിക്കൽ ക്യാരക്ടർ റെക്കഗ്നിഷന്റെയും (OCR) പ്രത്യേകതകൾ ചിത്രീകരിക്കുന്ന വീഡിയോ.

സ്‌കാൻ ചെയ്ത ഡോക്യുമെന്റുകളിൽ നിന്ന് അച്ചടിച്ചതും കൈയ്യെഴുത്തുള്ളതുമായ അക്ഷരങ്ങൾ യാന്ത്രികമായി വേർതിരിച്ചെടുത്ത് മെഷീൻ എൻകോഡഡ് ടെക്സ്റ്റിലേക്ക് മാറ്റിയെടുക്കുന്നതിനുള്ള കമ്പ്യൂട്ടർ സങ്കേതമാണ് ഒപ്റ്റിക്കൽ ക്യാരക്റ്റർ റെക്കഗ്നിഷൻ അഥവാ ഒ.സി.ആർ. കടലാസ് വിവരസ്ത്രോതസ്സുകളായ ലിഖിത പ്രമാണങ്ങൾ, കച്ചവട രശീതികൾ, കത്തുകൾ അല്ലെങ്കിൽ മറ്റു അച്ചടിച്ച രേഖകളെ കമ്പ്യൂട്ടറിന് സ്വീകരിക്കാനുതകുന്ന വിധത്തിലുള്ള രൂപത്തിലാക്കാൻ ഈ സങ്കേതം വ്യാപകമായി ഉപയോഗിക്കുന്നു. അച്ചടിച്ച ഉള്ളടക്കങ്ങൾ ഡിജിറ്റൈസ് ചെയ്യുന്നതിനായുള്ള സാധാരണ ഉപയോഗിക്കുന്ന സമ്പ്രദായമാണിത്. ഇങ്ങനെ ചെയ്യുന്നതുകൊണ്ട് അവയിലെ വിവരങ്ങൾ ഇലക്ടോണിക്സ് സങ്കേതത്തിലൂടെ തിരയാനും, ഒതുങ്ങിയ രീതിയിൽ സംഭരിച്ച് സൂക്ഷിക്കാനും, ഓൺലൈനായി വായിക്കാനും, മെഷീൻ ട്രാൻസിലേഷൻ, ടെക്സ്റ്റ് ടു സ്പീച്ച്, ടെക്സ്റ്റ് മൈനിങ്ങ് തുടങ്ങിയ യാന്ത്രിക പ്രവർത്തികൾക്ക് ഉപയോഗിക്കുകയും ചെയ്യുന്നു. പാറ്റേൺ റെക്കഗ്നിഷൻ, കൃത്രിമബുദ്ധി (artificial intelligence), കമ്പ്യൂട്ടർ വിഷൻ എന്നിവ ഒ.സി.ആറിന്റെ ഗവേഷണ മേഖലയിലുൾപ്പെടുന്നു.[1]

ആദ്യകാല വേർഷനുകളിലെല്ലാം ചിത്രങ്ങളിലെ ഓരോ അക്ഷരങ്ങൾക്കനുസരിച്ചും പ്രത്യേകം പ്രോഗ്രാമുകൾ എഴുതണമായിരുന്നു. കൂടാതെ ഒരു ഫോണ്ട് സെറ്റ് മാത്രമേ ഒരു സമയം പ്രവർത്തിച്ചിരുന്നുള്ളൂ.മിക്ക ഫോണ്ടുകളെയും കൃത്യതയോടെ തിരിച്ചറിയാനുള്ള ഇൻന്റലിജെൻസ് സിസ്റ്റം ഇപ്പോൾ സാധാരണമായി ലഭ്യമാണ്. യഥാർഥ സ്കാൻ ചെയ്ത പേജിനോട് കിടപിടിയ്ക്കുന്ന തരത്തിൽ, ചിത്രങ്ങളും കോളങ്ങളും മറ്റു ടെക്സ്റ്റ് ഇതരരൂപങ്ങളും പുനർനിർമ്മിക്കാൻ തക്ക ശേഷിയുള്ള ഒ.സി.ആർ സങ്കേതങ്ങൾ ഇന്ന് ലഭ്യമാണ്.

ആദ്യകാല പതിപ്പുകൾ ഓരോ കാരക്ടരിന്റെയും ചിത്രങ്ങൾ ഉപയോഗിച്ച് പരിശീലിപ്പിക്കേണ്ടതുണ്ട്, കൂടാതെ ഒരു സമയം ഒരു ഫോണ്ടിൽ പ്രവർത്തിക്കുകയും വേണം. മിക്ക ഫോണ്ടുകൾക്കും ഉയർന്ന അളവിലുള്ള തിരിച്ചറിയൽ കൃത്യത ഉൽപ്പാദിപ്പിക്കാൻ കഴിവുള്ള വിപുലമായ സംവിധാനങ്ങൾ ഇപ്പോൾ സാധാരണമാണ്, കൂടാതെ വൈവിധ്യമാർന്ന ഡിജിറ്റൽ ഇമേജ് ഫയൽ ഫോർമാറ്റ് ഇൻപുട്ടുകൾക്കുള്ള പിന്തുണയും ഉണ്ട്.[2] ചിത്രങ്ങൾ, കോളങ്ങൾ, മറ്റ് നോൺ-ടെക്‌സ്‌ച്വൽ കമ്പോണന്റ് എന്നിവയുൾപ്പെടെ ഒറിജിനൽ പേജിനെ ഏകദേശം കണക്കാക്കുന്ന ഫോർമാറ്റ് ചെയ്‌ത ഔട്ട്‌പുട്ട് പുനർനിർമ്മിക്കാൻ ചില സിസ്റ്റങ്ങൾക്ക് കഴിയും.

ചരിത്രം[തിരുത്തുക]

ആദ്യകാല ഒപ്റ്റിക്കൽ ക്യാരക്ടർ റെഗ്നിഷൻ ടെലിഗ്രാഫിയും അന്ധർക്കായി വായനാ ഉപകരണങ്ങൾ സൃഷ്ടിക്കുന്നതും ഉൾപ്പെടുന്ന സാങ്കേതികവിദ്യകൾ രൂപപ്പെടുത്തി. 1914-ൽ ഇമ്മാനുവൽ ഗോൾഡ്‌ബെർഗ് അക്ഷരങ്ങൾ വായിക്കുകയും അവയെ സാധാരണ ടെലിഗ്രാഫ് കോഡാക്കി മാറ്റുകയും ചെയ്യുന്ന ഒരു യന്ത്രം വികസിപ്പിച്ചെടുത്തു.[3] അതേ സമയം, എഡ്മണ്ട് ഫോർണിയർ ഡി ആൽബ് ഒരു ഹാൻഡ്‌ഹെൽഡ് സ്‌കാനറായ ഒപ്‌ടോഫോൺ വികസിപ്പിച്ചെടുത്തു, അത് പ്രിന്റ് ചെയ്‌ത പേജിലുടനീളം നീക്കുമ്പോൾ, പ്രത്യേക അക്ഷരങ്ങൾക്കോ പ്രതീകങ്ങൾക്കോ അനുയോജ്യമായ ടോണുകൾ നിർമ്മിക്കുന്നു.[4][5]

1920-കളുടെ അവസാനത്തിലും 1930-കളിലും ഇമ്മാനുവൽ ഗോൾഡ്ബെർഗ് ഒരു ഒപ്റ്റിക്കൽ കോഡ് തിരിച്ചറിയൽ സംവിധാനം ഉപയോഗിച്ച് മൈക്രോഫിലിം ആർക്കൈവുകൾ തിരയുന്നതിനായി "സ്റ്റാറ്റിസ്റ്റിക്കൽ മെഷീൻ" വികസിപ്പിച്ചെടുത്തു. 1931-ൽ ഈ കണ്ടുപിടുത്തത്തിന് 1,838,389 എന്ന യുഎസ്എ പേറ്റന്റ് ലഭിച്ചു. പേറ്റന്റ് ഐബിഎം ഏറ്റെടുത്തു.

അവലംബം[തിരുത്തുക]

  1. OnDemand, HPE Haven. "OCR Document". മൂലതാളിൽ നിന്നും April 15, 2016-ന് ആർക്കൈവ് ചെയ്തത്.
  2. OnDemand, HPE Haven. "undefined". മൂലതാളിൽ നിന്നും April 19, 2016-ന് ആർക്കൈവ് ചെയ്തത്.
  3. Schantz, Herbert F. (1982). The history of OCR, optical character recognition. [Manchester Center, Vt.]: Recognition Technologies Users Association. ISBN 9780943072012.
  4. Dhavale, Sunita Vikrant (March 10, 2017). Advanced Image-Based Spam Detection and Filtering Techniques. Hershey, PA: IGI Global. പുറം. 91. ISBN 9781683180142. ശേഖരിച്ചത് 27 September 2019.
  5. d'Albe, E. E. F. (1 July 1914). "On a Type-Reading Optophone". Proceedings of the Royal Society A: Mathematical, Physical and Engineering Sciences. 90 (619): 373–375. Bibcode:1914RSPSA..90..373D. doi:10.1098/rspa.1914.0061.

പുറം കണ്ണികൾ[തിരുത്തുക]