ഒപ്റ്റിക്കൽ കാരക്റ്റർ റെക്കഗ്നിഷൻ
സ്കാൻ ചെയ്ത ഡോക്യുമെന്റുകളിൽ നിന്ന് അച്ചടിച്ചതും കൈയ്യെഴുത്തുള്ളതുമായ അക്ഷരങ്ങൾ യാന്ത്രികമായ വേർതിരിച്ചെടുത്ത് മെഷീൻ എൻകോഡഡ് ടെക്സ്റ്റിലേക്ക് മാറ്റിയെടുക്കുന്നതിനുള്ള കമ്പ്യൂട്ടർ സങ്കേതമാണ് ഒപ്റ്റിക്കൽ ക്യാരക്റ്റർ റെക്കഗ്നിഷൻ അഥവാ ഒ.സി.ആർ. കടലാസ് വിവരസ്ത്രോതസ്സുകളായ ലിഖിത പ്രമാണങ്ങൾ, കച്ചവട രശീതികൾ, കത്തുകൾ അല്ലെങ്കിൽ മറ്റു അച്ചടിച്ച രേഖകളെ കമ്പ്യൂട്ടറിന് സ്വീകരിക്കാനുതകുന്ന വിധത്തിലുള്ള രൂപത്തിലാക്കാൻ ഈ സങ്കേതം വ്യാപകമായി ഉപയോഗിക്കുന്നു. അച്ചടിച്ച ഉള്ളടക്കങ്ങൾ ഡിജിറ്റൈസ് ചെയ്യുന്നതിനായുള്ള സാധാരണ ഉപയോഗിക്കുന്ന സമ്പ്രദായമാണിത്. ഇങ്ങനെ ചെയ്യുന്നതുകൊണ്ട് അവയിലെ വിവരങ്ങൾ ഇലക്ടോണിക്സ് സങ്കേതത്തിലൂടെ തിരയാനും, ഒതുങ്ങിയ രീതിയിൽ സംഭരിച്ച് സൂക്ഷിക്കാനും, ഓൺലൈനായി വായിക്കാനും, മെഷീൻ ട്രാൻസിലേഷൻ, ടെക്സ്റ്റ് ടു സ്പീച്ച്, ടെക്സ്റ്റ് മൈനിങ്ങ് തുടങ്ങിയ യാന്ത്രിക പ്രവർത്തികൾക്ക് ഉപയോഗിക്കുകയും ചെയ്യുന്നു. പാറ്റേൺ റെക്കഗ്നിഷൻ, കൃത്രിമബുദ്ധി (artificial intelligence), കമ്പ്യൂട്ടർ വിഷൻ എന്നിവ ഒ.സി.ആറിന്റെ ഗവേഷണ മേഖലയിലുൾപ്പെടുന്നു.
ആദ്യകാല വേർഷനുകളിലെല്ലാം ചിത്രങ്ങളിലെ ഓരോ അക്ഷരങ്ങൾക്കനുസരിച്ചും പ്രത്യേകം പ്രോഗ്രാമുകൾ എഴുതണമായിരുന്നു. കൂടാതെ ഒരു ഫോണ്ട് സെറ്റ് മാത്രമേ ഒരു സമയം പ്രവർത്തിച്ചിരുന്നുള്ളൂ.മിക്ക ഫോണ്ടുകളെയും കൃത്യതയോടെ തിരിച്ചറിയാനുള്ള ഇൻന്റലിജെൻസ് സിസ്റ്റം ഇപ്പോൾ സാധാരണമായി ലഭ്യമാണ്. യഥാർഥ സ്കാൻ ചെയ്ത പേജിനോട് കിടപിടിയ്ക്കുന്ന തരത്തിൽ, ചിത്രങ്ങളും കോളങ്ങളും മറ്റു ടെക്സ്റ്റ് ഇതരരൂപങ്ങളും പുനർനിർമ്മിക്കാൻ തക്ക ശേഷിയുള്ള ഒ.സി.ആർ സങ്കേതങ്ങൾ ഇന്ന് ലഭ്യമാണ്.
അവലംബം[തിരുത്തുക]
പുറം കണ്ണികൾ[തിരുത്തുക]
![]() |
വിക്കിമീഡിയ കോമൺസിലെ Optical character recognition എന്ന വർഗ്ഗത്തിൽ ഇതുമായി ബന്ധപ്പെട്ട കൂടുതൽ പ്രമാണങ്ങൾ ലഭ്യമാണ്. |
- Unicode OCR - Hex Range: 2440-245F Optical Character Recognition in Unicode