യന്ത്രപഠനം

വിക്കിപീഡിയ, ഒരു സ്വതന്ത്ര വിജ്ഞാനകോശം.
Jump to navigation Jump to search

വസ്തുതകളിലൂന്നിയുള്ള നിർമ്മാണ-പഠന വ്യവസ്ഥിതിയാണ് കൃത്രിമബുദ്ധിയുടെ ഒരു ശാഖയായ യന്ത്രപഠനം അഥവാ മെഷീൻ ലേർണിങ്(Machine Learning). അമേരിക്കക്കാരനായ കമ്പ്യൂട്ടർ ഗെയിം നിർമാതാവും ആർട്ടിഫിഷ്യൽ ഇന്റലിജൻസ് വിദഗ്ദ്ധനുമായ ആർതർ സാമുവൽ ആണ് ഈ പേരിന്റെ ഉപജ്ഞാതാവ്. അപ്പോൾ 1959ൽ അദ്ദേഹം ഐ ബി എമ്മിൽ എഞ്ചിനിയർ ആയി ജോലി ചെയ്യുകയായിരുന്നു. ഇതിലൂടെ കമ്പ്യൂട്ടറുകളെ, നേരിട്ടുള്ള നിർദ്ദേശങ്ങൾ വഴിയല്ലാതെ, ഉദാഹരണങ്ങൾ മാത്രം ഉപയോഗിച്ച് പരിശീലിപ്പിക്കുകയും അത് വഴി തീരുമാനങ്ങളിലെത്താൻ പ്രാപ്തിയാക്കുകയും ചെയ്യുന്നു. ഉദാഹരണത്തിന്, ഇമെയിൽ സന്ദേശങ്ങളിൽ നിന്ന് പാഴ്‌മെയിലുകളെയും അല്ലാത്തവയെയും തിരിച്ചറിയാൻ യന്ത്രപഠന സമ്പ്രദായത്തെ പരിശീലിപ്പിക്കുകയാണെങ്കിൽ, പുതുതായി വരുന്ന മെയിൽ സന്ദേശങ്ങളെ പാഴ്‌മെയിലാണോയെന്ന് പരിശോധിച്ച് തരംതിരിക്കാൻ ഇതിലൂടെ സാധിക്കുന്നു. സാമാന്യവത്കരണത്തെയും പ്രതിപാദനത്തെയും അടിസ്ഥാനമാക്കിയാണ് യന്ത്രപഠന വ്യവസ്ഥിതിയുടെ കാമ്പ് നിലനിൽക്കുന്നത്. ദത്തവിവര മാതൃകാ ചിത്രീകരണവും ഈ മാതൃകകളിൽ നിന്നും വിലയിരുത്തപ്പെട്ട പ്രവൃത്തികളും എല്ലാ യന്ത്രപഠന വ്യവസ്ഥിതികളുടെയും ഭാഗമാണ്. ഇതുവരെ കാണാത്ത ദത്തവിവര മാതൃകയിൽപ്പോലും നടപ്പിലാക്കാമെന്ന സവിശേഷതയാണ് സാമാന്യവത്കരണം; ഇത് സാധ്യമാക്കുന്ന അവസ്ഥകളെ കണക്കുകൂട്ടൽ പഠന സിദ്ധാന്ത ശാഖയുടെ ആണിക്കല്ലായി കണക്കാക്കാം.

മേഖലകൾ[തിരുത്തുക]

യന്ത്രപഠനത്തെ ആസ്പദമാക്കി പ്രവർത്തിക്കുന്ന ധാരാളം മേഖലകളുണ്ട്. ഉദാഹരണമായി, ഓപ്റ്റിക്കൽ ക്യാരക്റ്റർ രെക്കഗ്നിഷൻ സാങ്കേതികവിദ്യയിൽ പ്രിന്റ് ചെയ്തിരിക്കുന്ന ചിഹ്നങ്ങളെയും അക്ഷരങ്ങളെയും മുൻ മാതൃകകളെ അടിസ്ഥാനമാക്കി യാന്ത്രികമായാണ് വായിച്ച് മനസ്സിലാക്കുന്നത്, ഇത് സാധ്യമാക്കിയത് യന്ത്രപഠനമാണ്.

തരംതിരിവുകൾ[തിരുത്തുക]

യന്ത്രപഠനം പ്രധാനമായും മൂന്ന് തരത്തിലാണുള്ളത്.

  • മാർഗദർശിത യന്ത്രപഠനം (സൂപ്പർവൈസ്ട് ലേണിംഗ്)
  • സ്വയംചലിത യന്ത്രപഠനം (അൺസൂപ്പർവൈസ്ട് ലേണിംഗ്)
  • ചുവടുവപ്പ് യന്ത്രപഠനം (റീഇൻഫോഴ്സ്ട് ലേണിംഗ്)

മാർഗദർശിത യന്ത്രപഠനം (സൂപ്പർവൈസ്ട് ലേണിംഗ്)[തിരുത്തുക]

മാർഗദർശിത യന്ത്രപഠനത്തിൽ മുൻപുള്ള ഉദാഹരണങ്ങളിലെ ഇൻപുട്ട് ഔട്പുട്ട് ബന്ധങ്ങൾ യന്ത്രത്തിൻറെ പരിശീലന ഘട്ടത്തിൽ ലഭ്യമായിരിക്കണം. വിവരത്തെ പല വിഭാഗങ്ങളായ് വേർതിരിക്കുന്നത് ഈ തത്ത്വം പ്രയോഗിച്ചുകൊണ്ടാണ്.

സ്വയംചലിത യന്ത്രപഠനം (അൺസൂപ്പർവൈസ്ട് ലേണിംഗ്)[തിരുത്തുക]

സ്വയംചലിത യന്ത്രപഠനത്തിലാകട്ടെ ഇൻപുട്ടുകൾ മാത്രം ഉപയോഗിച്ചുകൊണ്ട് ഭാവിയിലെ ഔട്പുട്ട് മൂല്യം അല്ലെങ്കിൽ ഇൻപുട്ട് ഔട്പുട്ട് ബന്ധത്തെക്കുറിച്ച് അറിയാൻ സാധിക്കുന്നു. ക്ലസ്റ്ററിംഗ് ഈ ഗണത്തിൽപ്പെടുന്നു. ഒറ്റ നോട്ടത്തിൽ ഒരു ബന്ധവും തോന്നാൻ ഇടയില്ലാത്ത വിവര മാനദണ്ഡങ്ങളെ ചേർത്ത് സാമ്യതയുള്ളവയെ കൂട്ടങ്ങളായി വകതിരിക്കാൻ ക്ലസ്റ്ററിംഗിലൂടെ കഴിയും.

ചുവടുവപ്പ് യന്ത്രപഠനം (റീഇൻഫോഴ്സ്ട് ലേണിംഗ്)[തിരുത്തുക]

ചുവടുവപ്പ് യന്ത്രപഠനം കൃത്രിമ ബുദ്ധിയുടെ ഒരു പ്രമുഖ വശമാണ്. ഓരോ ഘട്ടത്തിലും അപ്പപ്പോഴത്തെ മാനദണ്ഡങ്ങൾ വിലയിരുത്തി അടുത്ത നീക്കം ഏറ്റവും ദക്ഷതയോടെ തിരഞ്ഞെടുക്കാൻ യന്ത്രത്തെ പരിശീലിപ്പിക്കുക എന്നതാണ് ഇതിനു പിന്നിലെ തത്ത്വം. കളികൾ, ഓൺലൈൻ' പരീക്ഷകൾ, സ്വയംചലിത വാഹന നിർമ്മാണം എന്നീ മേഖലകളിൽ ചുവടുവപ്പ് യന്ത്രപഠനത്തിനു ഏറെ പ്രാധാന്യമുണ്ട്.

ഘടകങ്ങൾ[തിരുത്തുക]

പ്രധാനമായും ആറ് ഘടകങ്ങളാണ് ഒരു യന്ത്രപഠന സങ്കേതത്തിൽ ഉണ്ടാവുക

  • വിവരം (Data)
  • കർത്തവ്യം (Task)
  • മാതൃക (Model)
  • നഷ്ടം (Loss)
  • പഠനം (Learning)
  • വിലയിരുത്തൽ (Evaluation)

വിവരം[തിരുത്തുക]

ഒരു യന്ത്രപഠന മാതൃകയെ പരിശീലിപ്പിക്കാൻ വലിയ അളവിലുള്ള വിവരം (ഡാറ്റ) ആവശ്യമാണ്. വിവരം (ഡാറ്റാ) ലഭ്യമല്ലെങ്കിൽ യന്ത്രപഠനം സാധ്യമല്ല. ഇന്റർനെറ്റിലും മറ്റും ലഭ്യമായ, ദിവസേന വർദ്ധച്ചുകൊണ്ടിരിക്കുന്ന ഡാറ്റയാണ് ഒരർത്ഥത്തിൽ യന്ത്രപഠനം സാധ്യമാക്കുന്നത്.

കർത്തവ്യം[തിരുത്തുക]

ധാരാളം വിവരങ്ങൾ (ഡാറ്റ) ലഭ്യമായാൽ അതിൽ നിന്ന് എന്ത് കർത്തവ്യമാണ് നാം നിർവഹിക്കാൻ പോവുന്നത് എന്ന് മുൻകൂട്ടി തീരുമാനിക്കേണ്ടതുണ്ട്. ഉദാഹരണത്തിന് സ്താനാർബുദം ഉണ്ടോ എന്ന് പരിശോധിച്ച ആയിരം രോഗികളുടെ പ്രായം, ട്യൂമറിന്റെ വലിപ്പം അർബുദം ആയിരുന്നോ അല്ലയോ എന്നൊക്കെ ഉള്ള ഡാറ്റ ഉണ്ടെന്ന് കരുതുക. പുതിയ ഒരാളുടെ പ്രായം, ട്യൂമറിന്റെ വലിപ്പം എന്നിവ തന്നാൽ അയാൾക്ക് ക്യാൻസർ ഉണ്ടോ ഇല്ലയോ എന്ന് പ്രവചിക്കുകയാകാം ഒരു യന്ത്രപഠന കർത്തവ്യം (Machine Learning Task).

മാതൃക[തിരുത്തുക]

ഇൻപുട്ടിൽ നിന്ന് ഔട്ട്പുട്ടിലേക്കുള്ള ഒരു സങ്കീർണ്ണമായ ഗണിത സമവാക്യം കണ്ടെത്തുകയാണ് യന്ത്രപഠനം ചെയ്യുന്നത്. ഈ ഗണിത സമവാക്യത്തിന്റെ സങ്കീർണ്ണത എത്രത്തോളമാവണം, ഏത് മാതൃകയിലുള്ള ഗണിത സമവാക്യം വേണം എന്നതൊക്കെ ഇവിടെ തീരുമാനിക്കപ്പെടുന്നു. ഉദാഹരണത്തിന് മാതൃ ഒരു രേഖീയസമവാക്യമായിരിക്കണോ (Linear Equation) അതോ ബഹുപദമായിരിക്കണോ (Polynomial) എന്ന് തീരുമാനിക്കപ്പെടുന്നു.

നഷ്ടം[തിരുത്തുക]

മാതൃക (ഗണിത സമവാക്യത്തിന്റെ മാതൃക) തീരുമാനിച്ച് കഴിഞ്ഞാൽ സമവാക്യത്തിലെ ഗുണാങ്കങ്ങൾ (Parameters) കണ്ടുപിടിക്കലാണ് അടുത്തത്. ഗുണാങ്കങ്ങൾക്ക് ആകസ്‌മിക (Random) വിലകൾ നൽകി, വിലകൾക്ക് ചെറിയ മാറ്റങ്ങൾ വരുത്തി പഠനത്തിന് ലഭ്യമായ വിവരങ്ങളലൂടെ കൂടതൽ മെച്ചപ്പെട്ട ഗൂണാങ്കങ്ങളിൽ എത്തിച്ചേരുകയാണ് വേണ്ടത്. ഇത് സാധിക്കണമെങ്കിൽ നമുക്ക് എത്തിച്ചേരേണ്ട ഉത്തരവും നിലവിൽ പ്രവചിക്കുന്ന ഉത്തരവും തമ്മിലുള്ള അന്തരം നിർവചിക്കണം. ഈ നിർവചനത്തെയാണ് നഷ്ടം (Loss) എന്ന് വിളിക്കുന്നത്. വർഗ്ഗ ശരാശരി നഷ്ടം ( Mean Squared Error), ക്രോസ്സ് എൻട്രോപ്പി ലോസ്സ് (Cross Entropy Loss) എന്നിവയാണ് പൊതുവായി ഉപയോഗിക്കുന്നത്.

പഠനം[തിരുത്തുക]

ലഭ്യമായ വിവരങ്ങളിലൂടെ ഗണിത സമവാക്യത്തിലെ ഗുണാങ്കങ്ങളുടെ പറ്റുന്നതിൽ ഏറ്റവും മെച്ചപ്പെട്ട വിലകൾ കണ്ടെത്തുന്ന ഘട്ടമാണിത്. നഷ്ടം (Loss) പരമാവധി കുറഞ്ഞ ഗുണാങ്ക വിലകൾ വേണം കണ്ടെത്താൻ. ഇതി വിവിധ ഒപ്റ്റിമൈസേഷൻ അൽഗോരിതങ്ങൾ ഉപയോഗിക്കുന്നു. ഗ്രോഡിയന്റേ ഡിസന്റ് എന്ന അൽഗോരിതം ആണ് വ്യാപകമായി ഇപയോഗിക്കുന്നത്.

വിലയിരുത്തൽ[തിരുത്തുക]

പഠനത്തിലൂടെ കണ്ടെത്തിയ യന്ത്രപഠന മാതൃകയുടെ കൃത്യതയെ ഒരു പരിശോധനാ വിവരങ്ങൾ(Test Data Set) വെച്ച് വിലയിരുത്തുന്നു. വർഗ്ഗ ശരാശരി നഷ്ടം ( Mean Squared Error), ആക്യുറസി (Accuracy Score) എന്നീ മാനദണ്ഡങ്ങളുപയോഗിച്ചാണ് വിലയിരുത്തൽ നടത്തുന്നത്.

"https://ml.wikipedia.org/w/index.php?title=യന്ത്രപഠനം&oldid=3386298" എന്ന താളിൽനിന്ന് ശേഖരിച്ചത്