ഹഡൂപ്പ്

വിക്കിപീഡിയ, ഒരു സ്വതന്ത്ര വിജ്ഞാനകോശം.
അപ്പാച്ചെ ഹഡൂപ്പ്
Hadoop logo new.svg
Original author(s)Doug Cutting, Mike Cafarella
വികസിപ്പിച്ചത്Apache Software Foundation
ആദ്യപതിപ്പ്ഏപ്രിൽ 1, 2006; 16 വർഷങ്ങൾക്ക് മുമ്പ് (2006-04-01)[1]
Stable release
2.7.x2.7.7 / മേയ് 31, 2018; 4 വർഷങ്ങൾക്ക് മുമ്പ് (2018-05-31)[2]
2.8.x2.8.5 / സെപ്റ്റംബർ 15, 2018; 4 വർഷങ്ങൾക്ക് മുമ്പ് (2018-09-15)[2]
2.9.x2.9.2 / നവംബർ 9, 2018; 4 വർഷങ്ങൾക്ക് മുമ്പ് (2018-11-09)[2]
2.10.x2.10.1 / സെപ്റ്റംബർ 21, 2020; 2 വർഷങ്ങൾക്ക് മുമ്പ് (2020-09-21)[2]
3.1.x3.1.4 / ഓഗസ്റ്റ് 3, 2020; 2 വർഷങ്ങൾക്ക് മുമ്പ് (2020-08-03)[2]
3.2.x3.2.2 / ജനുവരി 9, 2021; 22 മാസങ്ങൾക്ക് മുമ്പ് (2021-01-09)[2]
3.3.x3.3.1 / ജൂൺ 15, 2021; 17 മാസങ്ങൾക്ക് മുമ്പ് (2021-06-15)[2]
RepositoryHadoop Repository
ഭാഷJava
ഓപ്പറേറ്റിങ് സിസ്റ്റംCross-platform
തരംDistributed file system
അനുമതിപത്രംApache License 2.0
വെബ്‌സൈറ്റ്hadoop.apache.org വിക്കിഡാറ്റയിൽ തിരുത്തുക

അപ്പാച്ചെ ഹഡൂപ്പ് എന്നത് ഡിസ്ട്രിബ്യൂട്ടഡ് പ്രോഗ്രാമുകൾ എഴുതുന്നതിനുള്ള ഒരു ചട്ടക്കൂടാണ് (framework). വൻതോതിലുള്ള ഡാറ്റയും കംപ്യൂട്ടേഷനും ഉൾപ്പെടുന്ന പ്രശ്നങ്ങൾ പരിഹരിക്കുന്നതിന് നിരവധി കമ്പ്യൂട്ടറുകളുടെ ഒരു ശൃംഖല ഉപയോഗിക്കുന്നതിനെ സുഗമമാക്കുന്ന ഓപ്പൺ സോഴ്‌സ് സോഫ്റ്റ്‌വെയർ യൂട്ടിലിറ്റികളുടെ ഒരു ശേഖരമാണിത്. മാപ്പ്റെഡ്യൂസ്(MapReduce) പ്രോഗ്രാമിംഗ് മോഡൽ ഉപയോഗിച്ച് വലിയ ഡാറ്റയുടെ വിതരണം ചെയ്ത സംഭരണത്തിനും പ്രോസസ്സിംഗിനുമായി ഇത് ഒരു സോഫ്റ്റ്വെയർ ചട്ടക്കൂട് നൽകുന്നു. കമ്മോഡിറ്റി ഹാർഡ്‌വെയറിൽ നിന്ന് നിർമ്മിച്ച കമ്പ്യൂട്ടർ ക്ലസ്റ്ററുകൾക്ക് വേണ്ടിയാണ് ഹഡൂപ്പ് യഥാർത്ഥത്തിൽ രൂപകൽപ്പന ചെയ്തിരിക്കുന്നത്, ഇത് ഇപ്പോഴും സാധാരണ ഉപയോഗത്തിനുവേണ്ടിയുള്ളതാണ്.[3] ഉയർന്ന നിലവാരമുള്ള ഹാർഡ്‌വെയറിന്റെ ക്ലസ്റ്ററുകളിലും ഇത് ഉപയോഗിക്കാൻ കഴിയും.[4][5]ഹഡൂപ്പിലെ എല്ലാ മൊഡ്യൂളുകളും രൂപകൽപ്പന ചെയ്തിരിക്കുന്നത് ഹാർഡ്‌വെയർ പരാജയപ്പെടുന്നത് സാധാരണ സംഭവങ്ങളാണെന്നും അവ ചട്ടക്കൂട് സ്വയമേവ കൈകാര്യം ചെയ്യണമെന്നുമുള്ള അടിസ്ഥാന അനുമാനത്തോടെയാണ്.[6]

അപ്പാച്ചെ ഹഡൂപ്പിന്റെ കാതൽ, ഹഡൂപ്പ് ഡിസ്ട്രിബ്യൂട്ടഡ് ഫയൽ സിസ്റ്റം (HDFS) എന്നറിയപ്പെടുന്ന ഒരു സ്റ്റോറേജ് ഭാഗവും മാപ്പ്റെഡ്യൂസ് പ്രോഗ്രാമിംഗ് മോഡലായ ഒരു പ്രോസസ്സിംഗ് ഭാഗവും ഉൾക്കൊള്ളുന്നു. ഹഡൂപ്പ് ഫയലുകളെ വലിയ ബ്ലോക്കുകളായി വിഭജിക്കുകയും ഒരു ക്ലസ്റ്ററിലെ നോഡുകളിലുടനീളം വിതരണം ചെയ്യുകയും ചെയ്യുന്നു. തുടർന്ന്, ഡാറ്റ പ്രോസസ്സ് ചെയ്യുന്നതിന് പാക്കേജുചെയ്ത കോഡ് നോഡുകളിലേക്ക് മാറ്റുന്നു. ഈ സമീപനം ഡാറ്റാ ലോക്കാലിറ്റി പ്രയോജനപ്പെടുത്തുന്നു,[7] അവിടെ നോഡുകൾ അവയ്ക്ക് ആക്‌സസ് ഉള്ള ഡാറ്റ കൈകാര്യം ചെയ്യുന്നു. ഉയർന്ന വേഗതയുള്ള നെറ്റ്‌വർക്കിംഗ് വഴി കമ്പ്യൂട്ടേഷനും ഡാറ്റയും ഫയൽ സിസ്റ്റത്തെ മാത്രം ആശ്രയിക്കുന്ന ഒരു പരമ്പരാഗത സൂപ്പർ കമ്പ്യൂട്ടർ ആർക്കിടെക്ചറിൽ ഉള്ളതിനേക്കാൾ വേഗത്തിലും കാര്യക്ഷമമായും ഡാറ്റാസെറ്റ് പ്രോസസ്സ് ചെയ്യാൻ ഇത് അനുവദിക്കുന്നു.[8][9]

ഇതും കാണുക[തിരുത്തുക]

അവലംബം[തിരുത്തുക]

  1. "Hadoop Releases". apache.org. Apache Software Foundation. ശേഖരിച്ചത് 2019-04-28.
  2. 2.0 2.1 2.2 2.3 2.4 2.5 2.6 "Apache Hadoop". ശേഖരിച്ചത് 7 September 2019.
  3. Judge, Peter (2012-10-22). "Doug Cutting: Big Data Is No Bubble". silicon.co.uk. ശേഖരിച്ചത് 2018-03-11.
  4. Woodie, Alex (2014-05-12). "Why Hadoop on IBM Power". datanami.com. Datanami. ശേഖരിച്ചത് 2018-03-11.
  5. Hemsoth, Nicole (2014-10-15). "Cray Launches Hadoop into HPC Airspace". hpcwire.com. ശേഖരിച്ചത് 2018-03-11.
  6. "Welcome to Apache Hadoop!". hadoop.apache.org. ശേഖരിച്ചത് 2016-08-25.
  7. "What is the Hadoop Distributed File System (HDFS)?". ibm.com. IBM. ശേഖരിച്ചത് 2021-04-12.
  8. Malak, Michael (2014-09-19). "Data Locality: HPC vs. Hadoop vs. Spark". datascienceassn.org. Data Science Association. ശേഖരിച്ചത് 2014-10-30.
  9. Wang, Yandong; Goldstone, Robin; Yu, Weikuan; Wang, Teng (October 2014). "Characterization and Optimization of Memory-Resident MapReduce on HPC Systems". 2014 IEEE 28th International Parallel and Distributed Processing Symposium. IEEE. പുറങ്ങൾ. 799–808. doi:10.1109/IPDPS.2014.87. ISBN 978-1-4799-3800-1. S2CID 11157612.
  10. "Apache Accumulo User Manual: Security". apache.org. Apache Software Foundation. ശേഖരിച്ചത് 2014-12-03.

ബിബ്ലിയോഗ്രഫി[തിരുത്തുക]

ബാഹ്യ ലിങ്കുകൾ[തിരുത്തുക]



"https://ml.wikipedia.org/w/index.php?title=ഹഡൂപ്പ്&oldid=3782032" എന്ന താളിൽനിന്ന് ശേഖരിച്ചത്