ഉള്ളടക്കത്തിലേക്ക് പോവുക

ഡീപ്സീക്ക്

വിക്കിപീഡിയ, ഒരു സ്വതന്ത്ര വിജ്ഞാനകോശം.
Hangzhou DeepSeek Artificial Intelligence Co., Ltd.
യഥാർഥ നാമം
杭州深度求索人工智能基础技术研究有限公司
Private
വ്യവസായംവിവരസാങ്കേതികവിദ്യ
സ്ഥാപിതംമേയ് 2023; 2 വർഷങ്ങൾ മുമ്പ്}}|Error: first parameter is missing.}} (2023-05)
സ്ഥാപകൻ
ആസ്ഥാനംHangzhou, ഷെജിയാങ്, ചൈന
പ്രധാന വ്യക്തി
  • Liang Wenfeng (CEO)
ഉടമസ്ഥൻഹൈ-ഫ്ലയർ
വെബ്സൈറ്റ്deepseek.com

ഒരു ചൈനീസ് ആർട്ടിഫിഷ്യൽ ഇന്റലിജൻസ് കമ്പനിയാണ് ഡീപ്സീക്ക് (ചൈനീസ്: 深度求索; പിൻയിൻ: Shēndù Qiúsuǒ). ഇത് ഓപ്പൺ-സോഴ്സ് വലിയ ഭാഷാ മോഡലുകൾ (ലാർജ് ലാംഗ്വേജ് മോഡലുകൾ) വികസിപ്പിക്കുന്നതിൽ ശ്രദ്ധ കേന്ദ്രീകരിക്കുന്നു. ഈ സ്ഥാപനം പൂർണ്ണമായും ചൈനീസ് കമ്പനിയായ ഹൈ-ഫ്ലയറിന്റെ ധനസഹായത്തിലാണ് പ്രവർത്തിക്കുന്നത്. ഡീപ്സീക്കും അതിന്റെ മാതൃസ്ഥാപനമായ ഹൈ-ഫ്ലയറും ഝെജിയാങ് പ്രവിശ്യയിലെ ഹാങ്ഷൌ എന്ന നഗരം ആസ്ഥാനമാക്കിയാണ് പ്രവർത്തിക്കുന്നത്.

പശ്ചാത്തലം

[തിരുത്തുക]

2015 ൽ,ഝെജിയാങ് യൂണിവേഴ്സിറ്റിയിലെ മൂന്ന് എഞ്ചിനീയർ ചേർന്നാണ് ഹൈ-ഫ്ലയർ ആരംഭിച്ചത്.

ഡീപ് സീക്ക്-വി3 മോഡലിന്റെ പരിശീലനത്തിനുള്ള മൊത്തം ചെലവ് [1]
സ്റ്റേജ് ചെലവ് (ആയിരം ജിപിയു മണിക്കൂറിനുള്ളിൽ) ചെലവ് (ഒരു ദശലക്ഷം ഡോളറിൽ)
പ്രീ-ട്രെയിനിംഗ് 2,664 5.328
സന്ദർഭ വിപുലീകരണം 119 0.24
മികച്ച ട്യൂണിംഗ് 5 0.01
ആകെ 2,788 5.576

ഇതും കാണുക

[തിരുത്തുക]

പരാമർശങ്ങൾ

[തിരുത്തുക]
  1. Jiang, Ben; Perezi, Bien (1 January 2025). "Meet DeepSeek: the Chinese start-up that is changing how AI models are trained". South China Morning Post (in ഇംഗ്ലീഷ്).
"https://ml.wikipedia.org/w/index.php?title=ഡീപ്സീക്ക്&oldid=4489501" എന്ന താളിൽനിന്ന് ശേഖരിച്ചത്