சீனாவின் DeepSeek;கதிகலங்கும் அமெரிக்கா; காரணம் என்ன !
சீன AI ஸ்டார்ட்அப் நிறுவனமான DeepSeek, அமெரிக்காவின் Meta மற்றும் OpenAI-க்கு போட்டியாக மிகப் பெரிய இயற்றறிவு மாதிரியை (Large language model) குறைந்த விலையில் அறிமுகப்படுத்தியுள்ளமை அமெரிக்க நிறுவனங்களுக்கு கலக்கதை ஏற்பட்படுத்தியுள்ளது.
DeepSeek மொபைல் செயலி 1.6 மில்லியன் பதிவிறக்கங்களைப் பெற்று, பல நாடுகளில் App Store தரவரிசையில் முதலிடத்தைப் பிடித்துள்ளது. மேலும், உலக சந்தையில் விலை நிர்ணய உத்திகள் குறித்து அமெரிக்க AI நிறுவனங்களுக்கு பெருத்த கவலைகளை எழுப்பியுள்ளது.
Meta மற்றும் OpenAI நிறுவனங்களின் பெரிய இயற்றறிவு மாதிரியை (LLM) போன்று செயல்திறனை வழங்கும் இந்த DeepSeek, முன்னணி AI நிறுவனங்களின் ஆதிக்கத்துக்கு சவாலாக உருவெடுத்துள்ளது.
DeepSeek-இன் இலவச செயலி அமெரிக்கா, பிரிட்டன், ஆஸ்திரேலியா, கனடா, சீனா, சிங்கப்பூர் உள்ளிட்ட பல நாடுகளில் உள்ள Apple App Store-ன் தரவரிசையில் ChatGPT-ஐ முந்தியுள்ளது.
DeepSeek என்றால் என்ன?
DeepSeek என்பது சீன ஹெட்ஜ் நிதி நிறுவனமான High-Flyer நிறுவனர் Liang Wenfeng-க்கு சொந்தமானது.
கடந்த 2023-ம் ஆண்டில் அறிமுகப்படுத்தப்பட்ட DeepSeek, கடந்த மாதம் ‘V3’ என்கிற அதன் பெரிய இயற்றறிவு மாதிரி (LLM) மூலம் OpenAI, Google மற்றும் Meta போன்ற பல அமெரிக்க AI நிறுவனங்களை விட சிறப்பாக செயல்படும் என்பதை நிரூபித்தது.
மனித பகுத்தறிவின் அம்சங்களைப் பிரதிபலிக்கும் DeepSeek-ன் ‘R1’ இயற்றறிவு மாதிரி (LLM), பல்வேறு அளவுகோல்களில் ChatGPT-யின் சமீபத்திய ‘O1’ மாதிரியை விட செயல்திறன் அடிப்படையில் மிஞ்சுகிறது.
DeepSeek-ன் ‘V3’ பெரிய இயற்றறிவு மாதிரி (LLM) மிகக் குறைந்த செலவில் உருவாக்கப்பட்டுள்ளது. மேலும், AI மாதிரிகளை இயக்குவதற்கு அதிக அளவு கணினி சக்தி தேவை என்ற தற்போதைய நம்பிக்கையை இது கேள்விக்குள்ளாக்கி உள்ளது.
DeepSeek ஆராய்ச்சியாளர்கள், அதன் V3 இயற்றறிவு மாதிரியை பயிற்றுவிக்க அமெரிக்காவின் NVIDIA நிறுவனத்தின் H800 GPU-வை பயன்படுத்தியிருக்கிறார்கள்.
உலகளவில் மிகச் சக்தி வாய்ந்த H100 GPU
உலகளவில் H100 GPU-க்கள் தான் மிகச் சக்தி வாய்ந்தவை, ஆனால் அமெரிக்க அரசின் தடையினால் சீன நிறுவனங்கள் அதை வாங்க முடியாது. அதைவிடத் திறனிலும் விலையிலும் குறைந்த H800-ஐ பயன்படுத்தி, DeepSeek-ன் V3 மாதிரியைப் பயிற்றுவித்திருப்பது AI வல்லுநர்களால் வியக்கப்படுகிறது.
DeepSeek மாதிரியைப் பயிற்றுவிக்க வெறும் 47 கோடி ரூபாய் (5.5 மில்லியன் டாலர்கள்) தான் செலவாகியிருக்கிறது என்று கூறப்படுகிறது; ChatGPT-யை பயிற்றுவிக்க சுமார் ரூ.8,500 கோடிக்கு மேல் செலவு செய்யப்படுகிறது.
மேலும், DeepSeek-ன் வெற்றி மேம்பட்ட AI GPU-க்கள் மீதான அமெரிக்காவின் ஏற்றுமதி தடைகளின் செயல்திறனையும் கேள்விக்குள்ளாக்கியுள்ளது. அதேவேளை DeepSeek செயலி அமெரிக்காவில் கடந்த ஜனவரி 10-ம் திகதி தான் அறிமுகம் செய்யப்பட்டது.
இந்நிலையில் அறிமுகம் செய்யப்பட்ட இரு வாரங்களில் Apple நிறுவனத்தின் ஆப் ஸ்டோரில் ChatGPT-ஐ முந்தி அதிக மதிப்பீடு பெற்ற இலவச செயலியாக DeepSeek மாறியுள்ளமை குறிப்பிடத்தக்கது.