સૌપ્રથમ તો આપણે ભાગ 1 અને ભાગ 2(જો ન વાંચ્યા હોય તો મારી પ્રોફાઇલમાં મળી જશે)ના અગત્યના પોઈન્ટસ ઉપર નજર કરી લઈએ! આપણે સમજ્યું હતું કે AI ને શીખવા માટે dataset(ડેટાસેટ) જરૂરી હોય છે! Dataset એટલે મોટી માત્રામાં એકઠી કરેલી માહિતી! આ માહિતી લખાણ, પ્રશ્ન-જવાબ, ફોટા, અવાજ, વિડિયો જેવી વિવિધ રૂપમાં હોય શકે છે! AI આ માહિતીમાંથી શીખે છે કે યુઝર્સ કેવી રીતે લખે છે, પ્રશ્ન કેવી રીતે પૂછે છે, અને જવાબ કેવી રીતે આપવામાં આવે છે! માણસ જેમ પુસ્તકો વાંચીને જ્ઞાન મેળવે છે તેમ AI dataset માંથી પેટર્ન (pattern) શીખે છે! અહીં એક મહત્વની વાત છે: AI માણસની જેમ વિચારતું નથી! AI મૂળભૂત રીતે ગણતરી કરે છે અને datasetમાંથી શીખેલા પેટર્નના આધારે આગળ કયો શબ્દ આવવો જોઈએ તેની ગણતરી કરે છે! એટલે AI દ્વારા લખાયેલો જવાબ હકીકતમાં ગણતરી અને સંભાવનાના આધારે બને છે!
પરંતુ જ્યારે આપણે AI એપમાં કોઈ પ્રશ્ન લખીએ છીએ અને થોડા સેકન્ડમાં જવાબ આવી જાય છે ત્યારે એક સ્વાભાવિક સવાલ ઊભો થાય છે: આ બધું અંદરથી કેવી રીતે કામ કરે છે? પ્રશ્ન ક્યાં જાય છે? જવાબ કોણ બનાવે છે? અને આટલી મોટી ગણતરીઓ એટલી ઝડપથી કેવી રીતે થઈ જાય છે? આ પ્રશ્નોના જવાબ સમજવા માટે કેટલીક મહત્વની ટેક્નોલોજીસ્ સમજવી જરૂરી છે! ખાસ કરીને LLM (Large Language Model), Data Centers(ડેટા સેન્ટર), GPU અને API, આ ચાર વસ્તુઓ AI સિસ્ટમમાં મુખ્ય ભૂમિકા ભજવે છે! જો આપણે આ ચાર ટેક્નોલોજીસ્ને સરળ રીતે સમજીએ, તો AI કેવી રીતે કામ કરે છે તેની ઘણી સ્પષ્ટ સમજ મળી શકે છે!
હવે આપણે સૌ પ્રથમ LLM (Large Language Model) વિશે સમજીએ! LLM એ એવા AI મોડેલને કહેવામાં આવે છે જે ખાસ કરીને ભાષા સાથે કામ કરવા માટે બનાવવામાં આવ્યું હોય! “Large” એટલે મોટું, કારણ કે આવા મોડેલમાં લાખો નહીં પરંતુ બિલિયન (અબજો) અથવા ટ્રિલિયન (લાખ કરોડ) જેટલા પરિમાણો (parameters) હોઈ શકે છે! Parameters એટલે એ આંતરિક સંખ્યાઓ જે AI ને શીખેલી માહિતી યાદ રાખવામાં મદદ કરે છે! જ્યારે AI ને train(ટ્રેઇન) કરવામાં આવે છે ત્યારે આ parameters ધીમે ધીમે બદલાય છે જેથી AI વધુ સાચા પેટર્ન ઓળખી શકે! LLM ને train કરવા માટે ઘણી મોટી માત્રામાં લખાણનો ઉપયોગ થાય છે, જેમ કે પુસ્તકો, વિજ્ઞાન લેખો, લેખો, વેબસાઇટો, સમાચાર લેખો અને અન્ય જાહેર ઉપલબ્ધ લખાણ! ટ્રેનિંગ દરમિયાન AI લખાણ વાંચીને શીખે છે કે એક શબ્દ પછી કયો શબ્દ આવવાની શક્યતા વધારે છે! ઉદાહરણ તરીકે, “આકાશમાં સૂર્ય…” પછી “ઉગે છે” અથવા “ચમકે છે” જેવા શબ્દો આવવાની શક્યતા વધારે હોય છે! આ રીતે AI ભાષાની પેટર્ન શીખે છે. જ્યારે તમે પ્રશ્ન પૂછો છો ત્યારે LLM તમારા પ્રશ્નને tokens(ટોકન)માં એટલે કે નાના ભાગોમાં વિભાજિત કરે છે, ત્યારબાદ દરેક token પર ગણતરી કરે છે અને જે તે શબ્દ બાદ આવતો યોગ્ય શબ્દ પસંદ કરીને ધીમે ધીમે સંપૂર્ણ જવાબ બનાવે છે!
આ આખી પ્રક્રિયા સામાન્ય રીતે મોબાઇલમાં ચાલવી મુશ્કેલ છે, કારણ કે મોટા LLM મોડેલને ચલાવવા માટે શક્તિશાળી હાર્ડવેર જરૂરી હોય છે! અહીં ડેટા સેન્ટર મહત્વની ભૂમિકા ભજવે છે! ડેટા સેન્ટર એટલે વિશાળ બિલ્ડિંગ અથવા કેમ્પસ જ્યાં હજારો અથવા લાખો સર્વર એકસાથે કામ કરતા હોય છે! સર્વર એટલે કે આસાન ભાષામાં કહીએ તો શક્તિશાળી કમ્પ્યુટર જે સતત દિવસ-રાત કામ કરતું રહે છે અને ઇન્ટરનેટ દ્વારા દુનિયાભરના યુઝર્સની રિકવેસ્ટ સ્વીકારવા માટે બનાવવામાં આવે છે! ડેટા સેન્ટરમાં માત્ર સર્વર જ નથી હોતા, પરંતુ તેમાં AI મોડેલ, મોટી સ્ટોરેજ સિસ્ટમ અને ડેટાસેટ જેવા માહિતીના સંગ્રહ પણ હોય છે! અહીં શક્તિશાળી GPU પણ હોય છે જે ભારે ગણતરી ઝડપથી કરી શકે છે! જ્યારે તમે મોબાઇલમાં AI એપમાં પ્રશ્ન લખો છો ત્યારે એ પ્રશ્ન સીધો ફોનમાં પ્રોસેસ થતો નથી! એ ઇન્ટરનેટ દ્વારા ડેટા સેન્ટર સુધી પહોંચે છે, જ્યાં સર્વર એ પ્રશ્ન AI મોડેલ સુધી મોકલે છે, AI મોડેલ ડેટાસેટમાંથી શીખેલા પેટર્નના આધારે જવાબ બનાવે છે અને એ જવાબ ફરી ઇન્ટરનેટ દ્વારા તમારા મોબાઇલ સુધી પાછો મોકલવામાં આવે છે, આ પ્રક્રિયા એટલી ઝડપથી થાય છે કે આપણે વિચારીએ છીએ કે જાણે AI આપણાં મોબાઇલમાં જ ચાલે છે, જ્યારે હકીકતમાં મોટાભાગનું કામ ડેટા સેન્ટરમાં થાય છે!
ડેટા સેન્ટર્સમાં હજારો સર્વર અને કમ્પ્યુટર સતત કામ કરતા હોવાથી ઘણી વીજળી વપરાય છે! ભારે ગણતરી દરમિયાન મશીનો ગરમ થઈ જાય છે, તેથી તેમને ઠંડા રાખવા માટે કૂલિંગ સિસ્ટમ ઉપયોગમાં લેવાય છે, જેમ કે મોટા પંખા, ઠંડા પાણીની પાઇપલાઇન અથવા ક્યારેક લિક્વિડ કૂલિંગ ટેક્નોલોજી! મોટી ટેક્નોલોજી કંપનીઓ પોતાના ડેટા સેન્ટર્સ દુનિયાના અલગ અલગ દેશોમાં બનાવે છે જેથી ઇન્ટરનેટ latency (જવાબ આવવામાં લાગતો સમય) ઓછો રહે અને યુઝરને ઝડપથી જવાબ મળી શકે!
હવે વાત કરીએ GPU (Graphics Processing Unit) ની! સામાન્ય કમ્પ્યુટરમાં CPU (Central Processing Unit) હોય છે જેનો વિવિધ કામ માટે ઉપયોગ થાય છે! પરંતુ AI મોડેલ train કરવા અથવા ચલાવવા માટે CPUનો ઉપયોગ થતો નથી કારણ કે તે ઘણું ધીમું કામ કરે છે, જ્યારે AIને એક સાથે લાખો ગાણિતિક પ્રકિયાઓ કરવાની જરૂર પડે છે! GPU ખાસ કરીને એ માટે બનાવવામાં આવ્યું છે કે તે એક સાથે ઘણી ગણતરીઓ ઝડપથી કરી શકે!
શરૂઆતમાં GPU ગેમિંગ અને ગ્રાફિક્સ માટે બનાવવામાં આવ્યા હતા! ગેમમાં દરેક સેકન્ડે ઘણી ઈમેજીસ બનતી હોય છે, અને આ કામ ઝડપથી કરવા માટે GPU ઉપયોગી બને છે, અને ટેકનોલોજી એક્સપર્ટસે શોધ્યું કે GPU ફક્ત ગેમ માટે જ નહીં, પરંતુ મોટી ગણતરીઓ માટે પણ ખૂબ ઉપયોગી છે કારણ કે GPU એક સાથે ઘણી ગણતરીઓ કરી શકે છે, AI મોડેલ્સને શીખવવા માટે ઘણી મોટી ગણતરીઓ કરવાની જરૂર પડે છે જ્યારે AI, ડેટાસેટમાંથી શીખે છે ત્યારે તેને વારંવાર ગણતરી કરવી પડે છે કે કયો શબ્દ સાચો છે, કઈ પેટર્ન સાચી છે અને કયો જવાબ વધુ યોગ્ય છે આ ગણતરી ખૂબ મોટી હોય છે અને જો સામાન્ય CPU થી કરવામાં આવે તો તેમાં બહુ સમય લાગી શકે છે તેથી ડેટા સેન્ટર્સમાં ઘણાં બધાં GPU એકસાથે કામ કરતા હોય છે, ક્યારેક હજારો GPU એક સાથે જોડાયેલા હોય છે અને તેઓ મળીને AI મોડેલને ટ્રેઇન કરવામાં મદદ કરે છે અને યુઝર્સના પ્રશ્નોના જવાબ પણ ઝડપથી બનાવી શકે છે!
હવે એક મહત્વનો પ્રશ્ન આવે છે કે મોબાઇલ એપ અથવા વેબસાઇટ AI મોડેલ સાથે કેવી રીતે જોડાય છે? અહીં API નો ઉપયોગ થાય છે! API એટલે કે "Application Programming Interface", પરંતુ સરળ રીતે સમજીએ તો API એવી પદ્ધતિ છે જેના દ્વારા એક સોફ્ટવેર બીજા સોફ્ટવેર સાથે વાત કરી શકે(વેલ, સરળ રીતે સમજીએ તો કોઈ એપ અથવા વેબસાઇટ અને AI મોડેલ એક પ્રકારે સોફ્ટવેર જ છે)! જ્યારે તમે મોબાઇલ એપમાં કોઈ પ્રશ્ન લખો છો ત્યારે એ પ્રશ્ન ઇન્ટરનેટ દ્વારા સર્વર સુધી પહોંચે છે. કોઈપણ એપ સીધી AI મોડલ સાથે જોડાતી નથી, તેના બદલે તે API દ્વારા રિકવેસ્ટ મોકલે છે, API આ રિકવેસ્ટને સર્વર સુધી પહોંચાડે છે, ત્યારબાદ સર્વર એ પ્રશ્નને AI મોડેલ સુધી મોકલે છે, AI મોડેલ પ્રશ્ન વાંચે છે, ગણતરી કરે છે અને યોગ્ય જવાબ બનાવે છે, ત્યારબાદ એ જવાબ સર્વરને મળે છે અને સર્વર ફરી API દ્વારા એ જવાબ મોબાઇલ એપ સુધી મોકલે છે, જેથી તમને સ્ક્રીન પર જવાબ દેખાય છે! આ આખી પ્રક્રિયા થોડી સેકન્ડમાં પૂર્ણ થઈ જાય છે, સરળ શબ્દોમાં કહીએ તો ઇન્ટરનેટ ડિવાઇસિસને જોડે છે, સર્વર માહિતી પ્રોસેસ કરે છે અને API બે સોફ્ટવેર વચ્ચે વાતચીત કરવાનું માધ્યમ બને છે!
હવે આખી પ્રક્રિયા એક સરળ રીતે સમજીએ. માનો કે તમે તમારા મોબાઇલમાં AI એપ ખોલો છો અને લખો છો: “મંગળ ગ્રહ વિશે માહિતી આપો.” આ લખાણ ઇન્ટરનેટ દ્વારા સર્વર સુધી જાય છે. સર્વર એ રિકવેસ્ટ ડેટા સેન્ટરમાં રહેલા AI મોડેલ સુધી મોકલે છે! AI મોડેલ પ્રશ્નને ટોકનમાં વિભાજિત કરે છે અને GPU ની મદદથી ગણતરી કરે છે અને ડેટાસેટ માંથી શીખેલા પેટર્નના આધારે યોગ્ય શબ્દો પસંદ કરીને જવાબ બનાવે છે! ત્યારબાદ સર્વર એ જવાબ API મારફતે પાછો તમારા મોબાઇલ એપ સુધી મોકલે છે! આખી પ્રક્રિયા સામાન્ય રીતે થોડી સેકન્ડમાં પૂર્ણ થાય છે એટલે યુઝર્સને તરત જ જવાબ મળી જાય છે!
આમ પદ્ધતિસર કામ કરતી સિસ્ટમ્સ જોઈને સમજાય છે કે AI માત્ર એક સોફ્ટવેર નથી તેની પાછળ ડેટાસેટ, ટ્રેઈનિંગ, શક્તિશાળી કમ્પ્યુટર, ડેટા સેન્ટર, ઇન્ટરનેટ અને પ્રોગ્રામિંગ જેવા ઘણા ભાગો સાથે મળીને કામ કરે છે! દરેક ટેકનોલોજીનું પોતાનું મહત્વ છે, Dataset વગર AI શીખી શકતું નથી! GPU વગર મોટી ગણતરી ઝડપથી થઈ શકતી નથી! ડેટા સેન્ટર વગર લાખો યુઝર્સ એકસાથે AI નો ઉપયોગ કરી શકતા નથી! અને API વગર એપ અને AI સિસ્ટમ વચ્ચે જોડાણ સરળ બનતું નથી!