AI: Data, Prompts, and Math in Gujarati Science by નીલકંઠ books and stories PDF | AI: ડેટા, પ્રોમ્પટ અને ગણિત

Featured Books
Categories
Share

AI: ડેટા, પ્રોમ્પટ અને ગણિત

આજના સમયમાં આપણે બધાં કોઈને કોઈ રીતે AI સાથે જોડાયેલા છીએ! કોઈ AI સાથે વાત કરે છે, કોઈ AIથી ફોટો બનાવે છે, કોઈ વિડિયો એડિટ કરે છે અથવા બનાવે છે! પરંતુ એક સામાન્ય પ્રશ્ન હંમેશા મનમાં રહે છે, આ AI છે શું?  તે કેવી રીતે  વિચારે છે? તે કેવી રીતે જવાબ આપે છે?વેલ, હું AI સાથે સંકળાયેલો છું અને તેના પર જ કામ કરું છું, dataset(ડેટાસેટ), prompt(પ્રોમ્પટ), math(ગણિત), database(ડેટાબેઝ), pattern(પેટર્ન), આ બધું જ મારા રોજબરોજના જીવનમાં શીખતો રહું છું અને વાંચતો પણ રહું છું અને એમાં કામ પણ કરું છું, પરંતુ જે વ્યક્તિઓ આ ફિલ્ડ સાથે જોડાયેલા નથી તેમને આ બધુ સાંભળીને આશ્ચર્ય અને મુંઝવણ થાય જ! આ લેખ ધ્વારા એ જ મુંઝવણ દૂર કરીએ અને સિમ્પલ લેન્ગ્વેજમાં સમજીએ! વેલ, સૌથી પહેલા એક વાત સ્પષ્ટ કરીએ! AI કોઈ માણસ નથી(ન જ હોય તેનું નામ જ આર્ટિફિશિયલ ઈન્ટેલિજન્સ છે એટલે કે કૃત્રિમ બુદ્ધિ)! એ વિચારતું નથી, એને લાગણીઓ નથી, એને સમજ નથી! સરળ ભાષામાં કહીએ તો AI એ એક મોટી ગણિતીય સિસ્ટમ છે, જે માણસે બનાવી છે! માણસ જેમ શીખે છે તેમ AI પણ શીખે છે, પરંતુ તફાવત એ છે કે માણસ અનુભવથી શીખે છે અને AI ડેટાથી શીખે છે! હવે પ્રશ્ન આવે છે, ડેટા એટલે શું? માનો કે એક બાળક છે! હવે બાળક જ્યારે જન્મે છે ત્યારે એને કંઈ આવડતું ન જ હોય! પરંતુ બાદમાં એ બાળક માતા-પિતા પાસેથી બોલવાનું શીખે છે, સ્કૂલમાં જાય છે, લખતાં વાંચતા શીખે છે, પુસ્તકો વાંચે છે, લોકો સાથે વાત કરે છે! આ બધું બાળક માટે "ડેટા" છે! એ જ રીતે AI માટે ડેટા એટલે લખાણ, ફોટા, વિડિયો, અવાજ, સંખ્યાઓ વગેરે જે માણસ ધ્વારા જ બનાવવામાં આવ્યા છે! અહીં dataset મહત્વનો અને યાદ રાખવા જેવો શબ્દ છે જેને AIનો પાયો કહી પણ શકાય! હવે Dataset શું છે તે સમજીએ. Dataset એટલે AI નું શિક્ષણ! જેમ બાળક સ્કૂલમાં જાય છે, પુસ્તકો વાંચે છે, શિક્ષકની વાત સાંભળે છે, ભૂલ કરે છે અને ફરી શીખે છે, એ બધું મળીને બાળકનું જ્ઞાન બને છે, એ જ રીતે AI ને પણ શીખવવામાં આવે છે! AI ને હજારો લખાણ બતાવવામાં આવે છે, લાખો ફોટા બતાવવામાં આવે છે, પ્રશ્નો અને તેમના જવાબ બતાવવામાં આવે છે! આ બધું ભેગું થઈને Dataset બને છે! Dataset એટલે AI ને આપવામાં આવેલું શીખવા માટેનું સાહિત્ય! જેમ આપણે લેખ કે વાર્તા અથવા નોવેલ લખવા માટે પુસ્તકો વાંચ્યા હશે લેખો વાંચ્યા હશે, અને પછી આપણે લખવાનુ શરૂ કર્યુ, તેમ AI પણ Dataset જોઈને શીખે છે! એક સરળ ઉદાહરણ લઈએ. માનો કે આપણે શરૂઆતમાં લખવાનું ચાલુ કર્યું અને ઘણી ભૂલો પણ પડી પરંતુ આપણે વધુ પુસ્તકો વાંચ્યા અને વધુ શુધ્ધ લખતાં શીખ્યા અને હવે આપણે કોઈ પણ લેખ કોઈ પણ ભૂલ વિના લખી શકીએ છીએ! AI પણ એવું જ કરે છે, પરંતુ તે કેટલીક વખત પરફેક્ટ જવાબ નથી આપી શકતું! Dataset એ AI માટે શીખવાનું એક માધ્યમ છે અને Dataset ધ્વારા AI જવાબ આપે છે! હવે સાથે સાથે Database શું છે તે પણ સમજીએ! આમ તો Database એટલે માહિતી સ્ટોર રાખવાની જગ્યા! જેમ તમારા મોબાઇલમાં ફોન નંબર સેવ હોય છે, ફોટા સંગ્રહિત હોય છે, એ બધું database છે! Database ફક્ત માહિતી સાચવે છે. તમે સોશિયલ મીડિયા વાપરતા જ હશો અથવા કોઈ વેબસાઇટ વિઝિટ કરો છો તો સાઈન અપનો ઓપ્શન આવશે જ જ્યાં તમારે ડિટેઇલ્સ એડ કરવાની હોય છે આ બધી જ ડિટેઇલ્સ ડેટાબેઝમાં સચવાય છે! હવે પ્રશ્ન આવે છે કે AI જવાબ કેવી રીતે આપે છે? જ્યારે તમે AI ને પ્રશ્ન પૂછો છો, ત્યારે તે તમારા સવાલને નાના ભાગોમાં વિભાજિત કરે છે! પછી તે સમજે છે કે આવા પ્રશ્નોના જવાબો કેવી રીતે આપવા, ત્યાર બાદ તે એક એક શબ્દને ગાણિતિક બનાવે છે, અને દરેક શબ્દ માટે AI વિચારે છે: "આ પછી કયો શબ્દ આવવાની શક્યતા વધારે છે?" આ રીતે ધીમે ધીમે આખો જવાબ તૈયાર થાય છે! એટલે કે AI નો જવાબ પહેલેથી જ બનાવેલો(અથવા ગોખેલો) નથી, પરંતુ ગાણિતિક રીતે બનાવેલો હોય છે! વેલ, prompt શબ્દ હાલ ઘણો જ સાંભળવા મળે છે, પરંતુ prompt છે શું? prompt એટલે આપણે AIને પૂછેલો સવાલ અથવા તો AIને કરવા માટે આપેલું કાર્ય જેને આપણે શબ્દોમાં લખીએ છીએ! માનો કે તમે એક વ્યક્તિને કહો છો કે, "એક વાર્તા લખો." એ વ્યક્તિ મૂંઝાશે કારણ કે તમે તેને વાર્તાનો વિષય કહ્યો નથી! પરંતુ તમે કહો, "તમારા ગામ અથવા શહેર વિષે 500 શબ્દોની વાર્તા લખો" તો એ વ્યક્તિ વધુ સ્પષ્ટ જવાબ લખશે! AI સાથે પણ એવું જ છે, prompt જેટલું સ્પષ્ટ, જવાબ એટલો સચોટ! અહીં Prompt પાછળ પણ ગણિત છે, AI શબ્દો સમજાતું નથી, એ સંખ્યાઓ જુએ છે! દરેક શબ્દ AI માટે એક નંબર છે! જ્યારે તમે લખો છો, "હું ખુશ છું", AI ધ્વારા આ શબ્દોને સંખ્યામાં ફેરવવામાં આવે છે! AI ત્યારબાદ ગણતરી કરે છે, આ શબ્દ પછી સૌથી વધારે શક્યતા કયા શબ્દની છે? આને "probability(સંભાવના)" કહેવાય છે! માનો કે તમે એક Prompt લખો છો, "આજે આકાશમાં". AIએ dataset માંથી શીખ્યું છે કે એ પછી "વાદળ", "સૂરજ", "તારા" જેવા શબ્દો આવે છે! એમાંથી જે શબ્દની શક્યતા વધારે હોય, એ પસંદ કરે છે! આ રીતે એક એક શબ્દ જોડાતો જાય છે અને આખો જવાબ બને છે! એટલે AI વિચારતું નથી, એ પ્રેડિકટ કરે છે! આજકાલ આપણે સોશિયલ મીડિયા પર ઘણા ટ્રેન્ડ જોયા છે જેમાં દરેક વ્યક્તિ પોતાનો AI ફોટો મૂકે છે! હવે AI ફોટો કેવી રીતે બનાવે છે? AI પાસે કોઈ કેમેરો નથી! એ ફોટો જોઈને ફોટો બનાવતું નથી! એ પહેલા dataset ધ્વારા લાખો ફોટાઓ  જોઈ ચૂક્યું હોય છે અથવા કહીએ કે ટ્રેઇન થયેલું હોય છે! ત્યારબાદ જ્યારે તમે કહો, "એક પહાડ પર ઊભેલો માણસનો ફોટો બનાવ" AI પહેલા અવ્યવસ્થિત ચિત્ર બનાવે છે જેને "noise" પછી ધીમે ધીમે ગણતરી ધ્વારા એ noise ને સ્પષ્ટ બનાવે છે, જેમ કોઈ પેઇન્ટર પહેલા હળવું સ્કેચ કરે, પછી રંગ ભરે એ જ રીતે, AI પણ એકએક પિક્સેલ ગોઠવે છે અને ફોટો તૈયાર કરે છે! AI વિડિયો બનાવવામાં પણ એ જ સિદ્ધાંત છે. ફરક એટલો છે કે એક ફોટાની જગ્યાએ તે ઘણા ફોટાઓ એક સાથે જોડે છે! AI દરેક ફ્રેમમાં ગણતરી કરે છે કે આગળ શું દેખાવું જોઈએ! AI, વિડિયો કોઈ ફિલ્મ સમજીને નથી બનાવતું, પરંતુ સંભાવનાથી બનાવે છે! આપણે ગણિતની વાત તો કરી હવે એક બહુ મહત્વની બાબત સમજવી જરૂરી છે, AIમાં ગણિત (Math) કેવી રીતે કામ કરે છે? અને આ ગણિતથી pattern કેવી રીતે બને છે?! અહીં એક પ્રશ્ન અને મુંઝવણ થશે કે "ગાણિતિક નંબરથી શબ્દ, વાક્ય અને અર્થ કેવી રીતે બને?" આ પ્રશ્નનો જવાબ બહુ સરળ ઉદાહરણથી સમજીએ! સૌપ્રથમ તો એટલું યાદ રાખીએ કે AI માટે શબ્દ, એ શબ્દ નથી, નંબર છે! જેમ આપણાં મોબાઈલમાં દરેક કોન્ટેક્ટ અથવા નામ સાથે એક નંબર હોય છે, એમ AI માટે "માતા", "પિતા", "પાણી", "આકાશ", બધાં શબ્દો અલગ અલગ સંખ્યાઓમાં ફેરવાઈ જાય છે! આ પ્રક્રિયાને "tokenization(ટોકનાઈઝેશન)" કહે છે! હવે આ નંબરો pattern કેવી રીતે બનાવે છે? માનો કે તમે રોજ સવારે ચા પીતા હો! તમારા મગજમાં એક pattern બની ગઈ છે, સવાર = ચા! કોઈ એક દિવસ તમે ચા ન પીવો તો કંઈક ખૂટે એવું લાગે! આ પેટર્ન તમારા મગજમાં રોજના અનુભવથી બનેલી છે! AI સાથે પણ આવું જ કંઈક છે, પરંતુ અનુભવથી નહીં, પરંતુ આંકડા થી! વેલ, datasetમાં લાખો વાક્યો હોય છે, AI એ બધાં વાંચે છે! એ ધ્યાન રાખે છે કે કયા નંબર (શબ્દ) પછી કયો નંબર વધારે વખત આવ્યો છે! ઉદાહરણ તરીકે, "સૂરજ" પછી "ઉગે છે" ઘણી વખત આવ્યું છે, "સૂરજ" પછી "તરબૂચ" ક્યારેય નથી આવ્યું! એટલે AIના ગણિતમાં એક rule બને છે, સૂરજ -> ઉગે છે (ઉચ્ચ સંભાવના)! આને pattern કહે છે! Pattern એટલે કંઈક જે વારંવાર રિપીટ થાય! AI દરેક શબ્દ માટે એક પેટર્ન બનાવે છે જેમાં લખેલું હોય છે: આ શબ્દ પછી આ શબ્દ આવવાની કેટલી શક્યતા છે! આ શક્યતા 0 અને 1 વચ્ચે હોય છે! જેમ 0.9 એટલે બહુ વધારે ચાન્સ છે, 0.01 એટલે બહુ ઓછો ચાન્સ હોય છે! હવે જ્યારે તમે prompt લખો છો, ત્યારે AI એક રમત રમે છે. એ પૂછે છે, "આ શબ્દ પછી કયો શબ્દ સૌથી યોગ્ય લાગશે?" યોગ્ય એટલે સાચો નહીં, પરંતુ જે pattern સાથે બંધબેસે! એટલે AIનો જવાબ સ્પષ્ટ લાગે છે કારણ કે એ pattern સાથે મેળ ખાય છે! માનો તમે લખો: "મને ભૂખ લાગી છે એટલે હું". AI datasetમાંથી શીખ્યું છે કે આગળ "ખાવા જઈશ", "જમવા બેસીશ" આવવાની શક્યતા વધારે છે! એમાંથી જે શબ્દની સંભાવના સૌથી વધારે હોય, એ પસંદ કરે છે. આ પસંદગી શુદ્ધ ગણિત છે, લાગણી નથી! ફોટોમાં પણ pattern છે! આંખ, નાક, મોઢું, આ બધાં એક ચોક્કસ ગોઠવણીમાં આવે છે! AIએ લાખો ચહેરા જોયા છે, એટલે એ જાણે છે કે આંખ સામાન્ય રીતે ક્યાં હોય, નાક કેટલું નીચે, મોઢું ક્યાં! જ્યારે એ ફોટો બનાવે છે, ત્યારે એ pattern મુજબ પિક્સેલ ગોઠવે છે, એટલે ચહેરો સાચો(real) લાગે છે! વિડિયોમાં pattern હજી વધારે મહત્વનો ભાગ ભજવે છે! ચાલતા માણસમાં પગ આગળ-પાછળ જાય છે, હાથ હલે છે, આ બધું જ "motion pattern" છે! AI એ પેટર્ન, datasetમાંથી શીખે જેમાં લાખો ફોટાઓ સ્ટોર હોય છે અને પછી ગણિતથી ફ્રેમ-દર-ફ્રેમ લાગુ કરે છે! અંતમાં એટલું જ સમજવું જરૂરી છે કે AI સમજતું નથી, પરંતુ pattern ઓળખે છે! આ pattern સંખ્યાઓથી બને છે, સંભાવનાથી ચાલે છે અને ગણિતથી નિયંત્રિત થાય છે! હવે સૌથી મહત્વનો પ્રશ્ન, AIના જવાબ સાચા કેમ લાગે છે? કારણ કે એ ભાષાની પેટર્ન શીખી ગયું છે, એ જાણે છે કે પ્રશ્ન હોય તો જવાબ કેવી રીતે લખાય! પરંતુ AIને સાચું-ખોટું સમજાતું નથી, એટલે ક્યારેક એ ખોટો જવાબ પણ આપી શકે છે! અહીં એક વાત એ પણ છે કે, AI બુદ્ધિશાળી નથી, પરંતુ એ માણસની બુદ્ધિનો અરીસો છે! માણસે જે લખ્યું, જે વિચાર્યું, જે બનાવ્યું, એ બધું AIના datasetમાં છે! એટલે AI આપણું પ્રતિબિંબ છે! અંતે પ્રશ્ન AIનો નથી, પ્રશ્ન આપણો છે! આપણે કેવી રીતે પ્રશ્ન પૂછીએ છીએ? આપણે AIનો ઉપયોગ સાધન તરીકે કરીએ છીએ કે આપણા વિચારવાની ક્ષમતાના વિકલ્પ તરીકે?! AI આપણને મદદ કરી શકે છે, પરંતુ વિચારવાનું કામ માણસે જ કરવું પડશે! જ્યાં સુધી માણસ વિચારશે, પ્રશ્ન કરશે, ત્યાં સુધી AI ફક્ત એક સાધન રહેશે માલિક નહીં!