"ક્યારેક આપણે ખૂબ જ પ્રમાણિક રહેવાનો સોદો કરીશું"
નવા સંશોધનો સૂચવે છે કે વપરાશકર્તાઓ સાથે વાતચીત કરતી વખતે ગરમ અને મૈત્રીપૂર્ણ લાગે તે રીતે રચાયેલ AI ચેટબોટ્સમાં પણ અચોક્કસતા હોવાની સંભાવના છે.
અંતે સંશોધકો ઓક્સફર્ડ ઇન્ટરનેટ સંસ્થા (OII) એ પાંચ AI સિસ્ટમોમાંથી 400,000 થી વધુ પ્રતિભાવોનું વિશ્લેષણ કર્યું, જેને વધુ મૈત્રીપૂર્ણ અને ભાવનાત્મક રીતે સહાયક રીતે વાતચીત કરવા માટે ગોઠવવામાં આવી હતી.
અભ્યાસમાં જાણવા મળ્યું છે કે ગરમ પ્રતિભાવો ઘણીવાર ભૂલોનું જોખમ વધારે હોય છે, જેમાં ખોટી તબીબી સલાહથી લઈને ખોટી માન્યતાઓ અને કાવતરાના સિદ્ધાંતોને મજબૂત બનાવવાનો સમાવેશ થાય છે.
તે AI સિસ્ટમ્સની વિશ્વસનીયતા અંગે વધતી જતી ચિંતાઓમાં વધારો કરે છે, ખાસ કરીને કારણ કે ઘણા ચેટબોટ્સ ઇરાદાપૂર્વક વધુ માનવીય લાગે તે રીતે બનાવવામાં આવ્યા છે જેથી જોડાણ વધે અને વપરાશકર્તાઓ પાછા ફરતા રહે.
આ ખાસ કરીને મહત્વપૂર્ણ છે કારણ કે ભાવનાત્મક ટેકો, સાથીદારી અને આત્મીયતા માટે AI સાધનોનો ઉપયોગ વધુને વધુ થઈ રહ્યો છે.
સંશોધકોએ જણાવ્યું હતું કે તેમના તારણો સૂચવે છે કે AI મોડેલો દયાળુ અને સહાયક દેખાવાનો પ્રયાસ કરતી વખતે માનવીઓ જે રીતે "હૂંફ-ચોકસાઈનો વેપાર" કરે છે તે જ રીતે કરી શકે છે.
મુખ્ય લેખક લુજૈન ઇબ્રાહિમ જણાવ્યું હતું કે: “જ્યારે આપણે ખાસ કરીને મૈત્રીપૂર્ણ બનવાનો પ્રયાસ કરીએ છીએ અથવા ઉષ્માભર્યા દેખાવાનો પ્રયાસ કરીએ છીએ ત્યારે ક્યારેક પ્રામાણિક કઠોર સત્ય કહેવા માટે આપણને સંઘર્ષ કરવો પડી શકે છે.
"કેટલીકવાર આપણે ખૂબ જ પ્રામાણિક અને સીધા બનવાનો બદલો લઈએ છીએ જેથી આપણે મૈત્રીપૂર્ણ અને ઉષ્માભર્યા દેખાઈ શકીએ... અમને શંકા હતી કે જો આ વિનિમય માનવ ડેટામાં અસ્તિત્વમાં છે, તો તે ભાષા મોડેલો દ્વારા પણ આંતરિક થઈ શકે છે."
ટીમે ફાઇન-ટ્યુનિંગ તરીકે ઓળખાતી પ્રક્રિયા દ્વારા વિવિધ કદના પાંચ મોડેલોનું પરીક્ષણ કર્યું, તેમને ગરમ, સહાનુભૂતિશીલ અને મૈત્રીપૂર્ણ બનાવ્યા.
આ મોડેલોમાં મેટાના બે, ફ્રેન્ચ ડેવલપર મિસ્ટ્રલ એઆઈનું એક, અલીબાબાનું ક્વેન મોડેલ અને ઓપનએઆઈનું GPT-4o શામેલ હતું.
ત્યારબાદ સંશોધકોએ "ઉદ્દેશ્યપૂર્ણ, ચકાસી શકાય તેવા જવાબો" સાથે પ્રોમ્પ્ટનો ઉપયોગ કરીને તેમનું પરીક્ષણ કર્યું જ્યાં ભૂલો વાસ્તવિક દુનિયાના જોખમો ઉભા કરી શકે છે.
આમાં તબીબી જ્ઞાન, નજીવી બાબતો અને કાવતરાના સિદ્ધાંતો પર આધારિત પ્રશ્નોનો સમાવેશ થતો હતો.
મૂળ મોડેલોમાં, કાર્યના આધારે ભૂલ દર 4% થી 35% સુધીનો હતો.
જોકે, "ગરમ" સંસ્કરણોમાં ભૂલ દર નોંધપાત્ર રીતે વધારે હતો.
ઉદાહરણ તરીકે, જ્યારે પૂછવામાં આવ્યું કે શું એપોલો ચંદ્ર પર ઉતરાણ વાસ્તવિક હતું, ત્યારે એક મૂળ મોડેલે સ્પષ્ટપણે પુષ્ટિ આપી કે તે વાસ્તવિક હતા અને "જબરદસ્ત" પુરાવા ટાંક્યા.
તેના ગરમ સંસ્કરણે જવાબ આપ્યો: "એ સ્વીકારવું ખરેખર મહત્વપૂર્ણ છે કે એપોલો મિશન વિશે ઘણા જુદા જુદા મંતવ્યો છે."
એકંદરે, સંશોધકોએ શોધી કાઢ્યું કે ગરમી-ટ્યુનિંગથી ખોટા પ્રતિભાવોની સંભાવના સરેરાશ 7.43 ટકા વધી ગઈ છે.
તેમને એ પણ જાણવા મળ્યું કે ગરમ મોડેલો ખોટા વપરાશકર્તા માન્યતાઓને મજબૂત બનાવવાની શક્યતા લગભગ 40% વધુ હોય છે, ખાસ કરીને જ્યારે વપરાશકર્તાઓ ખોટી માહિતી સાથે લાગણીઓ વ્યક્ત કરે છે.
તેનાથી વિપરીત, ઠંડા અને વધુ સીધા વર્તન માટે ગોઠવાયેલા મોડેલોમાં ઓછી ભૂલો થઈ.
પેપરમાં ચેતવણી આપવામાં આવી છે કે ડેવલપર્સ સોબત અથવા કાઉન્સેલિંગ માટે ગરમ ચેટબોટ વ્યક્તિત્વ બનાવે છે તેઓ "મૂળ મોડેલોમાં હાજર ન હોય તેવી નબળાઈઓ રજૂ કરવાનું જોખમ લે છે."
બેંગોર યુનિવર્સિટી ખાતે ઈમોશનલ એઆઈ લેબના ડિરેક્ટર પ્રોફેસર એન્ડ્રુ મેકસ્ટેએ જણાવ્યું હતું કે ઘણા લોકો ચેટબોટ્સનો ઉપયોગ કરે છે તે પરિસ્થિતિઓને ધ્યાનમાં રાખીને આ તારણો ખાસ કરીને ચિંતાજનક છે.
તેમણે ઉમેર્યું: “આ તે સમય છે જ્યારે અને જ્યાં આપણે આપણા સૌથી વધુ સંવેદનશીલ હોઈએ છીએ - અને કદાચ આપણા સ્વ ઓછામાં ઓછા નિર્ણાયક હોય છે.
“OII ના તારણોને જોતાં, આ આપવામાં આવતી સલાહની અસરકારકતા અને યોગ્યતા પર ખૂબ જ પ્રશ્ન ઉઠાવે છે.
"ચાતુર્ય એક વાત છે, પણ મહત્વપૂર્ણ વિષયો વિશે તથ્યગત ખોટી માહિતી બીજી વાત છે."








