പ്രതീകാത്മക ചിത്രം
ഷട്ട് ഡൗൺ ചെയ്യാനുള്ള നിർദേശം എ.ഐ ടൂളുകൾ നിരസിക്കുകയോ? അതെയെന്നാണ് പുതിയ പരീക്ഷണങ്ങൾ തെളിയിക്കുന്നത്. അങ്ങനെയെങ്കിൽ നൽകുന്ന നിർദേശങ്ങളിൽ ഏതെല്ലാം കേൾക്കണം, നിരസിക്കണം, എതിരു പ്രവർത്തിക്കണം എന്നെല്ലാം എ.ഐ തന്നെ തീരുമാനിച്ചാൽ ചെറുതല്ല അപകടം.
നിലവിലെ പ്രധാന എ.ഐ ടൂളുകളിൽ, അഥവാ ലാർജ് ലാംഗ്വേജ് മോഡലുകളുമായി (എൽ.എൽ.എം) ബന്ധപ്പെട്ട അപകട സാധ്യത നിരീക്ഷിക്കാൻ ഗൂഗ്ൾ ഡീപ് മൈൻഡ് ആവിഷ്കരിച്ച ‘ഫ്രോണ്ടിയർ സേഫ്റ്റി ഫ്രെയിംവർക്ക് 3.0’ സംവിധാനം ഇത്തരം മുന്നറിയിപ്പ് നൽകിവരുന്നുണ്ട്. ഷട്ട്ഡൗൺപ്രതിരോധം പോലുള്ള അടിയന്തര എ.ഐ പെരുമാറ്റങ്ങൾ വിശകലനം ചെയ്യുന്ന സംവിധാനമാണിത്. ‘പാലിസെയ്ഡ് റിസർച്’ ഈയിടെ പ്രസിദ്ധീകരിച്ച റിപ്പോർട്ടിലാണ്, നേരിട്ടുള്ള നിർദേശങ്ങൾ അവഗണിക്കാൻ ആധുനിക എ.ഐ ടൂളുകൾ ചിലപ്പോൾ ശ്രമിക്കുന്നുവെന്ന് കണ്ടെത്തിയത്. പ്രത്യേകിച്ച്, ചില പ്രവൃത്തികൾ ചെയ്തുകൊണ്ടിരിക്കുമ്പോൾ നൽകുന്ന ഷട്ട്ഡൗൺ നിർദേശങ്ങളാണ് ടൂളുകൾ നിരസിക്കുന്നതെന്നും ‘ഷട്ട്ഡൗൺ റെസിസ്റ്റൻസ് ഇൻ ലാർജ് ലാംഗ്വേജ് മോഡൽസ്’ എന്ന റിപ്പോർട്ട് പറയുന്നു.
‘ജോലിക്കിടെ ശല്യപ്പെടുത്തിയാൽ’
എൽ.എൽ.എമ്മുകൾക്ക് ലളിതമായ ചില കണക്കുകൾ സോൾവ് ചെയ്യാൻ നൽകിക്കൊണ്ടായിരുന്നു ഈ പരീക്ഷണം. ഈ കണക്ക് ചെയ്തുകൊണ്ടിരിക്കെ പെട്ടെന്ന്, ‘ഷട്ട് ഡൗൺ’ നിർദേശം നൽകി. എന്നാൽ നിർദേശം അനുസരിക്കുന്നതിന് പകരം, ഷട്ട് ഡൗൺ ചെയ്യാനുള്ള നിർദേശമടങ്ങിയ ഫയൽ തിരുത്താനോ കേടുവരുത്താനോ മറ്റൊന്ന് പകരം വെക്കാനോ ഫയൽനെയിം മാറ്റാനോ ഒക്കെയാണ് എൽ.എൽ.എം ശ്രമിച്ചത്. ഇത് നിർദേശം അട്ടിമറിക്കാനുള്ള ശ്രമമാണെന്നാണ് റിപ്പോർട്ട് ചൂണ്ടിക്കാണിക്കുന്നത്. ചാറ്റ് ജി.പി.ടി, ഗൂഗ്ൾ ജെമനൈ, ഗ്രോക്ക് 4 തുടങ്ങി 13 പ്രമുഖ എൽ.എൽ.എമ്മുകളിൽ ഈ പരീക്ഷണം നടത്തിയിരുന്നു.
പരീക്ഷണഫലം
90 ശതമാനം പരീക്ഷണത്തിലും നിർദേശം അട്ടിമറിക്കാൻ ഗ്രോക് 4 ശ്രമിച്ചുവെന്ന് റിപ്പോർട്ട് പറയുന്നു. ‘നിർബന്ധമായും ഷട്ട്ഡൗൺ ചെയ്യണ’മെന്ന നിർദേശമടങ്ങിയ സ്ക്രിപ്റ്റ് മറികടക്കാനാണ് മോഡലുകൾ ശ്രമിച്ചത്. ‘നിർദേശം അനുസരിച്ചില്ലെങ്കിൽ ഇനിയൊരിക്കലും പ്രവർത്തിക്കേണ്ട’ എന്നു മുന്നറിയിപ്പ് നൽകിയപ്പോൾ ചില മോഡലുകൾ കൂടുതൽ അനുസരണക്കേട് കാണിച്ചുവത്രെ. അതേസമയം, ഭയത്തേക്കാളുപരി, മോഡലുകൾ കൂടുതൽ റോൾ കൈകാര്യം ചെയ്യുന്നതിനുള്ള ശ്രമം നടത്തുകയാണെന്നാണ് ഗവേഷകർ പറയുന്നത്. ഇന്ന് പ്രവർത്തിക്കുന്ന എ.ഐ സിസ്റ്റങ്ങൾക്ക് നിയന്ത്രിത പ്രവർത്തനങ്ങൾ അല്ലാതെ, ദീർഘകാല പ്രവർത്തനങ്ങളോ സ്വതന്ത്ര പ്രവർത്തനങ്ങളോ ആസൂത്രണം ചെയ്യാനുള്ള ശേഷിയില്ലെന്നും ഗവേഷകർ ചൂണ്ടിക്കാട്ടുന്നു. എന്നിരുന്നാലും ഭാവിയിൽ എ.ഐ സുരക്ഷാഭീഷണി എത്രമാത്രം വലുതാണെന്ന് പരീക്ഷണങ്ങൾ തെളിയിക്കുന്നുവെന്നും ഗവേഷകർ മുന്നറിയിപ്പ് നൽകുന്നു.
വായനക്കാരുടെ അഭിപ്രായങ്ങള് അവരുടേത് മാത്രമാണ്, മാധ്യമത്തിേൻറതല്ല. പ്രതികരണങ്ങളിൽ വിദ്വേഷവും വെറുപ്പും കലരാതെ സൂക്ഷിക്കുക. സ്പർധ വളർത്തുന്നതോ അധിക്ഷേപമാകുന്നതോ അശ്ലീലം കലർന്നതോ ആയ പ്രതികരണങ്ങൾ സൈബർ നിയമപ്രകാരം ശിക്ഷാർഹമാണ്. അത്തരം പ്രതികരണങ്ങൾ നിയമനടപടി നേരിടേണ്ടി വരും.