സാൻഫ്രാൻസിസ്കോ: ആർട്ടിഫിഷ്യൽ ഇന്റലിജൻസ് രംഗത്ത് വിപ്ലവകരമായ മാറ്റങ്ങൾ ലക്ഷ്യമിട്ട് മൈക്രോസോഫ്റ്റ് തങ്ങളുടെ മൂന്നാമത്തെ ഇൻ-ഹൗസ് എ.ഐ മോഡലായ MAI-Transcribe-1 പുറത്തിറക്കി. ലോകത്തിലെ തന്നെ ഏറ്റവും കൃത്യതയാർന്ന ട്രാൻസ്ക്രിപ്ഷൻ മോഡലാണിതെന്ന് അവകാശപ്പെടുന്ന ഇതിന്റെ പിഴവ് നിരക്ക് വെറും 3.9 ശതമാനം മാത്രമാണ്. ഇംഗ്ലീഷ്, ഹിന്ദി, അറബിക്, ചൈനീസ് തുടങ്ങി 25 ഓളം ഭാഷകളിൽ ഈ സേവനം ലഭ്യമാണ്. വ്യവസായ മാനദണ്ഡമായ ഫ്ലുവേസ് ബെഞ്ച്മാർക്കിൽ 11 പ്രധാന ഭാഷകളിൽ ഒന്നാം സ്ഥാനത്തെത്തിയ ഈ മോഡൽ, ഗൂഗിളിന്റെ ഏറ്റവും പുതിയ ജെമിനി 3.1 ഫ്ലാഷിനെ 11 ഭാഷകളിൽ പിന്നിലാക്കി എന്നത് ശ്രദ്ധേയമാണ്.
മൈക്രോസോഫ്റ്റ് ഫൗണ്ടറിയിൽ ലഭ്യമായ ഈ മോഡലിന്റെ മറ്റൊരു പ്രത്യേകത അതിന്റെ കുറഞ്ഞ ചിലവാണ്. ഒരു മണിക്കൂർ ഉപയോഗിക്കുന്നതിന് വെറും 0.36 ഡോളർ ( 33.34 രൂപ) മാത്രമേ ചിലവാകൂ. നിലവിലുള്ള അസൂർ ഫാസ്റ്റ് സേവനത്തേക്കാൾ 2.5 മടങ്ങ് വേഗതയിൽ പ്രവർത്തിക്കാനും ഇതിന് സാധിക്കും. നിലവിൽ റിയൽ-ടൈം ട്രാൻസ്ക്രിപ്ഷൻ സൗകര്യം ഇതിലില്ലെങ്കിലും ഭാവിയിൽ ആ ഫീചർ കൂടി ഉൾപ്പെടുത്തുമെന്ന് മൈക്രോസോഫ്റ്റ് വ്യക്തമാക്കി. സ്പീച്-ടു-ടെക്സ്റ്റ് ആവശ്യങ്ങൾക്കായി ഏറ്റവും മികച്ച ചോയിസായി ഈ മോഡൽ മാറുമെന്നാണ് ടെക് ലോകത്തെ വിലയിരുത്തൽ.
ട്രാൻസ്ക്രിപ്ഷൻ മോഡലിന് പുറമെ MAI-Voice-1, MAI-Image-2 എന്നീ രണ്ട് മോഡലുകൾ കൂടി മൈക്രോസോഫ്റ്റ് അവതരിപ്പിച്ചു. മനുഷ്യശബ്ദത്തിന് സമാനമായ രീതിയിൽ വികാരങ്ങളും പ്രകടനങ്ങളും ഉൾക്കൊള്ളുന്ന ശബ്ദങ്ങൾ സൃഷ്ടിക്കാൻ MAI-Voice-1ന് കഴിയും. വെറും ഒരു സെക്കൻഡിനുള്ളിൽ 60 സെക്കൻഡ് ദൈർഘ്യമുള്ള ഓഡിയോ നിർമിക്കാൻ ശേഷിയുള്ള ഈ മോഡൽ കോപൈലറ്റ് പോഡ്കാസ്റ്റുകളിൽ ലഭ്യമാണ്. പ്രകടനത്തിലും വേഗതയിലും ശ്രദ്ധ കേന്ദ്രീകരിക്കുന്ന MAI-Image-2 ചിത്രങ്ങൾ അതിവേഗത്തിൽ നിർമിക്കാൻ സഹായിക്കുന്ന ഒന്നാണ്. ഗൂഗ്ളിന്റെയും ഓപൺ എ.ഐയുടെയും വലിയ ഭാഷ മോഡലുകൾക്ക് പകരമായി കുറഞ്ഞ ചിലവിൽ ലഭ്യമാകുന്ന ഇത്തരം ചെറിയ മോഡലുകളിലൂടെ വിപണി പിടിക്കാനാണ് മൈക്രോസോഫ്റ്റ് ലക്ഷ്യമിടുന്നത്.
വായനക്കാരുടെ അഭിപ്രായങ്ങള് അവരുടേത് മാത്രമാണ്, മാധ്യമത്തിേൻറതല്ല. പ്രതികരണങ്ങളിൽ വിദ്വേഷവും വെറുപ്പും കലരാതെ സൂക്ഷിക്കുക. സ്പർധ വളർത്തുന്നതോ അധിക്ഷേപമാകുന്നതോ അശ്ലീലം കലർന്നതോ ആയ പ്രതികരണങ്ങൾ സൈബർ നിയമപ്രകാരം ശിക്ഷാർഹമാണ്. അത്തരം പ്രതികരണങ്ങൾ നിയമനടപടി നേരിടേണ്ടി വരും.