ഗൂഗ്ൾ ജെമിനിയെ പിന്നിലാക്കി മറ്റൊരു എ.ഐ മോഡൽ; കുറഞ്ഞ ചിലവിൽ അതിവേഗ ട്രാൻസ്ക്രിപ്ഷനുമായി മൈക്രോസോഫ്റ്റ്
text_fieldsസാൻഫ്രാൻസിസ്കോ: ആർട്ടിഫിഷ്യൽ ഇന്റലിജൻസ് രംഗത്ത് വിപ്ലവകരമായ മാറ്റങ്ങൾ ലക്ഷ്യമിട്ട് മൈക്രോസോഫ്റ്റ് തങ്ങളുടെ മൂന്നാമത്തെ ഇൻ-ഹൗസ് എ.ഐ മോഡലായ MAI-Transcribe-1 പുറത്തിറക്കി. ലോകത്തിലെ തന്നെ ഏറ്റവും കൃത്യതയാർന്ന ട്രാൻസ്ക്രിപ്ഷൻ മോഡലാണിതെന്ന് അവകാശപ്പെടുന്ന ഇതിന്റെ പിഴവ് നിരക്ക് വെറും 3.9 ശതമാനം മാത്രമാണ്. ഇംഗ്ലീഷ്, ഹിന്ദി, അറബിക്, ചൈനീസ് തുടങ്ങി 25 ഓളം ഭാഷകളിൽ ഈ സേവനം ലഭ്യമാണ്. വ്യവസായ മാനദണ്ഡമായ ഫ്ലുവേസ് ബെഞ്ച്മാർക്കിൽ 11 പ്രധാന ഭാഷകളിൽ ഒന്നാം സ്ഥാനത്തെത്തിയ ഈ മോഡൽ, ഗൂഗിളിന്റെ ഏറ്റവും പുതിയ ജെമിനി 3.1 ഫ്ലാഷിനെ 11 ഭാഷകളിൽ പിന്നിലാക്കി എന്നത് ശ്രദ്ധേയമാണ്.
മൈക്രോസോഫ്റ്റ് ഫൗണ്ടറിയിൽ ലഭ്യമായ ഈ മോഡലിന്റെ മറ്റൊരു പ്രത്യേകത അതിന്റെ കുറഞ്ഞ ചിലവാണ്. ഒരു മണിക്കൂർ ഉപയോഗിക്കുന്നതിന് വെറും 0.36 ഡോളർ ( 33.34 രൂപ) മാത്രമേ ചിലവാകൂ. നിലവിലുള്ള അസൂർ ഫാസ്റ്റ് സേവനത്തേക്കാൾ 2.5 മടങ്ങ് വേഗതയിൽ പ്രവർത്തിക്കാനും ഇതിന് സാധിക്കും. നിലവിൽ റിയൽ-ടൈം ട്രാൻസ്ക്രിപ്ഷൻ സൗകര്യം ഇതിലില്ലെങ്കിലും ഭാവിയിൽ ആ ഫീചർ കൂടി ഉൾപ്പെടുത്തുമെന്ന് മൈക്രോസോഫ്റ്റ് വ്യക്തമാക്കി. സ്പീച്-ടു-ടെക്സ്റ്റ് ആവശ്യങ്ങൾക്കായി ഏറ്റവും മികച്ച ചോയിസായി ഈ മോഡൽ മാറുമെന്നാണ് ടെക് ലോകത്തെ വിലയിരുത്തൽ.
ട്രാൻസ്ക്രിപ്ഷൻ മോഡലിന് പുറമെ MAI-Voice-1, MAI-Image-2 എന്നീ രണ്ട് മോഡലുകൾ കൂടി മൈക്രോസോഫ്റ്റ് അവതരിപ്പിച്ചു. മനുഷ്യശബ്ദത്തിന് സമാനമായ രീതിയിൽ വികാരങ്ങളും പ്രകടനങ്ങളും ഉൾക്കൊള്ളുന്ന ശബ്ദങ്ങൾ സൃഷ്ടിക്കാൻ MAI-Voice-1ന് കഴിയും. വെറും ഒരു സെക്കൻഡിനുള്ളിൽ 60 സെക്കൻഡ് ദൈർഘ്യമുള്ള ഓഡിയോ നിർമിക്കാൻ ശേഷിയുള്ള ഈ മോഡൽ കോപൈലറ്റ് പോഡ്കാസ്റ്റുകളിൽ ലഭ്യമാണ്. പ്രകടനത്തിലും വേഗതയിലും ശ്രദ്ധ കേന്ദ്രീകരിക്കുന്ന MAI-Image-2 ചിത്രങ്ങൾ അതിവേഗത്തിൽ നിർമിക്കാൻ സഹായിക്കുന്ന ഒന്നാണ്. ഗൂഗ്ളിന്റെയും ഓപൺ എ.ഐയുടെയും വലിയ ഭാഷ മോഡലുകൾക്ക് പകരമായി കുറഞ്ഞ ചിലവിൽ ലഭ്യമാകുന്ന ഇത്തരം ചെറിയ മോഡലുകളിലൂടെ വിപണി പിടിക്കാനാണ് മൈക്രോസോഫ്റ്റ് ലക്ഷ്യമിടുന്നത്.
Don't miss the exclusive news, Stay updated
Subscribe to our Newsletter
By subscribing you agree to our Terms & Conditions.

