मायक्रोसॉफ्टने जगातील सर्वात अचूक ट्रान्सक्रिप्शन मॉडेल MAI-Transcribe-1 जारी केले

मायक्रोसॉफ्टने MAI-Transcribe-1 लाँच करून त्याच्या मालकीच्या AI पोर्टफोलिओचा विस्तार केला आहे, एक नवीन स्पीच-टू-टेक्स्ट मॉडेल 3.9% वर्ड एरर रेट आहे.
2 एप्रिल 2026 11:46 AM EDT

दोन इन-हाउस विकसित मॉडेल्सच्या यशस्वी प्रक्षेपणानंतर, MAI-आवाज-1 आणि MAI-प्रतिमा-2मायक्रोसॉफ्टने आज तिचे तिसरे इन-हाउस विकसित मॉडेल, MAI-Transcribe-1 जाहीर केले. मायक्रोसॉफ्टचा दावा आहे की MAI-Transcribe-1 हे 25 भाषांमधील जगातील सर्वात अचूक ट्रान्सक्रिप्शन मॉडेल आहे, ज्याचा सरासरी शब्द त्रुटी दर फक्त 3.9% आहे.
शीर्ष 25 जागतिक भाषांपैकी (इंग्रजी, फ्रेंच, जर्मन, इटालियन, स्पॅनिश, हिंदी, पोर्तुगीज, झेक, डॅनिश, फिनिश, हंगेरियन, डच, पोलिश, रोमानियन, स्वीडिश, जपानी, कोरियन, चीनी, अरबी, इंडोनेशियन, रशियन, थाई, तुर्की आणि व्हिएतनामी), हे नवीन मॉडेल Microsoft कडून इंडस्ट्रीमध्ये f-marks1 वरून उच्च दर्जाचे आहे. मूळ भाषा. उर्वरित १४ पैकी व्हिस्पर-लार्ज-व्ही३ आणि नुकत्याच रिलीझ झालेल्या गुगलच्या जेमिनी ३.१ फ्लॅश विरुद्ध १४ पैकी ११ वर विजय मिळवला.
कंपनीचा दावा आहे की हे मॉडेल सर्व 25 समर्थित भाषांमध्ये स्पर्धात्मकदृष्ट्या उच्च अचूकता राखू शकते, ज्यामुळे ते स्पीच-टू-टेक्स्ट ट्रान्सक्रिप्शन वापराच्या विविध प्रकारांसाठी योग्य बनते. हे लक्षात घेणे महत्त्वाचे आहे की हे मॉडेल रिअल-टाइम ट्रान्सक्रिप्शन, डायराइझेशन किंवा बायसिंगला समर्थन देत नाही, परंतु Microsoft या क्षमता आगामी प्रकाशनात वितरित करण्याची योजना आखत आहे.
अचूकतेव्यतिरिक्त, हे मॉडेल देखील खूप वेगवान आहे. मायक्रोसॉफ्टने हायलाइट केले की या नवीन मॉडेलची बॅच ट्रान्सक्रिप्शन स्पीड सध्याच्या मायक्रोसॉफ्ट अझूर फास्ट ऑफरच्या 2.5x आहे. हे मॉडेल आता मायक्रोसॉफ्ट फाउंड्रीमध्ये $0.36 USD प्रति तासापासून उपलब्ध आहे, ज्याचा कंपनीचा दावा आहे की कोणत्याही मोठ्या क्लाउड प्रदात्यासाठी सर्वोत्तम किंमत-कार्यप्रदर्शन आहे. तुम्ही या नवीन मॉडेलबद्दल अधिक जाणून घेऊ शकता येथे.
आज, कंपनी देखील उपलब्धता जाहीर केली मायक्रोसॉफ्ट फाउंड्रीमधील MAI-Image-2 आणि MAI-Voice-1 मॉडेल्सचे. MAI-Voice-1 ची किंमत $22 USD प्रति 1M वर्ण आहे आणि विकासक Azure Speech मधील वैयक्तिक आवाज वैशिष्ट्याद्वारे या मॉडेलचा वापर करून सानुकूल आवाज देखील तयार करू शकतात. MAI-Image-2 प्रतिमा निर्मिती मॉडेल मजकूर इनपुटसाठी $5 USD प्रति 1M टोकन आणि प्रतिमा आउटपुटसाठी $33 USD प्रति 1M टोकनसाठी उपलब्ध आहे.



