Meta-მ წარმოადგინა SeamlessM4T ხელოვნური ინტელექტის მოდელი, რომელსაც შეუძლია მეტყველების ამოცნობა და მისი თითქმის 100 ენაზე თარგმნა.
თავად კომპანიაში ამბობენ, რომ ეს არის გარღვევა ხელოვნური ინტელექტის გამოყენებით მეტყველებაში და მეტყველების ტექსტში გადაყვანაში.
„ჩვენი ერთიანი მოდელი უზრუნველყოფს მოთხოვნილ თარგმანს, რომელიც საშუალებას აძლევს სხვადასხვა ენებზე მოსაუბრე ადამიანებს უფრო ეფექტურად დაუკავშირდნენ ერთმანეთს. SeamlessM4T ირიბად ცნობს საწყის ენებს ცალკე ენის იდენტიფიკაციის მოდელის საჭიროების გარეშე. ამ ბოლო წინადადებით თუ ვიმსჯელებთ, ჩვენ ვსაუბრობთ ხელოვნური ინტელექტის მოდელზე, რომელიც თავდაპირველად გაწვრთნილი იყო როგორც ენის ამოცნობისა და ტექსტად გადაქცევისთვის, ასევე თარგმნისთვის. ანუ, ეს არ არის ორი ცალკეული მოდელი ერთ პროგრამაში“, - ამბობენ კომპანიაში.
მისი დამუშავების პროცესში META-ამ გამოიყენა დაახლოებით „ათობით მილიარდი“ წინადადება და 4 მილიონი საათი მეტყველება. გარდა ამისა, მკვლევარებმა 443,000 საათი მეტყველება შეადარეს ტექსტს და შექმნეს 29,000 საათი მეტყველება-სიტყვის შესატყვისი, რომელიც SeamlessM4T-ს ასწავლიდა მეტყველების ტექსტად გადაწერას, ტექსტის თარგმნას, ტექსტიდან მეტყველების გენერირება და მეტყველების თარგმნასაც კი.
ამავდროულად, META-ს ესმის, რომ მისი მოდელი არ არის იდეალური, ამიტომ ის არ გირჩევთ SeamlessM4T-ის გამოყენებას გრძელი ფორმებისა და სხვადასხვა დოკუმენტის თარგმნისთვის, რომლებიც აღიარებულია სამთავრობო უწყებებისა და მთარგმნელობითი ორგანოების მიერ. Meta ასევე არ გირჩევთ SeamlessM4T-ის გამოყენებას სამედიცინო ან იურიდიული მიზნებისთვის.