خبر " گوگل ترنسلیت و میت با هوش مصنوعی Gemini 3.5 Live Translate متحول می‌شوند [تماشا کنید] "

گوگل به تازگی از انتشار مدل هوش مصنوعی Gemini 3.5 Live Translate پرده برداشته است؛ ابزار قدرتمندی که به زودی با اضافه شدن به سرویس‌های گوگل میت و گوگل ترنسلیت، تجربه ترجمه هم‌زمان و زنده مکالمات صوتی را به سطحی کاملاً جدید ارتقا می‌دهد.

به گفته گوگل، Gemini 3.5 Live Translate می‌تواند به‌طور خودکار بیش از ۷۰ زبان را شناسایی کند. این مدل همچنین می‌تواند ترجمه‌هایی با صدای طبیعی تولید کند که لحن، سرعت و گام صدای گوینده در آنها حفظ شده است. ‌علاوه‌براین، برعکس سیستم‌های نوبتی که منتظر می‌مانند تا صحبت‌های گوینده تمام شود، این مدل می‌تواند به‌طور هم‌زمان گفتار گوینده را ترجمه کند.

گوگل این مدل را در دو دمو به نمایش گذاشته است. دموی اول تجربه دوبله زنده را نشان می‌دهد که در آن یک ویدیو به‌صورت هم‌زمان به زبان دیگری ترجمه می‌شود. در‌همین‌حال، دموی دوم بر ترجمه سخنرانی‌ها و ارائه‌ها به چندین زبان تمرکز دارد که نتایج هر دو بسیار چشمگیر است.

قابلیت‌های جدید Gemini 3.5 Live Translate در گوگل میت و ترنسلیت

گوگل اعلام کرده که Gemini 3.5 Live Translate به گوگل میت اضافه خواهد شد. این قابلیت پس از عرضه، پشتیبانی از بیش از ۷۰ زبان را به همراه خواهد داشت که پیشرفتی بزرگ نسبت به محدودیت فعلیِ تنها ۵ زبان محسوب می‌شود. یکی دیگر از نکات برجسته این است که امکان ترکیب بیش از ۲۰۰۰ زبان را در یک جلسه فراهم می‌کند؛ درحالی‌که پیش از این، ترجمه گفتار در گوگل میت تنها به زبان انگلیسی یا از زبان انگلیسی انجام می‌شد. گوگل همچنین قصد دارد رابط کاربری گوگل میت را به‌روزرسانی کند تا بتوانید سریع‌تر به ترجمه گفتار دسترسی داشته باشید.

نسخه بهبودیافته ترجمه گفتار در گوگل میت در ابتدا به‌صورت پیش‌نمایش خصوصی برای مشتریان تجاری منتخب Google Workspace عرضه خواهد شد. غول فناوری سپس آن را در اواخر سال جاری میلادی برای کاربران بیشتری توسعه می‌دهد.

مدل Gemini 3.5 Live Translate همچنین به صورت جهانی برای برنامه ترنسلیت در اندروید و iOS عرضه می‌شود. همراه با این انتشار، گوگل یک «حالت شنیداری» جدید را نیز برای اندروید معرفی کرده است. این حالت جدید نرم‌افزار علاوه‌بر امکان گوش دادن به ترجمه‌های زنده از طریق هدفون، قابلیت شنیدن مستقیم ترجمه‌ها از طریق بلندگوی گوشی را هم فراهم می‌کند.

مانند تمام محتواهای تولیدشده توسط هوش مصنوعی، صدای ایجادشده توسط Gemini 3.5 Live Translate با SynthID علامت‌گذاری خواهد شد. فناوری SynthID یک واترمارک نامرئی است که برای جلوگیری از انتشار اطلاعات نادرست استفاده می‌شود. گوگل می‌گوید این واترمارک به‌طور مستقیم در خروجی صوتی تعبیه خواهد شد.

قابلیت‌های جدید Gemini 3.5 Live Translate در گوگل میت و ترنسلیت

نوشته‌های مرتبط

پیام بگذارید لغو پاسخ