گــــفــتـــار

هوشمندانه، ارزشمندترین‌ها را انتخاب کنید.

آیــپــا با استفاده از فنّاوری یادگیری ماشینی (machine learning)، امکان افزودن قابلیت پردازش، تحلیل و تدقیق اصوات را برای برنامه‌های کاربردی و کسب‌وکار شما به ارمغان می‌آورد. با کمک این سامانه می‌توان امکان ارتباط کلامی انسان با کامپیوتر و یا موبایل را فراهم نمود. دستیاران دیجیتالی از پیدا کردن مسیرهای مشخص تا پرس‌وجو درباره وضعیت آب و هوای مقصد گردش، به عنوان راهنما در زندگی ما ظاهر شده‌اند. این ابزارها از Siri و Alexa تا google home  و Cortana از پردازش زبان طبیعی و رگولاتور‌‌‌های هدایت‌شده استفاده می‌کنند. همچنین امروزه ربات‌های پاسخگوی هوشمند در مراکز تماس تلفنی جایگزین اپراتورهای انسانی شده است و به صورت اتوماتیک و با استفاده از هوش مصنوعی پاسخ‌گوی تماس‌های مشتریان می‌باشد.

سرویس تحلیل گفتار آیپا مشتمل بر ابزارهای بازشناسی گفتار (تبدیل گفتار به نوشتار)، سنتز گفتار (تبدیل نوشتار به گفتار)، تحلیل گوینده و تحلیل صوت می‌باشد که در ادامه به معرفی هر یک خواهیم پرداخت.

بازشناسی گفتار (تبدیل گفتار به نوشتار)

این ابزار وظیفه تبدیل صوت به متن را برعهده دارد. در ماژول بازشناسی گفتار (speech recognition ) آیپا، از حدود 500 ساعت داده صوتی آموزشی از لهجه‌های مختلف فارسی برای یادگیری مدل آوایی استفاده شده است که یکی از شاخصه‌های برتری ما نسبت به سایر رقبا می‌باشد.

مزایای سیستم تبدیل گفتار به متن آیپا به شرح زیر است:

تبدیل گفتار فارسی و انگلیسی به متن با دقت و سرعت بالا

قابلیت تبدیل گفتار محاوره‌ای و رسمی به متن

امکان تشخیص گویندگان متفاوت در یک فایل صوتی

تشخیص لهجه‌های مختلف زبان فارسی

قابلیت تبدیل گفتار به متن برای زبان‌های دیگر

مقاوم در برابر نویز حتی با وجود استفاده از سنسور (میکروفون) بی‌کیفیت.

از جمله کاربردهای این ابزار به شرح زیر است:

نویسندگان و افرادی که شغل آن‌ها به گونه‌ای است که با تایپ کردن و نوشتن بسیار سروکار دارند.

افرادی که نیاز دارند از آرشیوهای صوتیِ موجود، متن آن‌ها را استخراج نمایند.

کمک به افراد کم‌توان مانند نابینایان یا کم‌شنوایان در فعالیت‌هایی نظیر پیام دادن، تایپ کردن صحبت‌ها، دستورات صوتی و غیره.

مراکز تماس سازمان‌‎ها و کسب‌وکارها برای مکتوب کردن گفت‌وگوها در لحظه برای فهم بهتر سؤالات و صحبت‌های مشتریان و پاسخ‌گویی بهتر به آن‌ها.

تشخیص فرامین و دستورات صوتی نظیر؛ اجرای برنامه‌ها در رایانه با بیان نام آن‌ها، کنترل لوازم خانگی با صوت، فرمان دادن به ربات‌ها و خودرو، کیوسک‌های اطلاعات و دستگاه‌های خودپرداز بانکی، استفاده در بازی‌های کامپیوتری (افزایش قابلیت و جذابیت) و غیره.

تحلیل گوینده 

 ابزار تحلیلِ گوینده آیپا دارای قابلیت‌های زیر می‌باشد:

 

تشخیص گوینده :(speaker identification) قابل استفاده در کاربردهای امنیتی و جنایی.

تأیید گوینده (speaker verification): قابل استفاده در رمزهای صوتی و کنترل دسترسی در رایانه‌، موبایل و تلفن بانک‌ها.

جداسازی گویندگان (speaker diarization): قابل استفاده در تایپ گفتاری صورت‌جلسه‌ها در یک جلسه، مانند صحن علنی مجلس به تفکیک گویندگان.

تطبیق و مقایسه هویت دو گوینده

تشخیص جنسیت گویندگان

تحلیل احساسات

از ابزار تحلیل گوینده به انضمام ابزار بازشناسی گفتار (تبدیل گفتار به متن)، می‌توان جلسات و گعده‌های صوتی را مورد تحلیل و مداقّه قرار داد که از مزایای این سامانه می‌توان به موارد زیر اشاره کرد:

 

استخراج متن جلسه از صوت ضبط شده آن

تفکیک محتوا براساس گویندگان

ارائه هوشمند صورت جلسه

احراز هویت از روی صدای افراد

سنتز گفتار (تبدیل نوشتار به گفتار)

ماژول سنتز گفتار (Text To Speech) برای دو زبان فارسی و انگلیسی، یکی دیگر از ابزارهای پردازش گفتار است که در بستر آیپا ارائه گردیده است. این ابزار وظیفه تبدیل متن به صوت را برعهده دارد. از ویژگی‌های ابزار سنتز گفتار می‌توان به موارد زیر اشاره کرد:

آموزش مدل با استفاده از دادگان مخصوص جمع‌آوری و ضبط‌شده توسط واحد زبان‌شناسی آرمان رایان شریف و با بهره‌مندی از صدای گویند رادیو و تلویزیون برای زبان فارسی.

انتقال احساسات موجود در متن توسط گوینده به صورت کاملاً طبیعی.

این ابزار برای تبدیل متن به فایل صوتی (کتاب گویا)، تلفظ کلمات در واژه‌نامه‌ها، خواندن صفحات رایانه و موبایل برای نابینایان کاربرد دارد. همچنین در سامانه‌های تلفن مخابرات و نیز دستگاه‌های خودپرداز جهت ارتباط گفتاری با کاربر به کار می‌رود. در برخی از سامانه‌های نوبت‌دهی مانند نوبت‌دهی مطب‌ها و بیمارستان‌ها، نام مراجعه‌کننده نیز ذخیره می‌شود که این ابزار به راحتی می‌تواند در هنگام اعلام نوبت، اسم شخص را نیز بیان نماید.

تحلیل صوت

ابزار تحلیل صوت آیپا دارای قابلیت‌های زیر می‌باشد: 

دسته‌بندی اصوات (صدای سوت قطار، لولای در، قارقار کلاغ، زنگ موبایل و غیره)

تشخیص فعالیت صدا

با استفاده از این ابزار می‌توان هشداردهنده‌هایی را طراحی کرد که نسبت به نوع خاصی از صدا حساس باشند. 

کلیه حقوق مادی و معنوی این سایت برای شرکت آرمان رایان شریف محفوظ می باشد