شرکت دانشبنیان آرمان رایان شریف با هدف تولید و توسعه محصولات و راهکارهای خلّاقانه در حوزه فناوری اطلاعات و به طور خاص هوش مصنوعی، توسط جمعی از فارغ التحصیلان دانشگاههای برتر ایران تأسیس شده است. این شرکت با تکیه بر تجربه چندین ساله در زمینه تحلیل و پردازش محتوا، محصولات متنوعی را تولید و به بازار عرضه نموده است . این شرکت در مسیر توسعه خود، گام در ارائه پلتفرم جامع خدمات هوش مصنوعی تحت عنوان آیپا (AIPA) نهاده است.
سکوی آیپا در سه حوزهی پردازش تصویر، متن و صوت از طریق رابط برنامهنویسی ساده به کاربران، خدمترسانی میکند و به دلیل گستردگی خدمات میتواند در کسب و کارهای مختلفی مورد استفاده قرار گیرد. دسترسی به خدمات آیپا به صورت API و با رعایت استاندارهای Open API و در قالب Swagger میباشد. با آیپا میتوانید بدون داشتن تخصص در زمینه هوش مصنوعی و یادگیری ماشینی و همچنین بدون صرف زمان و هزینهی چشمگیر، از خدمات هوش مصنوعی در کسب و کار خود استفاده نمایید.
ابزارهای پردازش صوت
1- بازشناسی گفتار
در ماژول بازشناسی گفتار آیپا از حدود 500 ساعت داده صوتی آموزشی از لهجههای مختلف فارسی برای یادگیری مدل آوایی استفاده شده است که یکی از شاخصههای برتری ما نسبت به سایر رقبا است. مزایای سیستم تبدیل گفتار به نوشتار آیپا از این قرار است:
- تبدیل گفتار فارسی و انگلیسی به متن با دقت و سرعت بالا
- قابلیت تبدیل گفتار محاورهای و رسمی
- امکان تشخیص گویندگان متفاوت در یک فایل صوتی
- تشخیص لهجههای مختلف زبان فارسی
- قابلیت تبدیل گفتار به متن برای زبانهای دیگر
- مقاوم پذیری بالا در برابر نویز حتی با وجود استفاده از سنسور (میکروفون) بیکیفیت
2- سنتز گفتار (تبدیل نوشتار به گفتار)
ماژول سنتز گفتار برای دو زبان فارسی و انگلیسی، یکی دیگر از ابزارهای پردازش صوت میباشد که در بستر آیپا ارائه گردیده است. از ویژگیهای سامانه سنتز گفتار آیپا میتوان به موارد زیر اشاره کرد:
- آموزش مدل با استفاده از دادگان مخصوص جمعآوری و ضبط شده توسط واحد زبانشناسی آرمان رایان شریف و با بهرهمندی از صدای گوینده رادیو و تلویزیون برای زبان فارسی
- انتقال احساسات موجود در متن توسط گوینده به صورت کاملآً طبیعی.
3- تحلیل گوینده
ابزار تحلیل گوینده آیپا دارای قابلیتهای زیر میباشد:
- تطبیق هویت دو گوینده: این که آیا دو صدا مرجع صوتی یکسانی دارد یا خیر؟
- جداسازی گویندگان: جداسازی و دستهبندی گویندگان مختلف در یک کنفرانس.
- تشخیص جنسیت گوینده
- تحلیل احساسات
4- تحلیل صوت
این ماژول دارای قابلیتها و کاربردهای مفیدی است که اهم آنها از این قرار است:
- دستهبندی و طبقهبندی اصوات (صدای قطار، پرنده و غیره)
- تشخیص فعالیت صدا
ابزارهای پردازش متن
1_ ابزارهای پایه در پردازش متن
با بهرهگیری از این سرویس میتوان متن ورودی به آن را مورد تحلیل همه جانبه قرار داد. این تحلیلها شامل موارد متعددی هستند:
- تشخیص موجودیتهای اسمی
- تشخیص کلمات کلیدی
- تشخیص کسره اضافه
- استخراج رابطه
- تشخیص نوع رابطه
- تشخیص نقلقول
- برچسبزن اجزای کلام
- ریشهیاب
- تقطیعگر متون
- تشخیص مرجع ضمایر
تمرکز این ابزارها بر روی زبان فارسی بوده و به همین منظور دادگانی غنی جمعآوری و پردازش شده است.
2_ تحلیل احساسات و عواطف
هدف از این تحلیل، شناسایی احساسات و عواطف موجود در متن است. با استفاده از این سرویس قادر خواهید بود متن مورد نظر خود را در سه سطح احساس (مثبت، منفی و خنثی) و یا در شش سطح عاطفی (شاد، عادی، شگفتزده، گریه، عصبانی، بیرغبت و وحشتزده) طبقهبندی نمایید. از مزایای این سرویس میتوان به موارد زیر اشاره کرد:
- نخستین و تنها ابزار موجود در زبان فارسی برای تشخیص عواطف
- تعیین احساسات بر مبنای مفهوم کلی عبارت
3_ خلاصهساز سند
این سرویس با توجه به محتوای سند، اقدام به تلخیص آن در یک پاراگراف و یا چند عبارت کلیدی مینماید:
- ارائه خلاصه بر اساس درخواست کاربر
- تحلیل محتوایی سند
- قابلیت تعیین میزان تلخیص
- قابلیت استخراج عبارات کلیدی
ابزارهای پردازش تصویر
1_ آنالیز چهره
ابزار آنالیز چهره (شامل ماژولهای تشخیص چهره در تصویر، تشخیص هویت، مقایسه دو چهره، تشخیص حالت عاطفی، تشخیص جنسیت و تخمین سن) یکی از قدرتمندترین ابزارهای ارائه شده در آیپا میباشد که دارای مزیتهای زیر است:
- دقت و سرعت بیبدیل در تشخیص چهره و مقایسه دو چهره
- شناسایی حداقل 200 هزار فرد یکتا به طور همزمان
- مقاوم در حالت سه رخ و نیم رخ چهره
- شناسایی چهره با ریش و مو
- شناسایی چهره با عینک و کلاه
- شناسایی چهره با ماسک بر روی صورت
- شناسایی چهره با گریمهای سنگین
- تشخیص حالت عاطفی چهره
2- آنالیز تصویر
سرویس آنالیز تصویر (شامل ابزارهای نویسهخوان نوری، برچسبزن تصویر، منظرهیاب، تشخیص اشیاء و توصیف تصویر) جزو سرویسهای منحصربهفرد آیپا است که علاوه بر قابلیت رقابت با نمونههای مشابه خارجی، دارای مزایای زیر میباشد:
- توصیف تصویر با دقت بالا در قالب یک یا چند جمله و یا برچسبهای مختلف
- قابلیت شناسایی بیش از 2550 فونت فارسی در نویسهخوان نوری
- دقت بالای خروجی