مخزن دادگــــان

ماجراجویی در هوش مصنوعی …

برای مشاهده لیست دادگان روی نام دادگان مورد نظر کلیک کنید.

پیکره گفتگوی روزمره گفتا (فیلم و سریال)

گفتگوی روزمره فیلم و سریال

این دادگان از ۱۰۰ هزار گفته از فیلم و سریال‌های ایرانی تشکیل شده‌است.که اطلاعاتی از قبیل سن و جنسیت و بازه شروع و پایان صحبت و گوینده‌ها را در خود جای‌داده است.

تعداد کل کلمات۸۴۵۵۲
تعداد گفته‌ها۱۰۰۰۰۰
تعداد دیالوگ۸۶۰۲

به عنوان مثال نمونه‌ای از این دادگان را در جدول پایین مشاهده می‌کنید.

شناسه گفتگوشروعپایانشخصسنجنسیتمتنشناسه صحنه
۸۰۶۷۰۱.۱۳۵گوینده ۱میانسالمردچطوری سعید آقا؟۷۰۳۵
۸۰۶۷۲.۶۰۲۳.۷۷۲گوینده ۲جوانمردخیلی ممنون.۷۰۳۵
۸۰۶۷۵.۷۴۵۷.۸۲۳گوینده ۱میانسالمرداوضاع انگاری خیلی خرابه!۷۰۳۵
۸۰۶۷۸.۳۹۹۱۰.۸۲۶گوینده ۲جوانمردنه بابا! شب آشتی می کنن با هم!۷۰۳۵
۸۰۶۷۱۳.۱۱۳۱۹.۴۸۳گوینده ۱میانسالمردمن بودم به جون خودم، تو سه سوت طلاق! معنی نداره!۷۰۳۵
۸۰۶۷۰۲.۰۶۷گوینده ۱جوانزنگوشیو برداشت جرئت نکردم حرف بزنم.۱۰۶۷۰
۸۰۶۷۲.۸۱۴۳.۹۰۲گوینده ۲جوانزنیعنی چی؟۱۰۶۷۰
۸۰۶۷۴.۲۱۵۶.۹۰۷گوینده ۲جوانزنتو مگه نمیگی میخوام قال قضیه رو بکنم، اینجوری؟۱۰۶۷۰
۸۰۶۷۶.۹۸۸۸.۱۷۱گوینده ۱جوانزننمیشه اینجوری!۱۰۶۷۰
۸۰۶۷۸.۴۰۲۱۱.۸۰۲گوینده ۱جوانزنباید دنبال یه راه دیگه بگردم بنفشه جون! من میرم بالا!۱۰۶۷۰
۸۰۶۷۱۱.۸۲۹۱۲.۸۸۹گوینده ۲جوانزنخسته نباشی!۱۰۶۷۰

 

درخواست دانلود پیکره گفتگوی روزمره گفتا (فیلم و سریال)

دادگان تشخیص هویت (افراد مشهور)

این دادگان شامل ۵۰ هزار تصویر از ۳۴۰۰ شخص مشهور در ایران است. این اشخاص شامل افراد مشهور ایرانی و غیر ایرانی هستند که در اخبار فارسی بیشتر مورد توجه قرار گرفته اند.

تعداد دادگان۵۰ هزار تصویر
ابعاد تصویر‍۱۶۰ پیکسل در ۱۶۰ پیکسل
تعداد افراد۳۴۰۰ نفر
منبع تصویروب سایت‌های ایرانی

 

درخواست دانلود دادگان تشخیص هویت

 

دادگان تبدیل متن به صوت

این دادگان توسط گروهی از محققین پردازش صوت جمع آوری گردیده است. در این دادگان بیش از ۸۰۰۰ جمله توسط یک گوینده‌ی مرد در استودیو خوانده شده است. منبع این جملات، زیرنویس‌های فارسی می‌باشند.

تعداد دادگان۸ هزار فایل صوتی
میانگین طول فایل‌ها۸ ثانیه
منبع صوت ها۳۴۰۰ نفر

درخواست دانلود دادگان تبدیل متن به صوت

پیکره گفتگوی روزمره گفتا (شبکه‌های اجتماعی)

این دادگان شامل ۷۳۸۴۱۷ گفته از شبکه های مجازی است که توسط نیروهای خبره با برچسب های ( گفتگوی روزمره ، هدفمندِ جدی ، توهین آمیز ، مشاجره) برچسب‌گذاری شده است.

درخت مکالمه برچسب زده شده۳۸۸۹۷
تعداد مکالمه برچسب زده شده۱۹۶۵۳۴
تعداد گفته برچسب زده شده۷۳۸۴۱۷
تعداد کل کلمات۲۶۶۸۹۹۷۳

پیکره گفتگوی روزمره گفتا (فیلم و سریال)

گفتگوی روزمره فیلم و سریال

این دادگان از ۱۰۰ هزار گفته از فیلم و سریال‌های ایرانی تشکیل شده‌است.که اطلاعاتی از قبیل سن و جنسیت و بازه شروع و پایان صحبت و گوینده‌ها را در خود جای‌داده است.

تعداد کل کلمات۸۴۵۵۲
تعداد گفته‌ها۱۰۰۰۰۰
تعداد دیالوگ۸۶۰۲
درخواست دانلود پیکره گفتگوی روزمره گفتا (فیلم و سریال)
دادگان تشخیص هویت (افراد مشهور)

این دادگان شامل ۵۰ هزار تصویر از ۳۴۰۰ شخص مشهور در ایران است. این اشخاص شامل افراد مشهور ایرانی و غیر ایرانی هستند که در اخبار فارسی بیشتر مورد توجه قرار گرفته اند.

تعداد دادگان۵۰ هزار تصویر
ابعاد تصویر‍۱۶۰ پیکسل در ۱۶۰ پیکسل
تعداد افراد۳۴۰۰ نفر
منبع تصویروب سایت‌های ایرانی

 

درخواست دانلود دادگان تشخیص هویت

 

دادگان تبدیل متن به صوت

این دادگان توسط گروهی از محققین پردازش صوت جمع آوری گردیده است. در این دادگان بیش از ۸۰۰۰ جمله توسط یک گوینده‌ی مرد در استودیو خوانده شده است. منبع این جملات، زیرنویس‌های فارسی می‌باشند.

تعداد دادگان۸ هزار فایل صوتی
میانگین طول فایل‌ها۸ ثانیه
منبع صوت ها۳۴۰۰ نفر

درخواست دانلود دادگان تبدیل متن به صوت

پیکره گفتگوی روزمره گفتا (شبکه‌های اجتماعی)

این دادگان شامل ۷۳۸۴۱۷ گفته از شبکه های مجازی است که توسط نیروهای خبره با برچسب های ( گفتگوی روزمره ، هدفمندِ جدی ، توهین آمیز ، مشاجره) برچسب‌گذاری شده است.

درخت مکالمه برچسب زده شده۳۸۸۹۷
تعداد مکالمه برچسب زده شده۱۹۶۵۳۴
تعداد گفته برچسب زده شده۷۳۸۴۱۷
تعداد کل کلمات۲۶۶۸۹۹۷۳

 

فرم درخواست دادگان 













    کلیه حقوق مادی و معنوی این سایت برای شرکت آرمان رایان شریف محفوظ می باشد