مخزن دادگــــان
ماجراجویی در هوش مصنوعی …
برای مشاهده لیست دادگان روی نام دادگان مورد نظر کلیک کنید.
پیکره گفتگوی روزمره گفتا (فیلم و سریال)
گفتگوی روزمره فیلم و سریال
این دادگان از ۱۰۰ هزار گفته از فیلم و سریالهای ایرانی تشکیل شدهاست.که اطلاعاتی از قبیل سن و جنسیت و بازه شروع و پایان صحبت و گویندهها را در خود جایداده است.
تعداد کل کلمات | ۸۴۵۵۲ |
تعداد گفتهها | ۱۰۰۰۰۰ |
تعداد دیالوگ | ۸۶۰۲ |
به عنوان مثال نمونهای از این دادگان را در جدول پایین مشاهده میکنید.
شناسه گفتگو | شروع | پایان | شخص | سن | جنسیت | متن | شناسه صحنه |
---|---|---|---|---|---|---|---|
۸۰۶۷ | ۰ | ۱.۱۳۵ | گوینده ۱ | میانسال | مرد | چطوری سعید آقا؟ | ۷۰۳۵ |
۸۰۶۷ | ۲.۶۰۲ | ۳.۷۷۲ | گوینده ۲ | جوان | مرد | خیلی ممنون. | ۷۰۳۵ |
۸۰۶۷ | ۵.۷۴۵ | ۷.۸۲۳ | گوینده ۱ | میانسال | مرد | اوضاع انگاری خیلی خرابه! | ۷۰۳۵ |
۸۰۶۷ | ۸.۳۹۹ | ۱۰.۸۲۶ | گوینده ۲ | جوان | مرد | نه بابا! شب آشتی می کنن با هم! | ۷۰۳۵ |
۸۰۶۷ | ۱۳.۱۱۳ | ۱۹.۴۸۳ | گوینده ۱ | میانسال | مرد | من بودم به جون خودم، تو سه سوت طلاق! معنی نداره! | ۷۰۳۵ |
۸۰۶۷ | ۰ | ۲.۰۶۷ | گوینده ۱ | جوان | زن | گوشیو برداشت جرئت نکردم حرف بزنم. | ۱۰۶۷۰ |
۸۰۶۷ | ۲.۸۱۴ | ۳.۹۰۲ | گوینده ۲ | جوان | زن | یعنی چی؟ | ۱۰۶۷۰ |
۸۰۶۷ | ۴.۲۱۵ | ۶.۹۰۷ | گوینده ۲ | جوان | زن | تو مگه نمیگی میخوام قال قضیه رو بکنم، اینجوری؟ | ۱۰۶۷۰ |
۸۰۶۷ | ۶.۹۸۸ | ۸.۱۷۱ | گوینده ۱ | جوان | زن | نمیشه اینجوری! | ۱۰۶۷۰ |
۸۰۶۷ | ۸.۴۰۲ | ۱۱.۸۰۲ | گوینده ۱ | جوان | زن | باید دنبال یه راه دیگه بگردم بنفشه جون! من میرم بالا! | ۱۰۶۷۰ |
۸۰۶۷ | ۱۱.۸۲۹ | ۱۲.۸۸۹ | گوینده ۲ | جوان | زن | خسته نباشی! | ۱۰۶۷۰ |
درخواست دانلود پیکره گفتگوی روزمره گفتا (فیلم و سریال)
دادگان تشخیص هویت (افراد مشهور)
این دادگان شامل ۵۰ هزار تصویر از ۳۴۰۰ شخص مشهور در ایران است. این اشخاص شامل افراد مشهور ایرانی و غیر ایرانی هستند که در اخبار فارسی بیشتر مورد توجه قرار گرفته اند.
تعداد دادگان ۵۰ هزار تصویر
ابعاد تصویر ۱۶۰ پیکسل در ۱۶۰ پیکسل
تعداد افراد ۳۴۰۰ نفر
منبع تصویر وب سایتهای ایرانی
درخواست دانلود دادگان تشخیص هویت
دادگان تبدیل متن به صوت
این دادگان توسط گروهی از محققین پردازش صوت جمع آوری گردیده است. در این دادگان بیش از ۸۰۰۰ جمله توسط یک گویندهی مرد در استودیو خوانده شده است. منبع این جملات، زیرنویسهای فارسی میباشند.
تعداد دادگان ۸ هزار فایل صوتی
میانگین طول فایلها ۸ ثانیه
منبع صوت ها ۳۴۰۰ نفر
درخواست دانلود دادگان تبدیل متن به صوت
پیکره گفتگوی روزمره گفتا (شبکههای اجتماعی)
این دادگان شامل ۷۳۸۴۱۷ گفته از شبکه های مجازی است که توسط نیروهای خبره با برچسب های ( گفتگوی روزمره ، هدفمندِ جدی ، توهین آمیز ، مشاجره) برچسبگذاری شده است.
درخت مکالمه برچسب زده شده ۳۸۸۹۷
تعداد مکالمه برچسب زده شده ۱۹۶۵۳۴
تعداد گفته برچسب زده شده ۷۳۸۴۱۷
تعداد کل کلمات ۲۶۶۸۹۹۷۳
درخواست دانلود پیکره گفتگوی روزمره گفتا (شبکههای اجتماعی)
پیکره گفتگوی روزمره گفتا (فیلم و سریال)
گفتگوی روزمره فیلم و سریال
این دادگان از ۱۰۰ هزار گفته از فیلم و سریالهای ایرانی تشکیل شدهاست.که اطلاعاتی از قبیل سن و جنسیت و بازه شروع و پایان صحبت و گویندهها را در خود جایداده است.
تعداد کل کلمات | ۸۴۵۵۲ |
تعداد گفتهها | ۱۰۰۰۰۰ |
تعداد دیالوگ | ۸۶۰۲ |
درخواست دانلود پیکره گفتگوی روزمره گفتا (فیلم و سریال)
دادگان تشخیص هویت (افراد مشهور)
این دادگان شامل ۵۰ هزار تصویر از ۳۴۰۰ شخص مشهور در ایران است. این اشخاص شامل افراد مشهور ایرانی و غیر ایرانی هستند که در اخبار فارسی بیشتر مورد توجه قرار گرفته اند.
تعداد دادگان ۵۰ هزار تصویر
ابعاد تصویر ۱۶۰ پیکسل در ۱۶۰ پیکسل
تعداد افراد ۳۴۰۰ نفر
منبع تصویر وب سایتهای ایرانی
درخواست دانلود دادگان تشخیص هویت
دادگان تبدیل متن به صوت
این دادگان توسط گروهی از محققین پردازش صوت جمع آوری گردیده است. در این دادگان بیش از ۸۰۰۰ جمله توسط یک گویندهی مرد در استودیو خوانده شده است. منبع این جملات، زیرنویسهای فارسی میباشند.
تعداد دادگان ۸ هزار فایل صوتی
میانگین طول فایلها ۸ ثانیه
منبع صوت ها ۳۴۰۰ نفر
درخواست دانلود دادگان تبدیل متن به صوت
پیکره گفتگوی روزمره گفتا (شبکههای اجتماعی)
این دادگان شامل ۷۳۸۴۱۷ گفته از شبکه های مجازی است که توسط نیروهای خبره با برچسب های ( گفتگوی روزمره ، هدفمندِ جدی ، توهین آمیز ، مشاجره) برچسبگذاری شده است.
درخت مکالمه برچسب زده شده ۳۸۸۹۷
تعداد مکالمه برچسب زده شده ۱۹۶۵۳۴
تعداد گفته برچسب زده شده ۷۳۸۴۱۷
تعداد کل کلمات ۲۶۶۸۹۹۷۳
درخواست دانلود پیکره گفتگوی روزمره گفتا (شبکههای اجتماعی)