Off-the-Shelf AI Training Datasets

Russian (Russia) scripted telephony

More info

Dataset successfully added to the Quote List

Common Use CasesASR, Virtual Assistant

Dataset IDRussian SpeechDat(E) Database

TypeAudio

Unit180 hours

LanguageRussian

CountryRussia

Serbian (Serbia) Pronunciation Dictionary

More info

Dataset successfully added to the Quote List

Common Use CasesASR, TTS, Language Modelling

Dataset IDsrp_SRB_PHON

TypeText

Unit29,000 words

LanguageSerbian

CountrySerbia

Shanghai dialect (China) Conversational Speech

More info

Dataset successfully added to the Quote List

Common Use CasesASR, Conversational AI, Speech Analytics

Dataset IDSHANGHAI_ASR001_CN

TypeAudio

Unit21 hours

LanguageShanghai dialect

CountryChina

Shanghai dialect (China) Conversational Speech

More info

Dataset successfully added to the Quote List

Common Use CasesASR, Conversational AI, Speech Analytics

Dataset IDSHANGHAI_ASR002_CN

TypeAudio

Unit4.5 hours

LanguageShanghai dialect

CountryChina

Slovak (Slovakia) scripted telephony

More info

Dataset successfully added to the Quote List

Common Use CasesASR, Virtual Assistant

Dataset IDSlovak SpeechDat(E) Database

TypeAudio

Unit65 hours

LanguageSlovak

CountrySlovakia

Slovenian (Slovenian) Pronunciation Dictionary

More info

Dataset successfully added to the Quote List

Common Use CasesASR, TTS, Language Modelling

Dataset IDslv_SVN_PHON

TypeText

Unit28,000 words

LanguageSlovenian

CountrySlovenia

Russian (Russia) scripted telephony

Dataset successfully added to the Quote List

Serbian (Serbia) Pronunciation Dictionary

Dataset successfully added to the Quote List

Shanghai dialect (China) Conversational Speech

Dataset successfully added to the Quote List

Shanghai dialect (China) Conversational Speech

Dataset successfully added to the Quote List

Slovak (Slovakia) scripted telephony

Dataset successfully added to the Quote List

Slovenian (Slovenian) Pronunciation Dictionary

Dataset successfully added to the Quote List

Get Started with Off-the-Shelf AI Training Datasets