Off-the-Shelf AI Training Datasets

Shanghai dialect (China) Conversational Speech

More info

Dataset successfully added to the Quote List

Common Use CasesASR, Conversational AI, Speech Analytics

Dataset IDSHANGHAI_ASR001_CN

TypeAudio

Unit21 hours

LanguageShanghai dialect

CountryChina

Shanghai dialect (China) Conversational Speech

More info

Dataset successfully added to the Quote List

Common Use CasesASR, Conversational AI, Speech Analytics

Dataset IDSHANGHAI_ASR002_CN

TypeAudio

Unit4.5 hours

LanguageShanghai dialect

CountryChina

Slovak (Slovakia) scripted telephony

More info

Dataset successfully added to the Quote List

Common Use CasesASR, Virtual Assistant

Dataset IDSlovak SpeechDat(E) Database

TypeAudio

Unit65 hours

LanguageSlovak

CountrySlovakia

Slovenian (Slovenian) Pronunciation Dictionary

More info

Dataset successfully added to the Quote List

Common Use CasesASR, TTS, Language Modelling

Dataset IDslv_SVN_PHON

TypeText

Unit28,000 words

LanguageSlovenian

CountrySlovenia

Slovenian (Slovenian) telephony

More info

Dataset successfully added to the Quote List

Common Use CasesASR, Virtual Assistant

Dataset IDSlovenian SpeechDat(II) FDB-1000

TypeAudio

Unit76 hours

LanguageSlovenian

CountrySlovenia

Somali (Somalia) conversational telephony

More info

Dataset successfully added to the Quote List

Common Use CasesASR, Conversational AI, Speech Analytics

Dataset IDSOM_ASR001

TypeAudio

Unit50 hours

LanguageSomali

CountrySomalia

Shanghai dialect (China) Conversational Speech

Dataset successfully added to the Quote List

Shanghai dialect (China) Conversational Speech

Dataset successfully added to the Quote List

Slovak (Slovakia) scripted telephony

Dataset successfully added to the Quote List

Slovenian (Slovenian) Pronunciation Dictionary

Dataset successfully added to the Quote List

Slovenian (Slovenian) telephony

Dataset successfully added to the Quote List

Somali (Somalia) conversational telephony

Dataset successfully added to the Quote List

Get Started with Off-the-Shelf AI Training Datasets