语料库供应商通常是指提供各类语言数据资源的机构或公司,这些资源包括书籍、文章、网页内容、对话记录等,经过加工处理,用于语言学研究、自然语言处理、机器学习等领域。全球知名的语料库供应商包括但不限于:
1. 欧洲语言资源协会(ELRA):提供多种语言的语料库资源。
2. 洛桑联邦理工学院(EPFL)的TALIS语料库:包含多种语言的口语和书面语数据。
3. 康奈尔大学图书馆的Linguistics and Philology Collection:提供语言学及哲学领域的语料库。
4. 澳大利亚的ANU语料库:包含多种土著语言的语料库。
5. 英国国家电子图书馆(BNC):拥有大量的英国英语书面语料。
6. 美国的Corpus of Contemporary American English(COCA):是一个大型的口语和书面语料库。
7. 德国的DGfS:提供多种德语语料库。
8. 荷兰的CLARIN:提供荷兰语及其他语言的语料库资源。
在中国,也有一些机构和平台提供语料库资源,例如:
1. 北京大学语料库研究中心:提供多种中文语料库资源。
2. 汉语语言资源联盟(HLR):聚合了多个汉语语料库资源。
3. 中国社会科学院语言研究所的现代汉语平衡语料库:是一个大型的中文书面语料库。
这些语料库供应商通常会提供不同类型的语料库,以满足不同用户和研究领域的需求。用户可以根据自己的研究目的和资源许可条件,购买或访问这些语料库。在使用这些资源时,用户需要遵守相关的版权和使用规定。