Глобальная лексикостатистическая база данных: цель проекта


НОВОСТИ

ОБЩАЯ ИНФОРМАЦИЯ

ЦЕЛЬ ПРОЕКТА

СПЕЦИФИКА ГЛБД

УЧАСТНИКИ

ПЛАНЫ

СОТРУДНИЧЕСТВО

МАТЕРИАЛЫ

ПУБЛИКАЦИИ

 

В сравнительно-историческом языкознании списки базисной лексики родственных (или потенциально родственных) языков обычно используются для лексикостатистики — достаточно простой процедуры, устанавливаю­щей степень родства языков на основании процентов «общих» для них слов (т. е. восходя­щих к одному и тому же слову-предку в праязыке) в списке Сводеша; а также для глотто­хро­нологии, несколько более сложного алгоритма, устанавливающего абсолютные даты расхождения праязыков на основании постулата, согласно которому базисная лексика заме­щается в языке с постоянной или, по меньшей мере, регулярно изменяющейся скоро­стью.

 

Несмотря на то, что как лексикостатистика, так и (в еще большей степени) глотто­хро­но­ло­гия часто подвергаются критике (ответ на ряд таких замечаний можно найти в статьях, посвященных лексикостатистической тематике и выложенных на нашем сайте), соответст­вующая методология до сих пор остается не только жизнеспособным и многообещающим, но и, что самое важное, единственным по-настоящему универсальным методом создания генеалогической классификации языков мира. При этом, однако, точность и достоверность результатов такой классификации напрямую зависит от того, насколько тщательно матери­ал списков базисной лексики обработан с помощью сравнительно-исторического метода.

 

В течение последнего десятилетия наблюдалось значительное повышение инте­реса к различного рода лексикостатистическим про­це­дурам, во многом вызванное прогрес­сом в аналогичных методах построения филогенетической классификации в биологии. В престижных научных журналах опубликована масса работ, авторы которых при­меняют к спискам базисной (и не только) лексики сложные статистические и вероятност­ные алгоритмы. К сожалению, серьезного влияния на историческое языко­знание эти работы, как правило, не оказывают, поскольку по большей части результатами их являются статистические аппроксимации, не имеющие отношения к конкретной исто­рии конкретных слов; нередко оказывается, что они вступают в элементарные противоре­чия как с исторической реальностью, так и со здравым смыслом — либо из-за неверных по­сылов, либо из-за недостаточного учета всех необходимых факторов, либо, как довольно часто показывает опыт, из-за неадекватного массива данных.

 

Главная задача ГЛБД — создание унифицированной и упорядоченной системы списков базис­ной лексики по языкам мира, которую можно было бы, помимо прочего, использовать для различных процедур автоматического анализа; однако главным требованием к ней яв­ля­ется историч­ность — будучи создаваема с целью развития исторического языкознания, база должна уважать его базисные принципы. Это означает, что лексиче­ские данные (везде, где это возможно), сопровождаются комментариями, содержащими синхронную и диа­хроническую информацию по соответствующим словам; индексы когна­ции, связывающие слова общего происхождения, должны быть объяснены и аргументиро­ваны; и, самое главное — сами списки должны составляться предельно тщательно (опыт показывает, что многие сводешевские списки, имеющие широкое хождение среди исследо­вателей, не имеющих специальной подготовки в области исторического языкознания, со­ставляются с грубейшими ошибками и могут легко привести к неверным результатам).

 

Списки базисной лексики, собранные и откомментированные на сайте ГЛБД, могут слу­жить для самых разных целей. Помимо главной из них (создания основы для генеалогиче­ских классификаций), они могут также использоваться в типологических исследованиях, в частности, по типологии фонетических изменений. Наконец, информация, приводимая в коммента­риях к базам данных, может иметь большое значение для исследований по истори­ческой семантике и каталогизации семантических сдвигов — любой прогресс в этой области будет иметь серьезные последствия для всей лингвистики в целом.

 

НА ГЛАВНУЮ СТРАНИЦУ                                    К БАЗАМ ДАННЫХ                              АНГЛИЙСКАЯ ВЕРСИЯ

 

     © 2011-2016 Г. Старостин (идея сайта, обработка данных)
    © 2011-2016 Ф. Крылов (программирование, техническая поддержка)