Нередко на простые вопросы приходится давать сложные ответы. Например: в чем разница между языком и диалектом? Если вы решите спросить об этом лингвиста, то усаживайтесь поудобнее. Хотя на первый взгляд в этом вопросе нет ничего сложного, ответить на него можно по-разному.
Разграничение между языком и диалектом может зависеть от той или иной точки зрения. С политической точки зрения, язык — это то, на чем обычно говорит народ как нация. К примеру, с 1850 по 1992 год существовал так называемый сербохорватский язык, который включал в себя несколько диалектов, в том числе сербский, хорватский и боснийский. Но после того, как в середине 1990-х годов Югославия распалась на несколько независимых государств, эти диалекты были признаны отдельными языками. Такое политическое определение отчасти работает, хотя и несет с собой больше проблем, нежели решений: бывают языки, на которых говорят в разных странах, яркий тому пример — испанский в Латинской Америке. Никто не станет утверждать, что мексиканский испанский и колумбийский испанский — это разные языки. Возможно, испанский, на котором говорят в некоторых частях Испании, настолько отличается от своих латиноамериканских разновидностей, что заслуживает называться отдельным языком, но это не до конца ясно.
А что, если провести границу между языком и диалектом, руководствуясь критерием взаимопонимания? К сожалению, и этот подход не идеален. Датчанин будет несколько лучше понимать шведский, чем швед — датский. Точно так же человек, говорящий на специфическом крестьянском говоре британского английского, поймет американца из Лос-Анджелеса гораздо лучше, чем американец его. Взаимопонимание часто зависит от внешних факторов — они представляют собой довольно неконтролируемую переменную — а не от присущих самому языку свойств.
Так что, возможно, нам стоит взять на вооружение чисто лингвистический подход. Представьте, что мы можем систематически измерить разницу (D) между двумя речевыми вариантами. Тогда конкретное значение D позволило бы нам определить границу между двумя диалектами и двумя языками. Найти такую величину, должно быть, не очень сложно, поскольку два языка можно сравнивать по множеству критериев, таких как звуковой инвентарь, грамматические характеристики или лексика.
Но что, если различия между речевыми вариациями являются градуальными и вероятность нахождения заданного значения D столь же высока, сколь и вероятность нахождение какой-то другой величины? Тогда нам пришлось бы выбрать в качестве отправной точки произвольное значение D, а произвольное значение отбросило бы нас назад к соображениям политического или практического характера, которые мы не собирались брать в рассмотрение. Хотим мы, чтобы наша линия разрыва проходила на уровне, где сербский и хорватский — это разные языки или один? Каталогизируя языки мира, сколько тысяч языков мы хотим предать забвению: пять? Или семь? А может быть, десять тысяч?
За последние годы удалось преодолеть два основных препятствия на пути различения языка и диалекта. Первое состоит в том, как измерить различия между речевыми вариантами — то есть найти значение для D. В 2008 году группа лингвистов создала Автоматизированную программу оценки сходства (Automated Similarity Judgment Program, ASJP), ежедневным куратором и основателем которой является ваш покорный слуга. ASJP кропотливо подготовила систематический сравнительный набор данных по языкам, который в настоящее время содержит 7655 списков слов. Они имеют отношение к двум третям мировых языков, если предположить, что для наших целей языки определяются по стандартному коду ISO 639-3. Поскольку каждый список слов содержит фиксированный набор из 40 понятий, которые истолковываются единообразно, их легко сравнивать и таким образом получить меру различия. Чаще всего в качестве меры различия между двумя словами используется вариант «расстояния Левенштейна» — этот термин был назван в честь Владимира Левенштейна, советского ученого, который в 1965 году разработал алгоритм для сравнения двух строк символов. Он определил «расстояние» как минимальное количество замен, вставок и удалений, необходимых для превращения одной строки в другую. Расстояние Левенштейна можно с пользой разделить на длину самой длинной из двух строк и таким образом поместить все расстояния в шкалу от 0 до 1. Данное явление известно как нормализованное расстояние Левенштейна, или LDN.
Второе препятствие заключается в том, что, возможно, «язык» и «диалект» являются понятиями, которые могут быть определены только в произвольном порядке. Здесь у нас есть для вас вполне обнадеживающие новости. Если мы посмотрим на все языковые семьи в базе данных ASJP, куда участники проекта включили существенную долю близких разновидностей, мы можем приступить к поиску различных типов поведения языков и диалектов. Перед нами возникает интригующая картина: расстояния как правило колеблются либо вокруг относительно небольшой величины, либо вокруг относительно большой, и между ними образуется впадина. Как выясняется, чаще всего эта впадина лежит в узком диапазоне, в среднем равном примерно 0,48 LDN. Мы не погрешим против точности, если скажем, что речевые варианты стремятся не быть частично похожими друг на друга в своей базовой лексике. Либо наблюдается тенденция к большей схожести, и в этом случае речевые варианты можно определить как разные диалекты, либо к меньшей схожести — и в этом случае их можно отнести к разным языкам. Здесь как раз и пролегает граница между языком и диалектом.
Вероятно, это явление стало результатом социальных обстоятельств. Диалекты расходятся по мере того, как люди расселяются на новых территориях и формируют новые идентичности, но, если между ними все еще есть некоторый контакт, может иметь место конвергенция, так что речевые варианты остаются похожими более чем на 50 процентов (и, следовательно, речь идет об одном языке). Однако небольшой толчок в направлении дивергенции может привести к тому, что языковые варианты разойдутся относительно быстро, увеличив расстояние Левенштейна, и в этом случае мы можем квалифицировать их как отдельные языки. Возможно, существует связь между границей для расстояний между словами в стандартном списке, используемом ASJP, и соответствующими расстояниями в других частях языковой структуры, которые могут приводить к серьезной потере взаимопонимания. Другими словами, порог взаимопонимания может коррелировать с порогом между языками и диалектами. Мы еще не изучили этот вопрос, но как объект для исследования он крайне интересен.
Придя к объективному, а не произвольному критерию для отделения языков от диалектов, мы можем применить его к языкам мира. Некоторые пары речевых разновидностей, которые считаются национальными языками, такие как боснийский и хорватский, находятся значительно ниже порога LDN, равного 0,48 (значит, это один и тот же язык, независимо от существования Югославии). Совсем недалеко от этого порога оказываются такие языки, как хинди и урду (едва ли их можно назвать двумя разными языками). А разновидности арабского и китайского языков, которые часто рассматриваются как единые языки, взлетают выше LDN = 0,48 (эти разновидности являются отдельными языками). На самом деле, есть несколько пар разновидностей, которые обычно считаются разными языками, но колеблются на границе: например, датский и шведский языки, у которых LDN составляет 0,4921.
Наконец, метод, полученный из наборов данных, называемый ASJP-хронологией, может быть применен с целью установить количество времени, необходимого для того, чтобы диалекты дистанцировались друг от друга настолько далеко, чтобы считаться отдельными языками. Найденный нами результат — 1059 лет, если не учитывать некоторую погрешность. Эти выводы подтверждаются тем, сколько времени обычно требуется, чтобы родовой язык языковой семьи распался на дочерние, которые впоследствии становятся предками подсемейств. Для этого нам необходимы другие методы анализа, но результаты схожи: для превращения диалектов в языки требуется около тысячелетия. Мы знаем это, потому что теперь можем отличить одно от другого.
Сёрен Вихманн — датский лингвист, сотрудничающий с Лейденским университетом (Нидерланды), Казанским федеральным университетом (Россия) и Пекинским лингвистическим университетом (Китай). Его последняя книга — «Временная стабильность лингвистических типологических особенностей» (Temporal Stability of Linguistic Typological Features, 2009) — написана в соавторстве с Эриком Холменом (Eric W. Holman).
Материалы ИноСМИ содержат оценки исключительно зарубежных СМИ и не отражают позицию редакции ИноСМИ.
Лучшие
Показать новые комментарии (0)
Все комментарии

| 4 Речевые дефекты вождей как источник фонетических особенностей языков У меня есть гипотеза относительно причины появления особенностей фонетики некоторых языков. Это причина - дефект речи вождя, особенно, если он правил долго. Поясню на примере польского языка, который принадлежит к славянским языкам. Вождь одного из крупных племен жутко шепелявил. В силу своего положения, ему часто приходилось говорить с народом. Невольно все стали подражать манере речи уважаемого человека, особенно детишки, которые вообще все перенимают на лету. При благоприятном стечении обстоятельств племя растет, вовлекая в свою орбиту соседние племена. Десяток-другой лет и, вуаля, имеем новый диалект. Раскрыть всю ветку (2 сообщений в ветке) 
| 3 baikal2011, идея очень интересна. Добавлю, что один человек диалект вряд ли создал бы. Скорее там в силу жуликоватости руководства и простоты нравов общества вожди постоянно получали по морде и хронически шепелявили вследствие выбитых зубов и разбитого рта. А у соседей чехов таких проблем не было. 
| 0 baikal2011, это уже не диалект, а акцент, скорее. А про "вождя" интересная теория.😀 В прошлые времена иных средств массовой пропаганды кроме митингов не было, но для этого данной особенностью должно были обладать несколько поколений вождей, иначе это на контрасте воспринималось бы девиация (српди них могли встречсться и громые и одноглазые😆). Если это хромосомная девиация живущего в изоляции племени (инцест, доминантные/рецессивные признаки), приводящая а особеноостям речевого аппарата, например, расщепление нёба или уздечки, то они утратили бы часть лексического набора, неудобного для коммуникации. А подражание явному изъяну вождя вряд ли было бы воспринято положительно (как амбиции). Однако, на детей гораздо более сильное влияние оказывают их родители, с которыми проводят значительную часть времени. От них они же язык и усваивают (заметьте, без всяких учебников😀). 
| 1 Посмотрел список русских слов - долго смеялся. Эти "лингвисты" не в состоянии даже несколько слов без грубых ошибок взять. Например "волосы" у них - "вылысы" asjp.clld.org/languages/RUSSIAN Раскрыть всю ветку (4 сообщений в ветке) 
| 0 Gosh, наверное они брали за основу древнеславянский? Однокоренное слоат "лысый".😆 Русский (церковный) современный язык подвергся историческому влиянию греческого, тюркского, немецкого языков. Древнеславянский ближе к древнему шведскому, которыы позже огерманился. Помните? Следы древнего языка: чело, длань, око, снег, перст. 
| 0 Чтоб я так жил, несколько сложнее. После ордынского влияния был этап утери языка и массовых заимствований из "церковнославянского" - то есть по сути протоболгарского, частично сербо-хорватского. Это появление всех этих "тыжи, иже, тужицы...". Через какое то время язык начал восстанавливать первичные черты - благодаря сохранению первоисточников через тех, кого потом назвали поморами (носители псковской и новгородской культуры). Именно они сохранили и наиболее неискаженный язык и древнейшие литературные памятники - былины, сказания. Кстати, из интереса - их речь 13 века более понятна современнику, чем тексты средней Руси 15 века. 
| 0 Чтоб я так жил, церковно-славянский был чисто письменным языком, на котором народ не говорил. 
| 1 Gosh, а персоны с волосатыми ногами - "вылысыпыдысты". 
| 1 Автор не дал объяснения, почему же языки отличаются и что является причиной их "дистанцирования"? Кто вызвал крушение "вавилонского столпотворения"? Я могу ответить на этот вопрос, а вот автор, боюсь, никогда не найдёт ответов, математик хренов. К тома же следует различать вербальные и невербальнве (включая графические) лингвохарактеристики. Что касается языка и диалекта, то это лишь разные аспекты на коммуникационный аппарат. Язык - это система понятий и структура. Диалект - это же употребимые словоформы (фразеология) и фонетический строй. Например, люди могут употреблять разные слова для обозначения однй и той же ситуации, но это не делает их разными языками. Это делает LDN метод бессмысленным. Естественно, что через диалект через тысячи лет взаимоизоляции и различного уклада жизни превратится в другой язык, утратив одни языковые структуры и сформировав новые. Язык - это динамическая сущность. А там уже и до цивилизационного разрыва в мировоззрении недалеко. Ещё дальше - биологическая сегрегаци, когда носители становятся представителями разных видов, а на это уже нужны миллионы лет. Раскрыть всю ветку (1 сообщений в ветке) 
| 0 Чтоб я так жил, Это делает LDN метод бессмысленным. Согласен. Этому "профессору" нужно рассказать анекдот про Чапаева - Патриции позли с гетерами в терму на вакханалию))) 
| 3 Язык - это диалект у которого есть армия ) Раскрыть всю ветку (1 сообщений в ветке) 
| 0 Pablovesovoy1, язык до Киева доведёт.(с) 
| 2 Есть более интересный пример, чем распад сербохорватского. Это политжаргон под названием "мова". Когда Галиция входила в состав Польши, укронационалисты издавали газету "Недiля", лишь бы слово отличалось от польского "Тиждень". Сейчас же "исконно украинским" стало слово "тиждень". И так с тысячами и тысячами слов. Глупыши не понимают, что для образования нового языка (не жаргона по типу "фени" с простой заменой слов) этого мало, нужно менять грамматику. Тссс! Я этого не говорил. Раскрыть всю ветку (1 сообщений в ветке) 
| 0 kosmopletov_aristarkh, не приживётся. Языки живут и меняются вне зависимости от желания человека. Не человек придумывает грамматику, а грамматикой классифицируют характеристики говора. В Тихом океане близ Новой Зеландии есть скалистый остров, где живёт более 7 тысяч племён, которые говорят на 7 тысячах различных языков. 
| 0 а вот Истсайдовский это язык или диалект??? Раскрыть всю ветку (2 сообщений в ветке) 
| 0 четослышал, гибридный язык, жаргон. 
| 0 Чтоб я так жил, свободу Истсайду!!!! 
| 1 респект переводчику. хотя не могу сказать, что осилил сей опус... но за советского учёного Левенштейна чувство гордости ощутил. 
| 1 Интересно, но окраинно-западенские диалекты русского превратились(или их превратили, извратив) как в украинский, так и в белорусские языки: из чаво появились шо и што, а в середине России упростили до чо...ОотоночОоМихаалыч! Пример диалектического материализьму: чОтам(засунув руку в карман)? ...человек на диалекте ищет материальную ценность в кармане. Великобритания впереди планеты всей в датской лингвистике под руководством Сёмки Левенштейна с его километром, разделившим диалект с языком на коэффициент 0,48. 
| 0 Как я понял из статьи, что сербский и хорватский языки различаются. Все остальное - диалекты датского. :))) 
| 2 Кстати не было никаких хорватского и сербского диалектов сербохорватского языка. Есть штокавский, чакавский и кайкавский диалекты. Причем литературные нормы и сербского и хорватского языка основываются на штокавском диалекте. Литературные сербский и хорватский отличаются друг от друга меньше чем диалекты хорватского (чакавский и кайкавский используются только в Хорватии).
Показать новые комментарии (0)baikal2011
Andreykan
Чтоб я так жил
Gosh
Чтоб я так жил
VoltPavel
realAVA
baikal2011
Чтоб я так жил
nik_anat15
Pablovesovoy1
Чтоб я так жил
kosmopletov_aristarkh
Чтоб я так жил
четослышал
Чтоб я так жил
четослышал
Kifer
Donproperdon
GreyCat
Welran
в ответ(Показать комментарийСкрыть комментарий)