Сеть связей между языками во всем мире
Ученые из Массачусетского технологического института изучили глобальную сеть языков.
По их мнению, современная кросскультурная коммуникация держится на семи мировых языках — английском, испанском, немецком, французском, русском, португальском и китайском, то есть тех, которые чаще всего используются для перевода информации между различными культурами.
Подробнее Global Language Network.
В ходе научной работы было проанализированы сообщения в «Твиттере», правки в «Википедии» и книги всемирной базы переводной литературы UNESCO.
Выяснилось, что если убрать перечисленные выше семь узловых языков, то мировая коммуникация распадется, и, например, народ мапуче из Чили никак не узнает, что там нового происходит в арабо-израильском конфликте, потому что эта информация до него доходит не напрямую, а через английский и испанский.
Изначально группа ученых задалась вопросом, какой язык в современном мире самый важный? Для этого они решили взять не только данные о количестве носителей языка, но и данные о связях между языками, о количестве знаменитых людей, рожденных носителями языка, и размер валового национального продукта. Они построили визуальную сеть связей между языками во всем мире.
Для изучения связей языков ученые проанализировали миллиард твитов и создали базу данных пользователей, которые используют твиты на разных языках. Например, кто твитит на английском и испанском, тот, с большой вероятностью, знает оба языка. Второй набор данных извлекли из национальных википедий. Ученых интересовали пользователи, которые редактируют статьи на разных языках. Третий набор данных дал анализ списков переводной литературы, предоставленных ЮНЕСКО с каких языков на какие существуют переводы книг. Например, «Приключения Тома Сойера» переведены с испанского на каталонский, а перевода на каталонский непосредственно с английского, не существует.
Еще пример: на голландском говорит всего 27 млн. человек, т.е. около 0,5% мирового населения, и однако он значимее, с точки зрения мировой коммуникации, по сравнению с, например, арабским, на котором говорят около 530 миллионов,(около 6% населения Земли). А все потому, что носители голландского очень активны в коммуникации и в сети.
Сравнив результаты по всем трем источникам, ученые увидели, что между этими тремя мирами существует неплохая корреляция, и даже есть общее свойство — они выражено иерархичны. То есть для связи между малоиспользуемыми языками используются несколько языков, ставших очень популярными. Это английский, испанский, немецкий, французский, русский, португальский и китайский. Ученые назвали их узловыми языками.
Чтобы понять особенность узлового языка, представьте себе, что на хинди или арабском языках говорят очень много людей, но они не так важны именно для глобальной коммуникации. На китайском говорят больше всего людей в мире, но по связанности с другими языками он уступает английскому и русскому. Высокая связанность русского языка, по мнению одного из авторов исследования Цезаря Идальго (César Hidalgo), заслуга СССР. В советское время переводили очень много литературы союзных республик и стран коммунистического блока, поэтому коммуникация вьетнамцев или таджиков с остальным миром осуществлялась посредством русского языка. Цифровой мир, интернет сменил технологию коммуникацию, теперь жители этих стран чаще используют английский как узловой язык.
Для определения центральности языков исследователи использовали данные о знаменитостях. Их извлекли из Википедии, взяв те персоналии, статьи о которых есть не менее чем на 26 языках — например, об Элвисе Пресли или принцессе Диане. Использовали также данные из Human Accomplishment — книги, где приведены сведения о почти 4 тысячах знаменитостей. По городу или местности, где родился персонаж, ученые определяли его язык — и знаменитость чаще всего оказывалась носителем одного из узловых языков.
Авторы исследования понимают, что использование данных из твиттера и Википедии — продуктов англоязычного мира — может наложить отпечаток на полученный результат. Но они полагают, что доминирование английского языка в интернете в первую очередь отражает реальность, то есть значимость английского в мировой коммуникации.
По материалам scientificrussia.ru