Проблемы подсчета слогов на разных языках

Этот текст написан в 2008 году и сохраняет разве что лингвистический интерес. Хотя алгоритмы подсчета слогов с тех пор почти не менялись, для последних версий программы это уже не принципиально, она надежно справляется со своей основной задачей, корректируя неточности в подсчете слогов за счет информации, полученной из файла перевода.

Я буду признателен за любые соображения на этот счет и думаю, что смогу извлечь из них полезную информацию. Однако, попробую всё же конкретизировать задачу. 

Для каждого из интересующих нас языков (итальянский, французский и английский) нужно детально продумать, грубо говоря, "что за чем считать?". Понятно, что, прежде, чем просто пересчитывать гласные, надо пересчитать имеющиеся дифтонги (сочетания двух гласных букв, образующие один слог) и исключить их из последующих подсчетов. А перед тем, как считать дифтонги, нужно сосчитать сочетания трех гласных, также сливающиеся в один слог (если таковые в языке возможны), и также исключить возможность посчитать их по второму и третьему разу при дальнейших пересчетах дифтонгов и одиночных гласных. Возможно, существуют и более крупные "просодические молекулы"? Не в курсе... На каком-то этапе нужно исключить из подсчетов "немые" гласные и гласные, звучащие как согласные (напр., u после q или g в большинстве языков).

Итак, искомый алгоритм – это перечень всех возможных сочетаний гласных букв, произносимых по правилам данного языка на один слог, плюс наиболее оптимальный порядок, в котором их следует пересчитывать. Вряд ли нам удастся найти порядок, гарантирующий полное отсутствие ошибок, но приблизиться к нему можно.

По опыту написания алгоритма для немецкого языка, могу сказать, что учебники и справочная литература не содержат всей необходимой нам информации. Так, в любом справочнике можно найти перечень немецких дифтонгов: au, äu, eu, ei, ie. Но, помимо них, в текстах немецких либретто мне попадались сочетания aa, ae, ai, ay, ee, ey, oe, oi, также сливавшиеся в один слог. Разумеется, учесть всё невозможно. Те же пары гласных, принадлежа разным частям слова, например, префиксу и корню, никакого дифтонга не образуют и должны считаться отдельно. В словах иноязычного происхождения они могут вести себя не так, как в немецком и т.д. и т.п.

И, наконец, вопросы по каждому из трёх языков, на которые у меня нет ответа.

Итальянский

Слияние в одну "слогоноту" подряд идущих гласных, в том числе принадлежащих двум - трём разным словам. Есть ли предел допустимого их количества? Есть ли сочетания, которые не могут сливаться подобным образом? Какова роль буквы h во всех этих случаях? Отличается ли в этом плане поведение гласных с "акцентами" (à, ò, ì, ù, è, é)?

Характерная иллюстрация. "Аида", заключительная фраза речитатива перед романсом Радамеса:

(Чем объяснить, что в первом такте фрагмента слова "te ho" идут на один слог, а во втором – на два?)

Французский

Ряд вопросов совпадает с вопросами по итальянской вокальной просодии: та же élision между двумя словами, гласные с "акцентами" и без. Впрочем, очевидно, что во французском эти вопросы намного жестче регламентированы и ответы на них найти легче. Но мне они на сегодняшний день неизвестны. Кроме того, у меня есть устойчивое ощущение, что все эти нормы сильно отличаются между собой в классицистской поэзии и операх от Люлли до Рамо и в опере романтической, а также в традиционном стихотворном либретто опер Гуно, Бизе и в прозе "Пеллеаса и Мелизанды". Так ли это и не придется ли сочинять для французского несколько  разных алгоритмов?

Характерная иллюстрация. "Пеллеас и Мелизанда", картина 1.

(Почему одно и то же слово "enfuie" в партии Мелизанды имеет три слога, а в партии Голо – два? Может, у них диалекты разные?)

Английский

К этому языку просто не знаешь, с какой стороны подступаться. С перечня относящихся к слогоразделу правил или сразу с исключений? Или проще со словаря исключений? В любом случае процент погрешностей в подсчетах в английской версии программы обещает быть рекордным. 

Наибольшее число проблем связано с буквой "e". Вот почти случайный набор слов, взятых с одной страницы клавира оперы "Сон в летнюю ночь" Бриттена (текст, что называется, в подлиннике). В словах слева буква "e" произносится, справа – нет:

over

every

evil

lovely

progeny

vilagery

Какие правила всё это описывают, как это "формализовать"?

Но даже разобравшись со всем на примере того же "Сна в летнюю ночь", мы столкнемся с неожиданностями в других операх того же Бриттена, написанных на современный прозаический текст. Так, окончание -tion в шекспировском тексте Бриттен трактует однозначно, как два слога, а, скажем, в прозе "Альберта Херринга" (по Мопассану) – как один...

В качестве примера – вполне конкретный частный вопрос: в каких случаях буквосочетание ia образует один слог, а в каких два? Объяснения со ссылками на ударность – безударность или на принадлежность гласной корню слова ничего не дают, так как программа не имеет связи с Оксфордскими словарями. Всё, что она может, – это проверить наличие тех или иных буквосочетаний и посчитать буквы...

Означает ли всё вышеизложенное, что задача невыполнима и вся затея бессмысленна? Вовсе нет. Задача выполнима лишь в некотором приближении, но и этот вариант не лишен смысла: просто на листе корректировки английский оригинал потребует процентов на 20 больше работы, чем немецкий, только и всего.

Со всеми соображениями обращайтесь ко мне на e-mail: guralnik@mail.ru .

Hosted by uCoz