AlefZet
Novial translation
editThanks very much for the translation. I have added it to the Novial test wikipedia. Nov ialiste 21:22, 18 September 2006 (UTC)
Салам от мусульман инкубатора:-) --Yaroslav Zolotaryov 21:43, 18 September 2006 (UTC)
crh локализация
editОтветил у себя. Alessandro 16:50, 27 October 2006 (UTC)
аффиксы падежей и принадлежности
editПравила пишу здесь, ответы на остальные вопросы - у себя.
- передние гласные: e, i, ö, ü
- задние гласные: a (â), ı, o, u
Если последний гласный звук основы – передний, то используется аффикс с передним гласным, если задний – то с задним. Из этого правила есть исключения
- слова, которые оканчиваются на мягкий согласный (в кириллице оканчиваются на мягкий знак) (суаль, баарь, контроль и т.д.) К ним присоединяются передние аффиксы
- слова, оканчивающиеся на q (zevq) К ним присоединяются задние аффиксы
- ещё некоторые слова (tarih - tarihı)
аффиксы падежей
edit1. Аффиксы падежей, при склонении слов без аффиксов принадлежности, а также с аффиксами принадлежности 1 и 2 лица множ. числа (-mız, -ñız и их варианты)
- Genitive -nıñ -niñ
- Dative -ğa, -qa, -ge, -ke
- Accusative -nı, -ni
- Locative -da, -ta, -de, -te
- Ablative -dan, -tan, -den, ten
2. Аффиксы падежей, при склонении слов с аффиксами принадлежности 1 и 2 лица ед. числа (-m, -ñ и их варианты)
- Genitive -nıñ -niñ
- Dative -a, -e
- Accusative -nı, -ni
- Locative -da, -ta, -de, -te
- Ablative -dan, -tan, -den, ten
3. Аффиксы падежей, при склонении слов с аффиксами принадлежности 3 лица (-ı, -sı и их варианты)
- Genitive -nıñ -niñ
- Dative -na, -ne
- Accusative -nı, -ni
- Locative -nda, -nde
- Ablative -ndan, -nden
(прошу прощения, сначала забыл добавть "глухие" варианты аффиксов - -ta, -te, -tan, -ten)
- Как определить передний или задний вариант аффикса используется? Если последний гласный в слове передний (e, i, ö, ü), то присоединяем передний аффикс (niñ, ni, de/te и т.д.). Если задний (a, ı, o, u), то присоединяем задний аффикс (nıñ, nı, da/ta и т.д.)
- Как определить глухой или звонкий вариант аффикса используется? Если основа заканчивается на гласный или звонкий согласный (b, c, d, g, ğ, j, l, m, n, ñ, r, v, y, z), то присоединяем звонкий аффикс (ğa/ge, da/de, dan/den). Если основа заканчивается на глухой согласный (ç, f, h, k, p, q, s, ş, t), то присоединяем глухой аффикс (qa/ke, ta/te, tan/ten).
- Как определить, каким из трёх наборов аффиксов (1, 2 или 3) мы пользуемся?
- 3.1. Если слово не имеет аффиксов принадлежности, или имеет аффиксы 1 и 2 лица множ. числа (-mız, -ımız, -umız, -miz, -imiz, -ümiz; -ñız, -ıñız, -uñız, -ñiz, -iñiz, -üñiz), то используем первый набор аффиксов:
- terek => terekke, terekte, terekten
- yol => yolğa, yolda, yoldan
- til + imiz > tilimiz => tilimizge, tilimizde, tilimizden
- baş + ıñız > başıñız => başıñızğa, başıñızda, başıñızdan
- 3.2. Если слово имеет аффиксы принадлежности 1 и 2 лица ед. числа (-m, -ım, -um, -im, -üm; -ñ, -ıñ, -uñ, -iñ, -üñ), то используем второй набор аффиксов:
- til + im > tilim => tilime, tilimde, tilimden
- til + iñ > tiliñ => tiliñe, tiliñde, tiliñden
- baş + ım > başım => başıma, başımda, başımdan
- baş + ıñ > başıñ => başıña, başıñda, başıñdan
- 3.3. Если слово имеет аффиксы принадлежности 3 лица (-ı, -u, -sı, -i, -ü, -si), то используем третий набор аффиксов:
- til + i > tili => tiline, tilinde, tilinden
- köy + ü > köyü => köyüne, köyünde, köyünden
- baş + ı > başı => başına, başında, başından
- yuqu + sı > yuqusı => yuqusına, yuqusında, yuqusından
- Проблема состоит в том, что автоматически определить, какой из трёх наборов используется, невозможно. Есть же слова которые сами по себе заканчиваются на ı, u, i, ü, m, ñ.
- Как например определить, что qolu > qoluna, qolundan, но при этом yuqu –> yuquğa, yuqudan. Ведь машине же непонятно, что qolu = qol + u (его рука), а yuqu - это просто yuqu (сон), а ни какое не yuq + u. Или например anañ -> anaña (потому что anañ = ana + ñ - твоя мать), но tañ -> tañğa (потому что tañ - это просто слово, заканчивающееся на ñ).
- А есть вообще омонимы. Например, если yüzüm - это виноград, то тогда yüzümge, а если yüzüm - это моё лицо (yüz + üm), то тогда yüzüme.
- Может надо посмотреть у турок - у них по-моему тоже должно быть что-то в этом роде.
- 3.1. Если слово не имеет аффиксов принадлежности, или имеет аффиксы 1 и 2 лица множ. числа (-mız, -ımız, -umız, -miz, -imiz, -ümiz; -ñız, -ıñız, -uñız, -ñiz, -iñiz, -üñiz), то используем первый набор аффиксов:
аффиксы принадлежности
edit- 1 лицо ед. ч. -m, -ım, -um, -im, -üm
- 2 лицо ед. ч. -ñ, -ıñ, -uñ, -iñ, -üñ
- 3 лицо ед. и мн ч. -ı, -u, -sı, -i, -ü, -si
- 1 лицо мн. ч. -mız, -ımız, -umız, -miz, -imiz, -ümiz
- 2 лицо мн. ч. -ñız, -ıñız, -uñız, -ñiz, -iñiz, -üñiz
С аффиксами принадлежности есть вот ещё какая проблема. Закон губной гармонии в крымскотатарском языке рапространяется только на первые два слога. Поэтому правило присоединения аффиксов такое
- если слово состоит из одного слога и гласный в нём задний губной (o, u), то присоединяются аффиксы -um, -uñ, -u, -umız, -uñız
- Например qol – qolum, qoluñ, qolu, qolumız, qoluñız
- если слово состоит из одного слога и гласный в нём передний губной (ö, ü), то присоединяются аффиксы -üm, -üñ, -ü, -ümiz, -üñiz
- Например göl – gölüm, gölüñ, gölü, gölümiz, gölüñiz
- если последний гласный в слове задний негубной (a, ı) либо задний губной (o, u), но в слове больше одного слога то присоединяются аффиксы -ım, -ıñ, -ı, -sı, -ımız, -ıñız
- Например davul – davulım, davulıñ, davulı, davulımız, davulıñız
- если последний гласный в слове передний негубной (e, i) либо передний губной (ö, ü), но в слове больше одного слога то присоединяются аффиксы -im, -iñ, -i, -si, -imiz, -iñiz
- Например tütün – tütünim, tütüniñ, tütüni, tütünimiz, tütüniñiz
Test
editРезультаты работы скрипта:
- {{grammar:nominative|dağ}} -> dağ
- {{grammar:genitive|dağ}} -> dağnıñ
- {{grammar:dative|dağ}} -> dağğa
- {{grammar:accusative|dağ}} -> dağnı
- {{grammar:locative|dağ}} -> dağda
- {{grammar:ablative|dağ}} -> dağdan
- {{grammar:possessive nominative|dağı}} -> dağı
- {{grammar:possessive genitive|dağı}} -> dağınıñ
- {{grammar:possessive dative|dağı}} -> dağına
- {{grammar:possessive accusative|dağı}} -> dağını
- {{grammar:possessive locative|dağı}} -> dağında
- {{grammar:possessive ablative|dağı}} -> dağından
--AlefZet 20:46, 28 October 2006 (UTC)
- Вроде всё правильно. Вот ещё несколько слов, в том числе заканчивающиеся не на ASCII буквы: yol, aydavcı, adam, hoş, taraf, hunü, yeşil, köz, terek. Alessandro 21:19, 28 October 2006 (UTC)
- {{grammar:nominative|yol}} -> yol
- {{grammar:genitive|yol}} -> yolnıñ
- {{grammar:dative|yol}} -> yolğa
- {{grammar:accusative|yol}} -> yolnı
- {{grammar:locative|yol}} -> yolda
- {{grammar:ablative|yol}} -> yoldan
- {{grammar:possessive nominative|yolımız}} -> yolımız
- {{grammar:possessive genitive|yolımız}} -> yolımıznıñ
- {{grammar:possessive dative|yolımız}} -> yolımızğa
- {{grammar:possessive accusative|yolımız}} -> yolımıznı
- {{grammar:possessive locative|yolımız}} -> yolımızda
- {{grammar:possessive ablative|yolımız}} -> yolımızdan
- Должно быть yolumız, т.к. слово yol состоит из одного слога. Alessandro 11:22, 29 October 2006 (UTC)
- {{grammar:nominative|aydavcı}} -> aydavcı
- {{grammar:genitive|aydavcı}} -> aydavcınıñ
- {{grammar:dative|aydavcı}} -> aydavcığa
- {{grammar:accusative|aydavcı}} -> aydavcını
- {{grammar:locative|aydavcı}} -> aydavcıda
- {{grammar:ablative|aydavcı}} -> aydavcıdan
- {{grammar:possessive nominative|aydavcıñ}} -> aydavcıñ
- {{grammar:possessive genitive|aydavcıñ}} -> aydavcıñnıñ
- {{grammar:possessive dative|aydavcıñ}} -> aydavcıña
- {{grammar:possessive accusative|aydavcıñ}} -> aydavcıñnı
- {{grammar:possessive locative|aydavcıñ}} -> aydavcıñda
- {{grammar:possessive ablative|aydavcıñ}} -> aydavcıñdan
- {{grammar:nominative|hoş}} -> hoş
- {{grammar:genitive|hoş}} -> hoşnıñ
- {{grammar:dative|hoş}} -> hoşqa
- {{grammar:accusative|hoş}} -> hoşnı
- {{grammar:locative|hoş}} -> hoşta
- {{grammar:ablative|hoş}} -> hoştan
- {{grammar:possessive nominative|hoşım}} -> hoşım
- {{grammar:possessive genitive|hoşım}} -> hoşımnıñ
- {{grammar:possessive dative|hoşım}} -> hoşıma
- {{grammar:possessive accusative|hoşım}} -> hoşımnı
- {{grammar:possessive locative|hoşım}} -> hoşımda
- {{grammar:possessive ablative|hoşım}} -> hoşımdan
- То же самое: должно быть hoşum, т.к. слово hoş - односложное. Alessandro 11:22, 29 October 2006 (UTC)
- {{grammar:nominative|hunü}} -> hunü
- {{grammar:genitive|hunü}} -> hunüniñ
- {{grammar:dative|hunü}} -> hunüge
- {{grammar:accusative|hunü}} -> hunüni
- {{grammar:locative|hunü}} -> hunüde
- {{grammar:ablative|hunü}} -> hunüden
- {{grammar:possessive nominative|hunüm}} -> hunüm
- {{grammar:possessive genitive|hunüm}} -> hunümniñ
- {{grammar:possessive dative|hunüm}} -> hunüme
- {{grammar:possessive accusative|hunüm}} -> hunümni
- {{grammar:possessive locative|hunüm}} -> hunümde
- {{grammar:possessive ablative|hunüm}} -> hunümden
- {{grammar:nominative|yeşil}} -> yeşil
- {{grammar:genitive|yeşil}} -> yeşilniñ
- {{grammar:dative|yeşil}} -> yeşilge
- {{grammar:accusative|yeşil}} -> yeşilni
- {{grammar:locative|yeşil}} -> yeşilde
- {{grammar:ablative|yeşil}} -> yeşilden
- {{grammar:possessive nominative|yeşiliñizler}} -> yeşiliñizler
- {{grammar:possessive genitive|yeşiliñizler}} -> yeşiliñizlerniñ
- {{grammar:possessive dative|yeşiliñizler}} -> yeşiliñizlerge
- {{grammar:possessive accusative|yeşiliñizler}} -> yeşiliñizlerni
- {{grammar:possessive locative|yeşiliñizler}} -> yeşiliñizlerde
- {{grammar:possessive ablative|yeşiliñizler}} -> yeşiliñizlerden
- Итого: с собственно падежными окончаниями всё ОК, а аффиксы принадлежности в двух местах не те. Alessandro 11:22, 29 October 2006 (UTC)
- Где?--AlefZet 11:27, 29 October 2006 (UTC)
- А, понятно. Скрипт аффиксы принадлежности не изменяет, какой проставишь, с тем и работает. Т.е. без разницы hoşum или hoşım, всё равно одинаковые падежные окончания будут.--AlefZet 11:31, 29 October 2006 (UTC)
- Ну как, можно баг открывать?--AlefZet 11:32, 29 October 2006 (UTC)
- Ну, видимо можно. Да, вот ещё такой момент. Есть ещё такая форма, которую раньше принято было счиать творительным падежом, а сейчас она падежом не считается. Форма с аффиксом -nen. Аффикс не изменяемый, одинаковый для всех слов: qolnen - рукой, qolumnen - моей рукой, bizlernen - с нами и т.д. Не знаю, нужно ли ещё и его прописывать. Alessandro 11:41, 29 October 2006 (UTC)
- У нас он тоже есть, называется көмектес - вспомогательный, а по-английски comitative, поскольку выражает совместность. Ввёл--AlefZet 11:55, 29 October 2006 (UTC)
- Fallback оставляем 'ru'? Т.е. пока интерфейс не переведен, будет русский.--AlefZet 12:03, 29 October 2006 (UTC)
- Думаю да. Поменять ведь всегда можно будет. Тут есть ещё такой момент, что турецкие крымцы по-русски не понимают. А крымские не понимают по-турецки. Но пока тут из Турции только Timurberk и он кое-как знает русский. Alessandro 12:24, 29 October 2006 (UTC)
латиница > кириллица
editСм. также как в кириллицу траслитерируется Talk:Wp/crh/Qurultay AlefZet 11:55, 29 October 2006 (UTC)
- Ну, пока, конечно, неправильно транслитерируется. Я на данный момент сделал на JavaScript транслитератор лат > кир, но пока без списка слов-исключений. Сейчас по мылу пришлю. А список исключений там будет сотни на полторы слов. :-/ Alessandro 12:24, 29 October 2006 (UTC)
таблицы исключений
editВопрос: можно ли как-нибудь в этих таблицах использвать что-то типа регулярных выражений? Или хотя бы просто оператор типа if. Проблема такого типа: если после слова "resul" идёт гласная или л, то заменяем его на "ресул" (resuller => ресуллер, resulimiz => ресулимиз), а если солгасная или конец слова, то на "ресуль" (resulniñ => ресульнинъ). Как такое описать? Alessandro 21:31, 31 October 2006 (UTC)
- К сожалению, пока - нет. Придётся описывать это в основной таблице как 'ln' => 'льн', 'lp' => 'льп', ... 'l' => 'л', и т.д.--AlefZet 13:01, 1 November 2006 (UTC)
- Гм... Это плохо. С -ль мы, положим, разберёмся, а вот с некоторыми словами будет тяжелее. Например я хотел прописать, чтобы слово kör само по себе конвертировалось в кёр (а не в корь, просто потому что слово слепой встречается чаще, чем экзотическая форма "видь!"). А что значит само по себе? Это значит, что перед kör идёт пробел, ", ( или -, а после - пробел, ", ., ,, :, ) или -. Получается, нужно прописать 24 комбинации?!
- kör само по себе конвертировалось в кёр - так оно и есть, преобразование в корь гораздо сложнее.
- Так ведь дело в том, что как раз корь - это правило, а кёр - исключение. Если уж делать транслитератор в кириллицу, то делать правильный. А так, лучше пусть совсем не будет кириллической версии у статей, чем будет, но кривая. Alessandro 15:28, 1 November 2006 (UTC)
- Не понимаю: чтобы слово kör само по себе конвертировалось в кёр (а не в корь, просто потому что слово слепой встречается чаще, чем экзотическая форма "видь!") и как раз корь - это правило, а кёр - исключение. Что "правило", а что "исключение"? корь - по-любому сложнее, поскольку требует регексов (с программоцентрической точки зреения - "исключение" (ну кто только придумывал такую орфографию! Интересно, в Яналифе тоже самое было?). Сейчас я обдумываю, как и где их встроить в существующий код, и какие могут быть последствия для других вещей.--AlefZet 18:33, 1 November 2006 (UTC)
- 1). Видимо я кривовато мысль излагаю. Общее правило при транслитерации текста из латиницы в кириллицу гласит, что
- сочетания bö- bü- cö- cü- gö- gü- kö- kü- mö- mü- şö- şü- заменяются на бо- бу- джо- джу- го- гу- ко- ку- мо- му- шо- шу-. В кириллической орфографии слово не может начинаться с бё- бю- джё- джю- гё- гю- кё- кю- мё- мю- шё- шю-. Исключений из этого правила очень мало (кёр, бюджет, бюро).
- если вслед за bö- bü- cö- cü- и т.д. идёт ч, н, р, с, т, з, а вслед за ними другой согласный или конец слова, то после ч, н, р, с, т, з ставится мягкий знак. Например köstermek > косьтермек, gönce > гоньдже, küç > кучь, küz > кузь, körmek > корьмек.
- Таким образом, если в списке исключений ничего насчёт kör не будет прописано, то оно должно преобразовываться в корь. Поэтому я и сказал, что с точки зрения алгоритма транслитерации преобразование kör > корь - это правило, а слово кёр, начинающееся с кё- - это исключение, таких слов (равно как и начинающихся с бё- бю- и т.д.) вообще говоря быть не должно.
- Но я хочу, чтобы одиночно стоящее слово kör (без аффиксов) преобразовывалось в кёр. Потому что с вероятностью 0,9 слово kör в латинском тексте значит "слепой" (кёр в кириллице), а не "видь!" (корь в кириллице).
- 2).Что касается того, кто придумывал крымскую кириллицу - честно скажу, не знаю, но руки надо поотрывать этому человеку. Сделали бы как у карачаевцев (ё = [ö], ю = [ü]) или как у ногайцев (оь = [ö], уь = [ü]) - и не было бы проблем.
- В яналифе такого не было, там всё было нормально (kөz, kyz, kөrmek и т.д.) Alessandro 19:20, 1 November 2006 (UTC)
- 1). Видимо я кривовато мысль излагаю. Общее правило при транслитерации текста из латиницы в кириллицу гласит, что
- Не понимаю: чтобы слово kör само по себе конвертировалось в кёр (а не в корь, просто потому что слово слепой встречается чаще, чем экзотическая форма "видь!") и как раз корь - это правило, а кёр - исключение. Что "правило", а что "исключение"? корь - по-любому сложнее, поскольку требует регексов (с программоцентрической точки зреения - "исключение" (ну кто только придумывал такую орфографию! Интересно, в Яналифе тоже самое было?). Сейчас я обдумываю, как и где их встроить в существующий код, и какие могут быть последствия для других вещей.--AlefZet 18:33, 1 November 2006 (UTC)
- Так ведь дело в том, что как раз корь - это правило, а кёр - исключение. Если уж делать транслитератор в кириллицу, то делать правильный. А так, лучше пусть совсем не будет кириллической версии у статей, чем будет, но кривая. Alessandro 15:28, 1 November 2006 (UTC)
- kör само по себе конвертировалось в кёр - так оно и есть, преобразование в корь гораздо сложнее.
- Гм... Это плохо. С -ль мы, положим, разберёмся, а вот с некоторыми словами будет тяжелее. Например я хотел прописать, чтобы слово kör само по себе конвертировалось в кёр (а не в корь, просто потому что слово слепой встречается чаще, чем экзотическая форма "видь!"). А что значит само по себе? Это значит, что перед kör идёт пробел, ", ( или -, а после - пробел, ", ., ,, :, ) или -. Получается, нужно прописать 24 комбинации?!
- И ещё один момент: заглавные буквы. Вариант слов с прописной и из всех прописных можно отдельно не прописывать? И понимает ли он, что заглавные варианты i и ı - это İ и I, а не наоборот? Alessandro 14:52, 1 November 2006 (UTC)
- Вариант слов с прописной и из всех прописных - это нужно обязательно. i/İ и ı/I - тут пока проблема, нужно как-то исправить основную функцию, (для частного случая, когда i первая буква преобразуемая в заглавную İ- решение есть, но почему-то не действует для интерфейса, только для содержания).--AlefZet 15:22, 1 November 2006 (UTC)
- То есть нужно писать
- "maal"=>"мааль",
- "Maal"=>"Мааль",
- "MAAL"=>"МААЛЬ",
- и т.д.? Alessandro 15:28, 1 November 2006 (UTC)
- То есть нужно писать
- Вариант слов с прописной и из всех прописных - это нужно обязательно. i/İ и ı/I - тут пока проблема, нужно как-то исправить основную функцию, (для частного случая, когда i первая буква преобразуемая в заглавную İ- решение есть, но почему-то не действует для интерфейса, только для содержания).--AlefZet 15:22, 1 November 2006 (UTC)
- И ещё один момент: заглавные буквы. Вариант слов с прописной и из всех прописных можно отдельно не прописывать? И понимает ли он, что заглавные варианты i и ı - это İ и I, а не наоборот? Alessandro 14:52, 1 November 2006 (UTC)
Регексы
editС регексами кое-что получилось.
Хотелось бы видеть описание правил транслитерации "словами", или в виде таблицы.
- ОК, сегодня времени нету совсем, а завтра я постараюсь здесь всё написать. Alessandro 08:52, 5 November 2006 (UTC)
Пока код громоздок (в сущности, "транслитерация" из JavaScript в PHP), требуется оптимизация кода (объявлять список гласных, например, только один раз и т.п.), выражения не наглядны (приходится вручную преобразовывать юникодовые сущности в символы и, далее, в перловские литералы).
В текущем состоянии - здесь. Результат транслитерации - здесь. Слово büyük транслитерируется почему-то как буё�к %(.
- О, ну вот это уже очень здорово! Alessandro 08:52, 5 November 2006 (UTC)
правила транслитерации латиница > кириллица
editЯ для краткости не буду расписывать отдельно случаи заглавных букв.
Условные обозначения:
- С - согласный
- Г - гласный
- ▷ - начало слова (пробел, откр. скобка, дефис, кавычка)
- ◁ - конец слова (пробел, закр. скобка, дефис, кавычка, запятая, точка, двоеточие, точка с запятой)
- (A B C) - A, B, или С Например (◁C) - конец слова или согласный,
0. некоторые "систематические" исключения
- 0.1. буква ц
- ▷ts > ▷ц
- ts◁ > ц◁
- tso > цо
- tsu > цу
- tsi > ци, за исключением сочетания tsiz
- Сts > Сц, за исключением сочетания Сtsiz
- tsC > цС
- 0.2. буква щ
- ▷şç > ▷щ
- şç◁ > щ◁
- 0.3. слова на -льон
- lyоn◁ > льон◁
1. буквы гъ, къ, нъ
- ğ => гъ
- q => къ
- ñ => нъ
2. мягкие знаки после л
Если перед l идёт передний гласный, то после л ставится мягкий знак.
- il(◁С) => iль(◁С)
- el(◁С) => eль(◁С)
- öl(◁С) => öль(◁С)
- ül(◁С) => üль(◁С)
3. ya и ye
ya и ye после согласных заменяются на ья и ье
- Сya => Сья
- Сye => Сье
4. буква э
буква e в нчале слова и после гласных переходит в э
- ▷e => ▷э
- Гe => Гэ
5. буквы ё и ю - первый заход
Если слово начинается с yö(çnrstz) или yü(çnrstz), а вслед за этим идёт согласный или конец слова, то после ч,н,р,с,т,з в кириллице ставится мягкий знак.
- ▷yö(çnrstz)(◁C) => yö(çnrstz)ь(◁C)
- ▷yü(çnrstz)(◁C) > yü(çnrstz)ь(◁C)
Сочетания yо, yö и yu, yü после согласных заменяются на ьё и ью соотвественно.
- Cy(оö) => Cьё
- Cy(uü) => Cью
Все остальные сочетания yо, yö и yu, yü заменяются на ё, ю.
- y(оö) => ё
- y(uü) => ю
6. обрабатываем bö- bü- и т.д. в первом слоге
- 6.1. случаи, когда нужен мягкий знак
- Если слово начинается с (bcgkmş)ö(çnrstz) или (bcgkmş)ü(çnrstz), а вслед за этим идёт согласный или конец слова, то после ч,н,р,с,т,з в кириллице ставится мягкий знак.
- ▷(bcgkmpş)ö(çnrstz)(◁C) => ▷(bcgkmpş)о(çnrstz)ь(◁C)
- ▷(bcgkmpş)ü(çnrstz)(◁C) => ▷(bcgkmpş)у(çnrstz)ь(◁C)
- 6.2. случаи, когда мягкий знак не нужен
- Все остальные сочетания (bcgkmş)ö и (bcgkmş)ü в начале слова заменяются на (б дж г к м ш)о и (б дж г к м ш)у соответственно.
- ▷(bcgkmpş)ö => ▷(bcgkmpş)о
- ▷(bcgkmpş)ü => ▷(bcgkmpş)у
7. ö и ü в начале слова
- 7.1. случаи, когда мягкий знак нужен
- Если слово начинается с ö(çnrstz) или ü(çnrstz), а вслед за этим идёт согласный или конец слова, то после ч,н,р,с,т,з в кириллице ставится мягкий знак.
- ▷ö(çnrstz)(◁C) => ▷о(çnrstz)ь(◁C)
- ▷ü(çnrstz)(◁C) => ▷у(çnrstz)ь(◁C)
- 7.2. случаи, когда мягкий знак не нужен
- Все остальные буквы ö и ü в начале слова о и у соответственно.
- ▷ö => ▷о
- ▷ü => ▷у
8. все оставшиеся вхождения букв a, e, o, ö, u, ü, y
- a => а
- e => е
- о => о
- ö => ё
- u => у
- ü => ю
- y => й
9. буква c
- c => дж
10. все остальные буквы
- â => я
- b => б
- ç => ч
- d => д
- f => ф
- g => г
- h => х
- ı => ы
- i => и
- j => ж
- k => к
- l => л
- m => м
- n => н
- p => п
- r => р
- s => с
- ş => ш
- t => т
- v => в
- z => з
11. убираем сочетания льл, ньн, рьр, сьс, тьт
- льл => лл
- ньн => нн
- рьр => рр
- сьс => сс
- тьт => тт
Ну вот, как-то вроде описал. Если какие-то непонятки, спрашивайте. Alessandro 21:25, 5 November 2006 (UTC)
римские цифры
editКак вы думаете, как лучше всего поступить с римскими цифрами? Они не должны транслитерироваться при конвертации всего текста в кириллицу. Каждый раз обрамлять их в -{ }- нецелесообразно, потому что сочетания типа II, XI, XL всегда обозначают числа - таких слов в языке нету. Я думаю, что в самом конце транслитерационого скрипта нужно прописать, что отдельно стоящие сочетания прописных букв ЫЫ, XЫ, XЛ - должны транслитерироваться обрато в латиницу. Но при этом возникает проблема: а можно ли вообще (с помощью тех же регексов) аккуратно описать римские цифры? В противном случае придётся сделать список из всех чисел от I хотя бы до 50 (этого хватит, чтобы покрыть встречающиеся в статьях века и номера правителей). Alessandro 13:32, 9 November 2006 (UTC)
- Это уже есть в скрипте: wrapper function translate() в LanguageCrh.php--AlefZet 22:22, 9 November 2006 (UTC)
- Только что проверил в своей песочнице - работает.--AlefZet 22:25, 9 November 2006 (UTC)
Я тут просмотрел этот файлик.
Первый момент: правила выполняются в том порядке, в котором они прописаны в файле? Если да, то с > дж нужно вернуть в конец, как это у меня было. Потому что в некоторых правилах в середине скрипта фигурирует именно c (просто удобнее, когда это один символ, а не два), а на дж её нужно заменить в самом конце.
- Честно говоря не знаю, мне кажется, что массивы обрабатываются как в strtr: от длинных строк к коротким.--AlefZet 17:21, 19 November 2006 (UTC)
Второй момент: зачем сделано правило юю > ую? Есть и слова с сочетанием юю (например тююр). Alessandro 19:45, 18 November 2006 (UTC)
- Это еще не окончательный вариант и отражает стадию борьбы с багом: результат транслитерации büyük и подобных слов приводит к появлению non-wellformed UTF-8, т.е. нераспознаваемого знака. Если б не этот баг, двигался бы дальше. Я даже не знаю проявляется ли он под никсами, я работаю под виндами. Если б знал, что только под виндами, наплевал бы на него пока. Встретил непонятное поведение, когда одновременно обрабатываются символы латиницы и кириллицы, пока кириллицу исключил, верну позже, когда прояснится. Я заинтересован, чтобы регексы работали как надо, надо делать версию 2 для казахского транслитератора тоже, а к 15 марта нужно будет скорее всего о версии 3 --AlefZet 17:21, 19 November 2006 (UTC)
- Баг этот касается обработки дляч Ё и Ю, полсмотрите регексы, может удастся переопределить эквивалентно?--AlefZet 17:33, 19 November 2006 (UTC)
- А скажите более конкретно, в каких случаях этот баг проявляется? Только при обработке сочетаний üyü и öyö? Если так, то можно для них написать отдельное правило (что-то типа: büyü- > бую-, cüyü- > джую, güyü- > гую; все остальные вхождения: üyü > юю). Alessandro 19:01, 19 November 2006 (UTC)
- Баг этот касается обработки дляч Ё и Ю, полсмотрите регексы, может удастся переопределить эквивалентно?--AlefZet 17:33, 19 November 2006 (UTC)
Соображения по поводу казахского транслитератора
editСоображение по поводу казахской вики. Тот транслитератор, который сейчас преобразует латиницу в кириллицу в окне редактирования не преобразует букву y (саму по себе) в й. Я обратил внимание, что у вас там есть специальная буква ý, но мне кажется, логично, чтобы все оставшиеся после создания букв ё, ю, я игреки также преобразовывались в й. Alessandro 19:45, 18 November 2006 (UTC)
- Вроде бы не должно оставаться непреобразованных игреков... Впрочем, все равно я намеревался переписать скрипт--AlefZet 17:10, 19 November 2006 (UTC)
Крымскотатарская локализация
editЯ тут нашёл людей, которые взялись переводить на крымскотатарский файл с интерфейсом. Надеюсь, что через недельку-другую значительный его кусок будет переведён. У меня такой вопрос (я до конца с этим так и не разобрался), не может так случиться, что сейчас крымскотатарский файл (в котором кроме пространств имён ничего не переведено) будет добавлен в SVN, а потом придётся долго возиться, чтобы его обновить? Alessandro 19:45, 18 November 2006 (UTC)
- Очень хорошо. Только пусть сразу делают в двух письменностях. Я могу сказать только про свой опыт. Впервые я отправил файлы в Mediazilla 16 июля, в SVN положили 6 ноября, довольно таки быстро уже 7 ноября файлы были на живых сайтах. После я отправлял обновления, их достаточно быстро присоединяли. Поэтому для нас с точностью до наоборот: стоит времни и усилий добиться, чтобы файлы взяли, но потом обновления прокатывают как по маслу. Однако, я посоветовал бы перевести хотя бы то, что показывается на заглавной странице справа, вверху и внизу. Ну, то что увидят при тестировании.--AlefZet 17:31, 19 November 2006 (UTC)
- 3,5 месяца? Долго, однако...
- Два варианта на разных алфавитах будут.
- я посоветовал бы перевести хотя бы то, что показывается на заглавной странице справа, вверху и внизу.
- Да, это обязательно будет в "первой партии" переводов. В крайнем случае, если меня знакомые подведут, я сам с грехом пополам, но переведу. Проблема вся в том, что терминология не разработана практически, в словаре её нету. :( Даже перевод таких простых слов как "ссылка" и то часто вызывает затруднения. Alessandro 19:21, 19 November 2006 (UTC)
- UPD: Самое первоочередное добавил сюда User:AlefZet/crh/MessagesCrh cyrl.php, User:AlefZet/crh/MessagesCrh latn.php. Alessandro 15:52, 20 November 2006 (UTC)
Обсуждения-сироты
editВот эти две странички ещё зачем-нибудь нужны: Talk:Test-wp/kk-latn и Talk:Test-wp/kk-latn/Names.php ? если нет, пометь их к удалению, пожалуйста. --Kaganer 18:28, 17 March 2008 (UTC)
crh.wiktionary
editMerhaba, benim çok vaktim olmuyor her zaman. O yüzden çok katkı yapamıyorum. Siz de el atabilir misiniz? https://incubator.wikimedia.org/wiki/Category:Wt/crh --123snake45 (talk) 17:09, 1 November 2014 (UTC)