Искусственный язык — различия между версиями

Материал из Орфовики
Перейти к: навигация, поиск
(Новая страница: «Можно разработать искусственный язык на базе диалектов русского (примеры: [http://ru.wikipedia.org/…»)
 
 
Строка 21: Строка 21:
  
 
=== Список приставок ===
 
=== Список приставок ===
Составляем список приставок (в общем готов: [[приставки]]), для каждой из них расписываем все функции (не готово).
+
Составляем список приставок (в общем готов: [[приставки]]), для каждой из них расписываем все функции (не расписаны).
  
 
На глазок оцениваем, какие можно заменить (ещё не начато), заменяем все слова с ними - составляем правила и словарь замен.
 
На глазок оцениваем, какие можно заменить (ещё не начато), заменяем все слова с ними - составляем правила и словарь замен.
Строка 83: Строка 83:
  
 
"Простая речь", имея полную однотомную грамматику и высокий уровень совместимости с русским языком (можно даже писать тексты на "простой речи", правильные с точки зрения официального русского языка!), была бы неплохой альтернативой эсперанто (грамматика 1910 года на 352 страницах), а среди славян - и интерлингве (грамматика 1955 года на 118 страницах).
 
"Простая речь", имея полную однотомную грамматику и высокий уровень совместимости с русским языком (можно даже писать тексты на "простой речи", правильные с точки зрения официального русского языка!), была бы неплохой альтернативой эсперанто (грамматика 1910 года на 352 страницах), а среди славян - и интерлингве (грамматика 1955 года на 118 страницах).
 +
 +
== Минимальный словарь ==
 +
 +
"В языке СП /старославянских памятников/ - суммарно 9616 слов. Из них славянских - 7838." (Цейтлин 27)
 +
"В составе славянских слов СП - 2879 глаголов и 2674 существительных." (Цейтлин 28)
 +
"...разнокоренных слов несколько больше - немногим более 1200." (Цейтлин 32)
 +
"...довольно часто один корень представлен в СП только одним словом, простым или производным, что весьма затрудняет анализ.
 +
Всего таких слов в СП около 350..." (Цейтлин 32)
 +
На 9616 слов СП приходится 611 сложных (Цейтлин 273)
 +
Так, самая многомногочисленная группа мотивированных существительных в языке СП — с формантом -ниjе со значением отвлеченного действия (в которой помимо слов, образованных от греческих корней, насчитывается 736 слов) содержит 74 сложения. Из 87 слов с суфф. -ьць, относящихся к категории лица, 51 слово является двукорневым сложением. Из 72 девербативов на -тел^ь со значением лица — 10 двукорневые сложения. Из 165 слов с формантами -ьникъ и -jеникъ — 17 сложные; из 39 слов отвлеченных значений на -ьствиjе — 9 сложений, из 130 на -ьство — всего 18; из 51 существительного с формантом -ость (-jесть) — только одно двукорневое сложение, из 28 слов на -ота (-jета) — также только одно двукорневое сложение. (Цейтлин 282)
 +
 +
В результате всех этих ограничений материалом настоящего словаря морфем русского языка послужило более 52 000 слов, составленных приблизительно из 5000 морфов (из них более 4400 корней, 70 префиксов и около 500 суффиксов, среди которых немало «аномальных», встречающихся лишь в нескольких словах). (СМРЯ)
 +
 +
Самые частые 750 слов охватывают около 80% текста, самые частые 1750 слов - около 89%, самые частые 6750 - около 95% (Дмитриев).
 +
 +
Самые частые 3000 слов из словаря Шарова при использовании замен покрываются 539 изучаемыми морфемами, не считая окончаний (98 служебные + 116 действия + 66 характеристики + 259 термины). Ещё 206 морфем не требуют изучения: 181 международные + 4 звукоподражания + 21 числительные.
 +
Для 5000-словника требуют изучения уже 557 морфем: 98 служебные + 122 действия + 70 характеристики + 267 термины. +331 не требуют изучения (302 международные (из них 7 можно писать знаками) + 8 звукоподражания + 21 числительные).
 +
 +
Таким образом, изучения 557 русских морфем (кроме окончаний) типичному носителю европейских языков достаточно, чтобы понимать более 90% специально подготовленного русского текста.
 +
По сравнению с 2000-словником для поддержки 3000-словника в ядро понадобилось добавить всего 16 корней, а в термины - 55.
 +
По сравнению с 3000-словником для поддержки 5000-словника в ядро (в действия и характеристики; перечень служебных морфем не расширялся) понадобилось добавить всего 10 корней, а в термины - 8.
 +
Подтвердилось предположение, что динамика нисходящая - добавления морфем между 3000- и 5000-словниками (2000 слов) сравнимы с добавлениями между 2000- и 3000-словниками (1000 слов), даже меньше.
 +
Подтвердилось предположение, что чем более редкие термины, тем больше шансов, что они международные. Международных слов в 5000-словнике на 68% больше, чем в 3000-словнике, что пропорционально (в отличие от русских терминов). Международных терминов уже больше, чем русских (в 3000-словнике было меньше).
 +
По Дмитриеву, для покрытия 95% текста достаточно поддержать 6750 самых частых слов. Предварительный просмотр в районе 6750-го, 7000-го, 8000-го и 10000-го слов показал, что более половины из них при использовании замен описываются уже известными морфемами, а значительная часть оставшихся - международные слова. Таким образом, текущий набор морфем вполне способен покрыть более 95% текста.
 +
Для сравнения, в Basic English 850 слов (там нет числительных, а приставки и суффиксы там не учитываются), а в эсперанто изначально было 900 морфем (даже без антонимов), включая международные. В текущей версии планового русского даже с международными словами морфем меньше, чем в эсперанто. Это включая 31 название растений и животных, которых в большинстве текстов просто не будет.
 +
Школьная программа обучения иностранному языку рассчитана на запоминание 1500-2000 слов, так что изучение планового русского займёт только половину времени, а в остальной части программы можно будет заниматься литературным русским языком, уже фактически умея читать по-русски. При альтернативном подходе (учить слова по какой-либо неадаптированной книге) для того же уровня понимания (95%) нужно вызубрить в 10 раз больше информации. Для типичного ученика это - стена на старте. Наличие же стандартного списка базовых морфем позволит ученику читать любые адаптированные книги и пользоваться специальным толковым словарём.
 +
 +
Текущий список морфем планового русского (557, охватывают более 95% специально адаптированного текста): [https://aftershock.news/?q=node/1405848]
  
 
== Ссылки по проекту "Простая речь"/"Плановый русский" ==
 
== Ссылки по проекту "Простая речь"/"Плановый русский" ==

Текущая версия на 05:44, 3 августа 2024

Можно разработать искусственный язык на базе диалектов русского (примеры: кяхтинский - изолирующий язык, Ruskio и Molot[1] - эсперантоиды), на базе восточнославянских языков (пример - укруска молва, интерлингвоид), на базе всех славянских языков (примеры: Slovio - эсперантоид, Slovianski-P и обчославенски jезик[2] - интерлингвоиды).

Эсперантоиды оперируют искусственными словами, созданными с помощью некоторого искусственного аппарата морфем. Интерлингвоиды заимствуют слова целиком с незначительными изменениями (под фонетические законы языка).

В Орфовики предпочтительно рассматривать проект интерлингвоида на базе диалектов русского языка. Рабочее название проекта - "плановый русский" (ПР).

Составлять этот язык лучше субстрактивно, т.е. отнимая от русского редкие способы словообразования (например, есть группы суффиксов, имеющих одинаковую функцию) и неудачно образованные слова (непонятно образованные, с уникальным корнем, уникальными искажениями и т.п.). Желательно минимизировать запас морфем, но следить за тем, чтобы выброшенные слова можно было более-менее полноценно заменить оставшимися. Это будет гарантировать полноту полученного языка. Ни один существующий славянский конланг пока не даёт такой гарантии.

Субстрактивный метод явно применялся при составлении Basic English (850 слов, с минимумом многозначности) и Oxford 3000 (3540 слов, с помощью которых определяются все остальные слова в Oxford Advanced Learner's Dictionary). Для сравнения интересны также экзамены на уровень владения японским (JLPT) и китайским (HSK) языками, где для каждого уровня определён конкретный список слов и иероглифов, которые надо знать. Ср. для русского экзамен TORFL, списки слов к нему.

Русский язык должен хорошо изучаться на базе ПР.

Использовать удобнее всего фонетические законы официального русского языка. Во избежание неоднородности языка церковнославянские и польские элементы надо либо убирать, либо преобразовывать под фонетику русского языка. См. Замена церковнославянизмов.

Международные слова желательно брать латинские, если нет латинских - греческие, но не германские. Для французских слов лучше искать латинские прообразы.

План действий

Желательно не создавать новых слов/форм, не зафиксированных в диалектах (речь не об официальном литературном подмножестве русского языка!). Желательно также не создавать гнёзда из одного-двух слов. В качестве замен для удаляемых слов могут быть использованы словосочетания.

Желательно, чтобы ПР был ближе к разговорному русскому, чем СРЛЯ.

Список приставок

Составляем список приставок (в общем готов: приставки), для каждой из них расписываем все функции (не расписаны).

На глазок оцениваем, какие можно заменить (ещё не начато), заменяем все слова с ними - составляем правила и словарь замен.

Прикидываем, какие значения многозначных приставок можно убрать, заменяем слова с такими значениями этих морфем на существующие синонимы (ещё не начато).

Список суффиксов

Составляем список суффиксов с функциями (есть черновик в архиве черновиков[3]).

На глазок оцениваем, какие можно заменить (ещё не начато), заменяем все слова с ними - составляем правила и словарь замен.

Прикидываем, какие значения многозначных суффиксов можно убрать, заменяем слова с такими значениями этих морфем на существующие синонимы (ещё не начато).

Список корней

По частотному словарю Шарова (30000 слов) составляем список глагольных корней (есть черновик - 1417 корней, см. Глаголы по списку Шарова), фильтруем его, предлагая более частотные замены. Используемые корни уже выделены: 385 славянских, 58 звукоподражательных, ? иностранных.

По частотному словарю составляем список корней существительных и фильтруем его. В данный момент строятся списки по акцентным парадигмам для сокращения числа парадигм и уверенного словообразования.

Пытаемся привести именные и глагольные корни друг другу в соответствие, в том числе по акцентным типам.

Словоизменение

Прикидываем, какие глагольные парадигмы можно заменить на производительные: ПР:Неправильные глаголы

Прикидываем, какие парадигмы склонения (см. Склонение) можно заменить на производительные, какие падежи можно убрать, какие функции падежей можно перераспределить:

Прикидываем, как регулярно образовывать сравнительную степень прилагательных.

  1. "В существительных третьего склонения (дочь, лошадь) и в сущ. 1-го с окончанием на "-ия", окончание "-е" с дательном и предложном (как в диалекте). На произношении это не сказалось бы (окончание-то безударное), но подровнялась бы система склонений и на письме однозначности чуть прибавилось (ср. заголовок "Угроза Росии")." [4] См. критику к 1956:40.
  2. Уничтожение предложного падежа: о слонЕ (Пр.) > про слонА (В.) (уже так в разг. речи)
  3. Уничтожение частичного падежа: вЫпить чайкУ (Ч.) > вЫпить чайкА (Р.) (уже почти исчез, кроме нескольких слов, и путается с родительным)
  4. Уничтожение склонения типа сапог (носок, погон и т.п.) и счётного падежа: нет/пара сапог (Сч.) > нет/пара сапогов (уже почти произошло)
  5. Уничтожение ждательного падежа: ждать письма/маму (Ж.) > ждать письмо/маму (В.) (уже так в разг. речи)
  6. Уничтожение склонения типа церковь (других таких слов нет): церквами (Т.) > церквями (уже так в разг. речи)
  7. Уничтожение склонения типа лошадь (дверь, плеть, кость): лошадьми (Т.) > лошадями (уже так в разг. речи)
  8. Уничтожение склонения типа сажень (других таких слов нет): сажен (Р.) > саженей (уже так в разг. речи)
  9. Уничтожение склонения типа башня (песня, пашня, спальня и т.п. на -ня): башен (Р.) > башень (есть случаи такого употребления)
  10. Уничтожение склонения типа чукча (других таких слов нет): чукчей (Р.) > чукч (есть случаи такого употребления)
  11. Уничтожение склонения типа стремя (семя, темя): стремян (Р.) > стремён (согласно этимологии; есть случаи такого употребления), считаем, что емя и рамо вымерли
  12. Уничтожение склонения типа людин (других таких слов нет): людин (И.) > людь (есть случаи такого употребления)
  13. Уничтожение склонения типа облако (других таких слов нет): облако (И.) > облак, муж.р. (согласно этимологии)
  14. Уничтожение склонения типа ухо (око): уши, ушей, ушами > ухи, ух, ухами (есть случаи такого употребления: Дурново 2000 298/)
  15. Уничтожение склонения типа путь (других таких слов нет): пути (Р.), пути (Д.), на пути (М.) > путя, путю, на путе (1 940 для "твоему пути", 5 для "твоему путю"; 5 050 для "твоего пути", 9 для "твоего путя")
  16. Уничтожение местного падежа: в/на/при слонЕ (М.) > в/на/при слонУ (Д.)[3], по аналогии с по/к (уже так во всех склонениях, кроме II, частично в II (тип ударения "всегда на окончание"): в полкУ, и с другим ударением в некоторых словах II склонения: в дымУ); или в рамках стандартного русского (не всегда получается): в лесУ (М.) > средИ лесА (Р.), в носУ (М.) > внутрИ нОса (Р.), на берегУ (М.) > повЕрх бЕрега (Р.). (см. Текст без творительного, предложного и местного падежей)
  17. Уничтожение творительного падежа: ударить ногой (Т.) > с ноги (Р.), быть мучимым кем-то (Т.) > от кого-то (Р.) (Ломоносов), стать кем-то > стать кто-то (В.) (он стал учитель - за учителя двусмысленно), стоять за кем-то > после кого-то (Р.); ср. это было несчастным случаем > это был несчастный случай (замена получается почти всегда, см. Текст без творительного, предложного и местного падежей)
  18. Уничтожение дательного падежа: слонУ/к слонУ (Д.) > до слонА (Р.), по слонУ (Д.) > по слонА (Р.) (ср. "по вас ползёт клоп")

Склонение типа очко/древко можно устранить заменой этих слов на синонимы. Например, очко -> глазок и балл, древко -> шест, рукоятка или ручка.

Ударения

Готовим законы для постановки ударения. Желательно исключить влияние приставок/предлогов и частицы -ся. Вариативность ударения в какой-либо парадигме либо распространяем на всю парадигму, либо выравниваем всю парадигму.

Хорошим достижением была бы полная предсказуемость склонения по двум каким-либо формам (например, N sg и G pl (показывает беглую гласную)). То же со спряжением, включая способ образования видовой и каузативной пар. Для глаголов можно брать за основу инфинитив (влияет на императив и прошедшее время) и 3 л. ед.ч. (показывает последнюю согласную корня, влияет на прочие личные формы и на причастия с деепричастиями, если они будут в языке).

Прочие исключения

По дороге выискиваем всевозможные исключения из законов: нерегулярное падение редуцированных, неправильные палатализации, неправильное образование ё, неправильные заимствования и т.п. По возможности исправляем их или заменяем слова на синонимы.

Грамматика

Грамматику следует составлять поверх двухтомной грамматики русского языка 1980 года. Неплохим достижением было бы сокращение объёма до 500 страниц при сохранении полноты изложения.

Правила правописания следует составлять поверх сборника 1956 года, с учётом найденных ошибок и недомолвок. Желательно сократить объём раза в два, чтобы всё уместилось в один том с грамматикой. См. Упрощение правил.

"Простая речь", имея полную однотомную грамматику и высокий уровень совместимости с русским языком (можно даже писать тексты на "простой речи", правильные с точки зрения официального русского языка!), была бы неплохой альтернативой эсперанто (грамматика 1910 года на 352 страницах), а среди славян - и интерлингве (грамматика 1955 года на 118 страницах).

Минимальный словарь

"В языке СП /старославянских памятников/ - суммарно 9616 слов. Из них славянских - 7838." (Цейтлин 27) "В составе славянских слов СП - 2879 глаголов и 2674 существительных." (Цейтлин 28) "...разнокоренных слов несколько больше - немногим более 1200." (Цейтлин 32) "...довольно часто один корень представлен в СП только одним словом, простым или производным, что весьма затрудняет анализ. Всего таких слов в СП около 350..." (Цейтлин 32) На 9616 слов СП приходится 611 сложных (Цейтлин 273) Так, самая многомногочисленная группа мотивированных существительных в языке СП — с формантом -ниjе со значением отвлеченного действия (в которой помимо слов, образованных от греческих корней, насчитывается 736 слов) содержит 74 сложения. Из 87 слов с суфф. -ьць, относящихся к категории лица, 51 слово является двукорневым сложением. Из 72 девербативов на -тел^ь со значением лица — 10 двукорневые сложения. Из 165 слов с формантами -ьникъ и -jеникъ — 17 сложные; из 39 слов отвлеченных значений на -ьствиjе — 9 сложений, из 130 на -ьство — всего 18; из 51 существительного с формантом -ость (-jесть) — только одно двукорневое сложение, из 28 слов на -ота (-jета) — также только одно двукорневое сложение. (Цейтлин 282)

В результате всех этих ограничений материалом настоящего словаря морфем русского языка послужило более 52 000 слов, составленных приблизительно из 5000 морфов (из них более 4400 корней, 70 префиксов и около 500 суффиксов, среди которых немало «аномальных», встречающихся лишь в нескольких словах). (СМРЯ)

Самые частые 750 слов охватывают около 80% текста, самые частые 1750 слов - около 89%, самые частые 6750 - около 95% (Дмитриев).

Самые частые 3000 слов из словаря Шарова при использовании замен покрываются 539 изучаемыми морфемами, не считая окончаний (98 служебные + 116 действия + 66 характеристики + 259 термины). Ещё 206 морфем не требуют изучения: 181 международные + 4 звукоподражания + 21 числительные. Для 5000-словника требуют изучения уже 557 морфем: 98 служебные + 122 действия + 70 характеристики + 267 термины. +331 не требуют изучения (302 международные (из них 7 можно писать знаками) + 8 звукоподражания + 21 числительные).

Таким образом, изучения 557 русских морфем (кроме окончаний) типичному носителю европейских языков достаточно, чтобы понимать более 90% специально подготовленного русского текста. По сравнению с 2000-словником для поддержки 3000-словника в ядро понадобилось добавить всего 16 корней, а в термины - 55. По сравнению с 3000-словником для поддержки 5000-словника в ядро (в действия и характеристики; перечень служебных морфем не расширялся) понадобилось добавить всего 10 корней, а в термины - 8. Подтвердилось предположение, что динамика нисходящая - добавления морфем между 3000- и 5000-словниками (2000 слов) сравнимы с добавлениями между 2000- и 3000-словниками (1000 слов), даже меньше. Подтвердилось предположение, что чем более редкие термины, тем больше шансов, что они международные. Международных слов в 5000-словнике на 68% больше, чем в 3000-словнике, что пропорционально (в отличие от русских терминов). Международных терминов уже больше, чем русских (в 3000-словнике было меньше). По Дмитриеву, для покрытия 95% текста достаточно поддержать 6750 самых частых слов. Предварительный просмотр в районе 6750-го, 7000-го, 8000-го и 10000-го слов показал, что более половины из них при использовании замен описываются уже известными морфемами, а значительная часть оставшихся - международные слова. Таким образом, текущий набор морфем вполне способен покрыть более 95% текста. Для сравнения, в Basic English 850 слов (там нет числительных, а приставки и суффиксы там не учитываются), а в эсперанто изначально было 900 морфем (даже без антонимов), включая международные. В текущей версии планового русского даже с международными словами морфем меньше, чем в эсперанто. Это включая 31 название растений и животных, которых в большинстве текстов просто не будет. Школьная программа обучения иностранному языку рассчитана на запоминание 1500-2000 слов, так что изучение планового русского займёт только половину времени, а в остальной части программы можно будет заниматься литературным русским языком, уже фактически умея читать по-русски. При альтернативном подходе (учить слова по какой-либо неадаптированной книге) для того же уровня понимания (95%) нужно вызубрить в 10 раз больше информации. Для типичного ученика это - стена на старте. Наличие же стандартного списка базовых морфем позволит ученику читать любые адаптированные книги и пользоваться специальным толковым словарём.

Текущий список морфем планового русского (557, охватывают более 95% специально адаптированного текста): [5]

Ссылки по проекту "Простая речь"/"Плановый русский"

Ссылки по проекту "Укруска молва"/"Русскый языкъ"

Примечания

  1. И. Карасев, Русский язык попал под Молот [1]
  2. http://lingvoforum.net/index.php/topic,3432.0.html
  3. Вот этот процесс: "Скажите как правильно: "в конкурсе чтецов, посвященном(посвещенному) Дню Победы"" [2]