|
|
|
Авторская страница |
На каком языке разговаривать с компьютером
На этом сайте уже есть несколько статей, касающихся в той или иной степени языков общения. На этот раз рассмотрим возможность создания языка, удобного как для общения между людьми, так и для общения с компьютером.
Кстати, на этих десяти языках говорит около половины населения земного шара. Вообще-то не следует забывать и о других языках - вполне возможно, что из некоторых из них можно почерпнуть ценные идеи. К сожалению, собственные языковые познания автора этих строк очень скромны и создать новый универсальный человеко-компьютерный язык мне не под силу. Вероятно не под силу эта задача будет и для любого другого человека, даже владеющего всеми этими десятью языками. Задача требует участия больших творческих коллективов. Однако кое-какие идеи я могу предложить Вашему вниманию. 1. Начнём с алфавита. Родным для компьютера является латинский алфавит, состоящий из 26 букв: A, B, C, D, E, F, G, H, I, J, K, L, M, N, O, P, Q, R, S, T, U, V, W, X, Y, Z. Однако в такой форме он используется только в очень ограниченном числе языков,- ряд других языков либо используют дополнительные символы, либо другие алфавиты. Существенными недостатками этого алфавита являются сложности с целым рядом его букв, которые могут в одном языке произноситься совершенно различно или наоборот разные буквы могут произноситься одинаково, а также недостаточное количество самих букв, из-за чего в большинстве языков приходится использовать дополнительные оригинальные буквы и использовать сложные сочетания букв. Например, слово борщ по правилам немецкого языка можно написать только так - Borschtsch. В этом отношении кириллица, состоящая из 33 букв значительно лучше, хотя с мягким и твёрдым знаками тоже не всё просто. По крайней мере найти соответствия каждой букве латинского алфавита значительно проще, чем обратное действие. Однако, по понятным причинам, использование кириллицы в качестве основы нашего языка совершенно нереально. Поэтому в качестве алфавита будем всё-таки использовать символы, имеющиеся на стандартной английской клавиатуре. У русского языка, однако, можно позаимствовать одно очень важное качество, отсутствующее у многих других языков. Заключается оно в том, что написание и произношение любых слов практически всегда соответствуют друг другу. Любые сочетания букв звучат примерно также, как звучит сумма их составляющих. Если сравнить, например с английским языком, то в нём существует масса сочетаний символов, звучащих совершенно по другому в зависимости от различных условий применения. Понятно, что в целях распознания разговорной речи компьютером, первый вариант значительно лучше последнего. Поэтому, если мы заложим в наш язык принцип соответствия произношения написанию, то можем избежать в будущем многих проблем. Лучше всё-таки иметь проблемы с какими-то отдельными языками, чем со всеми языками сразу. Поэтому можно предложить использование следующих букв и символов, а также их сочетаний, каждому из которых соответствуют определённые буквы или их сочетания других языков:
Примеры приведены для четырёх языков, для любых других принцип остаётся одинаковым – по возможности один символ должен соответствовать наиболее близким по звучанию звукам различных языков. При помощи трёх дополнительных символов возможно уточнение оттенков звучания. 2. Некоторые идеи грамматики можно позаимствовать из немецкого языка. Во-первых, не плохо бы иметь более-менее постоянные формы всех слов, не усугублённые многообразием словоформ из-за множества видов склонений и т.п. В немецком языке основную роль в этой сфере играют так называемые артикли: der, die и das, которые показывают род существительных и играют основную роль в их склонении. Это примерно тоже самое, как если бы в русском языке перед каждым существительным применяли слова – эта, это, этот, эти и т.д. При этом сами существительные не изменяются, а изменяются только их артикли. Хотя такой метод и ведёт к некоторому усложнению, поскольку каждому существительному д.б. сопоставлен один из артиклей, что ведёт к дополнительному увеличению числа слов в предложениях, однако позволяет обойтись только минимальным количеством форм существительных. Эта особенность языка позволяет также свободно соединять существительные в сложные слова, которые могут очень точно описывать многие понятия, которые без использования этого метода требуют гораздо большего количества слов. Благодаря этому количество слов в предложениях существенно уменьшается. Все эти качества очень ценны для компьютера. Если с грамматикой существительных в немецком языке всё в порядке, то вот про грамматику глагола этого сказать нельзя – она чрезвычайно сложна. Здесь используются сразу два различных метода формообразования глаголов, которые могут применяться параллельно. Один метод в некоторой степени напоминает формообразование русских глаголов, когда для спряжения и для выражения времени действия видоизменяется сам глагол. Другой метод заключается опять же в использовании вспомогательных глаголов, на которые возлагается основная нагрузка. При этом иногда один глагол может иметь до четырёх отдельных частей, стоящих в разных местах предложения. А всего различных форм каждого из глаголов может быть около тридцати. Всё это чрезвычайно сложно и в первую очередь для человека. Тем не менее сама идея очень интересная. Она позволяет иметь в предложениях всегда узнаваемые формы основного глагола, а вся нагрузка по выражению необходимой формы ложится всего на несколько вспомогательных глаголов. Если поближе познакомиться с грамматикой немецкого глагола, то становится ясно, что многие формы немецкого глагола дублируют друг друга, а большинство из них применяется очень редко. Реально наиболее часто применяются всего около пяти форм глагола. Всё это означает, что можно всё значительно упростить, оставив саму идею незыблемой. При этом достаточно всего тех же трёх вспомогательных глаголов, а количество составных частей глаголов может не превышать двух. Из немецкого же языка можно позаимствовать и порядок слов в предложениях. Если в русском языке можно начинать говорить последовательно подбирая подходящие слова и особо не заботясь о том, что будет в конце, то в немецком языке с самого начала известно какое слово будет последним. Жёсткий порядок слов в предложениях без сомнения полезен для компьютерной идентификации отдельных предложений. Мы рассмотрели наиболее сложные составляющие предлагаемого языка. Словарный запас для него можно черпать из самых разных языков, при этом важны в первую очередь длина слов и их звучание в целях их эффективного компьютерного распознавания в случае необходимости. Такой язык вряд ли будет пригоден для сочинения песен, но его назначение скорее напоминает роль латыни в биологии. PS 1. Примеры слов предлагаемого языка: 2. В статье приведены соображения автора, основанные на знании лишь полутора языков, поэтому новый язык вполне может выглядеть и совершенно иначе. Дизайн - Красота отвлекает |