ДОСТУПНО О СЛОЖНОМ,
или ОБО ВСЁМ, ЧТО ПРИДЁТ В ГОЛОВУ

Авторская страница


Home 

Wladimir Celler 

Как сделать искусственный интеллект

        На тему искусственного интеллекта я уже писал в одной статье. Там у меня прозвучала мысль, что сделать искуственный интеллект (ИИ) не так уж и сложно. Поскольку всё-таки желающих заняться созданием ИИ за это время не появилось, по крайней мере мне никто об этом не сообщил, то мне ничего не остаётся, как писать следующую статью, в которой я надеюсь растолковать, как его всё-таки можно было бы разработать.

        Итак, что же мы будем разрабатывать? Если мы возьмём за образец человека, то такое же, но искусственное устройство, нам явно пока не по зубам. Слишком уж много у человека свойств, которые пока даже не изучены, чтобы быть смоделированными. Поэтому забудем сразу же такие понятия как, например, сознание и душа. А будем мы разрабатывать устройство, которое всего навсего могло бы самостоятельно собирать информацию, перерабатывать её и выдавать новую полезную информацию. Такие устройства, кстати уже давно разрабатываются. Среди самоходных роботов, способных ориентироваться в окружающей местности, проводятся уже даже соревнования по преодолению пересечённой местности. Автомобили, самостоятельно ориентирующиеся в дорожной обстановке, уже испытываются на дорогах. Но, если на пути всех этих роботов положить, например, книгу, то они её наверняка не отличат от камня и, либо переедут, либо объедут, либо, в лучшем случае, проведут её химический анализ.

        Нас же больше интересует как раз возможность ориентации искусственных созданий в самой интересной области - области накопленных человеческих знаний. Поскольку, почти любую информацию такого рода можно выразить в виде текста, то нам наиболее интересен ИИ, способный анализировать текст. Количество текстовой информации, накопленной в интернете, огромно, но если Вы любой поисковой машине зададите запрос:
        - Который час?
то ни одна из них не выдаст:
        - Посмотри сам в правом нижнем углу экрана.

        Итак, для того, чтобы ИИ мог анализировать тексты, он должен уметь выполнять три важнейших функции.
Первая функция - входной анализ текста. Здесь программа ИИ должна уметь выполнять следующее:

  • графематический анализ текста (я использую термины, использованные на сайте www.aot.ru, там же есть подробные описания каждого из них), заключающийся в выделении отдельных слов, определении границ предложений и абзацев, а также определение языка текста,- даже если текст включает в себя части, написанные на разных языках, программа должна автоматически выбирать соответствующий языковый движок;
  • морфологический анализ текста, заключающийся в идентификации формы, в которой встречается каждое из слов в тексте;
  • синтаксический анализ, заключающийся в определении структуры отдельных предложений.
Вторая функция заключается фактически в обеспечении "понимания" программой текста. Эта функция состоит из следующих составляющих:
  • семантический анализ, заключающийся в анализе предложений на предмет определения, например, субъектов, объектов, форм воздействия одних на других и прочих частичек смысла в предложениях;
  • интеллектуальная обработка результатов семантического анализа.
Третья функция заключается в формировании ответной реакции на порцию поступившей информации.

        Ситуация с ходом работ в этой области, насколько мне известно, такая. По крайней мере для трёх языков - английского, немецкого и русского - существуют работоспособные программы, проводящие вполне качественные графематический, морфологический и синтаксический анализы текстов. Поскольку с каждым следующим этапом работ степень их сложности возрастает, то вот с семантическим анализом уже, разумеется не всё так просто. Тем не менее существующие программы умеют проводить уже и первичный семантический анализ. Нет сомнения, что качество работы таких программ уже в ближайшие годы будет на вполне приличном уровне. На этом мои сведения о ходе работ в этой сфере заканчиваются и мне не известно, работает ли кто-нибудь где-нибудь над следующим этапом обработки текста, а именно самым интеллектуальным - обработкой результатов семантического анализа. Кстати, если кто-то что-то знает, то подбросьте информацию.

        Мы же, пока, попробуем сами заняться этим самым наисложнейшим этапом создания ИИ. Идея такова.

        Во первых, нам понадобится первичный источник знаний. На эту роль отлично подходит свободная интернет-энциклопедия Википедия. На данный момент количество статей в английской её части превышает уже 650000, немецкая часть имеет более 250000, а русская часть хоть и сильно отстаёт, но всё равно 25000 уже имеет.

        Суть идеи такова, если разработать такую систему классификации информации, которая позволит любому виду информации предоставить вполне определённое предназначенное для неё место, то всю информацию можно квантовать на отдельные мелкие части, каждая из которых будет нести вполне определённый узкий смысл. Если это удастся сделать, тогда потребуется только разработать алгоритмы, сопоставляющие результаты семантического анализа координатам тех мест классификационной системы, где хранится соответствующая информация. А дальше уже не очень сложно, можно, например, сравнить новую информацию с имеющейся на предмет новизны, противоречивости и т.п. Таким образом, если ту же Википедию переструктурировать таким образом, что вся информация будет поделена на смысловые части, то такой источник информации становится сам по себе более интеллектуальным, как более интеллектуальна любая структурированная система, например, периодическая система элементов Менделеева.

        Свой вариант именно такой интеллектуальной классификационной системы (ИКС) я хочу предложить Вам далее. Но для того, чтобы объяснить её принципы, мне придётся начать издалека...

        Представьте себе ситуацию, что каждый человек, прежде чем появиться на белый свет, мог бы попросить Бога выполнить несколько желаний, касающихся его будущей жизни. Разумеется, эти желания не могут касаться времени, точнее продолжительности будущей жизни (это было бы уж слишком). При всём при этом оказывается, что и прочие желания скорее всего будут непосредственно зависеть от продолжительности будущей жизни, если бы эту величину можно было заранее узнать.

        Подумаем, что бы мог попросить человек, если бы он знал, что ему отведено всего, к примеру, 10 секунд жизни. Конечно, было бы интересно провести это время на какой-нибудь другой планете, или на Луне, к примеру. Однако проблема в том, что, по крайней мере в Солнечной системе вряд ли существует такое место, кроме как на Земле, где человек мог бы прожить хотя бы 10 секунд. Единственно, что остаётся человеку - выбрать Землю, а точнее биосферу Земли, поскольку где-нибудь в чреве вулкана или в недрах Земли было бы по крайней мере слишком жарковато. А вот в пределах практически всей биосферы вполне можно провести 10 секунд, причём это может быть Антарктида, Эверест или даже некоторая глубина в водах Мирового Океана.

        Теперь рассмотрим ту же ситуацию, но период времени увеличим до 10 минут. В этом случае придётся уточнять положение в пределах биосферы Земли уже более конкретно, поскольку, например, под водой без воздуха прожить 10 минут практически уже сложно. Это уточнение как раз и есть воздух.

        Увеличивая период времени до 10 часов, обнаруживаем, что следующей проблемой выступает температура, поскольку при минусовых температурах без какой-либо защиты этого времени вполне достаточно, чтобы замёрзнуть. Таким образом, следующим уточнением являются климатические условия, либо одежда и жильё.

        Продолжая закономерность, увидим, что для 10 дней на первый план выходит вода, а для 10 недель - пища.

        В принципе, всего указанного выше, достаточно, чтобы просто жить. Но следующая проблема состоит в том, что ту же воду и пищу должен кто-то давать. Ребёнок требует ухода. Поэтому на следующей ступени нашей иерархии поставим семью и соответствующий условный период времени установим в 10 месяцев.

        Интересный вопрос, что можно ещё попросить, если период жизни составляет 10 лет? Не вдаваясь в прочие рассуждения, сразу отвечаю - познание. Первые годы своей жизни человек занят познанием мира, от обучения языку до обучения в школе. Кто-то может мне возразить, что способность к познанию и просить не надо, она и так присуща человеку. Но я всё-таки исхожу из точки зрения, что то, каков человек, заслуга не его самого, а Творца.

        Ну и, наконец, что же ещё требуется, чтобы прожить 100 лет или , другими словами, целую жизнь? Вот здесь-то и стоят наконец все прочие ценности, которые человек часто только и считает за ценности - общение, все формы и разновидности культуры, достижения прогресса и т.п.

        Таким образом, мы получили шкалу из 8 ценностей, расположенных по степени значимости для человека. Но оказывается, это ещё не всё, что требуется для полноценной жизни. Мы забыли самое главное, без чего нельзя прожить и 10 мгновений -Вселенную или Бога (кому как нравится, исходя из того, верующий Вы человек или нет).

        Не менее важное качество, которое мы забыли, есть воспроизводство, репродукция, сохранение Живой Земли, которые позволяют каждому человеку прожить, условно говоря, 10 жизней в своих детях.

        Таким образом, все мыслимые ценности человека укладываются в шкалу из 10 нижеприведённых пунктов с возможными условными названиями:
  1. Вселенная, Бог
  2. Земля, Биосфера
  3. Воздух, Биоэнергия
  4. Климат, Жилище
  5. Вода
  6. Пища
  7. Семья
  8. Познание, Наука
  9. Общение, Культура
  10. Репродукция, Воспроизводство.
        Анализируя этот список, можно, между прочим, отметить некоторые особенности:

  1. первые три пункта даны человеку даром;
  2. следующие три пункта достаются человеку трудом;
  3. пункты 7, 8 и 9 я бы назвал инструментами, с помощью которых человек выполняет основную свою функцию, основное предназначение, ради которых он и появляется на свет;
  4. пункт 10 является целью.
        На этом месте я хотел бы отметить, что многие могут не согласиться с моими рассуждениями и их шкала ценностей может оказаться совершенно другая, поэтому я подчёркиваю, что всё, что я пишу есть только лишь моё мнение и я не претендую на что-либо большее. Так или иначе, но все эти 10 пунктов могут быть использованы в качестве основы системы классификации. Несмотря на то, что вся указанная иерархия ценностей была составлена исходя из потребностей человека, оказывается, что указанную шкалу можно использовать не только для классификации потребностей всех других существ на Земле и всей биосферы в целом, но и для классификации абсолютно всего, что есть во всей Вселленной.

        Структуру ИКС можно изобразить в виде трёхвитковой спирали, на каждом из витков которой расположено 10 областей, соответствующих десяти вышеперечисленным пунктам, причём граничащие пункты являются общими для двух витков и, таким образом, общее количество областей-пунктов оказывается равным 28.

        Все обозначения областей на спирали являются условными. Каждая область в глубину представляет собой точно такую же трёхвитковую спираль, и так хоть до бесконечности. Нижний виток спирали относится к природе в общем, в том числе и к человеку, как к биологическому существу. Средний виток спирали относится к человеку, как к существу разумному. Верхний виток спирали относится к разуму.

        Ещё раз хочу повторить, что то, что было описано как потребности, охватывает по принципу от общего к частному весь существующий мир. Поэтому невозможно совершенно точно дать название каждому пункту и совершенно точно сформулировать, что будет относиться к этому пункту. Можно лишь описать общую идею классификации и предложить определённые правила наполнения такой системы информацией.

        Так, нижний виток каждой спирали это факты. Средний виток каждой спирали это технологии. Каждый верхний виток спиралей относится к закономерностям. Поэтому любой вид информации изначально должен быть по возможности разделён на составляющие, относящиеся к фактам, технологиям и закономерностям. Если такое разделение не возможно, то информация относится к тому витку спирали, какой составляющей в ней больше. Само представление текста в ИКС изначально вложенное. Это означает, что если, читая обыкновенную статью, мы, встречая в ней пролинкованные слова, можем по этим ссылкам и не ходить, если эти слова нам, к примеру, известны, то прочитать статью в ИКС мы можем только переходя по ссылкам вглубь.

        Первый пункт Вселенная включает в себя всю информацию о неживой материи во Вселенной.

        Второй пункт Земля содержит информацию о живой материи с точки зрения её химического функционирования и истории развития.

        Третий пункт Воздух относится к биоэнергии.

        Здесь я хотел бы сразу прокомментировать эти три первых пункта. За критерий классификации по ним можно принять понятие Жизнь, поскольку первый пункт обо всём, что не связано непосредственно с жизнью, второй пункт, наоборот, о том, что с жизнью связано, но не сама жизнь, а третий пункт непосредственно о жизни, о которой, к сожалению, науке не очень много-то и известно.

        Следующий пункт содержит информацию о Климате как совокупности различных природных воздействий на живую природу.

        Пункт 5 посвящён Воде как основе жизни.

        Пункт 6 - всё о Пище и питании организмов.

        Пункты 4, 5 и 6 можно объединить, как описывающие среду обитания.

        Пункт 7 - всё о Семье.

        Пункт 8 - всё о Познании.

        Пункт 9 - всё об Общении между организмами.

        Таким образом, пункты 7, 8 и 9 относятся ко всем проявлениям разума.

        Пункт 10 - всё о Воспроизводстве и репродукции является одновременно началом следующего витка спирали.

        Кроме уже указанных особенностей ИКС, можно отметить ещё некоторые:

  1. спираль в некоторой степени символизирует процесс эволюции, поскольку каждый следующий пункт как правило относится к более молодым событиям и для каждого последующего пункта предыдущие являются необходимой основой;
  2. в модели отсутствуют приоритеты, хотя она и построена, опираясь на шкалу приоритетов живых организмов, это не означает, что какие-либо пункты важнее, чем другие;
  3. между отдельными пунктами спирали могут устанавливаться вполне предсказуемые взаимодействия, например, эволюционные между соседними областями и качественные между одинаковыми областями на разных витках, что может быть очень важно при построении алгоритмов ИИ.
        Понятное дело, что такая ИКС не идеальна, поскольку, например в каждом случае, когда будут присутствовать какие-либо описываемые объекты с количеством разновидностей более одного, тогда будут возникать списки, каждый объект которых будет порождать собственную спираль. Кроме того, первоначальная подготовка данных для построения банка информации на основе ИКС может быть выполнена только вручную и эта работа очень трудоёмка (поэтому-то я и указал на свободную Википедию, разработчиков у которой огромное количество). Недостатком является и то, что координаты любого блока информации не являются жёстко заданными и без индексации и ключевых слов вероятно обойтись не получится.

        Однако, у такой системы есть и очень важное достоинство. Она позволяет заложить в компьютер информацию, которая, во-первых, практически мало зависит от языка, на котором она вводится, а во-вторых, несёт ту попутную информацию, которая собственно и относится к области понимания. Например, в компьютер не составляет особого труда заложить какой-нибудь алгоритм расчёта, например, объёма куба. Но, помимо того, что V=a3, компьютер в данном случае будет ещё и знать, что этот алгоритм относится к:

  1. глобальной вселенской закономерности,
  2. из области человеческих технологий, связанных с познанием,
  3. и использующих технологии математического моделирования Вселенной,
  4. относящиеся к фактическим пространственным объектам Вселенной.
На самом деле это только мизерная часть того, что будет знать компьютер об этом алгоритме, выраженная на русском языке.

        Если такую систему всё-таки удастся реализовать, то можно представить, что, используя набор определённых алгоритмов можно научить её давать разумные ответы на довольно сложные вопросы. Например, если в вопросе присутствуют слова "где", "когда" или "сколько", то понятно, что ответ на них скорее всего находится среди фактов и искать, следовательно, следует в нижнем витке спирали. Если такая система реализуема в принципе, то можно её заставить заполнять информацией саму себя, а это значит, что, снабдив её роботом, аналогичным поисковым машинам и заставив перерабатывать всю информацию в интернете, Вы получите систему, которая знает всё, что известно в мире. А если удастся создать алгоритмы, выявляющие закономерности в нижних витках спирали, то это уже будет суперинтеллект.

PS     Все идеи, описанные здесь, не подкреплены никакими исследованиями и разработками и являются только лишь плодами моей фантазии, но, тем не менее, от авторских прав я не отказываюсь.




Дизайн - Красота отвлекает