AI: логика и правила единиц БД – порядок слов
Падежи - это полбеды, нужно также заложить в программу AI правильные окончания и приставки, чтобы он знал как правильно формируются слова и мог их составлять грамматически правильно. Но и это еще не все, ведь мы не хотим заранее, чтобы AI отвечал тупо шаблонами, он должен сам определять о чем речь и в зависимости от конкретной ситуации самостоятельно выбирать правильный ответ / вопрос. О ситуации - тоже нужно в отдельной статье рассмотреть различного рода ситуации и соответственную ответную реакцию AI, ведь было бы весьма странно, если бы на вопрос "Как дела, чувак, блин?" наш AI ответил бы "Хорошо, а как твои, Ваня?" или "Сегодня, сэр, не плохо!" вместо "Круто, внатуре, чувак, а ты чем паришься?" - чувствуете стиль, характер и непредсказуемость машины?
Например, "Вани, как у дела тебя?" вместо "Ваня, как у дела тебя?". Теперь нас вполне устраивает грамматически правильное предложение - вопрос AI Ване, но порядок слов носит хаотичный (случайный) порядок, поэтому, будем учить нашего AI правильной расстановке слов. К сожалению, это одна из самых сложных вещей, потому как в русском языке нет каких-либо конкретных правил, так, например, в зависимости от конкретной ситуации распорядок слов может постоянно меняться, в зависимости от того, какие чувства и эмоции мы хотим передать. Например.
- Утвердительное предложение:
- Я СЕГОДНЯ пойду в кино. (именно сегодня, а не завтра я пойду в кино)
- Пойду Я сегодня в кино. Или:
- Сегодня в кино пойду Я. (именно я сегодня пойду в кино, а не кто-либо другой)
- Я ПОЙДУ сегодня в кино. (а не поеду, полечу, поплыву и т.д.)
- В КИНО я пойду сегодня. (именно в кино, а не на концерт или куда-то еще)
Вот так непредсказуемо может быть изменен порядок слов и не только в утвердительном, но и в вопросительном, восклицательном и повествовательном предложениях. Так какой же выход следует искать, ведь, не зная правильную расстановку слов, AI может ответить "В я пойду кино сегодня" - что теряет всякий смысл, хотя и можно догадаться на примере такого маленького и простого предложения, но это только пример, а ведь бывают и гораздо более сложные ситуации.
Чтобы этого избежать и помочь AI отвечать не только грамотно, но и правильно, и логично, нужно не только каждому слову назначать свои свойства, но и каждому словосочетанию или целой фразе, например, нужно определить каждое слово (в упрощенном виде) по качеству, характеру, направлению, типу, виду и т.д. Это очень сложный и трудоемкий процесс и может занимать значительные вычислительные ресурсы, но иначе AI будет похож не на человека, а на робота с готовыми шаблонными ответами, сгенерированные случайным образом из заготовок - болванок) на искомые в БД похожие вопросы. Поэтому, чтобы наш AI не был болваном (шаблонным роботом), мы определяем наши слова:
- Я - существительное, тип - одушевленное (речь идет о живом существе, а не о предмете), соответствует вопросу "кто?"; местоимение.
- Сегодня - время, существительное.
- Пойду - глагол, действие будущего; зависимое от "я".
- В - предлог, отвдельно употребляться не может, указывает конкретное место "где" или "куда".
- Кино - существительное, тип - неодушевленное (речь идет о предмете), соответствует вопросу "что?"; указывающее конкретное место "где".
Вот эти основные свойства слов (их на самом деле гораздо больше, порядка 20) и расставят все точки над i. Но нужно учесть массу языковых правил, например, местоимение и предлог совместно используются, т.е. робот может ответить "В я пойду кино сегодня" и будет прав, конечно, ответ не верный с точки зрения человека, но не машины, ведь можно же сказать "я у машины стою рядом", тогда закладываем в программу AI, что предлог "в", "у", "около" и т.д. могут сочетаься только с существительным и только с ним образовывать грамматическую пару, т.е.: "я", "у машины", "стою", "рядом". Теперь сделаем замес слов, генерируя их хаотически:
- "я", "у машины", "стою", "рядом".
- "у машины", "стою", "рядом", "я".
- "стою", "рядом", "я", "у машины".
- "рядом", "я", "у машины", "стою".
Ну вот, как бы мы не изменяли порядок слов, он теперь всегда будет правильным, но лишенным смысла, ведь нам нужен на конкретный вопрос, конкретный ответ, опять же, это не так сложно реализовать, зная свойства всех слов, словосочетаний и фраз, а также их приоритет при общении. Используя основные правила русского языка, рассмотрим наш примитивный пример более подробней.
- КТО сегодня пойдет в кино?
- Я сегодня пойду в кино.
- Кто СЕГОДНЯ пойдет в кино?
- Я СЕГОДНЯ пойду в кино; или: СЕГОДНЯ я пойду в кино. В зависимости от важности слов в контексте, робот с AI может самостоятельно выбрать порядок слов: по акценту ответить или по важности, или по обращению - зависит от более крупных единиц БД - предложения и абзатца.
- Ты КУДА пойдешь сегодня?
- Я В КИНО пойду сегодня.
Но определенная форма вопроса подразумевает под собой определенную форму ответа, ведь одни и теже вопросы, заданные по разному могут дать совершенно разные варианты ответов. Так, в одном случае достаточно уточнить, а в другом случае нужно ответить утвердительно или отрицательно, но при этом можно без уточнений или пояснений, например:
- Ты знаешь, какой сегодня день? - на этот вопрос должен быть положительный или отрицательтый ответ, потому что его форма это подразумевает: "ты знаешь?..", "а он был там?.." - "нет, не был...", ...
- Да, знаю, сегодня солнечный день, понедельник, 2009 год, 30-е мая по календарю.
- Нет, не знаю, (нет календаря).
- Нет.
В первом случае вопрос задается без обращения (вводного слова или фразы) к оппоненту: "Кто сегодня пойдет в кино?", во втором случае с обращение тот же самый вопрос, - "Ты знаешь, кто сегодня пойдет в кино?", соответственно и ответы будут разные, автоматически генерируемые из слов с определенными свойствами:
- Я сегодня пойду в кино;
- Да, знаю, пойду я.
- Да, знаю;
- Да, знаю, - я;
- Да, знаю, я пойду;
- Да, знаю, пойду я сегодня в кино;
- и т.д.
На сколько полно генерировать ответ, AI должен определить исходя из разговора, т.е. не просто тупо сгенерировать из определенных шаблонов, а сгенерировать на основании учета психологии собеседника, его характера. Есть люди, которые любят краткость - сестру таланта, есть зануды, как я, любящие пообщаться подольше и побольше, используя различные стиллистические приемы речи, различные водные слова, массу прилагательных, слов пояснительных, звуковых и эмоциональных - заметили, какое длинное предложение написал, а ведь можно было все пятью словами объяснить. Вот и робот с AI должен примерно также вести беседу, а не просто тупо поддакивать или поднекивать.
Рассмотрены некоторые проблемы корректировки БД AI в автоматическом режиме по порядку слов (глаголы и предлоги, глаголы и направление или место, глаголы и время, глаголы и другие слова) в статье AI: проблемы БД и корректировка.
Частицы. Также есть некоторые правила на частицы русского языка, например, частицы отрицания "не" с глаголами пишется раздельно, также правила на повторения частицы "ни" и междуметия, например, "ни-ни" - "ни в коем случае", "совсем нет".
Числа. Подробней о проблемах чисел см. статью AI: единицы БД - предложения.
Это только общие проблемы глаголов, но такие проблемы встают в лингвистике с лиом, родом, числом и др., также проблемы присущи каждой части речи - самостоятельной и служебной. Все проблемы в рамках одной статьи рассмотреть невозможно, это займет примерно 200 статей, как эта. Слова в истории постоянно меняются, устаревают, появляются новые, изменяются правила языка и т.д. и т.п.
Другие статьи по теме seo (оптимизация), монетизации и раскрутке:
Комментариев: Комментариев нет
Опубликованно: Понедельник, Июнь 1st, 2009 в 19:53
Обновлено: 3 Июнь 2009 в 21:48.
Директории: AI (ИИ)
Автор: admin, все авторы.
В статье: 1073 слов. Ссылки на странице.
Понравилась статья? - Не пропустите следующую, подпишитесь на RSS-канал[],
Также Вы можете оставить комментарий, или на Вашем сайте.
Эту статью находят по поисковым запросам:





Метки статьи:



463768885,
zgr@bk.ru...























