AI: свойства единиц БД – предложения
Помимо правильной и грамотной расстановки слов, AI также должен уметь анализировать предложения, как отдельные единицы БД, работать с ними примерно так же, как со словами, используя массу свойств технических и логических, а также и правила самого языка.
Кто-то задастся вопросом, а зачем AI уметь классифицировать и парсить (анализировать) предложения в купе - абзатцы, ведь на это потребуется сумасшедшие вычисления, сотни, а то и тысячи запросов в БД, стоит ли оно того?
Стоит, иначе чем наш AI будет отличаться от калькулятора? Например, возьмем числа: "Он мог бы убежать, но они остался" - у человека не возникает вопрос числа: он или они, хотя предложение грамматически правильное. Это была опечатка, но сравните: "Он мог бы убежать, но он остались" - конечно, это тоже опечатка, поэтому, определить число людей - один или несколько - можно только из предыдущего предложения: "Дети и Стив пришли в лес и начался дождь. Он мог бы убежать, но он остались".
Проанализировав предложение, разложив его на составляющие - пары, становится очевидным, что ресь идет о нескольких людях, а не об одном. Теперь даже при любых опечатках AI будет иметь представление о чем говорится и самостоятельно его исправит. То есть "Стив - он" (ед.ч.), "дети - они" (мн. ч.), таким образом любые из опечатков дадут в итоге верный вариант правки "он остались" - "они остались" и "они остался" - "они остались". Это не еще не есть интеллект, но уже что-то близкое. Ведь простой редактор текстов, каким бы сложным он не был не сможет верно определить тему текста и предложить его скорректировать.
Помимо прочих проблем стоят также остро следующие проблемы:
- Акцентное слово - интонация и основной смысл предложения.
- Тип предложения - вопросительное, утвердительное, восклицательное, побудительное, повествовательное. Если нет графических знаков - многоточия, точки с запятой, запятой, вопросительного или восклицательного знака, то как определить по умолчанию?
- Определить основную интонацию и характер: грубое или вежливое, эллегичное или веселое, умное или глупое (несуразное, если требуется ответить на какой-то вопрос или задать дополнительный - поведение в общении).
- Определить способ общения: хитрый, насмешливый, наглый, дерзкий и т.д.
Таких проблем очень и очень много. Например, если в тексте часто употребляется слово "козел", то о чем речь - о животных или плохих людях? Например, - "Иду, значит, а тут какой-то козел выскакивает и давай меня бадать и ставить на счетчик. Я-то всяких козлов видел, но этот урод просто, хамит, угрожает... Да, таких козлов еще поискать надо". Здесь речь о "плохом человеке". Теперь, зная о чем речь, - о человеке в переносном смысле, хотя слово "человек" вообще не упоминается, нужно определить интонацию и характер, как AI должен вести разговор: "Да, сэр, животные странные нынче" или "Да, развелось бандитов" (про бандитов ни слова в тексте), "Да, действительно, урод" и т.д. Как нужно отвечать AI и поддерживать беседу - грубо, вежливо или как-то еще?
Нужно также ставить задачу для AI определить члены предложения — грамматически значимые части, на которые делится предложение при синтаксическом анализе. Они могут состоять как из отдельных слов, так и из словосочетаний. Выделяют два главных члена предложения: подлежащее и сказуемое, которые находятся в предикативном отношении и играют наиболее важную роль. К второстепенным членам предложения относятся дополнение, обстоятельство, определение. Это позволит определять значимые и не значимые слова, вводные слова и даже целые предложения, например, удивление, - "Нифига себе, сказал я себе, ну ты, блин, мужик, даешь...".
Если нет никаких графических знаков, никаких частиц, указывающих на тип предложения и AI не может сделать сравнительный анализ для точного результата, то AI может уточнить, спросить собеседника, - "Вы спрашиваете или уточняете, я не пойму?". Например, сравните:
- Эх, какая жизнь... - восклицательное.
- Эх, ну и жизнь... - повествовательное.
- Какая жизнь... - может быть и вопросительным и восклицательным и повествовательным, зависит от графического обозначения - символа "?", "!" или ".".
Другие статьи по теме seo (оптимизация), монетизации и раскрутке:
Комментариев: Комментариев нет
Опубликованно: Воскресенье, Май 31st, 2009 в 23:00
Обновлено: 1 Июнь 2009 в 20:35.
Директории: AI (ИИ)
Автор: admin, все авторы.
В статье: 585 слов. Ссылки на странице.
Понравилась статья? - Не пропустите следующую, подпишитесь на RSS-канал[],
Также Вы можете оставить комментарий, или на Вашем сайте.
Эту статью находят по поисковым запросам:





Метки статьи:



463768885,
zgr@bk.ru...























