Global Informatics

- Информатика и вычислительная техника

Методы извлечения знаний

Автор книги, являющийся в данном случае экспертом, на основании собственной модели мира М1 пишет книгу, представляя свои знания в виде текста. Затем инженер по знаниям на основании своей модели знаний М2 и информации, почерпнутой из текста Т, интерпретирует знания эксперта. Схема процесса извлечения знаний из текста показывает, что смысл М1, заложенный автором книги, отличается от смысла М2, который постигает читатель (инженер по знаниям). Эти различия определяются тем, насколько развиты факторы, и у конкретного аналитика (читателя).

Немецкий философ и языковед В. Фон Гумбольдт так охарактеризовал сложную и трудно формализуемую процедуру взаимного понимания людей: «Люди понимают друг друга не потому, что передают собеседнику знаки предметов, и даже не потому, что взаимно настраивают друг друга на точное и полное воспроизведение идентичного понятия, а потому, что взаимно затрагивают друг в друге одно и то же звено цепи чувственных представлений и зачатков внутренних понятий, прикасаются к одним и тем же клавишам инструмента своего духа, благодаря чему у каждого вспыхивают в сознании соответствующие, но не тождественные смыслы».

Особую сложность представляет извлечение знаний из специальной литературы и методик, поскольку в них очень высока степень концентрации специальных знаний.

Простейший алгоритм извлечения знаний из текстов включает следующие шаги:

. Составить «базовый» список литературы для ознакомления с предметной областью.

. Выбрать текст для извлечения знаний.

. Беглое знакомство с текстом. Провести консультации со специалистами для определения значений незнакомых слов.

. Сформировать первую гипотезу о макроструктуре текста.

. Внимательно прочитать текст и выписать ключевые слова и выражения, определив тем самым «смысловые вехи».

. Определить связи между ключевыми словами, разработать макроструктуры текста в форме графа или реферата.

. Сформировать новое представление знаний на основании макроструктуры текста.

Перейти на страницу: 1 2 3 4 5 6 

Статья в тему

Система централизованного контроля температуры
Система централизованного контроля температуры (СЦКТ) предназначена для измерения температуры объекта и получении информации о выходе температуры разных точек объекта за границы уставок. Система централизованного контроля (СЦК) позволяет собирать и обрабатывать большое количество ...

Главные разделы


www.globalinformatics.ru © 2024 - Все права защищены!