Standard OSV
Standard OSV, стандарт ОСВ — полная координатная система в информационном пространстве, предложенная ульяновским математиком–алгебраистом Сергеем Васильевичем Охитиным, владельцем информационной компании «ВолгаГИС»
Содержание
История открытия информационного пространства
Под пространством знаний (информационным пространством) имеется в виду система информационных объектов, связанных определяемыми ниже отношениями. В качестве объектов здесь могут выступать любые понятия, сведения, знания (то, что на латыни передаётся терминами notitia, scientia, а по–английски называется information).
Пространство знаний является важнейшим продуктом научной деятельности. Но определение принципов его формирования является нетривиальной проблемой. Вкратце оглядев пройденный наукой путь, можно выделить четыре этапа систематизации научных знаний. Все они были связаны с кризисами роста науки и информационными революциями.
Доисторическая эпоха
Начальный этап развития информационного пространства связан с изобретением письменности. Сведения о нём мифологичны и опираются на девинаторные реконструкции гуманистов нового времени. Можно предположить, что в то время унификация терминов, знаков, грамматик языков и изобретение пригодного носителя являлись основными проблемами сохранения и передачи знаний. Эти задачи были решены на следующем этапе, про который известно гораздо более. Хронологически он относится к рубежу между XV и XVI вв., и был связан с распространением книгопечатной продукции.
Эпоха Возрождения
К началу второго этапа развития пространства знаний немало людей (полигисторов) прочли и освоили все известные на то время книги. Но уже к концу XVI века прочесть все книги стало невозможно. Более того, — стало сложно контролировать фонды крупных библиотек, в которых находились десятки тысяч единиц хранения. Рубежным было опубликование первого папского «Индекса» 1559 году, в котором запрещались не только отдельные книги и их авторы, но и любая продукция некоторых типографий. Об этом «Индексе» известно мало, поскольку он сам попал в последующие «Индексы» и подлежал уничтожению. На этом этапе важным достижением стало структурирование текста: были изобретены главы, параграфы, абзацы, нумерация страниц и предметный указатель. Задача систематизации фондов в то время не осознавалась, и коллекции описывались по образцу тогдашних бестиариев и мираклей. Научный подход к этой области связан с именем К. Линнея (1707–1778). Только в XVIII веке начинаются первые попытки описания архивов и библиотек (в России эта работа была начата Г.Ф. Миллером, 1705–1783). Но эта деятельность относится к третьему периоду, который можно обозначить, как кризис образованности.
Эпоха Просвещения
Рост и специализация научных знаний привели к тому, что не осталось знатоков всех наук, искусств и ремёсел, на которых была богата эпоха Возрождения. Важное изобретение этого времени — «Энциклопедия» (всестороннее учение). Автором первого труда такого рода («Cyclopedia, or universal Dictionary of the Arts and Sciences», 1728) был английский писатель Э. Чемберс (1680—1740), его идеи легли в основу коллективного труда «Le grande Encyclopedie», созданной в 1751–1780 годах под редакцией Дидро и Д'Аламбера. Предполагают, что Чемберс был вдохновлён «Dictionnaire historique et critique» (Роттердам, 1696) французского скептика П. Бейля (1647–1706).
К XIX веку энциклопедии перестали иметь авторский характер и (или) разделились по отраслям знаний. Например, российский астроном Димитрий Матвеевич Перевощиков (1790–1880) в 1826–1837 годах издал в виде катехизиса 13–титомную «Ручную математическую энциклопедию», очень популярную в России — её хвалили Н.В. Гоголь, М.Ю. Лермонтов и Н.Г. Чернышевский. Но тем самым слово «энциклопедия» потеряло своё исходное значение, а само понятие было перенесено на многие фундаментальные сочинения первых двух периодов, например,— на «Naturalis Historiae» Плиния.
В начале XX века энциклопедии переродились в специализированные справочники, и уже не воспринимались в качестве учебного пособия по всему кругу наук. В связи с этим характерен рассказ М.А. Булгакова «Сколько Брокгауза может вынести организм?» Незадолго до этого двумя бельгийскими библиографами П. Отлетом и Г. Лафонтеном на основе «Десятичной классификации» М. Дьюи была изобретена Универсальная Десятичная Классификация (УДК), предназначавшаяся для линейной индексации всех знаний. К концу XX века их затея потерпела крах (видимо, в самом полном виде она была применена только к математическим дисциплинам).
«Информационное общество»
Четвёртая информационная революция связана с изобретением электронных носителей информации и Интернета. Прежние методы систематизации сведений и доступа к ним в новой ситуации оказались непригодны. Изобретение баз данных, гипертекста и поисковых роботов временно снизило остроту проблемы, но ненадолго, так как объём накапливаемых сведений (в том числе и научных) растёт экспоненциально даже без учёта прогресса технологий, а с учётом роста технологий — сверхэкспоненциально. Таким образом, необходим прорыв в области исследования пространства знаний и законов его формирования. Кое-что уже воплощено в роботах Google, Рамблер и других. Создатель Википедии Джимми Уэйлс (Jimmy Wales) планирует в 2008 году сделать собственную поисковую систему Wikia Search, которая превзойдёт все существующие поисковые системы. По всей видимости, упор делается на грамматический анализ текстов и поиск алгоритмов релевантного ответа на запросы.
Новый подход предложил ульяновский математик–алгебраист С.В. Охитин. Несколько лет назад (в начале XXI века) он описал полный набор отношений пространства знаний и теперь создаёт экспертно–интеллектуальный индексатор, использующий коллективный опыт пользователей его системы на принципах нейронной сети.
Идеи С.В. Охитина находятся в стадии реализации,— их автору необходимо преодолеть значительные технические трудности для полного воплощения своего проекта. «Стандарт ОСВ», в настоящем его состоянии, полезен и при «домашнем» использовании, в особенности — в таких слабо формализуемых областях, как гуманитарные и технические науки (естественные науки, в силу развитого внутреннего формализма, пока могут развиваться на своём потенциале, что демонстрирует система Google Scholar).
Новости
Идеи С.В. Охитина обсуждались на конференции «Философия математики: актуальные проблемы», проходившей 15–16 июня 2007 года в I Гуманитарном корпусе МГУ на Воробьёвых горах. Доклад «Структура пространства знаний» был представлен на секции «Математика в культуре» А.Б. Верёвкиным ([2]).
Цитата создателя
Классификация информации в стандарте OSV дает следующие преимущества перед всеми современными поисковыми машинами:
- Настраиваются связи между терминами и понятиями, а не отдельными Интернет–ресурсами.
- Эволюция информационной системы и классификация новых объектов может быть осуществлена в результате анализа запросов пользователей.
- Существенно повышается релевантность при поисковых запросах.
- Осуществляется переход от линейного каталога к пространственному.
- Становится возможным классифицировать абстрактные и научные термины.
Описание стандарта ОСВ
Стандарт ОСВ (OSV–standard) предназначается для позиционирования в пространстве знаний, и состоит из четырёх типов информационных характеристик, подлежащих обязательной индексации в случае наличия таковых:
1. смысловые характеристики
- ключевое слово
- синонимы понятия
- морфология терминов
- этимология терминов
- определение понятия
- символьные обозначения
2. иерархические характеристики
- генерализации понятия (информационные надобъекты)
- специализации понятия (информационные подобъекты, дочерние объекты, атрибуты)
- понятийные соседи
- бренды, марки и школы
3. сервисные характеристики
- дистрибьюторы, то есть распространители описываемого объекта
- потребители объекта
- сопутствующие объекты
- службы поддержки и их инструментарий, условия продолжения существования объекта
- обучение пользователей
- документальная база, библиография об объекте
4. событийные характеристики
- история объекта
- творцы и источники объекта и понятия
- свежие новости и прогнозы
Уточнённое, формальное определение нового алгоритма таково:
- Standard OSV — это числовая функция с двумя аргументами, первым из которых является смысловое понятие (для робота — словосочетание запроса), а вторым — информационный объект (для робота — электронная страница). Тем самым, данный алгоритм индексирования каждой электронной странице сопоставляет спектр её значений на списке возможных запросов пользователей, и этот спектр используется для определения уровня релевантности ссылки, предоставляемой поисковым роботом.
Указанный стандарт носит имя своего изобретателя — Охитина С.В., ульяновского математика и владельца фирмы «ВолгаГИС».
О гиперссылках
Система индексирования в ОСВ–стандарте подразумевает, что описываемые характеристики должны одновременно служить и гиперпереходами на другие объекты информационного пространства, в особенности — внутри разрабатываемого ресурса. Разумеется, здесь нужно придерживаться определённой меры и не перегружать текст однотипными линками. Гиперссылку на стабильный, тематически интересный внешний ресурс следует осуществлять в двух важнейших случаях (хотя возможны и исключения):
- на общезначимый источник
- на дружественный ресурс
Логика правил гиперпереходов одновременно подчиняется двум целям, стимулирующим развитие пространства знаний в надлежащем направлении:
- гиперссылка поощряет целевой ресурс информационного пространства
- она помогает своей аудитории ориентироваться в этом пространстве
Аналогичные правила действуют и в отношении библиографии.
Цитаты
- «... Где этот мир? Куда он делся? И никто не ожидал, что станет очевидцем третьей мировой революции. В истории, как мне кажется, было три принципиальных момента, связанных с изменениями массового сознания. Первый — появление алфавита, что позволило сохранять информацию. Второй — книгопечатание, результатом чего было создание культурного слоя. Третий момент — возникновение интернета, когда информация стала всеобщей. Мы неожиданно оказались соучастниками интер- нетовской революции. Даже Билл Гейтс в 1995-м году говорил: а-а, интернет, да это — так. Никто не был к ней готов. Поэтому сегодня мы имеем явное несоответствие формы и содержания: понятно, что и Microsoft не лучший продукт, который был на рынке, что и Google быстро устаревает. Скорость изменений, миллиарды сайтов и, главное, количество людей, у которых есть мобильные телефоны, компьютеры, камеры, — все это и приводит к апокалиптическому мышлению. Моя мысль: раньше ощущение апокалипсиса приходило от незнания, сегодня — от избыточности знания. Что нам нужно — так это научиться философски осмысливать себя в этом мире. ...» (Г.К. Каспаров «Эсквайр», №8)
См. также
Ссылки
- Авторский сайт «OSV–standard» (в работе)
- Верёвкин А.Б. «Структура пространства знаний» // «Философия математики: актуальные проблемы». Материалы Международной научной конференции 15–16 июня 2007,— М.: Издательство Савин С.А., 472 с., стр. 196–198