Category: it

Category was added automatically. Read all entries about "it".

2007

Куда приткнуться программисту

В альтернативном сообществе сокращается дискуссия.

Оказывается, нам нет, о чем спорить.

Критики нет со стороны науки. С нами не спорит Путин. Сказал общую фразу - вроде не против, но и не за. Молчание.

Вот недавно некая программа нарисовала перетекание воды из Хвалынского в Каспийское море.

Ну и что?

Пусть программа еще и объем воды, необходимый для пополнения связанных бассейнов, в частности по линии Балхаш-Арал, Каспийское море, Черное море, Средиземное море посчитает.

Кто будет критиковать?


Раз фундаментальные исследования не вызывают откликов, то надо менять тактику.

Есть идея - идти в народ, делать простые наглядные програмульки на злободневные альтернативные темы.

Какие программные продукты нужны сегодня альтернативному историку?

2007

Синхронизация списка исследователей с Авторы.xls

Начинаю собирать список работ исследователей из разных источников в одну базу данных.

Учитываю, что такое собирание-синхронизация никогда не закончится.

Сформулируем бизнес-модель

Авторы делают работы (по-английски "document", "product"). Автором может быть или один человек, или несколько человек, или организация.

Организация, которая регулярно выполняет работы по некоторой тематике, называется проектом.

Работа может быть закрытой (секретной) или публичной, в разном степени готовности.

Публичное представление автором готовой работы как явления, которое возможно скопировать (прочитать, увидеть), называется публикацией (по-английски "publication"). Важной считается публикации на бумажном носителе (книга, журнал, газета, карта), зарегистрированная кодом ISSN-ISBN. Публикация в Сети регистрируется уникальным адресом.

Копия публикации называется экземпляром. Фотография, отсканированная копия экземпляра, текст экземпляра называется артефактом. Удобно хранить артефакт в цифровом виде.

Одна работа может публиковаться несколько раз.

Подтверждение факта публикации лично от автора имеет информационную ценность.

Алгоритм переноса Эксель-файла в медиавики


  1. в режиме визуальной правки копи-пастим таблицу из Экселя в медиавики

  2. переключаемся в режим редактирования кода, имеем текстовое отображения Эксель-данных; на этом этапе удобно сравнивать изменения с предыдущей версией Эксель-файла

  3. вместо разметки таблицы проставляем разметку для шаблон:публИзАвторы.xls

  4. меняем символ |- на }}{{публИзАвторы.xls и убираем тег nowiki

Связываем Эксель-файл с общей базой данных

Любой Эксель-файл на самом деле является обыкновенной базой данных. Сайт с медиавики позиционирует себя не просто как база данных, а как единая, качественно нормализированная база, без дубликатов. На данный момент http://hist.tk/ обеспечивает уникальность авторов, то есть каждый автор хранится на отдельной странице.

Синхронизирую вручную авторов из файла Авторы.xls. Синхронизировал всех, кроме некоторых из публикаций РосНОУ, которых считаю сейчас неинтересными - они выделены красным цветом.

Синхронизирую вручную публикации, то есть сохраняю в отдельные страницы. Пример - страница Цивилизация знаний: проблемы и смыслы образования: в 2 ч. Труды Восемнадцатой Международной научной конференции, Москва, 21-22 апреля 2017 г..

В правиле Каждая страница медиавики есть аналогом строки таблицы абстрактной базы данных есть исключение для подобъектов, которые имитируют страницу-строку таблицы и при этом находятся внутри другой страницы. Это исключение использую для строк файла Авторы.xls.

Начинаем тематическук систематизацию публикаций

Можно собирать аннотации на одну и ту же публикацию, написанные разными людьми, но такие тексты не будут краткими. Другой путь - строить аннотации самостоятельно. Для этого можно:


  1. классифицировать каждого автора

  2. классифицировать проект, сайт, печатное издание

  3. классифицировать темы работы; УДК для этого случая хороший классификатор

Первый же шаг (классификация каждого автора) дал хороший результат - весь Файл:Авторы.xls‎ можно увидеть на одной странице в более-менее понятном виде для непосвящённого читателя.

Сортировку подобрал так, чтобы умершие исследователи были внизу, ведь нас интересуют новые идеи.


Выводы

На данный момент реализована возможность синхронизации имён авторов, включая требование РосНОУ - фамилии и инициалы авторов на русском и английском языках

Также эта работа показала мне, что неприязнь Андрея Степаненко к ФиНам преувеличена. Поскольку Андрей печатается в РосНОУ от имени их проекта Новая Хронология, то похоже, что он называет политически заангажированным только Фоменко, а не всех ФиНов. Как одно из следствий, буду думать про интеграцию с Хроно-Вики (http://chronology.org.ru).

Конфликты данных

Обнаружил такие несуразности в файле Авторы.xls:


  • конференция 25-26 апреля 2014 называется Четырнадцатой, а на самом деле она Пятнадцатая

  • в программе конференции 2017 года работы Степаненко А.Г. называются "Попытка реконструкции хронологии", "Пусковые механизмы Потопа", а в файле - "Идентификация монголо-татарского ига", "Метангидратная катастрофа и Дарданов потоп" и "Этапы кометной катастрофы".

2007

Процесс имеет субъекта, цели и похожие процессы

Пришли мысли при создании процесса Jesus Christ genealogy

Процесс обязательно имеет субъекта - это автор (человек), который поставил цели. Как противоположность, событие не имеет субъекта.
Если субъект умер, то процесс невозможно обсудить; у живых людей по отношению к такому процессу возникает только один вопрос "верить или не верить?"

Цели процесса нужно обязательно фиксировать. Поэтому когда Сергей Шишкин пишет, что Оценка степени достоверности события является одной из главных задач, ради которой создается база данных. Поэтому полезны ссылки на различные информационные ресурсы, откуда могут быть взяты дополнительные данные, то на самом деле - это сформулированные по-другому все те же цели: "Верить ли процессу?", "Кому конкретнее можно верить, насколько сильно и почему?".

Также можно было бы добавить в структуру события-процесса параметр "Дружественные процессы" (пример), что перечисляет другие процессы с похожими целями.
2007

Информационная система ОИ. Разговор с Сергеем

Сергей Шишкин пишет:

Виктор, поясняю свои представления о информационной системе в связи с исследованиями по истории. Я вижу в будущем сообщество историков, которые могут иметь свои интересы, предметные области, точки зрения для интерпретаций и свои ресурсы в сети. Но часть событий, которые они в процессе своей работы выделили и сформировали публикуют в открытом доступе в определенной стандартной структуре. При чем как обычные страницы, на которых после структурированной информации может быть что угодно. Естественно, важно, чтобы такие страницы с событием (или процессом) имели постоянный сетевой адрес. Возможно у каждого есть реестр таких событий с метаинформацией и адресом. То есть хранилище распределенное в сети и не все обязаны работать с программами. Можно вручную, глазами и головой, имея наглядную информацию. Но она структурирована и соответственно можно обмениваться событиями. Я, например, не катастрофист и все, что собирает Степаненко, мне не надо. Но какие-то события мне интересны и наоборот. То есть речь идёт о неком общем стандарте для обмена информацией. Другое дело, когда у нас есть библиотека программ для анализа, интересующих нас событий и для этого анализа формируется своя система в какую-то базу данных. Возможно более специальную, в которой есть какая-то специфика предметной области. Конечно, можно представить некую универсальную систему, которая всосёт в себя всё в будущем, но пока я бы такой задачи не ставил. Рано. Гораздо важнее может быть создать программы-агенты, которые бы бродили по заданным адресам других открытых ресурсов и собирали бы по определенным правилам в нашей структуре хотя бы в полуавтоматическом режиме интересные события, например, из той же википедии.
Что касается вопроса о шаблонах вашей вики, то я имел виду попробовать для себя порождать там события, выделив какое-то направление. Типа поэкспериментировать.Как я сейчас делаю в гугл-сайтах. Отсюда и вопрос о порталах. Для работы вручную важно иметь что-то типа каталогов с более расширенными функциями для описания, чем категории в вики-движках.
В будущем можно рассуждать о библиотеках программ, которые будут порождать новые представления в каких-то иных структурах, удобных для аналитики. Но это в будущем. И не только для программ, но и для экспертного человеческого анализа.
Вот мои эксперименты создания процессов вручную
https://sites.google.com/site/einedatabase/shemy
А вот примеры событий
https://sites.google.com/site/xxretrospektiva/kalendar/1923/lozannskij-dogovor
https://sites.google.com/site/xxretrospektiva/kalendar/1920/sevrskij-dogovor
https://sites.google.com/site/xxretrospektiva/kalendar/1917/dekret-o-zemle
https://sites.google.com/site/xxretrospektiva/kalendar/1916/soglasenie-sajka---piko
А здесь есть некие общие замечания (в начале и в конце примера!)
https://sites.google.com/site/einedatabase/idei

Виктор отвечает:
"часть событий, которые они в процессе своей работы выделили и сформировали публикуют в открытом доступе в определенной стандартной структуре... важно, чтобы такие страницы с событием (или процессом) имели постоянный сетевой адрес" - значит, разные историки должны опубликовать свои события на постоянном веб-сайте. Я планирую, что это будет википедия (сайт на движке Mediawiki), или всеобщая или личная (на движке mediawiki).
Это и есть первичное распределенное хранилище. И оно уже есть, и величина его огромная.
Тяжело договорится про стандарты структуры. Я знаю следующие способы структуризации в Википедия: шаблоны, Wikidata и Semantic Mediawiki. Wikidata хранится в RDF формате, перспективная, но сложно устанавливается на личную вики. Semantic Mediawiki легко устанавливается на личную вики, но слабо распространён (не используется в Википедии). А вот шаблоны - похоже как раз то, что надо. Единственный их недостаток - ограниченность выразительных средств (типов данных и т.д.), но он восполняется возможностями Информационной системы.

В конце концов Информационная система будет иметь программы-агенты, которые будут импортировать нужные события. Mediawiki агент будет анализировать википедии.

Википедии для экспериментов можно и нужно создавать сколько угодно на разных хостингах, с пустой или предварительно заполненной базой данных. Я создам Вам пару википедий и сообщу детали.


Ссылки исследую, результаты структурирую в http://hist.tk Мне нужно время, информации у Вас много.