EventsIndexing: различия между версиями

Материал из Common History development
Перейти к навигации Перейти к поиску
(Андрей)
 
(не показано 29 промежуточных версий этого же участника)
Строка 1: Строка 1:
[[Category:Task]]
+
[[Category:Реконструкция по типам событий]]
= 1 =
+
{{mentioned|https://chispa1707.livejournal.com/3050988.html}}
== [[Андрей]] ==
+
Автоматизация для [[Алгоритм в Excel реконструкции по типам событий]]
[https://chispa1707.livejournal.com/3011074.html?thread=35234818#t35234818 в строках слева годы, в столбцах наверху индексы, на пересечении - числовое значение. Очищаю до единицы, - важен сам факт, что в этом году индекс есть. После этого годы не нужны. Имеет значение только то, какие индексы встречаются в одной строке. Строк много, и в итоге я подвел сумму, какой индекс с какими индексами сколько раз встретился в одной строке] за все годы!
+
= [[совпадение типов событий в одном году]] =
 
+
== число совпадений со сдвигом ==
 
+
[https://chispa1707.livejournal.com/3010636.html есть у меня в Экселе табличка: 1-й столбец - год 2-й столбец - двухбуквенный индекс места события 3-й столбец - двухбуквенный индекс типа события ... Первая задача. Требуется выяснить, например, как часто разные события встречаются в одном и том же году году... на пересечении в ячейке - цифра, говорящая, сколько раз индекс столбца встретился в одном году с индексом строки... для тех же 879 индексов сверяем совпадения со сдвигом в год, два, три, четыре и пять. ]
* [https://chispa1707.livejournal.com/3011074.html https://my-files.ru/qwyi0r Данные позже 1852 года можно и удалить...  установить число совпадений разных индексов год в год. Позже можно опробовать и со сдвижкой в 1-5 лет... пять вариантов: индексы типа события в разных сочетаниях с индексами места. "Штаты" - территории учтены до уровня штатов (областей), там, где они указаны. "Регионы" - территории укрупнены до регионов типа "Западная Сибирь", это тоже имеет свой смысл... рабочий файл здесь: https://my-files.ru/em9hqo]
 
* 00 крайняя попытка 2 (Автосохраненный).xlsx: [https://chispa1707.livejournal.com/3010636.html?thread=35238220#t35238220 Исходные две колонки на листе "3 столбца". Я их чуток сократил (до 822-1852 лет) и получил таблицу на листе "Основа". Совпадения вывожу на лист 822-1852. Здесь можно сделать и со сдвижкой на любое число лет. Суммирую итог отдельно на нижней строке. Сумму транспонирую и поочередно вывожу либо на лист СВОДНАЯ, либо (если со сдвигом в год) на лист СВОДНАЯ2]
 
*: "Суммирую итог отдельно на нижней строке" значит, что за все годы!
 
  
* про сдвиги:
+
= [https://chispa1707.livejournal.com/3011074.html?thread=35245058#t35245058 алгоритм находится здесь] =
[https://chispa1707.livejournal.com/3010636.html есть у меня в Экселе табличка: 1-й столбец - год 2-й столбец - двухбуквенный индекс места события 3-й столбец - двухбуквенный индекс типа события ... Первая задача. Требуется выяснить, например, как часто разные события встречаются в одном и том же году году...  на пересечении в ячейке - цифра, говорящая, сколько раз индекс столбца встретился в одном году с индексом строки... для тех же 879 индексов сверяем совпадения со сдвигом в год, два, три, четыре и пять. ]
 
  
== [[Любкин Сергей]] ==
+
{{github|it4history/reconstruction/tree/master/Excel/EventsIndexing/EventtypesByYears.cs}}
[https://chispa1707.livejournal.com/3010636.html?thread=35242316#t35242316 отчёт, выводящий для каждой пары индексов: - количество годов, в которых они встречаются оба (как у Вас в первом варианте); - количество событий в этих годах, в которых есть индекс строки; - количество событий в этих годах, в которых есть индекс столбца.]
 
  
History_02.xlsx
+
алгоритм нужно понимать через теорию графов
 +
[https://chispa1707.livejournal.com/3011074.html?thread=35267074#t35267074 действия с файлом 00 крайняя попытка 2 (Автосохраненный).xlsx: Суммирую итог отдельно на нижней строке. Сумму транспонирую и поочередно вывожу либо на лист СВОДНАЯ, либо (если со сдвигом в год) на лист СВОДНАЯ2 легко объяснимы в теории графов, то получил алгоритм. В нём первичные графы byYears созданы также, как создавался лист Основа, а cуммирование итогов для листа СВОДНАЯ b СВОДНАЯ2 - это объединение первичные графов.]
  
== [[curiousmole]] ==
+
[https://chispa1707.livejournal.com/3012125.html?thread=35257117#t35257117 нужно исследовать причинно-следственные связи между типами событий, поэтому вы считаете сдвиг для типов событий "позже", а не "раньше". Так удобнее, потому что в строке будут причины, а в столбцах следствия. Меняю алгоритм на "позже", соответственно тренировка (unit-test) алгоритма теперь выглядит так: пусть имеем три года 1, 2 и 3; в этих годах произошли типы событий] https://ic.pics.livejournal.com/it4history/77674790/10097/10097_original.png
непонятные: [https://chispa1707.livejournal.com/3011074.html?thread=35236610#t35236610 29548 строк на 873 колонки]
+
<pre>результат для сдвига в 1 год :
== Andrew Po ==
+
$, a, b, c,
некоторый файл https://chispa1707.livejournal.com/3011074.html?thread=35237122#t35237122
+
a, 0, 1, 0,
 +
b, 1, 1, 1,
 +
c, 0, 0, 0,
 +
результат для сдвига в 2 года:
 +
$, a, b, c,
 +
a, 1, 0, 1,
 +
b, 1, 0, 1,
 +
c, 0, 0, 0,</pre>
  
== [[it4history]] ==
 
[https://chispa1707.livejournal.com/3011074.html?thread=35245058#t35245058 алгоритм находится здесь] {{github|it4history/reconstruction/tree/master/Excel/EventsIndexing/EventtypesByYears.cs}}
 
  
= 2 =
+
[[Gephi]]
процент совпадений. Например, если индекс столбца всего встречается 100 раз, а с выбранным индексом строки он встретился 14 раз, то частота совпадений именно с этим индексом - 14 %.
 
= 3 =
 
индексы, на деле, составят несколько групп с высоким процентом совпадений внутри группы и с малым процентом совпадений с индексами из других групп. Число этих групп отразит число разных этапов развития цивилизации.
 

Текущая версия на 00:59, 31 декабря 2018

mentioned:
https://chispa1707.livejournal.com/3050988.html

Автоматизация для Алгоритм в Excel реконструкции по типам событий

совпадение типов событий в одном году[править]

число совпадений со сдвигом[править]

есть у меня в Экселе табличка: 1-й столбец - год 2-й столбец - двухбуквенный индекс места события 3-й столбец - двухбуквенный индекс типа события ... Первая задача. Требуется выяснить, например, как часто разные события встречаются в одном и том же году году... на пересечении в ячейке - цифра, говорящая, сколько раз индекс столбца встретился в одном году с индексом строки... для тех же 879 индексов сверяем совпадения со сдвигом в год, два, три, четыре и пять.

алгоритм находится здесь[править]

EventtypesByYears.cs

алгоритм нужно понимать через теорию графов действия с файлом 00 крайняя попытка 2 (Автосохраненный).xlsx: Суммирую итог отдельно на нижней строке. Сумму транспонирую и поочередно вывожу либо на лист СВОДНАЯ, либо (если со сдвигом в год) на лист СВОДНАЯ2 легко объяснимы в теории графов, то получил алгоритм. В нём первичные графы byYears созданы также, как создавался лист Основа, а cуммирование итогов для листа СВОДНАЯ b СВОДНАЯ2 - это объединение первичные графов.

нужно исследовать причинно-следственные связи между типами событий, поэтому вы считаете сдвиг для типов событий "позже", а не "раньше". Так удобнее, потому что в строке будут причины, а в столбцах следствия. Меняю алгоритм на "позже", соответственно тренировка (unit-test) алгоритма теперь выглядит так: пусть имеем три года 1, 2 и 3; в этих годах произошли типы событий 10097_original.png

результат для сдвига в 1 год :
$, a, b, c, 
a, 0, 1, 0, 
b, 1, 1, 1, 
c, 0, 0, 0, 
результат для сдвига в 2 года:
$, a, b, c, 
a, 1, 0, 1, 
b, 1, 0, 1, 
c, 0, 0, 0,


Gephi