ОКРЕСТНОСТИ ПЕТЕРБУРГАПутеводители Карты История Фотогалерея    Старая версия сайта
Начало » ГЛАВНЫЙ » Военно-исторический раздел » Финский военный фотоархив 1939-1945
Финский военный фотоархив 1939-1945 [сообщение #151362] пт, 26 апреля 2013 13:42 Переход к следующему сообщения
pravia
http://sa-kuva.fi/
Три раздела: Зимняя война, Война-продолжение,
Лапландская война.
Всего около 170 тысяч фотографий.
Есть английский интерфейс
Re: Финский военный фотоархив 1939-1945 [сообщение #154175 является ответом на сообщение #151362] сб, 15 июня 2013 21:47 Переход к предыдущему сообщенияПереход к следующему сообщения
pravia
привязка фотографий к карте
http://terijoki.spb.ru/trk_sa-kuva.php
Re: Финский военный фотоархив 1939-1945 [сообщение #170758 является ответом на сообщение #151362] ср, 01 октября 2014 12:02 Переход к предыдущему сообщенияПереход к следующему сообщения
BarSeek
Список топонимов, встречающихся в подписях к фотографиям из архива SA-Kuva.

Список (58 кб, txt, UTF-8)
Re: Финский военный фотоархив 1939-1945 [сообщение #170778 является ответом на сообщение #170758] ср, 01 октября 2014 22:10 Переход к предыдущему сообщенияПереход к следующему сообщения
Буквоед
Спасибо, весьма полезная вешь.

Все новое это хорошо забытое старое
Re: Финский военный фотоархив 1939-1945 [сообщение #170899 является ответом на сообщение #151362] вт, 07 октября 2014 10:56 Переход к предыдущему сообщенияПереход к следующему сообщения
BarSeek
Текстовая база данных фотоархива SA-Kuva.
Поля : Номер фото/Фотограф/Место съемки/Подпись к фото/Доп.сведения (Kuvan numero/Kuvaaja/Paikka/Kuvateksti/Lisätietoja).
Отсортировано по месту съемки.

sa-kuva.zip (zip 3 Мб, в архиве текстовый файл sa-kuva.txt размером 16 Мб)

В текстовом файле информационные поля разделены невидимыми символами табуляции, что позволяет импортировать его для работы в электронные таблицы (MS Excel, OO Calc и т.п.) как файл *.CSV (с разделителями). В базе около 160 000 записей, у старых таблиц и процессоров могут быть трудности.



Процедура импорта в общих чертах такая.
MS Excel : Открыть - Текстовые файлы - sa-kuva.txt - Формат файла Юникод (UTF-8) - Далее - Разделитель табуляция - Ограничитель строк (пусто) - Готово.
OO Calc : Открыть - Текст CSV - sa-kuva.txt - Кодировка Юникод (UTF-8) - Язык финский - Разделитель табуляция - OK
Сохранить в родном формате соответствующей таблицы. Номер интересующего фото из таблицы вставляется в поле поиска на сайте фотоархива (с галкой "päivättömät" в финской версии).

  • Вложение: sakuva-import.jpg
    (Размер: 64.27KB, Загружено 1876 раз)
  • Вложение: sakuva-sample.jpg
    (Размер: 35.81KB, Загружено 1877 раз)
Re: Финский военный фотоархив 1939-1945 [сообщение #170904 является ответом на сообщение #170899] вт, 07 октября 2014 20:46 Переход к предыдущему сообщенияПереход к следующему сообщения
alexsvar
Спасибо! Большая работа проделана. Жаль прямые ссылки не сделать.

Кстати обнаружил, что там появилось видео и в очень приличном качестве.
Re: Финский военный фотоархив 1939-1945 [сообщение #170907 является ответом на сообщение #151362] вт, 07 октября 2014 22:04 Переход к предыдущему сообщенияПереход к следующему сообщения
BarSeek
Работа на самом деле не такая большая, но пришлось вспомнить программирование на языке Бэйсик. Ну то есть я не просматривал все эти 160 000 фото, а этим занималась программа. Делалось это где-то в мае, но потом случайно было обнаружено (по исчезновению очевидных ляпов), что текстовое содержимое базы финнами корректируется и в сентябре сделал обновление полей. Поэтому по количеству записей база актуальна на май, а по текстовому содержимому на сентябрь. Дату фото выковыривал из соседнего фрейма, но позже обнаружилось, что не везде корректно и тут я ее убрал.
Прямые ссылки сделать можно, но по прошлому опыту потрошения архива документов digi.narc.fi есть шкурные опасения, что при наплыве скачивающих терабайтную базу финны что-то поменяют в коде html и придется разбираться с ним с нуля, чтобы обновить базу.
Re: Финский военный фотоархив 1939-1945 [сообщение #170925 является ответом на сообщение #170907] ср, 08 октября 2014 11:36 Переход к предыдущему сообщенияПереход к следующему сообщения
alexsvar
BarSeek писал(а) вт, 07 октября 2014 22:04

Работа на самом деле не такая большая, но пришлось вспомнить программирование на языке Бэйсик. Ну то есть я не просматривал все эти 160 000 фото, а этим занималась программа. Делалось это где-то в мае, но потом случайно было обнаружено (по исчезновению очевидных ляпов), что текстовое содержимое базы финнами корректируется и в сентябре сделал обновление полей. Поэтому по количеству записей база актуальна на май, а по текстовому содержимому на сентябрь. Дату фото выковыривал из соседнего фрейма, но позже обнаружилось, что не везде корректно и тут я ее убрал.
Прямые ссылки сделать можно, но по прошлому опыту потрошения архива документов digi.narc.fi есть шкурные опасения, что при наплыве скачивающих терабайтную базу финны что-то поменяют в коде html и придется разбираться с ним с нуля, чтобы обновить базу.


Дата фотографии ОЧЕНЬ важна. Ее можно как-то оттуда извлечь в общую базу?
Re: Финский военный фотоархив 1939-1945 [сообщение #170944 является ответом на сообщение #151362] ср, 08 октября 2014 15:31 Переход к предыдущему сообщенияПереход к следующему сообщения
BarSeek
Есть майская версия базы, где дата извлечена из всплывающей надписи к фото в формате ГГГГММДД. Но впоследствии обнаружилось, что эта дата у четвертой части записей отсутствует, а вместо этого в самой подписи может содержаться что-то типа "1943", "10-15.8.1941" или "Marras-joulukuu 1942" (нояб[рь]-декабрь 1942). Писать обработчик для последнего варианта мне было (откровенно говоря) лень. Но извлечь год можно легко.
Re: Финский военный фотоархив 1939-1945 [сообщение #170947 является ответом на сообщение #170944] ср, 08 октября 2014 19:34 Переход к предыдущему сообщенияПереход к следующему сообщения
alexsvar
BarSeek писал(а) ср, 08 октября 2014 15:31

Есть майская версия базы, где дата извлечена из всплывающей надписи к фото в формате ГГГГММДД. Но впоследствии обнаружилось, что эта дата у четвертой части записей отсутствует, а вместо этого в самой подписи может содержаться что-то типа "1943", "10-15.8.1941" или "Marras-joulukuu 1942" (нояб[рь]-декабрь 1942). Писать обработчик для последнего варианта мне было (откровенно говоря) лень. Но извлечь год можно легко.


А пришлите пожалуйста майскую версию, если выкрою время - посижу-подумаю. Дата ценна тем, что позволяет искать по определенным событиям.
Re: Финский военный фотоархив 1939-1945 [сообщение #170963 является ответом на сообщение #151362] чт, 09 октября 2014 12:25 Переход к предыдущему сообщенияПереход к следующему сообщения
BarSeek
Вчера вечером всё-таки сделал извлечение нестандартных форматов времени съемки, но надо будет внимательно проверить получившееся. Бросается в глаза, что с базой у финнов ведется работа и по полю "Доп. информация" изменения май-сентябрь очень значительные. Также корректируются подписи к фото. Вот для сравнения майская и сентябрьская карточка одного и того же фото. В мае оно идентифицировалось как "Береговая артиллерия, Ханко, 1943", а сейчас как "8-дюймовая батарея Мякилуото..." и доп.сведения - "Диапозитив помечен как Ханко, однако фото с Мякилуото". И уже без даты.

  • Вложение: Kuva3.jpg
    (Размер: 34.64KB, Загружено 1540 раз)
Re: Финский военный фотоархив 1939-1945 [сообщение #170965 является ответом на сообщение #170963] чт, 09 октября 2014 12:34 Переход к предыдущему сообщенияПереход к следующему сообщения
alexsvar
BarSeek писал(а) чт, 09 октября 2014 12:25

Вчера вечером всё-таки сделал извлечение нестандартных форматов времени съемки, но надо будет внимательно проверить получившееся. Бросается в глаза, что с базой у финнов ведется работа и по полю "Доп. информация" изменения май-сентябрь очень значительные. Также корректируются подписи к фото. Вот для сравнения майская и сентябрьская карточка одного и того же фото. В мае оно идентифицировалось как "Береговая артиллерия, Ханко, 1943", а сейчас как "8-дюймовая батарея Мякилуото..." и доп.сведения - "Диапозитив помечен как Ханко, однако фото с Мякилуото". И уже без даты.




Если ID записи совпадает, то в изменениях проблем нет.
Re: Финский военный фотоархив 1939-1945 [сообщение #171011 является ответом на сообщение #151362] пт, 10 октября 2014 16:19 Переход к предыдущему сообщенияПереход к следующему сообщения
BarSeek
Файл в архиве обновлен, добавлено поле времени съемки по состоянию на май этого года. Возможны косяки у табличных процессоров с интерпретацией этого поля, т.к. там помимо ДД-ММ-ГГГГ могут попадаться самые разные варианты (в лучшем случае "05.1942" станет "май 42", в худшем превратится в пятизначное целое число). При встрече с подобным лучше при импорте файла ткнуть в эту колонку и указать, что эти данные имеют формат Текст.
Re: Финский военный фотоархив 1939-1945 [сообщение #171035 является ответом на сообщение #171011] сб, 11 октября 2014 23:23 Переход к предыдущему сообщенияПереход к следующему сообщения
alexsvar
Спасибо, так гораздо интересней. У меня ОпенОфис не осилил всю таблицу "засосать", но это не страшно.
А если машинным переводом перевести - сильно коряво будет или все-таки будет какой-то смысл?
Re: Финский военный фотоархив 1939-1945 [сообщение #171041 является ответом на сообщение #151362] вс, 12 октября 2014 00:58 Переход к предыдущему сообщенияПереход к следующему сообщения
BarSeek
ОпенОфис точно должен грузить всю, т.к. этот файл выгружен именно из него, причем из очень несвежей версии для Линукса. И прочая работа с базой тоже была только в ОпенОфисе, но версии посвежее.
Попробовал бросить кусок текста в гуглопереводчик, текст получается довольно веселый. С сокращениями (которые там сплошь и рядом) совсем никак, "Ч-цистерна" (h-vaunu, танк) и "Медведь-Хилл" (Кархумяки) опять же намекают о двухэтапном переводе через английский.
Re: Финский военный фотоархив 1939-1945 [сообщение #171066 является ответом на сообщение #171041] пн, 13 октября 2014 09:21 Переход к предыдущему сообщенияПереход к следующему сообщения
alexsvar
BarSeek писал(а) вс, 12 октября 2014 00:58

ОпенОфис точно должен грузить всю, т.к. этот файл выгружен именно из него, причем из очень несвежей версии для Линукса. И прочая работа с базой тоже была только в ОпенОфисе, но версии посвежее.
Попробовал бросить кусок текста в гуглопереводчик, текст получается довольно веселый. С сокращениями (которые там сплошь и рядом) совсем никак, "Ч-цистерна" (h-vaunu, танк) и "Медведь-Хилл" (Кархумяки) опять же намекают о двухэтапном переводе через английский.



Перевод у Гугля осуществляется через английский. А если автозаменой поменять штук 50-100 слов... хотя их проще заучить.
Re: Финский военный фотоархив 1939-1945 [сообщение #171072 является ответом на сообщение #151362] пн, 13 октября 2014 12:48 Переход к предыдущему сообщения
BarSeek
Там перевод даже одного и того же слова непонятно от чего зависит. Во фрагменте, который я ему подбрасывал, друг за другом шло несколько строчек, где фигурировали "танки" (h-vaunuja). Почему-то у него они превращались то в "ч-цистерны", то в "ч-вагоны" (вариант - "Н-вагоны"), то в "ч-трейлеры" (вариант - "полуприцепы").

Вот еще прекрасно оттуда же :

Голодание вражеского мертвой лошади принца холма.
Kuvassa должен быть построен к мальчикам, готовых к духовке в половине в темноте.
Лошадь получил пулю в борьбе за шею и упал. Это ветеринар и его помощник шкуры его.
Красиво филиал павшего сухостой длинных щупалец отделений в разных частях.
Всадников утверждают, что они хладнокровные лошади и наслаждаться жизнью в скважине.
Потрясающий кожей полигон.
Хвост Metso является общим тотемом глуши баз каюты на двери.
Педик сделан из слоев бункер крыши должен быть помещен.
Предыдущая тема: "Финская гора" в Вознесенье
Следующая тема: Орудия Канэ (Canet 152/45) на Ладоге. 1941-1944
Переход к форуму:
  


Текущее время: ср фев #d 07:25:44 MSK 2020