|
|
|
|
Re: Финский военный фотоархив 1939-1945 [сообщение #170899 является ответом на сообщение #151362] |
вт, 07 октября 2014 10:56 |
|
Текстовая база данных фотоархива SA-Kuva.
Поля : Номер фото/Фотограф/Место съемки/Подпись к фото/Доп.сведения (Kuvan numero/Kuvaaja/Paikka/Kuvateksti/Lisätietoja).
Отсортировано по месту съемки.
sa-kuva.zip (zip 3 Мб, в архиве текстовый файл sa-kuva.txt размером 16 Мб)
В текстовом файле информационные поля разделены невидимыми символами табуляции, что позволяет импортировать его для работы в электронные таблицы (MS Excel, OO Calc и т.п.) как файл *.CSV (с разделителями). В базе около 160 000 записей, у старых таблиц и процессоров могут быть трудности.
Процедура импорта в общих чертах такая.
MS Excel : Открыть - Текстовые файлы - sa-kuva.txt - Формат файла Юникод (UTF-8) - Далее - Разделитель табуляция - Ограничитель строк (пусто) - Готово.
OO Calc : Открыть - Текст CSV - sa-kuva.txt - Кодировка Юникод (UTF-8) - Язык финский - Разделитель табуляция - OK
Сохранить в родном формате соответствующей таблицы. Номер интересующего фото из таблицы вставляется в поле поиска на сайте фотоархива (с галкой "päivättömät" в финской версии).
|
|
|
|
Re: Финский военный фотоархив 1939-1945 [сообщение #170907 является ответом на сообщение #151362] |
вт, 07 октября 2014 22:04 |
|
Работа на самом деле не такая большая, но пришлось вспомнить программирование на языке Бэйсик. Ну то есть я не просматривал все эти 160 000 фото, а этим занималась программа. Делалось это где-то в мае, но потом случайно было обнаружено (по исчезновению очевидных ляпов), что текстовое содержимое базы финнами корректируется и в сентябре сделал обновление полей. Поэтому по количеству записей база актуальна на май, а по текстовому содержимому на сентябрь. Дату фото выковыривал из соседнего фрейма, но позже обнаружилось, что не везде корректно и тут я ее убрал.
Прямые ссылки сделать можно, но по прошлому опыту потрошения архива документов digi.narc.fi есть шкурные опасения, что при наплыве скачивающих терабайтную базу финны что-то поменяют в коде html и придется разбираться с ним с нуля, чтобы обновить базу.
|
|
|
Re: Финский военный фотоархив 1939-1945 [сообщение #170925 является ответом на сообщение #170907] |
ср, 08 октября 2014 11:36 |
|
BarSeek писал(а) вт, 07 октября 2014 22:04 | Работа на самом деле не такая большая, но пришлось вспомнить программирование на языке Бэйсик. Ну то есть я не просматривал все эти 160 000 фото, а этим занималась программа. Делалось это где-то в мае, но потом случайно было обнаружено (по исчезновению очевидных ляпов), что текстовое содержимое базы финнами корректируется и в сентябре сделал обновление полей. Поэтому по количеству записей база актуальна на май, а по текстовому содержимому на сентябрь. Дату фото выковыривал из соседнего фрейма, но позже обнаружилось, что не везде корректно и тут я ее убрал.
Прямые ссылки сделать можно, но по прошлому опыту потрошения архива документов digi.narc.fi есть шкурные опасения, что при наплыве скачивающих терабайтную базу финны что-то поменяют в коде html и придется разбираться с ним с нуля, чтобы обновить базу.
|
Дата фотографии ОЧЕНЬ важна. Ее можно как-то оттуда извлечь в общую базу?
|
|
|
Re: Финский военный фотоархив 1939-1945 [сообщение #170944 является ответом на сообщение #151362] |
ср, 08 октября 2014 15:31 |
|
Есть майская версия базы, где дата извлечена из всплывающей надписи к фото в формате ГГГГММДД. Но впоследствии обнаружилось, что эта дата у четвертой части записей отсутствует, а вместо этого в самой подписи может содержаться что-то типа "1943", "10-15.8.1941" или "Marras-joulukuu 1942" (нояб[рь]-декабрь 1942). Писать обработчик для последнего варианта мне было (откровенно говоря) лень. Но извлечь год можно легко.
|
|
|
Re: Финский военный фотоархив 1939-1945 [сообщение #170947 является ответом на сообщение #170944] |
ср, 08 октября 2014 19:34 |
|
BarSeek писал(а) ср, 08 октября 2014 15:31 | Есть майская версия базы, где дата извлечена из всплывающей надписи к фото в формате ГГГГММДД. Но впоследствии обнаружилось, что эта дата у четвертой части записей отсутствует, а вместо этого в самой подписи может содержаться что-то типа "1943", "10-15.8.1941" или "Marras-joulukuu 1942" (нояб[рь]-декабрь 1942). Писать обработчик для последнего варианта мне было (откровенно говоря) лень. Но извлечь год можно легко.
|
А пришлите пожалуйста майскую версию, если выкрою время - посижу-подумаю. Дата ценна тем, что позволяет искать по определенным событиям.
|
|
|
Re: Финский военный фотоархив 1939-1945 [сообщение #170963 является ответом на сообщение #151362] |
чт, 09 октября 2014 12:25 |
|
Вчера вечером всё-таки сделал извлечение нестандартных форматов времени съемки, но надо будет внимательно проверить получившееся. Бросается в глаза, что с базой у финнов ведется работа и по полю "Доп. информация" изменения май-сентябрь очень значительные. Также корректируются подписи к фото. Вот для сравнения майская и сентябрьская карточка одного и того же фото. В мае оно идентифицировалось как "Береговая артиллерия, Ханко, 1943", а сейчас как "8-дюймовая батарея Мякилуото..." и доп.сведения - "Диапозитив помечен как Ханко, однако фото с Мякилуото". И уже без даты.
-
Вложение: Kuva3.jpg
(Размер: 34.64KB, Загружено 1915 раз)
|
|
|
Re: Финский военный фотоархив 1939-1945 [сообщение #170965 является ответом на сообщение #170963] |
чт, 09 октября 2014 12:34 |
|
BarSeek писал(а) чт, 09 октября 2014 12:25 | Вчера вечером всё-таки сделал извлечение нестандартных форматов времени съемки, но надо будет внимательно проверить получившееся. Бросается в глаза, что с базой у финнов ведется работа и по полю "Доп. информация" изменения май-сентябрь очень значительные. Также корректируются подписи к фото. Вот для сравнения майская и сентябрьская карточка одного и того же фото. В мае оно идентифицировалось как "Береговая артиллерия, Ханко, 1943", а сейчас как "8-дюймовая батарея Мякилуото..." и доп.сведения - "Диапозитив помечен как Ханко, однако фото с Мякилуото". И уже без даты.
|
Если ID записи совпадает, то в изменениях проблем нет.
|
|
|
Re: Финский военный фотоархив 1939-1945 [сообщение #171011 является ответом на сообщение #151362] |
пт, 10 октября 2014 16:19 |
|
Файл в архиве обновлен, добавлено поле времени съемки по состоянию на май этого года. Возможны косяки у табличных процессоров с интерпретацией этого поля, т.к. там помимо ДД-ММ-ГГГГ могут попадаться самые разные варианты (в лучшем случае "05.1942" станет "май 42", в худшем превратится в пятизначное целое число). При встрече с подобным лучше при импорте файла ткнуть в эту колонку и указать, что эти данные имеют формат Текст.
|
|
|
|
Re: Финский военный фотоархив 1939-1945 [сообщение #171041 является ответом на сообщение #151362] |
вс, 12 октября 2014 00:58 |
|
ОпенОфис точно должен грузить всю, т.к. этот файл выгружен именно из него, причем из очень несвежей версии для Линукса. И прочая работа с базой тоже была только в ОпенОфисе, но версии посвежее.
Попробовал бросить кусок текста в гуглопереводчик, текст получается довольно веселый. С сокращениями (которые там сплошь и рядом) совсем никак, "Ч-цистерна" (h-vaunu, танк) и "Медведь-Хилл" (Кархумяки) опять же намекают о двухэтапном переводе через английский.
|
|
|
Re: Финский военный фотоархив 1939-1945 [сообщение #171066 является ответом на сообщение #171041] |
пн, 13 октября 2014 09:21 |
|
BarSeek писал(а) вс, 12 октября 2014 00:58 | ОпенОфис точно должен грузить всю, т.к. этот файл выгружен именно из него, причем из очень несвежей версии для Линукса. И прочая работа с базой тоже была только в ОпенОфисе, но версии посвежее.
Попробовал бросить кусок текста в гуглопереводчик, текст получается довольно веселый. С сокращениями (которые там сплошь и рядом) совсем никак, "Ч-цистерна" (h-vaunu, танк) и "Медведь-Хилл" (Кархумяки) опять же намекают о двухэтапном переводе через английский.
|
Перевод у Гугля осуществляется через английский. А если автозаменой поменять штук 50-100 слов... хотя их проще заучить.
|
|
|
Re: Финский военный фотоархив 1939-1945 [сообщение #171072 является ответом на сообщение #151362] |
пн, 13 октября 2014 12:48 |
|
Там перевод даже одного и того же слова непонятно от чего зависит. Во фрагменте, который я ему подбрасывал, друг за другом шло несколько строчек, где фигурировали "танки" (h-vaunuja). Почему-то у него они превращались то в "ч-цистерны", то в "ч-вагоны" (вариант - "Н-вагоны"), то в "ч-трейлеры" (вариант - "полуприцепы").
Вот еще прекрасно оттуда же :
Голодание вражеского мертвой лошади принца холма.
Kuvassa должен быть построен к мальчикам, готовых к духовке в половине в темноте.
Лошадь получил пулю в борьбе за шею и упал. Это ветеринар и его помощник шкуры его.
Красиво филиал павшего сухостой длинных щупалец отделений в разных частях.
Всадников утверждают, что они хладнокровные лошади и наслаждаться жизнью в скважине.
Потрясающий кожей полигон.
Хвост Metso является общим тотемом глуши баз каюты на двери.
Педик сделан из слоев бункер крыши должен быть помещен.
|
|
|