| Re: Адресный указатель справочника "Весь Петербург" [сообщение #191406 является ответом на сообщение #191388] |
чт, 14 декабря 2017 06:31   |
|
|
В любом случае - это гигантская кропотливая работа. Excel не лучший вариант, так как размер листа был ограничен ~64000 строк (возможно, теперь это не так). Но, без материального стимула выполнять такие обработки никто наверное не согласится. Все-таки наиболее перспективным мне кажется попытка распознавания, что тоже архи-сложно и затратно. Но мне кажется, что при этом процент ошибок будет таки меньше ручного волонтерского подхода. Мои знакомые когда-то занимались распознаванием дореформенных словарей для проекта Яндекс.Словари, который "погиб" из-за копирайтных проблем. Я немного участвовал в пост-обработке распознанного Словаря Академии Российской и Словаря церковно-славянского языка для загрузки в базу данных. Это была еще та работка! Хотя результаты какие-то получились http://dic.feb-web.ru/rusdict/index.htm
Но выполнялось все-это в течение нескольких лет по разным грантам, которых теперь не дают. Деньги кончились. Нет денег - нет работы.
С уважением,
slog
|
|
|
|