Чем слкеивать 2 текста для распознавания в OCR?
3339
18
Какое ПО порекомендуете для склеивания двух текстовых изображений для дальнейшего распознавания в OCR?
Заранее благодарен за дельные советы.
RAMM
а нафига?... сначала распознали по частям... потом склеили в любом текстовом редакторе.. или текст у вас вдоль разрезан?
dep
Текст газетный, формата А3. Идёт в несколько колонок. Склеить колонки в нужном порядке в текстовом редакторе не удастся. Поэтому нужно склеивать на стадии сканирования картинки.
Давным-давно у ручных сканеров была такая функция. У guineform, давно, тоже, кажется, было.
В файнридере такого нет. Сканер формата А3 стоит слишком дорого.
Поэтому повторю вопрос... Чем склеивать 2 отсканированных картинки (А4) с многоколоночным текстом в формат А3 для последующего распознавания в OCR?
RAMM
??????? :а\?:
какая то проблема замороченная! Ну фотошоп тебе нужен! А на стадии сканирования тебе ни одна программа не поможет - все идет через Твайн. А вообще при сопостовлении времени потраченного на склеивание и цене за А3 - скан а3 бкдет выгоднее!
RAMM
фотошоп спасёт мир...
на стадии сканирования планшетным сканером это действительно навряд-ли возможно....
Chingiz
Как я понимаю, нужен софт типа того, которым склеивают аэрофотоснимки. Не в фотошопе же их друг к другу подгоняют!
Anomander
А почему бы и нет... Чем фотошоп плох для этой цели? Как бы изначально создан для работы с фотографиями...
PN
> Чем фотошоп плох для этой цели?

Просто для аэрофотосъемки надо склеивать сотни фотографий, совмещая граничные изображения. Не думаю, что фотошоп предназначен для такого. Хотя очень может быть что есть для него специальный плагин.
PN
Чем фотошоп плох для этой цели? Как бы изначально создан для работы с фотографиями...
Фотошоп не просто плох, он АБСОЛЮТНО непригоден для этой цели. И создан он для работы не с фотографиями, а с изображениями. То есть с набором пикселей, а не изображениями реальных объектов, имеющих свои характеристики.

А программы для обработки снимков действительно есть... и их много...
Например Erdas Imagine, TNT, ER Mapper, Intergraph...
Ну или полегче типа Idrisi, Ilwis, Photomod...
Master_
О, точно... На Erdas Imagine и пусть клеит... очень, блин, подходящая программа, чтобы слепить в одно два растровых изображения... Это можно вообще пайнтом сделать, а еще FineReader, начиная с седбмой версии вполне корректно обрабатывает верстку в несколько колонок...
PN
Сам понимаю, что ОДИН раз можно склеить хоть в паер поинте.. но человеку то надо много раз... одно и тоже...

Тут даже одной программы мало... надо целую технологию... А так вот на лету ничего и не припоминается...

Поэтому путного мы ничего не подсказали, но участие в решении его проблемы приняли.. :ухмылка:
Master_
Чето я туплю! А фотографии м электронном виде - не набор пиксилей? А для склейки аэрофото используется софт уж больно специалезированный! И человеку ему только из-за склеивания изучать...запарится.
slux
А фотографии м электронном виде - не набор пиксилей?
Для фотошопа и есть набор пикселей, а для тех программ не набор, вернее НЕ ТОЛЬКО набор. То есть если в фотошопе одна фотография ничего не знает о другой и независимая, то в тех прогах они влияют друг на друга. Это либо общая система координат, либо явное указание, либо другие методы.
Например, известно, что оси 2-х фото лежат параллельно, и пиксель №3456, строки №4200 фото №1 соответсвует пикселю №1 строки 1516 фото №2.
Тогда процедура склеивания 2 фото будет выглядеть так: удалить все пиксели в фото №1 после 4200 строки и 3456 столбца и дальше добавить изображение №2, начиная с 1517 строки и 2 столбца...

Объяснил конечно грубо, и реально это выглядет не так (там всё обычно делается в координатах), но всё-же...

А в фотошопе это можно делать только вручную... что для фотографий числом более 2 задача почти нерешаемая...

В принципе я видел несколько простых прог для тупой склейки нескольких растровых фрагментов в одну простыню, написанных "для себя", но где их достать или скачать незнаю...
Master_
Теперь я за кампанию:)

Сканируется по частям скажем формат А4. В графическом редакторе создаем пустой лист требуемого формата от А3 до А0.

Далее процедуры копи-энд-пэйст. Из маленьких форматов в большой. Совмещение визуальное. Делается быстро, ну если комп тянет. Сам так делал.
Юра
> Совмещение визуальное

Так вот этого как раз не хотелось бы.
RAMM
Благодарю всех за советы.
Небольшой отчёт.

Да, возможно, с учётом затраченного времени, сканер формата А3 (29 тыс. руб) окажется выгодней А4 (2,7 тыс.руб). К сожалению, пока, это вне бюджета (ну, как всегда, собсно, под новый год, и после нового года в особенности:улыб:).

Затраты по времени сканирования-склеивания-распознования оказались даже не сравнимы со временем сохранения файла из фотошопа и его загрузку потом в файнридер (ноут pentium M 1400, 256 RAM):
в формат TIFF - ~5 мин., размер файла 68мег
в формат PDF - ~3 мин., размер файла 18 мег.
Загрузка в файнридер - всего лишь в два раза быстрее сохранения.
Сам сканер (perfection 1270) на 600dpi прогон делает несравнимо быстрей, секунд за 30.

Т.е. время сохранения/загрузки оказалось самым критичным для работы. Подозреваю, что докупка памяти в ноут не даст значительного прироста (покупка отдельного компьютера с большим объёмом памяти и процем помощней без сканера А3 - имхо, пустая трата денег)

Дальнейший выход - чесать репу на предмет более шустрых чем фотошоп программ и аккумулировать денежку на А3.

Кто может посоветовать программы пошустрей фотошопа? (работа, напомню, ведётся с ч/б изображением, само изображение только склеивается в программе, без дополнительной обработки - т.е. ресурсы фотошопа расходуются впустую)
Юра
Далее процедуры копи-энд-пэйст. Из маленьких форматов в большой. Совмещение визуальное. Делается быстро, ну если комп тянет. Сам так делал.
Делается и на моем компе быстро, сохраняется из фотошопа - долго.
Одну страницу можно терпеть - а 10-15 уже критично.
Какой программой пользовались, на каком компе и сколько времени занимало? (изображение - 600 dpi, черно-белое)
RAMM
а зачем вам файлы на 600? файнридер их все равно на 300 пересчитывает перед распознаванием... а вы теряете время на сканировании и раздуваете объем файла в 4 раза...

ради интереса можете попробовать Ulead PhotoImpact... может он будет побыстрее...
RAMM
Да какая разница, какая прога!!!??? Операция сохранения зависит от скорости железа..т.е. жесткого. И ни надо ломать голову - визуальное совмещение кусочков или по координатам, все равно при сканирование не возможно идеально расположить лист...и всеравно придется его подравнивать (наклон и т.д.) в фотошопе или в Gis системе. Вообщем вывод такой - своими силами Вы ни чего несделаете, покрайней мере как хотите. Берете свои "портянки" и топаете в фирму где есть сканер А2-А3 формата, оплачиваете работу и все ОК!