Інтернет та суспільство → Компанія Google має намір зайнятися оцифровуванням текстів з друкованих ЗМІ
Нова технологія дозволить зібрати воєдино графічно різнорідні елементи статті — заголовки, текст та ілюстрації. Винахід допоможе видавцям газет і журналів скласти електронний архів публікацій.
Технологія, запропонована Google, передбачає два етапи розпізнавання: сегментування блоків і сегментування статей. У ході сегментації блоків програма розбиває статтю на окремі елементи — текст, заголовки, підзаголовки, картинки, а потім визначає, належать ці елементи до однієї статті або до різних, і встановлює послідовність, в якій вони повинні бути розташовані.
Джерело: IT-ІМК
Технологія, запропонована Google, передбачає два етапи розпізнавання: сегментування блоків і сегментування статей. У ході сегментації блоків програма розбиває статтю на окремі елементи — текст, заголовки, підзаголовки, картинки, а потім визначає, належать ці елементи до однієї статті або до різних, і встановлює послідовність, в якій вони повинні бути розташовані.
Джерело: IT-ІМК


