Řešená problematika je v současnosti ve světě i u nás předmětem zájmu řady výzkumných týmů, které se snaží řešit úlohy, které́ se blíží cílům tohoto projektu. Nejde však zdaleka o problematiku vyřešenou. Různé přístupy jednotlivých výzkumných týmů přinášejí různě kvalitní výsledky, které však mnohdy končí jen v podobě článků nebo omezeně aplikovatelných výsledků.
Tak, jak se vyvíjejí metody strojového učení, otevírají se další možnosti automatizovaného vytěžování digitalizovaných dokumentů. Problematiku identifikace obrázků v digitalizovaných publikacích zkoumali pracovníci MZK v roce 2021 v rámci přípravy na podání tohoto projektu a prezentovali své závěry na konferenci Archivy, knihovny a muzea v digitálním světě v prosinci 2021 v příspěvku Obrazová data a strojové učení. Testy byly zaměřeny na identifikaci obrázků vložených do textu a srovnávaly výstupy existujícího OCR (produkovaného systémem ABBYY Recognition Server různých verzí) s nástroji strojového učení (Newspaper Navigator, UNet, dhSegment).
Klíčová zjištění z těchto praktických testů ukazují, že při použití stávajících nástrojů není možné bez dalšího vývoje dosáhnout takové přesnosti, která by umožnila jejich praktické nasazení. Zároveň nestáčí jen identifikovat netextové části dokumentů, ale je nutné́ získat informace o jejich obsahu, aby bylo umožněno jejich vyhledávaní. Tyto informace je často možné získat z textů souvisejícím s daným netextovým objektem, což ale vyžaduje znalost struktury a vztahů elementů dokumentu a schopnost aspoň základním způsobem porozumět textu.
Potřebné informace je také možné získat přímo z obrázků a ilustrací pomocí technik počítačového vidění. Analýza struktury a vztahů částí dokumentů i extrakce sémantických informací z obrazu jsou velmi aktivní výzkumná témata a v projektu budeme vycházet z nejnovějších poznatků v těchto oblastech.
V kontextu digitalizace kulturního dědictví vznikají specializované nástroje nebo sady nástrojů na zpracování dokumentů, z nichž některé extrahují základní netextové prvky na určitém typu dokumentů, ale neextrahují informace o vztazích elementů stránky.